用数据整理的技术,把书籍读薄,再融会贯通的方法2022.8.22
最近看了一些书籍,也写了读后感,但是闭上书本,每本书之间有什么联系,不能方便的针对一个话题把书籍内容串联起来。那就重新把关键字打碎再关联。
1、把每本书的读后感列关键字。
2、把关键字分词,得到词频。
单词 | 词性 | 词频 |
---|---|---|
思维 | 名词 | 13 |
语言 | 名词 | 10 |
数据 | 名词 | 10 |
关系 | 名词 | 9 |
科学 | 名词 | 7 |
信息 | 名词 | 7 |
问题 | 名词 | 7 |
复杂 | 形容词 | 6 |
情绪 | 名词 | 6 |
文化 | 名词 | 6 |
选择 | 动词 | 6 |
搜索 | 动词 | 6 |
成长 | 动词 | 6 |
心理 | 名词 | 5 |
社会 | 名词 | 5 |
理性 | 名词 | 5 |
行动 | 名动词 | 5 |
数学 | 名词 | 5 |
实验 | 名动词 | 5 |
统计 | 动词 | 5 |
人工智能 | 名词 | 5 |
运动 | 名动词 | 5 |
学习 | 动词 | 5 |
真理 | 名词 | 4 |
家庭 | 名词 | 4 |
3、用关键字遍历每个书籍的读后感,输出以关键字为链接的书名和读后感截取。
'''
1、读取词频
2、读取书籍点评
3、遍历词频,if词频在书籍点评中
3、词频的书名加入书名
4、写入excel
'''
import re
import pandas
from DataRecorder import Recorder # 记录器
大集合 = pandas.read_excel('@@@@@图书榜单大集合-2022.8.23.xlsx',sheet_name='大集合',header=None, nrows=500)
词频 = pandas.read_excel('微词云分词后的结果数据.xlsx',sheet_name='全部单词',header=None, nrows=50)
for 词频行 in 词频.values:
# print(词频行[0])
书名列表 = []
书名字符串 = ''
书名字符串清洗 = ''
count = 1
for 大集合行 in 大集合.values:
count +=1
print(count)
# print(大集合行[0])
# print(大集合行[35])
if 词频行[0] in str(大集合行[35]):
# print(大集合行[0])
# print(大集合行[35])
location=re.search(词频行[0],str(大集合行[35]))#返回一个match object
span=location.span()#返回匹配对象起始位置索引和结束位置索引组成的元组,即(start,end)
start,end=span
查询到的字符串=str(大集合行[35])[start-15:end+15].replace('\n', '').replace('\r', '')
if 查询到的字符串 == '':
查询到的字符串=str(大集合行[35])[start-5:end+5].replace('\n', '').replace('\r', '')
if 查询到的字符串 == '':
查询到的字符串=str(大集合行[35])[start-2:end+2].replace('\n', '').replace('\r', '')
书名字符串 += '《'+str(大集合行[0])+'》'+'-'*10+查询到的字符串+'\n'
# 书名列表.append(大集合行[0])
# print(书名列表)
书名字符串清洗 = 书名字符串.strip('\n')
# print(书名字符串清洗)
r = Recorder('results.xlsx', 1) # 50表示每50条记录写入一次文件
r.add_data((词频行[0],书名字符串清洗))# 插入一条数据(也可一次插入多条)
单词 | |
---|---|
思维 | 《科学思考者》----------,方法,陪伴,赋能,叙事,奇迹思维,神笔马良,民间神药,阿姨爱上《陈海贤·自我发展心理学》----------,第二序列改变,解放思想,僵固思维,对世界的应该,对自己的应该,《卓克·科学思维课》----------化、心理、思维、方法、极《为什么》----------观察,关联,行动,干预,想象,思维和数据的关系,复杂科学,信息,《跨学科工具箱》----------我管理的重要模型体能情绪思维食物-基因三高肥胖每天运《读懂一本书樊登读书法》----------书原则,读薄,讲稿,整体结构,思维导图,互动《数学之美》----------论,大数据思维,信息度量《智能时代》----------成语言,青霉素的因果关系,机械思维,还原论,确定性,香农,信息论 |
语言 | 《科学思考者》----------,情绪可控,理财,事实,观点,语言,换位,妥协,真相,数据,局限《陈海贤·自我发展心理学》----------,弹性思维,关系,自我,角色,语言,互补,依恋,三角化,责任,我《未来简史》----------忆,想法,想象,共同体,文字,语言,心理,生理,生物工程,机械,《卓克·科学思维课》----------思维、搜索、神、考古、读心术、语言、自制药、体系、黑洞《读懂一本书樊登读书法》----------总比自己想的强,逻辑,大局观,语言能力,发声,控场,幽默感,同理《数学之美》----------,最大熵,麦克斯韦妖,控制论,语言,自然语言,文字,数字,信息,《智能时代》----------测试,飞鸟派仿生人工智能,自然语言处理语法派和数据派,谷歌翻译,《体态语言大全》----------肢体语言的祛 |
数据 | 《科学思考者》----------观点,语言,换位,妥协,真相,数据,局限,反事实分析,数学,科学《学习观、断墨寻径》----------思路过渡 2.4.1.增加数据 增加经验 多看一《未来简史》----------,泛灵,农业,宗教,人文主义,数据,科学,自由,社会,进化,经济《为什么》----------,概率,统计,反事实,中介,大数据,人工智能,观察,关联,行动,《数学之美》----------信息论,大数据思维,信息《未来学校》----------,互联网知识普惠,兴趣动力,大数据人工智能精准辅导《智能时代》----------人工智能,自然语言处理语法派和数据派,谷歌翻译,百度吃货从百度知 |
关系 | 《科学思考者》----------不超过百分之一,程序正义,因果关系,公鸡打鸣太阳出来,加油汽车走《陈海贤·自我发展心理学》----------模型,人际关系,关键期的《未来简史》----------代,幸福,长寿,神,知识,生产关系,心灵,灵魂,感觉,欲望,记忆《为什么》----------因果关系,相《5%的改变》----------我,原生家庭,工作,理想,亲密关系,人际关系,减肥,自律,困惑,《社会学爱情思维课》----------、金钱、处女、底线、琐事、长期关系、代际关系、亲密关系、出轨、恐《蛤蟆先生去看心理医生》----------,输,对抗,秘密,人生坐标,新关系,总结,影子,阴影,老师,朋友《智能时代》----------搜索匹配合成语言,青霉素的因果关系,机械思维,还原论,确定性,香 |
科学 | 《刘擎西方现代思想讲义》----------个人,金钱,经济,宗教,信仰,科学,真理,爱情,家庭,家族,工作《科学思考者》----------能量守恒,市场均衡,行动,复杂科学,归因谬误,情绪可控,理财,事《陈海贤·自我发展心理学》----------键期的选择,人生发展阶段,行为科学,认知,家庭,积极,精神分析,《李林·宗教学10讲》----------,自己,悟空,主动性,想象力,科学,拼凑,变化,文化,排斥,吸纳《学习观、断墨寻径》----------杀死出洞人 固执心理 科学发展迫害 网络攻击 触《未来简史》----------,农业,宗教,人文主义,数据,科学,自由,社会,进化,经济,现代《卓克·科学思维课》----------源、发展、旁证、驯化、边界、伪科学、因果、相关、谬误、严谨、遗憾《为什么》----------,想象,思维和数据的关系,复杂科学,信息,知识,关系,大似然估计《王立铭进化论讲义》----------储备,学习,进化对抗进化,复杂科学系统,复杂,分工,协作,对抗, |
信息 | 《学习观、断墨寻径》---------- 为何更抽象 概念 信息 知识 记忆目标《为什么》----------,思维和数据的关系,复杂科学,信息,知识,关系,大似然估计,倾向《数学之美》----------《王立铭进化论讲义》----------绝,包袱,方法论,低熵,能量,信息,继承,增长,繁衍,效率,可能《智能时代》----------械思维,还原论,确定性,香农,信息论,不确定性,熵,谷歌广告,匪 |
问题 | 《数学之美》----------验,仿生,还原论,上下文,所以问题,数学问题,可判定问题,有答案 |
情绪 | 《科学思考者》----------衡,行动,复杂科学,归因谬误,情绪可控,理财,事实,观点,语言,《陈海贤·自我发展心理学》----------展,选择,新经验,象与骑象人,情绪,理性,舒适区,控制感,以人为《5%的改变》----------人,统计,松动思想,输出,负面情绪,允许,授权,中立,不确定,公《跨学科工具箱》----------型体能情绪思维食《蛤蟆先生去看心理医生》----------问,感受,情绪,人生故事 |
文化 | 《科学思考者》----------,比特币,保健品,美容品,中国文化,自证预言,皮革马力翁效应,吸《李林·宗教学10讲》----------一神,二神,多神,人神,共识,文化,生产,凝聚,想象,合作,强大《卓克·科学思维课》----------普,双盲、文化、心理、思《王立铭进化论讲义》----------,退化,社会达尔文主义,伦理,文化基因,文明,竞争,创新者的窘境 |
复杂 | 《科学思考者》----------迹,能量守恒,市场均衡,行动,复杂科学,归因谬误,情绪可控,理财《为什么》----------干预,想象,思维和数据的关系,复杂科学,信息,知识,关系,大似然《王立铭进化论讲义》----------余,储备,学习,进化对抗进化,复杂科学系统,复杂,分工,协作,对《我们如何走到今天》----------璃,声音,光,制冷,时 |
选择 | 《陈海贤·自我发展心理学》----------,心智模型,人际关系,关键期的选择,人生发展阶段,行为科学,认知《蛤蟆先生去看心理医生》----------充沛,纸条,成人,强迫,出口,选择,男孩,男人,心理游戏,自证预《王立铭进化论讲义》----------自私,匮乏,起点,变异,自然,选择,定义,胜利,个体,群体,基因 |
搜索 | 《卓克·科学思维课》----------梦境、衰老、线粒体、批判思维、搜索、神、考古、读心术、语言、自制《数学之美》----------,分类,信息指纹,密码,作弊,搜索模型,布隆过滤器,马尔科夫链,《智能时代》----------,谷歌翻译,百度吃货从百度知道搜索,网络搜索美国大选,谷歌问答, |
成长 | 《5%的改变》----------动,不猜,大方,痕迹管理,看到成长,定一个时间,主动策划,颓废,《跨学科工具箱》----------1%创新小剂量+痛苦+恢复=成长18讲古代哲学《当下的力量《社会学爱情思维课》----------新旧脚本、成长途径、享乐《蛤蟆先生去看心理医生》----------孩子,感觉,计量,模糊,状态,成长,寓言,讲解,倾听,愤怒,悲伤 |
好了,现在可以针对一个关键字在多本书之间游荡吹牛了。
相关文章
- 从程序员成为技术领导者:掌握全面解决问题的方法(温伯格)
- 【金猿技术展】时序数据库表结构改变处理方法 ——高效处理PB级数据,可实时监测预警业务运行状态的技术
- 红队技术-各端口横向移动方法
- 没想到吧,PHP 中在类的外部也可以调用私有方法!
- MySQL快速修改表内容的方法(mysql修改表的内容)
- 管理简化Linux系统MySQL包管理的新方法(linuxmysql包)
- 使用Oracle多列去重的技术方法(oracle多列去重)
- 户权限管理Oracle 用户权限管理:必要技术与方法(oracle用)
- Linux下实现组播技术的简易方法(组播linux)
- 深入探索:Linux Clone技术的应用和实现方法(linuxclone)
- 异常Linux系统ppp0接口异常检查与解决方法(linuxppp0)
- Oracle全系统备份技术指南(oracle全备份方法)
- Oracle数据库冷恢复技术深入剖析(oracle冷恢复方法)
- API技术连接MySQL数据库的最佳方法(api如何连接mysql)
- 解决方法调整MySQL的字符集和字段属性设置(mysql不显示字段宽度)
- 使用 Redis 超时处理技术实现更优性能(redis 超时解决方法)
- 极速提升网站性能使用Redis缓存管理技术(redis缓存用哪个方法)
- js中设计一段程序,让它能够打印自己的方法收集藏
- mysql忘记密码的解决方法(linux和windows小结)
- javascript倒排序方法
- 关于ASP.NET页面打印技术的常用方法总结
- Asp.net获取当前目录的方法小结
- jquery自定义类似$.ajax()的方法实现代码
- jsdata日期初始化的5种方法
- IE6-8中Date不支持toISOString的修复方法
- Ruby中检测Gem是否安装的方法