zl程序教程

您现在的位置是:首页 >  后端

当前栏目

用数据整理的技术,把书籍读薄,再融会贯通的方法2022.8.22

方法技术数据 整理 书籍 22 2022.8 融会贯通
2023-06-13 09:15:59 时间

最近看了一些书籍,也写了读后感,但是闭上书本,每本书之间有什么联系,不能方便的针对一个话题把书籍内容串联起来。那就重新把关键字打碎再关联。

1、把每本书的读后感列关键字。

2、把关键字分词,得到词频。

单词

词性

词频

思维

名词

13

语言

名词

10

数据

名词

10

关系

名词

9

科学

名词

7

信息

名词

7

问题

名词

7

复杂

形容词

6

情绪

名词

6

文化

名词

6

选择

动词

6

搜索

动词

6

成长

动词

6

心理

名词

5

社会

名词

5

理性

名词

5

行动

名动词

5

数学

名词

5

实验

名动词

5

统计

动词

5

人工智能

名词

5

运动

名动词

5

学习

动词

5

真理

名词

4

家庭

名词

4

3、用关键字遍历每个书籍的读后感,输出以关键字为链接的书名和读后感截取。

'''
1、读取词频
2、读取书籍点评
3、遍历词频,if词频在书籍点评中
3、词频的书名加入书名
4、写入excel
'''
import re
import pandas
from DataRecorder import Recorder  # 记录器

大集合 = pandas.read_excel('@@@@@图书榜单大集合-2022.8.23.xlsx',sheet_name='大集合',header=None, nrows=500)
词频 = pandas.read_excel('微词云分词后的结果数据.xlsx',sheet_name='全部单词',header=None, nrows=50)
for 词频行 in 词频.values:
#    print(词频行[0])
    书名列表 = []
    书名字符串 = ''
    书名字符串清洗 = ''
    count = 1
    for 大集合行 in 大集合.values:
        count +=1
        print(count)
#        print(大集合行[0])
#        print(大集合行[35])
        if 词频行[0] in str(大集合行[35]):
#            print(大集合行[0])
#            print(大集合行[35])
            location=re.search(词频行[0],str(大集合行[35]))#返回一个match object
            span=location.span()#返回匹配对象起始位置索引和结束位置索引组成的元组,即(start,end)
            start,end=span
            查询到的字符串=str(大集合行[35])[start-15:end+15].replace('\n', '').replace('\r', '')
            if 查询到的字符串 == '':
                查询到的字符串=str(大集合行[35])[start-5:end+5].replace('\n', '').replace('\r', '')
            if 查询到的字符串 == '':
                查询到的字符串=str(大集合行[35])[start-2:end+2].replace('\n', '').replace('\r', '')
            书名字符串 += '《'+str(大集合行[0])+'》'+'-'*10+查询到的字符串+'\n'
#            书名列表.append(大集合行[0])
#    print(书名列表)
    书名字符串清洗 = 书名字符串.strip('\n')
#    print(书名字符串清洗)
    r = Recorder('results.xlsx', 1)  # 50表示每50条记录写入一次文件
    r.add_data((词频行[0],书名字符串清洗))# 插入一条数据(也可一次插入多条)

单词

思维

《科学思考者》----------,方法,陪伴,赋能,叙事,奇迹思维,神笔马良,民间神药,阿姨爱上《陈海贤·自我发展心理学》----------,第二序列改变,解放思想,僵固思维,对世界的应该,对自己的应该,《卓克·科学思维课》----------化、心理、思维、方法、极《为什么》----------观察,关联,行动,干预,想象,思维和数据的关系,复杂科学,信息,《跨学科工具箱》----------我管理的重要模型体能情绪思维食物-基因三高肥胖每天运《读懂一本书樊登读书法》----------书原则,读薄,讲稿,整体结构,思维导图,互动《数学之美》----------论,大数据思维,信息度量《智能时代》----------成语言,青霉素的因果关系,机械思维,还原论,确定性,香农,信息论

语言

《科学思考者》----------,情绪可控,理财,事实,观点,语言,换位,妥协,真相,数据,局限《陈海贤·自我发展心理学》----------,弹性思维,关系,自我,角色,语言,互补,依恋,三角化,责任,我《未来简史》----------忆,想法,想象,共同体,文字,语言,心理,生理,生物工程,机械,《卓克·科学思维课》----------思维、搜索、神、考古、读心术、语言、自制药、体系、黑洞《读懂一本书樊登读书法》----------总比自己想的强,逻辑,大局观,语言能力,发声,控场,幽默感,同理《数学之美》----------,最大熵,麦克斯韦妖,控制论,语言,自然语言,文字,数字,信息,《智能时代》----------测试,飞鸟派仿生人工智能,自然语言处理语法派和数据派,谷歌翻译,《体态语言大全》----------肢体语言的祛

数据

《科学思考者》----------观点,语言,换位,妥协,真相,数据,局限,反事实分析,数学,科学《学习观、断墨寻径》----------思路过渡 2.4.1.增加数据 增加经验 多看一《未来简史》----------,泛灵,农业,宗教,人文主义,数据,科学,自由,社会,进化,经济《为什么》----------,概率,统计,反事实,中介,大数据,人工智能,观察,关联,行动,《数学之美》----------信息论,大数据思维,信息《未来学校》----------,互联网知识普惠,兴趣动力,大数据人工智能精准辅导《智能时代》----------人工智能,自然语言处理语法派和数据派,谷歌翻译,百度吃货从百度知

关系

《科学思考者》----------不超过百分之一,程序正义,因果关系,公鸡打鸣太阳出来,加油汽车走《陈海贤·自我发展心理学》----------模型,人际关系,关键期的《未来简史》----------代,幸福,长寿,神,知识,生产关系,心灵,灵魂,感觉,欲望,记忆《为什么》----------因果关系,相《5%的改变》----------我,原生家庭,工作,理想,亲密关系,人际关系,减肥,自律,困惑,《社会学爱情思维课》----------、金钱、处女、底线、琐事、长期关系、代际关系、亲密关系、出轨、恐《蛤蟆先生去看心理医生》----------,输,对抗,秘密,人生坐标,新关系,总结,影子,阴影,老师,朋友《智能时代》----------搜索匹配合成语言,青霉素的因果关系,机械思维,还原论,确定性,香

科学

《刘擎西方现代思想讲义》----------个人,金钱,经济,宗教,信仰,科学,真理,爱情,家庭,家族,工作《科学思考者》----------能量守恒,市场均衡,行动,复杂科学,归因谬误,情绪可控,理财,事《陈海贤·自我发展心理学》----------键期的选择,人生发展阶段,行为科学,认知,家庭,积极,精神分析,《李林·宗教学10讲》----------,自己,悟空,主动性,想象力,科学,拼凑,变化,文化,排斥,吸纳《学习观、断墨寻径》----------杀死出洞人 固执心理 科学发展迫害 网络攻击 触《未来简史》----------,农业,宗教,人文主义,数据,科学,自由,社会,进化,经济,现代《卓克·科学思维课》----------源、发展、旁证、驯化、边界、伪科学、因果、相关、谬误、严谨、遗憾《为什么》----------,想象,思维和数据的关系,复杂科学,信息,知识,关系,大似然估计《王立铭进化论讲义》----------储备,学习,进化对抗进化,复杂科学系统,复杂,分工,协作,对抗,

信息

《学习观、断墨寻径》---------- 为何更抽象 概念 信息 知识 记忆目标《为什么》----------,思维和数据的关系,复杂科学,信息,知识,关系,大似然估计,倾向《数学之美》----------《王立铭进化论讲义》----------绝,包袱,方法论,低熵,能量,信息,继承,增长,繁衍,效率,可能《智能时代》----------械思维,还原论,确定性,香农,信息论,不确定性,熵,谷歌广告,匪

问题

《数学之美》----------验,仿生,还原论,上下文,所以问题,数学问题,可判定问题,有答案

情绪

《科学思考者》----------衡,行动,复杂科学,归因谬误,情绪可控,理财,事实,观点,语言,《陈海贤·自我发展心理学》----------展,选择,新经验,象与骑象人,情绪,理性,舒适区,控制感,以人为《5%的改变》----------人,统计,松动思想,输出,负面情绪,允许,授权,中立,不确定,公《跨学科工具箱》----------型体能情绪思维食《蛤蟆先生去看心理医生》----------问,感受,情绪,人生故事

文化

《科学思考者》----------,比特币,保健品,美容品,中国文化,自证预言,皮革马力翁效应,吸《李林·宗教学10讲》----------一神,二神,多神,人神,共识,文化,生产,凝聚,想象,合作,强大《卓克·科学思维课》----------普,双盲、文化、心理、思《王立铭进化论讲义》----------,退化,社会达尔文主义,伦理,文化基因,文明,竞争,创新者的窘境

复杂

《科学思考者》----------迹,能量守恒,市场均衡,行动,复杂科学,归因谬误,情绪可控,理财《为什么》----------干预,想象,思维和数据的关系,复杂科学,信息,知识,关系,大似然《王立铭进化论讲义》----------余,储备,学习,进化对抗进化,复杂科学系统,复杂,分工,协作,对《我们如何走到今天》----------璃,声音,光,制冷,时

选择

《陈海贤·自我发展心理学》----------,心智模型,人际关系,关键期的选择,人生发展阶段,行为科学,认知《蛤蟆先生去看心理医生》----------充沛,纸条,成人,强迫,出口,选择,男孩,男人,心理游戏,自证预《王立铭进化论讲义》----------自私,匮乏,起点,变异,自然,选择,定义,胜利,个体,群体,基因

搜索

《卓克·科学思维课》----------梦境、衰老、线粒体、批判思维、搜索、神、考古、读心术、语言、自制《数学之美》----------,分类,信息指纹,密码,作弊,搜索模型,布隆过滤器,马尔科夫链,《智能时代》----------,谷歌翻译,百度吃货从百度知道搜索,网络搜索美国大选,谷歌问答,

成长

《5%的改变》----------动,不猜,大方,痕迹管理,看到成长,定一个时间,主动策划,颓废,《跨学科工具箱》----------1%创新小剂量+痛苦+恢复=成长18讲古代哲学《当下的力量《社会学爱情思维课》----------新旧脚本、成长途径、享乐《蛤蟆先生去看心理医生》----------孩子,感觉,计量,模糊,状态,成长,寓言,讲解,倾听,愤怒,悲伤

好了,现在可以针对一个关键字在多本书之间游荡吹牛了。