您现在的位置是：首页 > 后端

当前栏目

《NLTK基础教程——用NLTK和Python库构建机器学习应用》——导读

Python 机器应用学习构建导读基础教程 NLTK

2023-09-11 14:17:45 时间

370cccfecfe98e58d2b85bfb137cf2787c3ae938

NLTK基础教程——用NLTK和Python库构建机器学习应用
这是一本介绍NLTK库，以及如何将该库与其他Python库搭配运用的书。NLTK是当前自然语言处理（NLP）社区中最为流行、使用最为广泛的库之一。NLTK的设计充分体现了简单的魅力。也就是说，对于大多数复杂的NLP任务，它都可以用寥寥几行代码来实现。

本书的前半部分从介绍Python和NLP开始。在这部分内容中，你将会学到一些通用的预处理技术，例如标识化处理（tokenization）、词干提取（stemming）、停用词（stop word）去除；一些专属于NPL领域的预处理技术等，如词性标注（part-of-speech tagging）；以及大多数文本相关的NLP任务都会涉及的命名实体识别（Named-entity recognition，简称NER）等技术。然后，我们会逐步将焦点转到更为复杂的NLP任务上，例如语法解析（parsing）以及其他NLP应用。

本书的后半部分则将更侧重于介绍如何构建一些NLP应用，如对于文本分类，可以用NLTK搭配scikit-learn库来进行。我们还会讨论一些其他的Python库，你应该了解一下这些与文本挖掘或自然语言处理任务相关的库。另外，也会带你看看如何从网页和社交媒体中采集数据，以及如何用NLTK进行大规模的文本处理。

第1章自然语言处理简介
 1.1 为什么要学习NLP
1.2 先从Python开始吧
 1.3 向NLTK迈进
 1.4 练习
 1.5 小结

第2章文本的歧义及其清理
 2.1 何谓文本歧义
 2.2 文本清理
 2.3 语句分离器
 2.4 标识化处理
 2.5 词干提取
 2.6 词形还原
 2.7 停用词移除
 2.8 罕见词移除
 2.9 拼写纠错
 2.10 练习
 2.11 小结

第3章词性标注
第4章文本结构解析
第5章 NLP应用
第6章文本分类
第7章 Web爬虫
第8章 NLTK与其他Python库的搭配运用
第9章 Python中的社交媒体挖掘
第10章大规模文本挖掘

Python 的 __name__ 变量及其应用 __name__ 是 Python 中的一个特殊变量,它代表当前模块的名字。当一个 Python 文件被直接运行的时候,__name__ 的值会被设置为 __main__。当代码被导入到其他模块中运行时,__name__ 的值会被设置为模块名称。
Python多线程爬虫编程中queue.Queue和queue.SimpleQueue的区别和应用在Python中，queue模块提供了多种队列类，用于在多线程编程中安全地交换信息。其中，queue.Queue 和queue.SimpleQueue 是两个常用的先进先出（FIFO）的队列类，它们有以下区别和优缺点： queue.Queue 是一个更复杂的队列类实现涉及到多个锁和条件变量，因此可能会影响性能和内存效率。 SimpleQueue 是一个更简单的队列类它只提供了put()和get()两个方法，并且不支持maxsize参数
异步社区异步社区(www.epubit.com)是人民邮电出版社旗下IT专业图书旗舰社区，也是国内领先的IT专业图书社区，致力于优质学习内容的出版和分享，实现了纸书电子书的同步上架，于2015年8月上线运营。公众号【异步图书】，每日赠送异步新书。

猜你喜欢

ext4文件系统
Docker 部署 Prometheus
科技云报道：2022Arm服务器现状：云阵营已成
【数据结构与算法】(二) c 语言链表的简单操作
一行命令搞定node.js 版本升级
GBDT理解
Andriod App类型简介
《软件功能测试自动化实战教程》—第6章6.2节数据驱动测试的一般步骤
CMake: (三) 交叉编译
金九银十必备！大厂面试官编写938页Android实战总结笔记
EF 延时加载与死锁
动态三维曲面
Typo域名测试工具urlcrazy大学霸IT达人
IOS之UI--自定义按钮实现代理监听点击事件
《HTML5与CSS3实战指南》——第2章 HTML5样式的标记2.1 The HTML5 Herald简介
应急响应系列之OA被入侵挖矿分析报告
数据中心能效标准正式发布
linux下tar解压时报"gzip: stdin: unexpected end of file"如何处理?
浅谈 | 嵌套连接
SSL工作原理

相关主题

windows安装python
Python高阶
python实现高并发
Python机器学习·微教程
Python标准库介绍
Python中Json模块
python 管道

zl程序教程

当前栏目

《NLTK基础教程——用NLTK和Python库构建机器学习应用》——导读

相关文章