您现在的位置是：首页 > 后端

当前栏目

《NLTK基础教程——用NLTK和Python库构建机器学习应用》——2.9　拼写纠错

Python 机器应用学习构建基础教程 2.9 NLTK

2023-09-11 14:17:45 时间

本节书摘来异步社区《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书中的第2章，第2.9节，作者：Nitin Hardeniya，更多章节内容可以访问云栖社区“异步社区”公众号查看。

2.9 拼写纠错

虽然并不是所有的NLP应用都会用到拼写检查器（spellchecker），但的确有些用例是需要执行基本的拼写检查的。我们可以通过纯字典查找的方式来创建一个非常基本的拼写检查器。业界也有专门为此类应用开发的一些增强型的字符串算法，用于一些模糊的字符串匹配。其中最常用的是edit-distance算法。NLTK也为我们提供了多种内置了edit-distance算法的度量模块。

 from nltk.metrics import edit_distance

 edit_distance("rain","shine")

3

我们将会在后续章节中更具体地介绍该模块。我们还会看到拼写检查器最优雅的实现代码之一，它出自Peter Norvig之手，这是一段用纯Python实现的、非常易于理解的代码。

客户流失？来看看大厂如何基于spark+机器学习构建千万数据规模上的用户留存模型 ⛵ 如何在海量用户中精准预测哪些客户即将流失？本文结合音乐流媒体平台 Sparkify 数据，详细讲解一个客户流失建模预测案例的全流程：探索性数据分析 EDA、数据处理、进一步数据探索、建模优化、结果评估。【代码与数据集亲测可运行】
机器学习建模高级用法！构建企业级AI建模流水线 ⛵ 机器学习建模高级用法！构建企业级AI建模流水线，不同环节有序地构建成工作流（pipeline）。本文以『客户流失』为例，讲解如何构建 SKLearn 流水线。
异步社区异步社区(www.epubit.com)是人民邮电出版社旗下IT专业图书旗舰社区，也是国内领先的IT专业图书社区，致力于优质学习内容的出版和分享，实现了纸书电子书的同步上架，于2015年8月上线运营。公众号【异步图书】，每日赠送异步新书。

猜你喜欢

使用Rome读取RSS报错，org.xml.sax.SAXParseException: 前言中不允许有内容。
飞蛾逐月优化算法求解最优潮流（Matlab实现）
ASP.NET制作调查问卷
AOP 你想干什么 IOC 你服务什么
Ubuntu18.04报错：make[1]: *** No rule to make target armv4-mont.o, needed by build-msm8916/lk. Stop.
使用page-slot显示SAP Spartacus section里包含的Component和layout设计
使用springboot的resttmplate请求远程服务的时候报 403问题
二维码（带有图片）的生成
redis 简单整理——复制的原理[二十三]
High-availability Clustering高可用之三 -- 管理Fencing
xgboost 特征选择，筛选特征的正要性
Hadoop_HDFS（二）：Shell操作之文件的管理（上传下载删除等）
使用LSTM做电影评论负面检测——使用朴素贝叶斯才51%，但是使用LSTM可以达到99%准确度
Leetcode.764 最大加号标志
[Redux] Extracting Presentational Components -- Todo, TodoList
数据中台快没得炒作了！Gartner给想建数据中台的一些建议
在OpenCV里实现极坐标变换5
Nginx错误提示：504 Gateway Time-out解决方法
阿里云ecs 增加虚拟网卡
python非对称加密模块rsa
行为型模式之命令模式
智能车学习（二十一）——浅谈CCD交叉以及横线摆放

相关主题

Python 虚拟机
Python 面向对象
Python 线程
python 666
Python机器学习库
Python模块之os
Python的序列

zl程序教程

当前栏目

《NLTK基础教程——用NLTK和Python库构建机器学习应用》——2.9　拼写纠错

相关文章

当前栏目

《NLTK基础教程——用NLTK和Python库构建机器学习应用》——2.9 拼写纠错

相关文章

《NLTK基础教程——用NLTK和Python库构建机器学习应用》——2.9　拼写纠错