NLP之NB:基于sklearn库利用不同语种数据集训练NB(朴素贝叶斯)算法,对新语种进行语种检测
2023-09-14 09:04:45 时间
NLP之NB:基于sklearn库利用不同语种数据集训练NB(朴素贝叶斯)算法,对新语种进行语种检测
目录
输出结果
测试01:I love you
测试02:Ich liebe dich
训练数据集
数据集下载:不同语种训练数据集Language_data
设计思路
核心代码
x_train, x_test, y_train, y_test = train_test_split(x, y, random_state=1)
language_detector = LanguageDetector()
language_detector.fit(x_train, y_train)
test_language='Ich liebe dich'
print(language_detector.predict(test_language))
print(language_detector.score(x_test, y_test))
相关文章
- 详解DQN训练技巧!带你回到深度强化学习「梦开始的地方」
- WAIC 2022 | 澜舟科技创始人&CEO 周明:基于预训练语言模型的可控文本生成研究与应用
- 蓝桥杯算法训练 金陵十三钗(dp状态压缩)------C语言—菜鸟级
- 蓝桥杯 算法训练 3000米排名预测---------C语言—菜鸟级
- paddle深度学习基础之训练调试与优化
- knn算法实现手写数字识别的背景_knn手写数字识别60000训练集
- 预训练模型还要训练吗_多模态预训练模型
- 总结!语义信息检索中的预训练模型
- 近万人围观Hinton最新演讲:前向-前向神经网络训练算法,论文已公开
- 强化学习技巧四:模型训练速度过慢、GPU利用率较低,CPU利用率很低问题总结与分析。
- pyTorch入门(五)——训练自己的数据集
- DN-DETR:引入去噪训练以加速收敛
- 再掀强化学习变革!DeepMind提出「算法蒸馏」:可探索的预训练强化学习Transformer
- 第十四届蓝桥杯集训——练习解题阶段(无序阶段)-ALGO-3 算法训练 K好数
- 第十四届蓝桥杯集训——练习解题阶段(无序阶段)-ALGO-49 算法训练 寻找数组中最大值
- 第十四届蓝桥杯集训——练习解题阶段(无序阶段)-ALGO-439 算法训练 简单字符变换
- AAAI 2023杰出论文一作分享:新算法加持的大批量学习加速推荐系统训练
- 大规模预训练、可控文本生成方向,清华大学计算机系NLP实验室招聘博士后(长期有效)
- 训练Rainbow算法需要1425个GPU Day?谷歌说强化学习可以降低计算成本
- Hugging Face发布PyTorch新库「Accelerate」:适用于多GPU、TPU、混合精度训练
- 134个预训练模型、精度高达85.1%,百度视觉算法最强基石PaddleClas全新升级
- LDA主题模型的训练算法和预测算法详解大数据