您现在的位置是：首页 > 其它

当前栏目

跑实验记录一

记录实验

2023-09-14 09:11:23 时间

1.使用tagger&wikipedia-pubmed-and-PMC-w2v词向量

Loading pretrained embeddings from ../.local/lib/python3.5/site-packages/neuroner/data/word_vectors/wikipedia-pubmed-and-PMC-w2v.txt...
WARNING: 5443657 invalid lines
Loaded 0 pretrained embeddings.
0 / 18309 (0.0000%) words have been initialized with pretrained embeddings.
0 found directly, 0 after lowercasing, 0 after lowercasing + zero.
Compiling...

词向量无效的问题。

2.使用tagger&PMC-w2v词向量

Loading pretrained embeddings from ./dataset/PMC-w2v.txt...
WARNING: 2515687 invalid lines
Loaded 0 pretrained embeddings.
0 / 18141 (0.0000%) words have been initialized with pretrained embeddings.
0 found directly, 0 after lowercasing, 0 after lowercasing + zero.
Compiling...

依旧是词向量不能加载的问题。

解决：找到原因了，因为词向量中的维度和默认维度不同，需要指定默认维度啊，--word_dim 200。即可：

Found 10407 unique words (115614 in total)
Loading pretrained embeddings from ./dataset/PMC-w2v.txt...
Found 80 unique characters
Found 9 unique named entity tags
4595 / 4598 / 4840 sentences in train / dev / test.
Saving the mappings to disk...

Loading pretrained embeddings from ./dataset/PMC-w2v.txt...
WARNING: 1 invalid lines
Loaded 2515686 pretrained embeddings.
17963 / 18141 (99.0188%) words have been initialized with pretrained embeddings.
17876 found directly, 46 after lowercasing, 41 after lowercasing + zero.
Compiling...

目前使用的是Att中的CDR数据集进行训练的。

3.使用tagger和chemdner_pubmed_drug.word2vec_model_token4_d50词向量

猜你喜欢

命令行中使用adb安装apk「建议收藏」
无栈协程(上)
Web多媒体笔记
JavaScript 函数
cdr和ps的区别有哪些 cdr和ps哪个难学
远程登录虚拟机Linux：轻松解决难题（远程登录虚拟机linux）
探索Linux系统下进程的端口号（查看linux进程端口号）
机制Java使用Redis实现数据过期机制（redisjava过期）
【Android OpenCV】Visual Studio 创建支持 OpenCV 库的 CMake 工程 ① ( 下载 OpenCV 库 | Windows 中安装 OpenCV 库 )
重新认识phparray_merge函数
【Android 逆向】Android 权限 ( 查看内存信息 | 查看 CPU 信息 | 查看电池信息 | 查看账户信息 | 查看 Activity 信息 | 查看 Package 信息 )
MySQL中的FRM文件保存表结构的重要文件格式（mysql中frm文件）
js获取图片长和宽度的代码
MySQL表无法展示怎么办（mysql不能展示表）
Linux在Win8下的安装之路（win8下安装linux）
驱动开发：内核中实现Dump进程转储
linux文件的创建与扫描,Linux系统quotacheck命令：扫描文件系统并建立Quota记录文件…

相关主题

记录贴
加分记录
增加记录
记录原理
vue记录
linux记录
shell记录
最近的记录

zl程序教程

当前栏目

跑实验记录一

1.使用tagger&wikipedia-pubmed-and-PMC-w2v词向量

2.使用tagger&PMC-w2v词向量

3.使用tagger和chemdner_pubmed_drug.word2vec_model_token4_d50词向量

相关文章