【数据】如何用Rselenium在pubmed上Get文章信息(1):环境搭建
数据 如何 环境 搭建 信息 文章 get PubMed
2023-06-13 09:15:24 时间
从网站上下载的原始表格,没有单位信息。但根据我们可以根据上面的DOI和Title去pubmed上搜索获取单位信息,126篇一个个搜索复制粘贴,这样简单繁琐的事情计算机来做是最好的。在这里我想用三次内容讲一下我是如何一步一步Get内容。
原理介绍
简单的说就是在R语言环境中,建立一个虚拟的Foxfire浏览器。这个Rselenium可以模拟我们操作适合的动作,比如鼠标指向网页的某个地方,输入内容,点击某个地方,等等。
环境搭建
1、硬件信息
iMac(MacOS Catalina)
2、软件安装
Rstudio(R 3.5.2):安装过程请问百度
Docker
下载地址1:
https://download.docker.com/mac/stable/Docker.dmg
下载地址2:
https://pan.baidu.com/s/1jElUkiD3xMvgL5AtjFRlyw
安装过程:
a.双击Docker.dmg
b.将Docker拖进应用程序中
c.双击点开图标
安装Foxfire镜像,打开Mac自带终端
sudo docker run -d -p 4445:4444 selenium/standalone-firefox:2.53.0
检查是否已经运行Foxfire镜像
sudo docker ps
这里需要注意Mac运行sudo需要输入用户名密码,在终端界面输入密码的时候是不会显示****的。
打开端口
设置-->安全与隐私-->防火墙关闭
打开Rstudio
install.packages("RSelenium")
library(RSelenium)
remDr <- remoteDriver(port=4445L,browserName = "firefox")
remDr$open()
看到上面的界面恭喜你已经成功的打开了一个虚拟的Foxfire浏览器,知道大家面对这样的界面可能会陌生,我们打开一个链接看看。
gurl<-"https://www.bing.com"remDr$navigate(gurl)remDr$screenshot(display = TRUE)
这样是不是熟悉了很多了呢?
作业
大家可以按照上面的内容自己练习搭建环境,随便输入什么个网址留一个截屏,在公众号回复自己的作业。提交作业人数到10人以上会继续下面的课程。
相关文章
- 数据透视表上线!如何在纯前端实现这个强大的数据分析功能?
- XGBoost如何用2GB内存训练100GB的数据!
- 晋级!Tapdata 实时主数据服务平台成功挺进创新南山2022“创业之星”决赛
- R语言LME4混合效应模型研究教师的受欢迎程度|附代码数据
- ganglia安装教程(centos7)详解大数据
- rvm,ruby的安装详解大数据
- MySQL如何防止重复提交数据(mysql重复提交数据)
- MongoDB中的IN操作:更高效的数据查询(mongodbin查询)
- Oracle如何获取第一条数据(oracle取第一条数据)
- MySQL表格导入导出使用教程:快速学会如何迁移数据库数据(mysql导出导入表)
- Oracle数据迁移脚本操作指南(oracle数据迁移脚本)
- 如何在 MySQL 中查询特定年份的数据?(mysql查询年份)
- 服务SQL Server 云端服务:利用云技术实现数据连接(sqlserver云端)
- 的优势Redis查询大量数据的绝佳之选(查询大量数据时Redis)
- 如何深入理解Redis中的数据(如何看redis中的数据)
- Redis面试学习如何利用AOF记录数据(redis面试题aof)
- 构建Redis集群如何运用数据槽(redis集群数据槽)
- 数据Oracle中如何删除单行数据(oracle中删除一行)
- Oracle中两张表数据合并策略(oracle中两张表合并)
- 如何使用Redis实现高并发插入数据(redis高并发插入数据)
- 明晚8点|360数科首席科学家张家兴:银行数据AI融合中台,如何跨越技术与业务间的天堑
- asptextbox获取显示mysql数据示例代码
- Asp.net导出Excel/Csv文本格式数据的方法