推荐一份R语言里文本挖掘和tidymodel包建模的参考资料
2023-04-18 16:53:15 时间
参考资料的链接
https://juliasilge.com/blog/
这个博客的作者是
image.png
应该是位大牛,她的博客里主要介绍的内容是文本挖掘和tidymodel这个R包做模型的一些内容,这个作者是不是tidymodel这个R包的作者呀?
她的github主页链接 https://github.com/juliasilge
博客内容很多,最新的更新时间是 12月15号,应该是一直在保持更新
博客里有数据和R语言的代码,我们完全可以跟着她的数据和代码重复她博客的内容。这里有一个问题是她的数据链接都是 https://raw.githubusercontent.com/ 这种形式的,我们在国内可能访问不到这个数据,生信技能树有推文介绍解决办法 ,对应的推文名称是 什么,GitHub网站的文件你无法读取
,他的解决办法是把https://raw.githubusercontent.com/
这个链接对应的换成 https://cdn.jsdelivr.net/gh/
这个就可以了,可以分别在R语言里试试如下命令
readr::read_csv('https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2020/2020-07-28/penguins.csv')
这个命令读取的时候可能会遇到网络的问题
readr::read_csv('https://cdn.jsdelivr.net/gh/rfordatascience/tidytuesday@master/data/2020/2020-07-28/penguins.csv')
这个就读取正常了
她的博客不光有文字内容,还有对应的视频版,但是视频版是在youtube,国内看的话可能需要访问国外网站
image.png
每篇博客的内容都不长,可以自己每天都花时间看看
相关文章
- Linux的watch命令--周期性执行某个命令
- 【译】软件开发的规律和原则
- Elasticsearch教程 | 第三篇:审计设置
- 设计模式系列—备忘录模式
- 「算法与数据结构」二叉树之美
- 干货分享:六大招教你有效进行代码 Review
- 队列实现栈的3种方法,全都击败了100%的用户!
- DotNET 5中的gRPC性能改进,超Golang和C++
- 函数式编程是未来的优秀编码范例吗?
- LRU(Least Recently Used)缓存算法的实现
- 聊一聊 软件系统中的“热力学第二定律”
- 推荐系统经典模型Wide & Deep
- 有哪些可以提升编程技能的好书值得推荐?
- 在Scrapy中如何利用CSS选择器从网页中采集目标数据——详细教程(上篇)
- 提高10倍开发效率的10个Chrome插件,你安装了几个?
- 东汉末年,他们把「服务雪崩」玩到了极致
- DevOps心态的5个基本价值
- 华为洪方明:中国制造业数字化转型迫在眉睫,亟需加速发展制造服务业
- 面试问到了K8S原理,花5分钟来总结下,以后再也不怕了
- 如何在整个DevOps中建立分层安全?