雅虎面向研究人员发布大规模机器学习数据集
2023-09-27 14:21:21 时间
据外媒报道,日前,雅虎推出了一个全新的“雅虎新闻推荐(Yahoo News Recommendation)”数据集,它被称为是有史以来对外公布最大的机器学习数据集。雅虎表示,这套数据集主要针对学术研究社团推出,这样他们在研究中再也不需要为无法获得大规模数据集而发愁了。
据悉,公开的数据集包括了1100亿个事件,其在未压缩的状态下总容量达13.5TB。
研究人员可以在数据集中找到匿名用户新闻交互数据等数据,这些数据则都是在去年早几个月从2000万名用户那里收集得到。
在Yahoo News Feed数据集中有来自用户与雅虎多个不同版块的互动数据,如雅虎电影、雅虎新闻、雅虎金融等。
另外,雅虎还在这套数据集中添加了一些人口分布数据,如性别、年龄及地理位置等。雅虎在一份声明中说道:“我们的目标是在大规模机器学习和推荐系统中促进独立研究的发展,并还要帮助在工业和学术研究之间创造一个公平竞争的环境。
【ML】机器学习数据集:sklearn中分类数据集介绍 在机器学习的教程中,我们会看到很多的demo,这些demo都是基于python中自带的数据集。今天我们将介绍sklearn中几个常用的分类预测数据集。本教程使用的sklearn版本是1.0.2。
【ML】机器学习数据集:sklearn中回归数据集介绍 在机器学习的教程中,我们会看到很多的demo,这些demo都是基于python中自带的数据集。今天我们将介绍三个用于回归预测的数据集。
相关文章
- 2017 年 机器学习之数据挖据、数据分析,可视化,ML,DL,NLP等知识记录和总结
- 8-机器学习进阶_自编码器扩展-2-4
- Datalore初体验:JetBrains的云端机器学习开发环境 免费GPU
- 互联网金融时代下机器学习与大数据风控系统
- 深度学习/机器视觉/数字IC/FPGA/算法手撕代码目录总汇
- 机器学习笔记之狄利克雷过程(二)基于标量参数作用的推导过程
- 机器学习笔记之降维(三)从最大投影方差角度观察主成分分析
- 大数据与机器学习:实践方法与行业案例1.1 数据的基本形态
- 大数据与机器学习:实践方法与行业案例.1.3 应用系统
- 大数据与机器学习:实践方法与行业案例.2.2 数据缓冲区
- 大数据与机器学习:实践方法与行业案例.3.5 本章小结
- 小白学数据 | 28张小抄表大放送:Python,R,大数据,机器学习
- 《机器学习与数据科学(基于R的统计学习方法)》——2.3 数据的来源
- 《Python机器学习——预测分析核心算法》——2.6 多类别分类问题:它属于哪种玻璃
- Python数据处理Tips机器学习英文数据集8种算法应用
- 无代码白话版通俗的理解机器学习如何对未知的数据进行预测
- 盘点76个当下全球免费、优质机器学习数据集获取资源
- 《Scala机器学习》一一1.7 总结
- 《Scala机器学习》一一第2章 数据管道和建模
- 《Scala机器学习》一一2.5 数据驱动系统的基本组件
- 【吴恩达机器学习】Week5 编程作业ex4——神经网络学习
- 机器学习和大数据——提高信用卡安全性
- 【玩转数据系列十五】机器学习PAI为你自动写歌词,妈妈再也不用担心我的freestyle了(提供数据、代码)
- 【机器学习】:梯度提升决策树(GBDT)
- 机器学习--线性代数基础
- 机器学习、数据科学、人工智能、深度学习、统计学等的区别