如何从900万长尾中找到下一个爆点
与人的经济地位一样,社交媒体中受欢迎的内容由于得到广泛传播,只会越来越受欢迎。比如,一个图像的流行并不一定象征着其质量过硬,某些大受欢迎的内容有着不佳的质量。但想找到高质量却不受欢迎的内容就有点困难了。
这是因为流行性遵循一个幂次定律:大部分注意力都集中在一小部分的内容上,而只有一小部分注意力放到了其余绝大多数的内容上。图片共享网站Flickr有约2亿张照片,其中1.66亿张只有五个及以下的人喜欢。
在不受欢迎的长尾效应中一定藏有许多摄影佳作。但如何找到它们呢?
意大利都灵大学的研究人员就找到了方法,他们训练机器视觉算法识别美,然后让它搜寻Flickr中的长尾图片,找到没人注意的佳作。
他们首先从Flickr数据库入手,收集大众关于其中10000张图片审美标准的意见,包括受欢迎和不受欢迎的图像,主题分为人、自然、动物以及城市四类。图片质量由高到低分五个等级,每个图像至少由5人评定。这个过程会生成每种类别图像的基本标准。
接下来,团队使用数据集开发了CrowdBeauty机器视觉系统,识别每一类图像。为做到这一点,算法运用一些准则来分析每一张图片,如其参照物、亮度、色彩、图片本身的布局特点。
算法会学习这些标准如何影响最终的审美评价,之后它会经过从未出现过的照片的测试。结果十分准确,特别是在动物和城市照片上。
最后,CrowdBeauty对Flickr上的900多万图像进行了分析,以挑选出还没有流行起来的漂亮图片。
结果令人印象深刻,CrowdBeauty找出了很多美丽的照片,在受欢迎程度上,这些照片与已经很受喜欢的图片不相上下,好评度仅低了1.5%。
左边是不受欢迎的图片,中间是受欢迎图片,右边是CrowdBeauty选出的图片
这立即引发了各种应用程序产生的可能性,其中一个想法是利用CrowdBeauty找到还没有流行起来的美丽的图片。换句话说,CrowdBeauty有可能通过突出被忽略但有才华的人,使图片分享平台民主化。
如果你自认为很有才华却没得到赏识,可以等着CrowdBeauty来发现你。
原文发布时间为:2015-05-26
本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号
相关文章
- 发现 Linux SpaceFM 文件管理器的威力
- 夯实数据智能底座 共筑数字经济发展“新基石”
- 五分钟教你使用console.log发布公司的招聘信息
- 微软发布 Windows 11 Beta 预览版 Build 22621.1250 和 22623.1250 (KB5023008)
- Windows 11 学院:在 Windows 11 Build 25290 上如何为文件管理器启用标签页拖拽支持
- 微软Windows 11 Dev 预览版 Build 25290 发布:带来新的开始菜单提醒角标
- 微软正用全屏通知提醒 Windows 10 用户免费升级 Windows 11,要点击 5 次才能退出
- Linux Mint 21.2 将于 6 月发布:改进登录屏幕,优化 Pix 图像管理程序等等
- 字节面试也会问SPI机制?
- 微软正式停售 Windows 10 产品密钥 / 许可证:继续提供 ISO 镜像下载,推荐用户升级 Windows 11
- 用复古电脑程序 Toy CPU 学习低级编程
- Windows 11 新功能泄露:现代音量合成器、实验工具和新的文件管理器
- 微软 Windows 11 文件资源管理器全新设计曝光:UI 迎来大修,整合 Microsoft 365
- 对比Pandas,学习PySpark大数据处理
- 微软宣布为Windows 11 21H2设备开启自动更新到22H2版本
- 互联网都在说降本增效,小红书技术团队是怎么做的?
- 微软将继续提供 Windows 10 ISO 镜像下载,即将停售产品密钥 / 许可证
- 微软宣布为Windows 11 21H2 设备开启自动更新到 22H2 版本
- 面试突击:Properties和Yml有什么区别?
- 微软 Windows 11 Beta 预览版 22621.1245 和 22623.1245 (KB5022358) 发布