zl程序教程

您现在的位置是:首页 >  IT要闻

当前栏目

如何从900万长尾中找到下一个爆点

2023-03-07 09:50:28 时间

与人的经济地位一样,社交媒体中受欢迎的内容由于得到广泛传播,只会越来越受欢迎。比如,一个图像的流行并不一定象征着其质量过硬,某些大受欢迎的内容有着不佳的质量。但想找到高质量却不受欢迎的内容就有点困难了。


这是因为流行性遵循一个幂次定律:大部分注意力都集中在一小部分的内容上,而只有一小部分注意力放到了其余绝大多数的内容上。图片共享网站Flickr有约2亿张照片,其中1.66亿张只有五个及以下的人喜欢。


在不受欢迎的长尾效应中一定藏有许多摄影佳作。但如何找到它们呢?


意大利都灵大学的研究人员就找到了方法,他们训练机器视觉算法识别美,然后让它搜寻Flickr中的长尾图片,找到没人注意的佳作。


他们首先从Flickr数据库入手,收集大众关于其中10000张图片审美标准的意见,包括受欢迎和不受欢迎的图像,主题分为人、自然、动物以及城市四类。图片质量由高到低分五个等级,每个图像至少由5人评定。这个过程会生成每种类别图像的基本标准。


接下来,团队使用数据集开发了CrowdBeauty机器视觉系统,识别每一类图像。为做到这一点,算法运用一些准则来分析每一张图片,如其参照物、亮度、色彩、图片本身的布局特点。


算法会学习这些标准如何影响最终的审美评价,之后它会经过从未出现过的照片的测试。结果十分准确,特别是在动物和城市照片上。

最后,CrowdBeauty对Flickr上的900多万图像进行了分析,以挑选出还没有流行起来的漂亮图片。


结果令人印象深刻,CrowdBeauty找出了很多美丽的照片,在受欢迎程度上,这些照片与已经很受喜欢的图片不相上下,好评度仅低了1.5%。

0?wx_fmt=png

左边是不受欢迎的图片,中间是受欢迎图片,右边是CrowdBeauty选出的图片


这立即引发了各种应用程序产生的可能性,其中一个想法是利用CrowdBeauty找到还没有流行起来的美丽的图片。换句话说,CrowdBeauty有可能通过突出被忽略但有才华的人,使图片分享平台民主化。


如果你自认为很有才华却没得到赏识,可以等着CrowdBeauty来发现你。


原文发布时间为:2015-05-26

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号