2022微信大数据挑战赛优胜方案总结
2023-06-13 09:14:07 时间
赛题介绍
- 比赛名称:微信多模态短视频
- 比赛页面:https://algo.weixin.qq.com/
- 比赛类型:多模态分类
多模态短视频分类是视频理解领域的基础技术之一,在安全审核、推荐运营、内容搜索等领域有着十分非常广泛的应用。一条短视频中通常包含有三种模态信息,即文本、音频、视频,它们在不同语义层面的分类体系中发挥着相互促进和补充的重要作用。
本赛题要求参赛队伍基于微信视频号短视频数据以及对应的分类标签标注,采用合理的机器学习技术对指定的测试短视频进行分类预测。
赛题数据
比赛分为初赛和复赛两个阶段:
- 初赛阶段提供百万量级的无标注数据和十万量级的有标注数据用于训练;
- 复赛阶段训练数据和初赛相同,主要区别是初赛阶段只提供视频抽帧特征,而复赛阶段提供视频抽帧原始图像。
初赛阶段所有训练数据对参赛队伍开放下载;复赛阶段的训练数据为闭源数据,参赛队伍在腾讯云TI-ONE平台完成训练。
数据集
比赛提供的数据集有三个类别:无标注训练数据集、有标注训练数据集、测试数据集。各类数据集具体包含字段如下表所示。
字段 | 初赛 | 复赛 | ||||
---|---|---|---|---|---|---|
训练数据集 | 测试数据集 | 训练数据集 | 测试数据集 | |||
无标注 | 有标注 | 无标注 | 有标注 | |||
id | √ | √ | √ | √ | √ | √ |
category_id | × | √ | × | × | √ | × |
title | √ | √ | √ | √ | √ | √ |
frames_feature | √ | √ | √ | × | × | × |
frames | × | × | × | √ | √ | √ |
asr | √ | √ | √ | √ | √ | √ |
ocr | √ | √ | √ | √ | √ | √ |
评估标准
分类的评估指标采用F1,由于有多个类别,而且类别不均衡,所以同时采用F1 micro和F1 macro,取平均值。同时,分类体系包含一级分类和二级分类,在评测中会分别计算并取平均值。
优胜选手分享
苟进决赛
冲冲冲
抱朴子
机器不学习啦
Warriors
蜜度信息
相关文章
- java个人微信消息接收_java接口接收json数据
- 草料二维码提交数据自动通知企业微信
- 【愚公系列】2022年11月 微信小程序-全局数据共享
- 基于微信小程序云开(统计学生信息并导出excel)
- 微信大数据挑战赛:第1周周星星方案汇总
- python自动化高效办公第二期,带你项目实战【二】{数据可视化、发送邮件(定时任务监控)、python聊天机器人(基于微信、钉钉)}
- 我的个人微信也迅速接入了 ChatGPT
- 微信小程序 从后台接口接收数据并把数据传给要跳转的页面–小程序中页面传值数据不完整(mpvue)
- 微信小程序阻止事件冒泡
- 情人节微信红包数据公布,你离海王与海后有多远...
- 5300亿笔!微信支付宝们火了 央行重磅数据刚刚发布
- 扫描支付数据使用Redis轻松获取微信收款扫描支付信息(redis读取微信收款)
- 能理解聊天记录的微信机器人 (一)
- 微信小程序“真相大白”,一场有关技术的价值观的讨论|唯物周刊
- 解密微信对话开放平台和腾讯小微