《中国人工智能学会通讯》——12.39 众包机器协同技术介绍
12.39 众包机器协同技术介绍
众包机器协同技术的核心想法是众包任务选择,即在一定预算约束下,选择最有“收益”的任务分配给众包工人进行求解。具体来讲,由于存在大量的 HTML 表格,而金钱上的预算又是有限的,假设为 k,能否精心挑选最有“收益”的 k 个表格中的列,让众包将它链接到知识库的概念上。剩余的列可以通过机器的方法,如基于文本相似性或图结构相似性进行匹配,或基于众包答案进行推理。
不难看出,众包机器协同技术的核心挑战在于如何定义“收益”,以及如何选出最有收益的 k 个HTML 表格的列。这里给出解决这些问题的基本想法,具体的技术介绍见文献 [33]。具体而言,有关表格列的收益考虑两方面因素:
● 任务的难度:如果一个任务对于机器来讲比较难,则应优先分配给众包解答。这里的“难度”反映了单纯依赖机器匹配的歧义程度。以图 6 为例,上面的一列机器以较大概率(0.95)认为是电影,而下面的一列机器则比较含糊,歧义性强。直观上讲,下面的列对于机器的难度更大。基于这一想法,提出了使用信息熵度量难度的方法。
● 任务的推理能力:很多时候,如果众包解决了某些任务,可以帮助推断其他任务的答案。图 7给出了两种推理示意:① 左侧是表内推理。如果众包确定了表格的第二列是电影导演,那第一列是电影名称的可能性就提升了。② 右侧是表间推理。如果众包判断了一列的类型,与它相似的列对应到同一类型的可能性就提升了。基于这一想法,提出了基于概率的任务推理模型。
基于上述因素,提出了任务收益(Utility)模型,并证明了挑选整体收益最大的 k 个任务这一问题属于 NP 难问题。为此,提出了一种有效的近似算法,并证明了该算法的近似比是 1 - 1/e(其中 e 为自然对数)。当众包返回 k 个任务的答案后,再根据前面介绍的表内和表间推理其它任务的答案。
【特朗普悍然给中国高科技加税】中国通讯、半导体等遭精准打压,美国用AI算出1300项加税商品 美国贸易代表办公室(USTR)昨天公布了拟加征关税的中国商品清单,这些商品多达1300种商品,计划加征25%的关税,其中,包含大量的半导体产业商品。值得注意的是,在精准打击中国制造2025的路上,美国使用了计算机算法挑选出这1300中商品。
《中国人工智能学会通讯》——12.49 结束语 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第12章,第12.49节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。
《中国人工智能学会通讯》——12.48 混合型数据聚类算法 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第12章,第12.48节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。
《中国人工智能学会通讯》——6.11 链接数据技术 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第6章,第6.11节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。
《中国人工智能学会通讯》——12.47 分类型数据聚类有效性 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第12章,第12.47节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。
《中国人工智能学会通讯》——12.46 分类型数据流聚类算法 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第12章,第12.46节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。
《中国人工智能学会通讯》——12.44 分类型数据的定义 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第12章,第12.44节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。
《中国人工智能学会通讯》——6.10 链接数据实践 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第6章,第6.10节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。
相关文章
- 分析师机构发布中国低代码平台现状分析报告,华为云AppCube为数字化转型加码
- 热火的智能投顾,在中国也许只是附庸的命
- 开房有风险?黑客组织“暗黑客栈”盯上中国高管
- Gartner陈勇:中国企业更积极探索双模IT
- AMD与天津海光合资 意欲成为中国服务器玩家
- Gartner:新型交付模式所引发的中国数字业务蝴蝶效应
- 《中国人工智能学会通讯》——6.18 文本情感分析 :让机器读懂人类情感
- 中国人工智能学会通讯——人工智能在各医学亚专科的发展现状及趋势 1.5 人工智能在各医学亚专科应用的局限性
- 中国人工智能学会通讯——无人驾驶的图灵测试
- 《中国人工智能学会通讯》——8.19 多目标优化中的机器学习
- 中国人工智能学会通讯——AI如何深度应用于消费金融的风控决策 1.3 另一方面,机器学习模型的自动训练和实时性,可以大幅度提高预测信用评分准确性。
- 中国人工智能学会通讯——Unsupervised Early Stage Investment
- 《中国人工智能学会通讯》——11.23 人的视觉成长过程
- 中国人工智能学会通讯——人类作为“情感机器”——效用函数、情绪和社会偏好
- 改写数据库历史的中国人
- 中国人工智能学会通讯——机器学习在商务智能中的创新应用
- 中国人工智能学会通讯——机器学习在商务智能中的创新应用 1.3 结构化的知识
- 中国人工智能学会通讯——构建强健的人工智能:原因及方式 1. 针对不确定性的决策
- 以色列机器人公司Roborteam进军中国市场, 要做改变生活的智能家庭“好帮手”
- 从源头重塑整个机器视觉行业,这家中国公司要搞事情