zl程序教程

您现在的位置是:首页 >  其他

当前栏目

《中国人工智能学会通讯》——12.49 结束语

中国人工智能 学会 通讯
2023-09-27 14:27:07 时间
本节书摘来自CCAI《中国人工智能学会通讯》一书中的第12章,第12.49节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。
12.49 结束语

近年来,分类型数据的聚类分析技术已经获得了长足的发展,在市场营销[43] 、生物信息学 [44-45] 、软件系统分析[46]等领域得到了广泛的应用。分类型数据的聚类算法也成为聚类集成学习的一种有效工具[47] 。而如此广泛的应用又吸引了越来越多的研究者的兴趣[48-49] ,推动了分类型数据聚类的进一步发展。

我们认为,在未来关于分类型数据聚类有如下问题值得进一步研究与思考。

(1) 分类型集值数据聚类算法:通常分类型数据中一个对象在每个分类变量上仅有一个属性值。在实际应用中,一些分类变量常常有多个属性值,称为集值数据。比如一个客户的性别变量是单个属性值,而头衔和地址变量常常有多个属性值。如何设计集值数据聚类的有效算法将是一个非常挑战性的工作。

(2) 大规模分类型数据聚类算法:规模性是分类型数据聚类算法面临的一个重要问题。分类型数据的规模性主要体现在样本规模的海量性和特征规模的高维性两个方面。抽样方法可以作为一种提高大规模数据计算效率的有效策略。如何建立合理的抽样策略能够保持数据的整体特性是大规模数据聚类的一个重要问题。针对分类型数据的高维性,如何进行特征选择与样本聚类的互学习,是一个值得探索的方向。

(3) 分类型数据可视化:分类型数据由于缺乏几何特性,不能像数值型数据直观地在几何空间进行可视化展示。分类型数据的可视化大多数是通过计算对象两两之间的距离,然后变换到二维空间进行展示。由于分类型数据的可视化常常计算的是对象之间的相对距离,因此不同分布的数据有可能出现在同一空间的相同位置,如何在同一空间可视化不同分布的数据仍然是一个值得关注的问题。


【特朗普悍然给中国高科技加税】中国通讯、半导体等遭精准打压,美国用AI算出1300项加税商品 美国贸易代表办公室(USTR)昨天公布了拟加征关税的中国商品清单,这些商品多达1300种商品,计划加征25%的关税,其中,包含大量的半导体产业商品。值得注意的是,在精准打击中国制造2025的路上,美国使用了计算机算法挑选出这1300中商品。
《中国人工智能学会通讯》——12.48 混合型数据聚类算法 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第12章,第12.48节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。
《中国人工智能学会通讯》——6.11 链接数据技术 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第6章,第6.11节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。
《中国人工智能学会通讯》——12.47 分类型数据聚类有效性 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第12章,第12.47节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。
《中国人工智能学会通讯》——12.46 分类型数据流聚类算法 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第12章,第12.46节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。
《中国人工智能学会通讯》——12.44 分类型数据的定义 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第12章,第12.44节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。
《中国人工智能学会通讯》——6.10 链接数据实践 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第6章,第6.10节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。