大数据文本分析的应用场景有哪些?
https://www.pmcaff.com/discuss/index/480966354177088?from=related&pmc_param%5Bentry_id%5D=1000000000167873
自问自答一发。之前写过2篇相关的文章:
【数据运营】在运营中,为什么文本分析远比数值型分析重要?(上)
【数据运营】在运营中,为什么文本分析远比数值型分析重要?一个实际案例,五点分析(下)
除了上面那几种应用,这种基于大数据的文本分析还有如下实际应用:
1 传播分析
检索对象在传播趋势和传播渠道上的分析。
- 传播走势
- 传播渠道
2 情感分析
情感分析指的是对文本中情感的倾向性和评价对象进行提取的过程。
基于上百万条社交网络平衡语料和数十万条新闻平衡语料的机器学习模型,结合自主开发的半监督学习技术,正负面情感分析准确度达到80%以上,可以轻松的识别网民对于某一检索对象的好恶倾向,最直接的应用就是品牌口碑检测领域。
3 信息分类
文本信息分类将文本按照预设的分类体系进行自动区分。常见的商业应用前景有:
通过社交网络挖掘商业情报和潜在销售机会;
- 企业内文本数据分析;
- 海量数据筛选;
- 资讯分类;
- 自动标签预测等。
4 典型意见提取
- 微博评论典型意见
- 网民典型评论
典型意见引擎将消费者意见进行单句级别的语义聚合,提取出有代表性的意见。常见的商业应用前景有:
- 消费者调研;
- 电商点评分析;
- 社会热点事件的意见整理。
5 文本聚类
相似文本聚类指的是机器自动对给定的文本进行话题聚类,将语义上相似的内容归为一类。常见的商业应用前景有:
- 海量文档、资讯的整理;
- 话题级别的统计分析。
6 关键词抽取
- 文章关键词抽取
- 用户评论关键词抽取
关键词提取引擎从一篇或多篇文本中提取出有代表性的关键词。关键词提取技术综合考虑词语在文本中的频率,和词语在千万级背景数据中的频率,选择出最具有代表性的关键词并给出相应权重。
可以使用户在如恒河沙数的文本数据中提炼出有价值的信息,节省阅读时间。
7 语义网络分析、知识图谱
通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法引入文本数据分析领域,并结合共现分析手段,可视化语义网络呈现各类文本/信息之间的内在相关关系,时间维度上的动态关系(传播路径)。
- 知识图谱网络
- 传播网络
- 商品关联网络
1.锤子新发布的功能“BigBang”分词功能。也算是大数据文本分析的应用,通过大数据文本分析,才能实现对词义的准确分析,从而做到更准确的分词。
2.网络舆情监控。这也当然是大数据文本分析的产物,提取网络文本的关键词,组成语义网络之后分析语义倾向,达到舆情监控的目的。
3.社交网络情绪监控。相信大家都看到了很多网络上直播自杀、发自杀预报的这样的事情,和舆情监控相同,就是对个人社交网络的信息进行监控,通过文本分析和机器学习的技术,分析出此人的情绪状况,一旦出现极端的负面情绪,可以通过一定的措施避免极端行为的发生。
4.证券行业投资情报获取。可以基于积累的大数据做进一步深层次的分析与挖掘,整合各社交网络、证券讨论社区群体信息提取加工成有价值的证券投资情报,对证券投资行为做辅助分析和预报。
相关文章
- 移动混合应用HTML5数据查询优化
- 从零开始入门 K8s | 应用存储和持久化数据卷:核心知识
- 13个应用案例,讲述最真实的大数据故事
- 分析了10个垂直行业后,告诉你大数据应用面临哪些挑战
- 大数据在信贷行业的营销与模型应用案例
- 分析了10个垂直行业后,告诉你大数据应用面临哪些挑战
- Knockout应用开发指南 第六章:加载或保存JSON数据
- 用好阿里云分析型数据库大存储实例,大幅降低大数据应用成本
- 开源大数据技术专场(上午):Spark、HBase、JStorm应用与实践
- 阿里小Ai之父解析阿里大数据在新兴行业的应用
- SAP UI5 应用的 OData 元数据请求的发送原理分析
- 使用PHP应用查询SAP HANA Express Edition里的数据
- 如何使用Prometheus采集SAP ABAP Netweaver的应用日志数据
- SAP UI5 应用开发教程之七十四 - SAP UI5 应用使用 OData V4 显示 Table 表格数据的一个陷阱试读版
- 使用 mock 数据在本地运行 SAP Fiori Elements 应用的工作原理
- 使用 Dynatrace 对 Node.js 应用的性能数据进行分析
- XAI之GS:全局代理(Global Surrogate,对黑盒机器学习执行模型可解释性的技术)的简介、常用工具包、案例应用之详细攻略
- DataScience:数据预处理/特征工程之两大类别特征、四大数据类型(数值型/类别型/字符串型/时间型简介、代码实现(数值型特征离散化/类别型特征编码数字化)、案例应用之详细攻略
- M3U8格式讲解及实际应用分析
- 基于用户角色的数据库智能监控系统应用场景分析
- 中科磐云国赛之Web安全应用全过程解析(保姆级)
- Android 后台应用保活、消息推送
- 完整性度量架构(IMA)介绍与分析——当应用程序运行、动态链接库加载、内核模块加载时,将用到的代码和关键数据(如配置文件和结构化数据)做一次hash比较的感觉
- 华为云服务-应用部署2-创建环境到创建应用
- Oracle 技能强化 Part 13 应用案例的分析学习