多类分类法在法律案件中的重要句子识别(CS)
自然语言处理(NLP)的发展正以实际应用和学术兴趣的形式在各个领域传播。从本质上讲,法律领域包含大量文本格式的数据。因此,需要应用自然语言处理来满足该领域的分析需求。对于法律专业人士来说,在法律案件中识别重要的句子、事实和论据是一项非常乏味的工作。在本研究中,我们从案件中主要当事人的角度,探讨了句子嵌入的多类分类,以识别法律案件中的重要句子。此外,为了提高直接使用类别交叉熵损失的准确性,定义了任务特定的损失函数。
原文题目:Important Sentence Identification in Legal Cases Using Multi-Class Classification
原文:The advancement of Natural Language Processing (NLP) is spreading through various domains in forms of practical applications and academic interests. Inherently, the legal domain contains a vast amount of data in text format. Therefore it requires the application of NLP to cater to the analytically demanding needs of the domain. Identifying important sentences, facts and arguments in a legal case is such a tedious task for legal professionals. In this research we explore the usage of sentence embeddings for multi-class classification to identify important sentences in a legal case, in the perspective of the main parties present in the case. In addition, a task-specific loss function is defined in order to improve the accuracy restricted by the straightforward use of categorical cross entropy loss.
相关文章
- 个人APP开发者现状:处于过渡阶段 向团队发展
- 聚焦数博会——软通云网:运营城市大数据“玩儿转”智慧城市
- 工程机械领域中联重科工业大数据应用实践
- 干货|大数据应用:前端模块化开发的价值
- 4大案例分析金融机构的大数据应用
- 大数据到底怎么学:数据科学概论与大数据学习误区
- 大数据+制造业怎么做?请看这6大应用场景
- 全栈必备 面向数据的架构
- 企业应用大数据的三重境界:数据·分析·成果
- 大数据道场(HDP SandBox) 初探
- 大数据在预测性维修中的应用
- Hadoop环境中管理大数据存储八大技巧
- 创业公司做数据分析(五)微信分享追踪系统
- 飞贷CTO陈定玮:两次重大商业模式改造背后的技术创新
- 解读Wikibon 2017年大数据分析预测报告
- “网管”必备的五大网络数据分析工具
- 2017年大数据产业发展呈六大趋势
- 一个资深数据人对数据挖掘解读
- 电商社交数据在大数据风控的应用实践
- 甲骨文预测:2017年大数据的变化趋势