基于事理图谱的辅助判案技术的研究与实现
这是一篇关于预训练模型,事理图谱,辅助判案,罪名预测,刑期预测的论文, 主要内容为随着人工智能技术的发展,各个领域都利用人工智能提高了自动化水平和效率。司法领域也不例外,我国积极推进“智慧法院”建设,致力于用科技手段提高司法机关办案水平,进一步确保司法的公平性和效率,同时也为人民群众普法用法提供帮助。因此,研究人工智能在司法领域的应用具有重要的社会价值。本课题的研究内容主要包括三部分:1、基于预训练模型提取特征的混合深度罪名预测模型。受益于预训练模型新颖的模型架构,训练方式和海量语料支持,预训练模型在自然语言处理任务上获得了优异的结果,因此本课题使用多种预训练模型对法律判决书文本进行特征提取,提取到的特征输入基于CNN以及LSTM的分类模型中对判决书进行罪名预测。本课题将预训练模型提取的特征和传统模型提取的特征做对比,基于预训练模型的特征明显超过传统模型。2、基于刑事判决书的事理图谱构建和刑期预测模型。传统知识图谱大多关注实体的属性和关系知识,而忽视了事件之间的演化规律,事理图谱弥补了这一点,事理图谱中的节点为事件,边为事件之间的演化关系。本课题通过对判决书的文本进行预处理,事件抽取,事件关系抽取完成了事理图谱的构建。通过计算节点之间相似度的方法完成刑期预测。3、基于事理图谱的辅助判决方案生成系统。在本课题提出的两个模型的基础上,使用PyQt实现一个可视化系统,接收案情描述作为输入,输出包含罪名和刑期预测的辅助判决方案结果,给司法人员和人民群众提供法律辅助。
基于罪名预测的相似案件推荐——以侵犯财产罪为例
这是一篇关于类案推荐,罪名预测,深度学习的论文, 主要内容为依法治国是我国的基本国策,近年以来法制建设不断推进,人们更加习惯于将问题诉诸法律,各类诉讼案件不断增加,部分法院存在审判工作压力大、审理周期长、人员紧缺等问题,在司法程序提升处理案件的效率显得尤为重要。并且随着我国经济社会不断发展,社会财富逐渐积累,中等收入群体日益扩大,人们对财产安全和稳定的需求也越来越迫切,需要对财富足够的安全感以稳定预期。因此精准的相似案例推荐对于法律判决有着重要作用,是司法智能化的重要环节,对依法保护人民财产安全有重要作用。本文首先介绍了论文涉及的相关理论与方法,包括财产犯罪的相关概念、深度学习模型以及推荐系统方法。其次使用BERT-LSTM模型解决案件的分类问题,以侵犯财产罪的法律判决书为研究对象,对数据进行类别平衡与降噪处理后,通过BERTLSTM模型对进行快速有效地对案件进行分类,完成罪名预测任务。实验结果表明,罪名预测的精确率为0.9448,宏平均F1分数为0.9401,精确率为0.9398,召回率为0.9411,在罪名预测任务上得到了较好的结果。再次以侵犯财产罪的法律判决书为研究对象,从法律要素角度,提出了相似案件的评价指标,将案件的相似性分为5个等级;最后以此为评价指标在第二章罪名预测模型的基础上进行Sentence-BERT的微调,由此得到法律案件事实描述的向量化语义表征,通过余弦相似度获得最终相似度并生成推荐列表。实验结果表明,由Sentence-BERT句向量进而计算相似度得到的推荐列表在Spearman秩相关系数上达到了0.7621,远高于基线模型,在NDCG@10指标达到0.9261,对比基线模型,NDCG指标整体提升了10%左右;并且分别对于“抢劫”和“敲诈勒索”这两个常见罪名采用示例生成推荐列表,从案件要素和刑期角度,推荐列表中的案件与查询案件相似度较高,生成的推荐列表质量较高,可以满足法律工作者的需求。本文结合使用的BERT-LSTM罪名预测模型与Sentence-BERT句向量表征,构建了基于罪名预测的相似案件推荐,在用BERT-LSTM模型对法律判决书进行罪名预测后,从相同罪名标签的数据库中依据Sentence-BERT进行语义表征和相似度计算,生成top N推荐列表,推荐列表质量较高,可以从法律要素和语义层面生成相似案件列表,推荐给法律工作者需要的案件;本文丰富了法律相似案例推荐的研究,为推荐算法在法律领域的应用提供重要的实证素材。
面向案件文书的罪名预测方法研究
这是一篇关于罪名预测,类别先验Mixup,数据不平衡,均值原型网络的论文, 主要内容为随着人工智能技术的发展以及司法数据的公开,司法领域的人工智能研究与应用受到了广泛关注。罪名预测作为法律判决预测中一个重要子任务,它是司法智能辅助系统的重要组成部分。罪名预测任务根据案情描述和事实预测被告人被判的罪名。罪名预测通常被看作司法领域的文本分类问题,已有方法大多采用深度神经网络构建罪名预测模型,在常见罪名的预测方面取得了很好的效果。然而,已有研究对罪名预测任务中的数据不平衡现象关注较少,导致低频罪名和易混淆罪名预测效果较差。本文面向裁判文书数据开展罪名预测方法研究,从度量学习文本分类和数据增强两个方面改进罪名预测方法。本文主要研究工作包括:(1)针对罪名预测任务中的单罪名情形,本文将均值原型网络引入司法领域的罪名预测这一特定任务中,提出了一种借助均值原型网络实现的罪名预测方法,该方法结合度量学习和Bert构建罪名预测模型,通过移动平均方式集成各罪名的分类原型向量。相比基线模型,该方法的罪名预测F1值提升了5.4%。(2)针对罪名预测存在的类别不平衡问题,本文提出了一种融入类别先验信息的Mixup数据增强策略,有效改进了低频罪名和易混淆罪名的预测性能。该方法首先利用Bi-LSTM和结构化自注意力机制获取案件描述与事实文本的向量表示,在此基础上,通过Mixup数据增强策略在文本向量表示空间中合成伪样本,并利用类别先验使合成样本的标签偏向低频罪名类别,以此来扩增低频罪名训练样本。实验结果表明,与现有方法相比,该方法在准确率、宏精确率、宏召回率和宏F1值上都获得了大幅提升,低频罪名预测的宏F1值提升了13.5%。(3)本文基于提出的预测模型构建了罪名预测原型系统。本文以提出的罪名预测模型为基础,结合Sanic Web开发框架和Vue.js前端框架,开发了基于B/S架构的罪名预测原型系统。
面向案件文书的罪名预测方法研究
这是一篇关于罪名预测,类别先验Mixup,数据不平衡,均值原型网络的论文, 主要内容为随着人工智能技术的发展以及司法数据的公开,司法领域的人工智能研究与应用受到了广泛关注。罪名预测作为法律判决预测中一个重要子任务,它是司法智能辅助系统的重要组成部分。罪名预测任务根据案情描述和事实预测被告人被判的罪名。罪名预测通常被看作司法领域的文本分类问题,已有方法大多采用深度神经网络构建罪名预测模型,在常见罪名的预测方面取得了很好的效果。然而,已有研究对罪名预测任务中的数据不平衡现象关注较少,导致低频罪名和易混淆罪名预测效果较差。本文面向裁判文书数据开展罪名预测方法研究,从度量学习文本分类和数据增强两个方面改进罪名预测方法。本文主要研究工作包括:(1)针对罪名预测任务中的单罪名情形,本文将均值原型网络引入司法领域的罪名预测这一特定任务中,提出了一种借助均值原型网络实现的罪名预测方法,该方法结合度量学习和Bert构建罪名预测模型,通过移动平均方式集成各罪名的分类原型向量。相比基线模型,该方法的罪名预测F1值提升了5.4%。(2)针对罪名预测存在的类别不平衡问题,本文提出了一种融入类别先验信息的Mixup数据增强策略,有效改进了低频罪名和易混淆罪名的预测性能。该方法首先利用Bi-LSTM和结构化自注意力机制获取案件描述与事实文本的向量表示,在此基础上,通过Mixup数据增强策略在文本向量表示空间中合成伪样本,并利用类别先验使合成样本的标签偏向低频罪名类别,以此来扩增低频罪名训练样本。实验结果表明,与现有方法相比,该方法在准确率、宏精确率、宏召回率和宏F1值上都获得了大幅提升,低频罪名预测的宏F1值提升了13.5%。(3)本文基于提出的预测模型构建了罪名预测原型系统。本文以提出的罪名预测模型为基础,结合Sanic Web开发框架和Vue.js前端框架,开发了基于B/S架构的罪名预测原型系统。
基于UniLM生成模型的法律判决预测可解释性研究
这是一篇关于罪名预测,生成模型,K-UniLM,梯度积分,可解释性的论文, 主要内容为随着社会的发展和科技的快速进步,目前网络上已经累计了大量的裁判文书数据资源,这些文书中蕴含着大量的法律知识信息和以往的判例经验信息,若能有效利用这些文书数据可以大大提高司法系统效率,同时为众多没有法律常识的群众提供免费、快捷的司法援助。由于文书数量庞大,种类繁多,如果人工查看和处理会花费大量的人力物力,而自然语言处理(Natural Language Processing,NLP)可以解决很多基于文本数据衍生出的问题。当前自然语言处理方法在法律领域应用最广的是法律判决预测(Legal Judgement Prediction,LJP),但是当前大多数研究仅限于使用并优化模型对结果进行预测,针对模型中的可解释性并没有做更深入的探索,使得模型的解释能力不足,难以在真实的司法场景中使用。同时,也少有研究在模型中融入外部知识,导致模型过度依赖数据。本文针对当前法律判决预测中模型可解释性不强,未很好融入外部知识等问题开展工作,创新性使用微调嵌入知识图谱的文本生成模型对其进行罪名预测分析,使用梯度积分等方法提升模型可解释性。最终结果显示本文提出的知识嵌入模型能够提升原有模型的预测准确率,解释性分析显示该模型具有较强的可解释性,本文研究为未来相关的研究打下基础,同时可以给法律相关从业人士提供较强的判案参考。首先,创新性地使用生成模型来处理法律判决预测中的罪名预测分类任务。本文选定Uni LM作为罪名预测的生成模型,该模型在预训练微调过程中在一定程度上统一了上下游任务,因此效果更好,同时使用起来更加便捷,可解释性相对于其他模型更好。实验结果显示模型在构建的数据集上具有较高的预测准确率,与基线模型相比可以得到生成模型相对于判别模型而言并没有损失较多正确率,验证了使用生成模型处理分类问题是行之有效的。其次,将知识图谱融入Uni LM模型,提升模型推断性能的同时增强其可解释性。由于法律领域包含很多的法律相关知识,目前大部分的模型并没有考虑向模型中融入知识进行推断,导致模型过于依赖数据,因此需要探索相应的将知识融入模型的方法。当前较为主流的知识形式可以以知识图谱形式进行表示,本文参考了K-BERT,在使用的Uni LM生成模型微调过程中融入知识图谱,与原模型对比,在增强其解释性的同时提高了模型的推断效果,实验结果说明了这种在模型微调中嵌入知识图谱的方法切实有效。最后,使用注意力机制和梯度积分的方法对模型进行了可解释性的探索,增强模型的透明程度。针对神经网络运行过程的不透明,解释性较差,难以真正运用到真实法律场景的问题,本文在完成了模型的生成预测之后,引入了注意力机制和梯度积分两种可解释性方法,前者对模型内部的运行机理和信息传递进行分析,后者研究了输入对于输出的贡献特征,通过这两种解释性方法分析增加了模型的透明程度。分析结果可以得到梯度积分方法结合本文选用的生成模型具有良好的可解释性,能够从输入中提取出案情的关键要素,同时与法条进行对比分析时可以得到提取出的关键要素与法条能够相互印证,充分说明了中国“依法治国”的法制特点。最后将罪名预测及梯度积分解释功能封装并上线至可解释性平台,使之能够在网页上快速便捷使用。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码码头 ,原文地址:https://m.bishedaima.com/lunwen/52754.html