9篇关于事理图谱的计算机毕业论文

今天分享的是关于事理图谱的9篇计算机毕业论文范文, 如果你的论文涉及到事理图谱等主题,本文能够帮助到你

基于事理图谱的事件故事线生成及演化推理方法研究

这是一篇关于故事线,知识图谱,事理图谱,事件推理,注意力机制的论文, 主要内容为近年来,随着信息技术的不断发展,互联网上的各种信息越来越多。当我们搜索某一事件时,往往会淹没在海量相关的新闻文本中,无法从中直接获取有效信息从而把握事件的主要发展脉络。如果想快速、全面的了解该事件,就需要从海量新闻文本中提取出事件相关的信息,然后利用这些信息构建事件的发展过程,并推理事件可能的发展趋势。因此,如何从新闻文本中抽取事件信息,刻画事件的演化过程,并推理事件未来可能的发展情况,已经成为自然语言处理领域的一个热点问题,同时也是一个具有很多现实应用场景的问题。本文针对上述问题中的两个关键任务:信息抽取和事件推理开展研究,完成了以下工作:首先,近年来新兴的故事线生成方法是描述事件演化过程中的一种有效方法。与时间线生成等方法相比,故事线可以捕捉事件的主体结构,但是目前的研究中大多是用从新闻文本中抽取的摘要作为故事线的节点,这种形式的故事线可读性较差,并且对于地点信息的抽取不够准确。本文提出一种基于知识图谱的故事线构建方法,以事件的三元组作为故事线的节点,相对于传统的摘要故事线,以三元组形式作为节点可读性更强,而且在信息抽取过程中会将地点实体抽取出来,用其来指导局部故事线的构建,准确度更高。同时,随着各种预训练语言模型的提出,传统静态词向量的一些劣势可以被改进,例如一词多义的问题。为了获得带有语义信息的动态词向量,本文在文本预处理阶段采用了预训练模型BERT用于生成更好的词向量。其次,在事件推理模型中,为了得到更好的事件表示,本文提出了基于自注意力机制的事件表征层,这样不仅能够得到该事件本身的表征,还能引入其他事件片段的表征,两者结合使得模型可以捕捉更多的有效事件信息。最后,本文以台风事件为背景,收集了大量相关事件新闻,构建事件数据库,并对本文提出的故事线生成模型和基于事理图谱的事件推理模型进行实验验证。实验结果表明了所提模型和方法的有效性。综上,本文基于深度学习、事理图谱等方法构建了一个文本事件分析的完整的流程和事件分析方法,可以有效缓解网络信息过载等问题,同时还可以应用于各种事件信息挖掘任务中。

面向热点话题的因果事理图谱构建及应用研究

这是一篇关于事理图谱,事件抽取,事件关系抽取,事件存储的论文, 主要内容为随着互联网的高速发展及移动设备的普及,人们获取热点话题的途径越来越多,每隔一段时间都会发生当下讨论度最高的话题。各个平台的报道消息使得人们检索话题中关键信息的时间增加,对于一起事件的前因后果及防护措施没有一个直观的表达。话题事件是实时的动态数据,会随着时间、地点、人物等因素下会触发不同的事件结果,研究事件间的因果逻辑是自然文本处理的一项难题。近些年知识图谱技术得到了广泛的研究,但着重解决的是静态数据问题。对于动态数据的研究提出了事理图谱概念,它是一种事理逻辑知识库,描述事件间的演化规律。针对以上问题,本文面向热点话题构建因果事理图谱,利用事件抽取技术抽取出事件的元素,利用事件关系抽取技术获得事件间的逻辑关系,在此基础上实现话题查询与智能问答功能,主要完成工作如下:提出了热点话题的事理图谱构建框架,首先数据源的获取采用Scrapy爬虫框架,以时间降序排序。基于热点话题标题采用Kmeans无监督算法将数据源分为几类话题。定义事件的元素由事件参与者、事件触发词、事件发生地点、事件发生时间、事件发生程度组成。其次采用序列标注方法,将事件抽取研究转化为序列标注任务,实现从热点话题事件中抽取事件元素。实验对比三种不同序列标注模型,发现基于BERT+Bi-LSTM+Attention+CRF模型的性能最好,在测试集上F1的值达到了91%。接着事件关系抽取研究,本文分别从基于依存句法分析显式因果关系抽取,基于事件句及事件对的隐式关系抽取做出研究,最终采用结合事件间规则特征和Bi-GRU的抽取模型,在测试集上F1的值达到了86%。然后基于事件抽取元素组成的事件对利用语义相似度计算得到分数最高的两对事件及事件关系抽取的4876条因果关系事件对,构造出<原因事件,因果,结果事件>、<事件i,相似,事件j>三元组,接下来将事件作为实体、事件与事件的因果、相似关系连接为关联关系存储在Neo4j图数据库中,实现事理逻辑知识库的搭建,构建出面向热点话题的因果事理图谱。最后,基于构建好的热点话题因果事理图谱设计开发了事理图谱应用系统,实现了话题查询和智能问答等功能。本文在构建事理图谱关键技术中,在事件抽取技术采用多种神经网络结合研究提高了事件元素抽取的准确率,在事件关系抽取提出事件对的概念,结合事件间的规则特征与双向长短时记忆模型抽取的因果事件对准确率更高,同时采用Neo4j图数据库克服传统数据库深度查询不足的缺点。基于此方法构建的因果事理图谱,节省了整合资源及构建时间,提高用户获取关键信息的速度,满足人们对实时热点话题理解与防护措施等需求有重要意义。

基于事理图谱的事件故事线生成及演化推理方法研究

基于知识图谱的食品安全网络舆情分析

这是一篇关于事件抽取,关系抽取,事理图谱,食品安全网络舆情的论文, 主要内容为近年来,随着互联网技术的不断发展和自媒体的广泛普及,越来越多的人开始在网络平台上发表自己对公共安全事件的观点和看法。其中,食品安全问题作为民众极为关心的问题,一经出现便会引发大量讨论。而互联网的开放式信息传播使得食品安全网络舆情的监管和治理变得越发困难。此外,食品安全网络舆情具有传播速度快、关注度广等特点,食品安全网络舆情数据的快速增长和实时变化,都为食品安全网络舆情的治理带来了新的挑战。同时,人工智能技术的蓬勃发展为实现快速获取网络舆情信息进而分析网络舆情演化规律提供了新的可能。快速准确地抽取食品安全网络舆情相关信息并明确其走势和演化方向以帮助政府等有关部门及时准确地采取引导措施,具有重要的理论和现实意义。由于网络舆论的出现往往是由事件引起的,因此考虑通过网络舆情事件的角度对网络舆情的演化规律进行分析。本文通过构建食品安全事理知识图谱的方式对食品安全网络舆情的演化路径进行分析。首先,针对目前事件语料库的匮乏,构建了食品安全事件语料库。通过对微博和新闻网站中的食品安全事件相关新闻进行爬取、整理和归纳,总结出了一套面向食品安全领域的事件标注模板,并依据此模板对新闻文本进行标注得到食品安全事件语料库用于事件抽取和事件关系抽取模型的训练。其次,采用Bert和双向长短期记忆网络相结合的方式构建了中文食品安全事件抽取模型。该模型将事件抽取任务看成是序列标注任务,通过对文本进行语义建模的方式对文本中的事件进行识别和分类。然后,从显性事件关系抽取和隐性事件关系抽取两个方面,分别用模式匹配和神经网络抽取事件序列和因果关系,最后得到包含这两种关系的事件对。最后,以“固体饮料冒充”这一事件为例,通过事件抽取、事件关系抽取和事件泛化等步骤构建了描述事件逻辑的事理图谱,并基于该事理图谱对网络舆情的演化路径进行分析。通过本文提出的事理图谱的构建方法可以得到较为客观和完善的带有食品安全领域特点的食品安全事理图谱。此外,利用事理图谱可以快速理清食品安全网络舆情事件演化路径,充分体现了其在网络舆情监测、预测和管理中的价值性。

基于深度学习的中华典籍知识抽取方法研究

这是一篇关于中华典籍,知识挖掘,事件抽取,事理图谱的论文, 主要内容为中华典籍记录了中国上下五千年的文化,承载了中国的血脉。中华典籍数字化是通过借助自然语言处理技术对古文文本进行信息处理和知识挖掘。由于古文与现代汉语的语法结构存在明显差异,且受限于语料标注问题,因此如何借助现代信息技术对典籍中蕴含的结构化知识进行抽取成为中华典籍数字化的首要任务。目前,中华典籍的数字化研究仍然以古文数字化、自动分词、自动断句以及词性标注为主,针对中华典籍文本中的知识挖掘与知识服务相关研究相对较少,尤其缺乏中华典籍中的知识抽取相关研究。事件抽取的出现使上述问题得到了较好的解决。然而,目前面向中华典籍的事件抽取方法研究属于仍处于初级阶段,存在很多问题。因此,本论文面向《史记》与《左传》,并通过对现有主流的的事件抽取方法进行改进,主要工作如下:针对当前广泛关注的知识图谱缺乏对历史事件及其关系的刻画的问题进行深入研究。如何快速准确地发现这些历史事件及其之间的内在联系,对于揭示历史实质,发现历史规律具有重要意义。鉴于此,本论文在BERT模型和LSTM-CRF模型的基础上,提出了面向《史记》的历史事件抽取方法,并基于此构建了《史记》事理图谱。实验结果表明,与当前主流方法相比,本论文所提方法的F1值达到0.823。通过事理图谱可以发现蕴含在《史记》中鲜为人知的知识,这为文献学、历史学、社会学等领域专家开展研究提供了必要的资料准备。由于中华典籍的文本与现代汉语的语法结构存在明显差异,且受限于语料标注问题。本论文以《左传》以及《史记》作为实验语料,基于BERT和Bi LSTM模型为基础,提出了一种融合外部知识的事件抽取研究框架。实验结果表明,本论文方法在事件抽取的F1值分别达到了0.874,0.869和0.871,这表明本论文方法能够较好的完成事件抽取任务,彰显了本论文的研究价值。

面向旅游领域的事理图谱构建关键技术研究

这是一篇关于事理图谱,事件抽取,时序关系抽取,知识图谱,智慧旅游的论文, 主要内容为据统计,2021年度国内旅游人数达到32.46亿人次,总消费达到2.92万亿元。如此大规模的旅游消费需求对现有的互联网平台来说是个巨大的挑战,如何能够动态化,个性化,智能化地为游客提供服务是其必不可忽视的需求。传统的旅游推荐系统大多只考虑旅游领域中的静态知识,然而游客在空间上的转移,和游客所参与的旅游事件都未曾考虑进来。事理图谱作为新一代认知人工智能不可或缺的重要基础设施,其以事件为节点更能描述世界的本质,为提升线上旅游服务的动态化,个性化,智能化提供了解决方案。本文根据旅游垂直领域的工业需求,针对事理图谱构建的关键技术展开研究,提出了一个自动化构建旅游垂直领域事理图谱的实现方案。该系统以基于国内旅游网站的非结构化文本数据的事件抽取框架,事件时序关系抽取框架,知识表示与存储等模块组成。本文的主要贡献和创新点如下:提出了基于机器阅读理解的事件抽取算法。该事件抽取算法将事件抽取任务建模成多轮问答的形式,相较于传统的序列标注算法而言,该方案能够融入标签的语义信息,让模型拥有足够的先验知识,从而更好的识别和抽取事件。该事件抽取算法在英文公开数据集ACE2005和中文数据集DuEE上的实验结果远超基线模型。提出了旅游垂直领域信息抽取框架,该抽取框架首先明确了旅游垂直领域的事件类型,然后基于这些事件类型构建了旅游垂直领域事件抽取和旅游事件时序关系抽取数据集。并且进一步针对该数据集设计基于attention机制的事件检测方案,该方案能够自动识别文本当中的事件触发词。最后提出兼顾效率和性能的旅游事件时序关系抽取方案,该方案在仅包含少量事件的文本中仍能保证关系抽取的高召回率和准确率。构建了一个针对游记数据的旅游垂直领域事理图谱TravelEG。探索知识图谱与事理图谱的融合,兼顾动态信息的同时考虑静态知识,能够更全面的描述游客的旅程。该图谱共包含约2.9w+事件节点,8w+条关系,可以为业界旅游智能推荐等需求提供专业的知识引擎。

基于电子病历的事理图谱构建系统的设计与实现

这是一篇关于事理图谱,中文电子病历,医疗事件,事件抽取,事件关系抽取的论文, 主要内容为医疗信息化建设水平的提高,使得医疗机构可以高效便捷的记录和存储医疗电子病历。电子病历记录了患者的诊疗过程,是医疗机构诊疗经验沉淀的成果,其中蕴含着许多丰富且极具价值的医疗知识。医疗健康大数据的发展,使得面向电子病历的智能化建设得到了重视。近年来,在人工智能领域,知识图谱的出现极大地推动了认知智能的发展。以事件和事件关系为核心的事理图谱的出现,有助于使机器学会事件之间的事理逻辑,掌握事件的发展和演化规律。电子病历中记录的诊疗过程可以抽象概括为医疗事件,基于电子病历数据构建面向医疗领域的事理图谱,有助于了解疾病的发展和演化规律,进而使电子病历中沉淀的医疗知识能更好的服务于疾病的诊治。本文研究基于中文电子病历构建事理图谱的问题。中文电子病历中的内容大部分是非结构化的自然语言文本,本文旨在通过自然语言处理技术,抽取中文电子病历中的医疗事件,挖掘医疗事件之间的关系,进而构建面向医疗领域的事理图谱,并在上述事理图谱构建算法的基础上,设计并实现基于电子病历的事理图谱构建系统。本文的工作包括以下几个方面:1)定义面向中文电子病历的事件表示形式,采用两阶段的事件抽取方法抽取中文电子病历中的医疗事件。其中,第一阶段抽取医疗事件的触发词,第二阶段抽取医疗事件的事件元素。2)归纳整理中文电子病历中显式因果关系表达模板,采用基于模式规则匹配的方法,抽取中文电子病历中具有因果关联的文本片段,进而提取因果事件对。3)对医疗事理图谱构建系统进行需求分析,在需求分析的基础上详细设计系统的整体架构及功能模块,最终实现了一个基于电子病历的事理图谱构建系统。

基于电子病历的事理图谱构建系统的设计与实现

面向金融领域的事理图谱构建关键技术研究

这是一篇关于事理图谱,因果关系抽取,事件表示学习,因果强度的论文, 主要内容为传统的知识图谱大多关注实体的属性与关系知识,而忽视了事件间的演化规律知识,为了弥补这一不足,研究者们提出了事理图谱的概念。事理图谱中的节点是高度泛化的事件,边是事件间的演化关系,例如因果关系与顺承关系。自然语言处理技术的发展使得信息抽取的准确率得到提升,也使得从文本中自动挖掘事理知识、构建事理图谱成为可能。本文从金融领域入手,对事理图谱自动构建的关键技术展开研究,具体内容包括端到端的事件因果关系抽取、常识信息增强的事件表示学习以及数据驱动的因果关系强度计算。事理知识的获取是构建事理图谱的基础,本文针对事件间因果关系的获取进行了探索。本文将事件因果关系抽取建模为序列标注任务,提出了基于预训练模型的因果抽取方法,以端到端的方式同时进行因果关系的识别与相关事件的抽取。为缓解有标注数据不足的问题,本文进一步提出基于噪声模型的半监督学习方法,利用大量无标注数据提升因果抽取的效果。中英文两个因果抽取数据集上的实验结果证明了该方法的有效性。事件是事理图谱的核心元素,为了更好地建模事件语义,本文提出了常识信息增强的事件表示学习方法,使学习到的事件表示中融入意图、情感、实体关系等常识信息,以更好地帮助事理图谱的构建以及在其他任务上的应用。事件相似度、脚本事件预测、股市预测等多个任务上的实验结果表明我们的方法可以更准确地建模事件语义,并提升下游任务上的效果。为了更好地建模事件间因果关系的强度,本文探索了基于统计与基于预训练模型的因果强度计算方法,从大量因果事件对中自动学习因果强度信息。COPA因果推理数据集上的实验结果表明,预训练模型可以有效地从大量因果事件对中学习因果知识,并准确地建模因果关系强度。最后,本文基于上述研究成果设计并实现了金融领域事理图谱构建系统,并在大规模金融语料上构建了包含数百万事件与因果关系的事理图谱,验证了本文提出的事理图谱构建方法的可行性。

本文内容包括但不限于文字、数据、图表及超链接等）均来源于该信息及资料的相关主题。发布者：源码导航，原文地址：https://m.bishedaima.com/lunwen/49215.html