事件知识图谱平台的构建与开发
这是一篇关于事件知识图谱,系统设计,图谱构建,图谱可视化的论文, 主要内容为随着互联网行业的迅猛发展,人们获取知识的途径发生了巨大变化,同时也引发了一场知识获取方式的变革。知识图谱以图的形式对互联网中海量信息进行整合,构成语义网络对知识进行表达,能够更好的对客观世界进行描述。传统的知识图谱主要描述概念、实体、关系等静态知识,难以体现以“事件”为核心的动态知识。本文针对事件知识图谱的构建过程进行研究,运用相关理论技术,独立设计和开发了一个事件知识图谱平台。本系统主要用于构建事件知识图谱,主要功能包括事件知识的存储与管理,图谱数据的存储及可视化应用,事件知识图谱的自动化构建等。系统基于浏览器/服务器(B/S)架构进行设计,主要模块包括新闻采集模块、图谱构建模块、算法交互模块、数据持久化模块、数据管理模块、网页交互模块。本文围绕事件知识图谱平台,主要研究了以下内容:1.结合事件知识图谱的相关理论,定义了事件知识的表示方法,实现了将事件知识转化为图谱数据。在此基础上,设计了一套用于存储结构化的事件知识和半结构化的图谱数据的方法。2.研究事件知识图谱的构建方法,设计并实现了基于模式匹配的事件关系识别、基于句法依存分析的事件知识抽取、基于事件相似度计算的事件融合等方法。针对不同的应用场景,设计并实现了两套完整的事件知识图谱构建方案。3.对系统需求进行分析,采用前后端分离开发的模式对系统进行了实现。前端使用Vue框架进行界面设计,服务端使用Spring boot进行开发,数据库技术使用了Mysql、Neo4j和Redis。算法模块使用Python语言实现,系统基于Redis数据库搭建了一个任务消息队列,实现算法模块与系统后台的解耦与交互。最后,本文设计了一套完整的系统测试方法。测试结果表明,本系统能够满足预期功能并且运行状况良好。本文在研究事件知识图谱的构建过程中,发掘并实现了一些系统拓展功能,如新闻聚类、新闻推荐等。
事件知识图谱并行化研究及应用
这是一篇关于事件知识图谱,Spark框架,并行化,数据并行,性能调优的论文, 主要内容为事件作为人类认知世界的基础,已得到越来越多研究者的关注。知识图谱的发展为计算机形式化描述现实世界事物提供了载体,构建基于事件的知识图谱成为研究者关注的方向之一。互联网的发展在改变人类生活方式的同时,也带来了巨大数据规模,给以互联网为数据来源的事件知识图谱构建带来巨大性能挑战。本文从提升事件知识图谱构建效率出发,分析了图谱构建各阶段影响性能的若干关键技术,提出了基于Spark的并行化解决方案,具体研究包括以下几方面:1.在图谱构建文本特征提取阶段,针对大规模数据对文本特征提取的挑战,从两方面开展了研究工作。(1)为提升大规模中文文本分词速度,研究并提出基于Spark的并行中文分词方法。(2)以并行中文分词结果为输入,在Spark MLlib库Word2Vec词向量训练实现方案上,研究并提出了提升Word2Vec训练性能的优化方案—LB-Word2Vec。通过一系列对比实验验证了以上两点研究都取得了不错效果,其中在有6个计算节点的集群下,并行中文分词比单机分词速度提升约3倍,LB-Word2Vec训练出的词向量模型在保证准确率基本不变的前提下,比未优化的并行Word2Vec速度提升近3倍,比单机Word2Vec速度提升近5倍。2.在图谱构建文本过滤阶段,针对时间复杂度为O(n2)的文本过滤算法在日益增长的数据规模下性能出现瓶颈问题,基于Spark实现了文本过滤算法的并行化且对实现方案进行了性能调优。经过一系列对比实验验证了并行文本过滤算法虽未降低算法的时间复杂度但性能表现更优越,在计算节点为26个的集群中,并行文本过滤算法比单机方法提升了25倍的速度。3.在图谱构建事件抽取阶段,针对大规模数据对事件抽取效率的挑战,基于TensorFlowOnSpark改进了现有事件抽取算法并在此基础上实现了一个定制的并行事件抽取平台。实验结果表明,虽然并行事件抽取算法在模型训练阶段因数据输入方式的限制速度提升不明显,但模型准确率与单机基本一致,而在基于训练出的模型的事件抽取阶段,提出的数据分发机制在拥有2个计算节点的集群下,事件抽取速度比单机提升2倍左右。4.基于Play2框架设计并实现了一个并行计算平台。该平台主要实现可视化提交与管理Spark作业、对外提供并行计算服务等功能,避免了命令行提交作业的复杂性,方便了作业在Web端的管理及外部环境对并行计算服务的访问。
事件知识图谱平台的构建与开发
这是一篇关于事件知识图谱,系统设计,图谱构建,图谱可视化的论文, 主要内容为随着互联网行业的迅猛发展,人们获取知识的途径发生了巨大变化,同时也引发了一场知识获取方式的变革。知识图谱以图的形式对互联网中海量信息进行整合,构成语义网络对知识进行表达,能够更好的对客观世界进行描述。传统的知识图谱主要描述概念、实体、关系等静态知识,难以体现以“事件”为核心的动态知识。本文针对事件知识图谱的构建过程进行研究,运用相关理论技术,独立设计和开发了一个事件知识图谱平台。本系统主要用于构建事件知识图谱,主要功能包括事件知识的存储与管理,图谱数据的存储及可视化应用,事件知识图谱的自动化构建等。系统基于浏览器/服务器(B/S)架构进行设计,主要模块包括新闻采集模块、图谱构建模块、算法交互模块、数据持久化模块、数据管理模块、网页交互模块。本文围绕事件知识图谱平台,主要研究了以下内容:1.结合事件知识图谱的相关理论,定义了事件知识的表示方法,实现了将事件知识转化为图谱数据。在此基础上,设计了一套用于存储结构化的事件知识和半结构化的图谱数据的方法。2.研究事件知识图谱的构建方法,设计并实现了基于模式匹配的事件关系识别、基于句法依存分析的事件知识抽取、基于事件相似度计算的事件融合等方法。针对不同的应用场景,设计并实现了两套完整的事件知识图谱构建方案。3.对系统需求进行分析,采用前后端分离开发的模式对系统进行了实现。前端使用Vue框架进行界面设计,服务端使用Spring boot进行开发,数据库技术使用了Mysql、Neo4j和Redis。算法模块使用Python语言实现,系统基于Redis数据库搭建了一个任务消息队列,实现算法模块与系统后台的解耦与交互。最后,本文设计了一套完整的系统测试方法。测试结果表明,本系统能够满足预期功能并且运行状况良好。本文在研究事件知识图谱的构建过程中,发掘并实现了一些系统拓展功能,如新闻聚类、新闻推荐等。
事件知识图谱平台的构建与开发
这是一篇关于事件知识图谱,系统设计,图谱构建,图谱可视化的论文, 主要内容为随着互联网行业的迅猛发展,人们获取知识的途径发生了巨大变化,同时也引发了一场知识获取方式的变革。知识图谱以图的形式对互联网中海量信息进行整合,构成语义网络对知识进行表达,能够更好的对客观世界进行描述。传统的知识图谱主要描述概念、实体、关系等静态知识,难以体现以“事件”为核心的动态知识。本文针对事件知识图谱的构建过程进行研究,运用相关理论技术,独立设计和开发了一个事件知识图谱平台。本系统主要用于构建事件知识图谱,主要功能包括事件知识的存储与管理,图谱数据的存储及可视化应用,事件知识图谱的自动化构建等。系统基于浏览器/服务器(B/S)架构进行设计,主要模块包括新闻采集模块、图谱构建模块、算法交互模块、数据持久化模块、数据管理模块、网页交互模块。本文围绕事件知识图谱平台,主要研究了以下内容:1.结合事件知识图谱的相关理论,定义了事件知识的表示方法,实现了将事件知识转化为图谱数据。在此基础上,设计了一套用于存储结构化的事件知识和半结构化的图谱数据的方法。2.研究事件知识图谱的构建方法,设计并实现了基于模式匹配的事件关系识别、基于句法依存分析的事件知识抽取、基于事件相似度计算的事件融合等方法。针对不同的应用场景,设计并实现了两套完整的事件知识图谱构建方案。3.对系统需求进行分析,采用前后端分离开发的模式对系统进行了实现。前端使用Vue框架进行界面设计,服务端使用Spring boot进行开发,数据库技术使用了Mysql、Neo4j和Redis。算法模块使用Python语言实现,系统基于Redis数据库搭建了一个任务消息队列,实现算法模块与系统后台的解耦与交互。最后,本文设计了一套完整的系统测试方法。测试结果表明,本系统能够满足预期功能并且运行状况良好。本文在研究事件知识图谱的构建过程中,发掘并实现了一些系统拓展功能,如新闻聚类、新闻推荐等。
面向计算机领域的人物事件抽取方法研究
这是一篇关于知识图谱,事件知识图谱,计算机学科领域,事件检测,事件元素抽取的论文, 主要内容为近年来,随着人工智能技术的迅速发展,知识图谱也逐渐受到越来越多的关注。在这种形势下,学科领域的知识图谱应时而生,其在教育领域中的应用也变的越来越重要。与此同时,计算机学科领域的知识图谱在计算机教育中也发挥着重要的作用,而人物事件是学科图谱的重要组成部分。在图谱中加入人物的事件信息会使得学科知识图谱更加丰富和有趣,有利于提高学生对于学习的积极性。然而构建人物事件知识图谱最重要的步骤就是事件抽取。因此,本课题以构建计算机学科领域的人物事件知识图谱为例,构建了计算机学科领域人物事件抽取的语料库,并且基于BiGRU和CNN模型设计了人物事件抽取的方法,同时获取了人物事件触发词以及事件元素,以此来构建计算机学科领域的人物事件知识图谱。本课题主要的研究工作有如下几点:1)构建了面向计算机领域的人物事件抽取语料库。基于计算机领域人物文本的特点进行人物事件语料库的构建,根据计算机领域的课程概念,进行人物实体的抽取,主要是把课程概念与人物实体一一对应起来。同时根据抽取出的人物实体,从Wikipedia等相关网站中爬取与此人物相关的文本数据作为原始语料,以此来构建计算机领域人物事件抽取的数据集。之后根据计算机领域人物事件的特点和抽取的需求,定义事件的类型和事件元素的类型,并且根据定义的事件体系,标注面向计算机领域人物事件抽取的数据集。2)设计了一种基于BiGRU和CNN串联融合的计算机领域人物事件检测的方法(SC-BiGRU-CNN)。通过使用双向的GRU模型来提取人物事件句的全局语义特征,同时将提取到的全局语义特征输入到CNN模型中来提取句子的局部语义特征,其目的是进一步提取更加细粒度化的语义特征表示。与此同时,利用SC-BiGRU-CNN方法将提取到的特征输入到Softmax分类器中完成对人物事件触发词的分类。实验结果表明,本文所提方法相较于基线方法在F1指标上有明显的提升。3)设计了一种基于BiGRU-Attention-CNN的计算机领域人物事件元素抽取的方法(Att-BiGRU-CNN*)。该方法使用BiGRU来获取输入向量的长距离语义依赖信息,之后引入Attention层,对经过BiGRU层所输出的特征进行处理,以获得更加准确的全局特征,将提取到的全局语义特征经过卷积层和动态多池化层来提取局部语义特征,之后利用提取的最终特征对人物事件元素进行分类。根据实验结果可以得出,Att-BiGRU-CNN*方法与基线方法相比在F1指标上有提升。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设工厂 ,原文地址:https://m.bishedaima.com/lunwen/48026.html