7篇关于知识抽取的计算机毕业论文

今天分享的是关于知识抽取的7篇计算机毕业论文范文, 如果你的论文涉及到知识抽取等主题,本文能够帮助到你

基于知识图谱的军事信息系统设计与实现

这是一篇关于军事知识图谱,深度学习,知识抽取,实体推荐,自然语言处理的论文, 主要内容为在互联网和大数据快速发展的当今,如何对互联网上的信息进行有效地挖掘和使用是目前研究的主要方向,而知识图谱技术就是一种可以有效地从大量零散的文字中提取出结构化知识的方法,并且能够挖掘信息间的关联性,有利于满足领域信息系统的需求,具有十分广泛的应用前景。本文基于知识图谱实现了以军事领域为核心的信息系统,具体工作内容如下:1、提出了基于军事领域知识图谱的构建方案。针对军事领域缺乏公开数据集等问题,本文对军事领域知识图谱的构建技术进行了深入的研究,在此基础上给出了军事领域知识图谱构建的总体设计方案。通过爬虫技术和基于深度学习的知识抽取技术,从互联网中获取了结构化、半结构化、非结构化数据,根据军事相关知识进行本体层设计,利用Neo4j技术完成了数据的存储,并完成了军事领域知识图谱的搭建。2、研究了针对军事领域信息的知识抽取算法和知识表示模型。本文采用BERT+CRF抽取模型用于知识抽取,有效解决了军事数据不完整、专业名词较多、实体关系重叠等问题。同时针对军事信息三元组的特点,对TransE翻译模型进行训练和改进,学习图谱中实体的语义信息、实体与实体间的关系信息,并对其进行向量化表示,通过计算实体之间的相似性,实现对实体的推荐。3、设计并实现了基于知识图谱的军事领域信息系统。在已构建的军事领域知识图谱的基础上,搭建出系统的各个功能模块,包括图谱可视化、实体查询、图谱维护、关系抽取、实体推荐等功能,最后对系统进行了测试工作,验证了系统功能的可行性。总体而言,本文提出了军事领域知识图谱的构建方案,以及针对军事信息的知识抽取和知识表示算法,实现了系统的搭建和系统功能的开发,在系统中为用户提供了多种信息获取功能,提升了用户体验。

危化品车辆在途运输监管知识图谱构建研究

这是一篇关于危化品车辆,在途运输监管,知识图谱,本体构建,知识抽取的论文, 主要内容为危化品于车辆在途运输阶段形成流动危险源,稍有不慎就极易造成泄露、爆炸等事故。近年来,我国危化品车辆在途运输事故时有发生,对人民生命财产和生态环境造成了极大危害。随着数字浪潮的掀起,我国对危化品车辆在途运输的监管逐步向信息化、规范化迈进,使得安全形势有所好转,但仍存在数据分析能力薄弱、数据体系分散等问题,不能很好地满足体量庞大、结构多样、关联分散的监管数据特征。知识图谱是一种图结构语义知识库,具有优秀的语义处理能力和信息关联能力,可以对复杂数据进行组织、管理与展示,形成良好的数据体系。故将知识图谱引入危化品车辆在途运输监管领域,以作为数据辅助工具服务于智慧监管平台,为监管人员提供数据支撑和决策参考。主要研究工作如下:(1)构建危化品车辆在途运输监管知识图谱模式层。首先,选择了本体建模技术构建知识图谱模式层。其次,在综合分析领域知识需求和本体构建典型方法的基础上,提出了“七步法”与“骨架法”相结合的本体构建流程。再次,采用Protégé本体构建工具和OWL本体建模语言定义了本体的类、关系、属性及约束,实现了本体构建并对其进行可视化。最后,展示了危化品车辆在途运输监管多维关联模式层,为数据层的构建提供了模型框架。(2)构建危化品车辆在途运输监管知识图谱数据层。首先,采取Python网络爬虫、现场采集、人工处理等方法获取了多源异构底层数据。其次,根据数据特征选取了人工筛选、自然语言处理技术等方法进行知识抽取,并将抽取结果处理为结构化形式,以作为数据层的实例数据。特别地,对违法记录文本数据进行了重点处理,分别设计了BERT-CRF模型、BERT-MRC模型、正则表达式对车牌号码、驾驶员等目标进行实体抽取。最后,选取了Protégé本体构建工具的内置模块Cellfie,建立了符合Mapping Master DSL语法形式的转换规则,将处理完毕的实例数据批量融合至本体模式层,形成了RDF三元组,实现了知识融合。(3)展示及应用危化品车辆在途运输监管知识图谱。首先,建立了RDF数据与图数据库的映射匹配规则。其次,选取了图数据库Neo4j,按照映射匹配规则实现了危化品车辆在途运输监管的知识存储和知识图谱的可视化。最后,结合危化品车辆在途运输风险预警和应急处置两方面应用需求,应用知识图谱进行了实例验证。

基于知识图谱和证据理论的个性化推荐算法研究

这是一篇关于知识图谱,推荐系统,证据理论,稀疏性,知识抽取的论文, 主要内容为知识图谱被定义为包含多类型节点和多类型边的多关系图,它实际上是一个语义网络的知识库,如今已广泛地应用在证券投资、搜索、自适应教育、大数据风控、聊天机器人、智能医疗、推荐系统等领域中。如何采取有效的辅助信息去改善协同过滤推荐系统的性能成为研究的热点。目前,改善的主要方法有在推荐系统中引入如深度学习、神经网络、知识图谱等辅助信息,相比其他辅助信息,知识图谱不但能够使实体之间具有更加丰富的语义关系,从而能够更深层地挖掘用户的兴趣,而且可以实现不同种类实体的关系连接,有助于去进行推荐结果的发散,因而在信息推荐技术领域有着相当得天独厚的优势,所以在电影推荐、音乐推荐等应用场景中,将知识图谱和证据理论引入推荐算法中,能够取得不错的效果,本文的主要研究内容如下:(1)对知识图谱的构建技术展开了研究,知识抽取技术不但是构建的第一步,而且是知识图谱质量保障的重中之重,因而本文重点研究了知识抽取的相关技术,包括命名实体识别和关系抽取等,经过综合分析,选取综合性能较优的组合模型去进行知识抽取,从而实现知识图谱的构建任务,为后续的研究打下基础。(2)针对协同过滤推荐系统中因数据过于稀缺和几乎没有用户行为数据而导致推荐效果不佳的问题,本文通过相关研究,提出一种基于知识图谱和证据理论的新方法,具体地,首先需要根据构建技术构建电影知识图谱,然后在用户社交网络中进行社区划分,接着,在每一个社区中研究了知识图谱的偏好传播和证据理论建模的灵活性,并将它们结合到一起,使他们具备了各自的优点,以达到对用户和商品的评分矩阵改进的目的,最终可以通过少数已有的用户和商品交互信息,对用户和商品的未交互信息进行预测。(3)根据前面的相关研究,展开实验和分析。首先,由于不同的构建技术存在着质量差异,因而在实验中验证了不同知识抽取技术抽取能力以及知识图谱构建质量的好坏对推荐性能造成的影响;然后,验证了知识图谱的引入与否给推荐性能带来的影响;最后选择基线进行对比实验,通过分析对比验证了改进模型和方法的可行性。

医疗知识图谱的表示学习及应用研究

这是一篇关于知识图谱,知识抽取,表示学习,链接预测,Neo4j的论文, 主要内容为在大数据时代,随着数据的高速增长,如何合理存储以及利用这些数据成为了人们亟待处理的问题。目前,医疗领域里的病历数据仍然采用的是传统模式的简单存放,虽然从纸质病历演变成了电子病历,但数据仍然繁琐复杂,未能得到有效利用。自2012年,谷歌提出了用以提升搜索引擎的搜索效率的知识图谱概念之后,其相关技术得到了快速发展。本课题旨在探索构建知识图谱的垂直领域中的应用系统,分析现有应用需求,完善知识图谱系统的功能,将现有知识图谱应用技术融入到知识图谱系统中,其中,通过分析国内外现状,发现构建医疗领域的知识图谱成为了人们迫切的需求,然而医学中的专业知识阻碍了研究进展,再者,国内也没有开源的具有标注的中文医疗数据。因此,在中文的医疗知识图谱中的研究还存在着严重的不足。在本课题的构建知识图谱系统的过程中,数据的获取和知识的抽取成为了第一步要解决的问题,当提取到知识三元组之后,对知识图谱进行表示学习,并且应用到系统中,实现知识的链接预测任务,再加入知识问答模块,构成了一个完整的知识图谱系统。本课题的主要工作:搜集了相关数据集,将这些数据集中的部分数据进行了筛选以及抽取,构建了一个新的数据集,并且进行了人工标注;对比了现阶段在知识抽取任务中表现良好的模型,通过调整参数以及实验对比,挑选出一个适用于本课题中电子病历数据集的知识抽取模型;同时,对比了现阶段常用在知识的表示学习中的模型,通过优化模型输入改进了这些模型,经实验对比,挑选出表现较为良好的表示学习模型;通过查阅资料以及分析其他论文,对比了不同的知识图谱存储方案,选择了一个最适合本系统的存储方式用以存放本系统中的知识图谱,既可以实现加快搜索,又能提供可视化展示;根据研究内容,加入了各种知识图谱的应用模块,包括知识的链接预测模块,知识的可视化展示模块,以及知识问答模块,搭建了一个较为完整的知识图谱应用系统。

基于表示学习的医学知识图谱融合算法研究

这是一篇关于表示学习,深度学习,知识抽取,医学词根,医学知识图谱融合的论文, 主要内容为随着互联网的发展,人们对医学知识搜索的需求迅速增长,然而现有的医学网站过于专业,无法让普通用户快速准确地找到所查询的知识。因此,基于知识图谱技术构建医疗专家辅助系统的任务应运而生。知识图谱是一种大规模的语义网络,以三元组的形式表示知识,在辅助决策、个性化推荐系统、信息检索等领域被广泛应用。但是,知识图谱数据来源多种多样,不同数据源之间通常有大量重合的三元组知识,必须融合后才能构成一个完整的知识图谱。知识图谱融合技术的挑战在于不同知识图谱的实体表示存在变种和歧义,本文针对这个问题进行了研究,首先详细介绍了表示学习、医学知识图谱构建与融合的研究背景和意义,同时对相关领域的国内外研究现状作了分析,接着设计实现一种基于深度学习的知识表示学习算法,通过自动抽取网络数据建立了高质量的医学知识图谱并利用表示学习模型和相关规则进行图谱融合,最后,设计了基于Web框架的知识图谱融合系统。本文的主要工作包括以下几个方面:一、设计实现一种基于深度学习的知识表示学习算法。将知识图谱中的三元组还原为句子,利用深度学习中常用的卷积神经网络和循环神经网络的特点,同时提取三元组的长期依赖关系和局部结构信息,保留其翻译特征。另外,提出了一种构造负例的新方法,该方法减少了模型训练阶段生成的错误负例,提升了算法的效果,同时也适用于其他知识表示学习模型,具有通用性。二、提出了医学知识图谱的融合流程,通过多源医学知识图谱的构建与融合来验证了该流程的有效性。本文采用网络数据爬虫技术从几个高质量的医学网站抽取医学知识,构建了包含疾病、症状、药品、检查、部位共计5类实体的医学本体和多种实体之间关系和属性的医学知识图谱。图谱融合阶段首先利用医学实体构造反映其特征的医学词根,然后根据知识表示学习算法为待融合医学实体推荐排名前十的候选实体,利用医学词根和规则对候选实体进行筛选,最后由专家对剩下的候选实体进行标注,融合后得到一个统一的医学知识图谱。三、实现了基于Web框架的知识图谱融合系统。系统包括知识表示学习算法推荐和实体标注功能,总体架构可分为数据层、执行层和交互层,核心在于执行层的图谱融合计算,候选实体推荐。系统嵌入了几种知识表示学习算法,适用于不同领域的知识图谱,用户可以根据具体数据特点进行算法选择。算法推荐实体后,对正确的实体进行标注,最后系统生成一个多源的大规模知识图谱。

面向多源数据的起重吊装作业知识图谱构建与应用研究

这是一篇关于起重吊装,知识图谱,知识抽取,深度学习的论文, 主要内容为起重吊装工程是危险性较大的分部分项工程之一,具有多人协作、专业性强、易受周边环境影响等特点,极易发生事故,尤其是群死群伤事故。尽管起重吊装作业领域已经积累了大量的数据资料,但杂乱无序的数据信息让从业人员难以迅速获得全面准确的知识。因此本文以起重吊装作业为切入点,利用自然语言处理、深度学习等相关技术和方法,研究面向多源数据的起重吊装作业领域知识图谱构建,最后将其应用于专项施工方案的合规性审查、安全教育培训、安全事故分析和规范知识获取。具体内容包括:通过分析起重吊装作业领域的知识结构特点和相关从业人员对知识的需求,确定以标准规范和起重事故调查报告作为主要知识来源,然后,基于知识工程和知识图谱技术,提出了起重吊装作业领域知识抽取的方法模型和评价指标。通过对起重吊装作业过程和多源数据进行分析,对起重吊装作业领域知识范围进行界定,从安全管理、机械、作业、组织和其他维度对领域专业知识进行层级分解,形成多维分层的领域知识分类体系。基于领域知识分类体系知识结构和内容,构建专业领域概念模型;基于标准规范知识结构特点和内容,构建标准规范概念模型;基于安全事故调查报告的结构特点和知识需求,构建起重事故概念模型。根据领域知识分类体系构建概念间的层级关系,并对不同概念间的非层级关系建模,形成起重吊装作业领域知识结构模式,为起重吊装作业领域知识图谱的构建提供理论基础。收集和整理起重吊装作业领域的标准规范和事故调查报告,根据多源数据结构特点,选择不同的知识抽取方法。对于实体抽取,形成基于分类体系、基于结构化数据、基于规则和基于深度学习的系统实体抽取方法;对于关系抽取,形成基于文本结构和基于规则的关系抽取方法;对于属性抽取,采取类似的实体抽取和关系抽取方法。基于获得的实体-关系-属性三元组,分析不同阶段不同情形下知识融合的方法,并提出基于Neo4j图储存的知识储存策略。将实体、关系、属性导入到知识图谱中,形成起重吊装作业领域知识图谱,为领域安全管理知识的集成和组织提供有效手段,并对建筑领域其他工程具有推广意义。针对起重吊装作业领域知识图谱开展多方面应用研究。探索利用领域知识图谱进行专项施工方案合规性审查的框架,研究运用Neo4j和知识库问答实现安全教育培训的途径,并利用知识图谱完成安全事故分析和规范知识获取,提供基于知识图谱的起重吊装领域多方位知识支持。论文有图66幅,表26个,参考文献119篇。

基于知识图谱的绒山羊基因-表型-变异知识库构建

这是一篇关于文献挖掘,知识图谱,绒山羊,知识抽取的论文, 主要内容为我国有丰富的山羊品种资源,具有非常明显的特征,如高繁殖性、抗逆性、耐粗饲等特点。其中绒山羊以其优良的纤维生产特性在我们的日常生活中起着重要的作用。关于羊绒的研究始于二十世纪五十年代,随着羊绒加工业的发展,羊绒市场也出现了供不应求、价格上涨的趋势,国内外的羊绒消耗需求日益增长,因此我国优质的羊绒生产及研究也得到了有益发展。然而研究表明近年来羊绒的纤维细度变得越来越粗,羊绒的细度及质量受到绒山羊研究人员开始关注,并以如何提高羊绒的数量和质量作为研究方向,不仅如此,绒山羊的奶、肉及抗病抗逆性等资源都是研究重点。绒山羊基因-表型-变异相关数据是生物学家进一步筛选与经济性状相关主效基因的基础。本文在挖掘文献的基础上,首次提出将知识图谱技术应用到绒山羊基因-表型-变异实体关联关系领域。针对目前缺少绒山羊基因-表型-变异数据库的问题,采用自然语言处理的文献挖掘技术,从Pub Med生物医学文献库中自动提取绒山羊变异相关文献摘要,对原数据进行数据预处理,删除作者详细信息及出版商信息等数据,根据知识图谱实体关系结构保留文献PMID,标题及摘要等数据。通过知识抽取得到与绒山羊相关71个基因的表型变异关联数据,然后采用爬虫技术提取外部数据库基因相关信息,进一步补全和优化知识,提高知识图谱质量,基于知识图谱将关联关系进行可视化,采用Neo4j图数据库以三元组形式存储关系数据,同时设计开发了绒山羊基因-表型-变异知识图谱可视化平台,该平台提供实体查询、关系查询及完整的知识谱图展示。

本文内容包括但不限于文字、数据、图表及超链接等）均来源于该信息及资料的相关主题。发布者：源码货栈，原文地址：https://m.bishedaima.com/lunwen/47892.html