电力设备知识图谱构建方法研究与实现
这是一篇关于知识图谱,电力设备,实体抽取,关系抽取,知识图谱可视化的论文, 主要内容为随着智能电网的发展,我国电力系统积累了大量有关电力设备检修和保养的文档,这些文档中蕴含着丰富的电力设备相关知识,但是目前这些知识并未得到充分利用。为了充分利用上述电力设备文档中的知识,可以使用知识抽取技术从文本中抽取结构化的知识,并构建电力设备领域知识图谱。知识抽取是知识图谱构建的关键步骤,为了提高知识抽取算法的准确率,本文研究了现有的知识抽取算法,并在现有研究的基础之上提出了命名实体识别和关系抽取算法,其主要研究内容如下。为了从电力设备文本中抽取命名实体,提出了一种基于字符对链接的实体识别算法TPNER,该方法基于字符对链接进行实体解码,并融入词汇信息以提高模型预测效果。通过MSRA、Weibo、CMeEE数据集的实验结果发现TPNER模型较现有模型分别提升0.1%、0.62%、8%左右,证明模型是有效的。为了抽取电力设备文本中的实体,通过电力设备相关文本和实际故障案例构建原始语料,并基于实体标注构建了电力设备实体识别数据集,最后使用上述实体识别算法在该数据集上进行实验。为了抽取电力设备文本中包含的实体关系三元组,对现有关系抽取算法CasRel进行优化,通过机器阅读理解优化向模型中输入更多先验知识,通过自注意力机制优化使模型从大量输入中提取关键信息。优化后的模型在百度信息抽取数据集上的实验结果较CasRel模型预测效果提升2.48%左右,充分证明了优化的有效性。为了抽取电力设备文本中的实体关系三元组,通过原始语料构建了电力设备关系抽取数据集,并使用上述优化后的关系抽取算法在该数据集上进行实验。设计并实现了电力设备知识图谱可视化系统,该系统主要包括知识图谱可视化、数据标注和知识图谱管理功能。通过知识图谱可视化功能,系统展示了本文构建的电力设备知识图谱;通过数据标注功能,系统可以对原始语料进行实体标注和关系标注,构建实体识别和关系抽取数据集;通过知识图谱管理功能,系统可以修改知识图谱中错误的实体关系三元组,并向知识图谱中添加新的实体关系三元组。
石油化学文本的命名实体识别研究及应用
这是一篇关于信息抽取,中文命名实体识别,多特征融合,知识图谱可视化的论文, 主要内容为石油化学文本的命名实体识别研究旨在从非结构化文本中抽取实体信息并高效地管理它们。对比通用领域,石油化学实体信息抽取任务存在两个方面的问题。一是缺乏模型训练和测试过程中所需的石油化学领域标注语料。二是石油化学领域的命名实体包含长实体和短实体类型,且石油化学实体之间的关系多种多样,这些特征会影响实体信息抽取模型的性能。在非结构化文本信息管理工作中,现有的管理方法通常是利用非结构化数据库存储信息,难以直观地观察到多组信息之间的关联性,不利于对数据的整合、应用和共享。针对以上问题,本文通过引入计算机技术对海量非结构化文本进行实体抽取和对实体信息高效地管理。首先,针对实体长度不一致、文本数据特征单一的问题,本文提出了一种基于多级语义特征融合及注意力机制的实体抽取模型。模型中通过多尺寸CNN语义网络对专业词汇内部组成的语义特征提取,缓解了实体长度不一致带来的边界位置难以捕捉的现象,并通过注意力机制计算上下文特征与词汇语义特征的相似度,给上下文特征赋予不同权重,实现字词特征融合,弥补了文本数据特征单一的问题。其次,针对缺乏标注语料的问题,本文构建了石油化学数据集。并在石油化学数据集上和CMe EE、Rusume两个公共数据集上与其它模型进行对比实验,通过评价指标来验证本文提出的模型的有效性和泛化性。其次,针对石油化学文本中存在多组实体关系的问题,本文提出基于特征聚合的实体关系抽取模型,本模型的输入层组合文本中实体类型嵌入、实体位置嵌入和上下文嵌入,利用胶囊网络学习实体之间的空间信息,并预测实体关系类型。通过设计实验来验证模型的有效性。最后,为了通过知识图谱直观地观察出实体信息,本文设计了石油化学文本命名实体识别系统。该系统可以查询石油化学文本中的实体信息和可视化展示实体关系信息,为大众提供一个可靠的石油化学知识科普服务平台,实现了对非结构文本有效的管理与应用。
基于多维大数据分析的纪检监察研判关键技术研究与应用
这是一篇关于纪检监察大数据,知识图谱构建,知识推理,社区发现,知识图谱可视化的论文, 主要内容为纪检监察机关在“实施国家大数据战略”的号召下重塑治理生态。论文针对“大数据+纪检监察”模式下案件调查初核多维大数据在处理中存在的数据类型杂乱、不易管理与不易发现线索等问题,提出构建基于知识图谱的案件调查初核知识图谱,通过推理其隐式关系、分析与挖掘案件模式以及提供数据分析可视化系统,为案件调查人员提供有效初核线索,帮助调查。论文有如下几方面贡献:1.提出基于知识图谱构建技术处理多维案件调查初核大数据。在知识抽取过程中,将纪检监察相关信息部门获取的多类Excel表格数据进行抽取、融合并转换为三元组形式。在知识推理时,将自动推理机与根据办案人员以往案件调查经验抽象的自定义规则推理机相结合,克服了在自动推理图谱中隐性关系时存在的三元组推理不全面的问题,达到了有效扩充案件初核知识图谱的目的。2.提出基于规则的以及概率的方法进行案件初核调查系统的上层应用开发。通过使用异常信息提取方法对涉案人员进行分析、使用模式判断方法对犯罪模式(尤其是团伙模式)进行挖掘以及使用“知识图谱+社区发现”模式将涉案人员进行归类,达到为案件调查人员提供有效分类数据以及使案件调查更为便利的目标。3.设计并实现为案件调查人员提供的数据分析结果可视化系统,将分析后数据进行多角度可视化展示,例如从时间链路和空间链路的角度展示重要事件的时间信息以及涉案人员的行程信息等。系统根据特定的功能需求,通过使用相应的Cypher语句查询案件调查初核知识图谱后,将查询结果以图谱、数据两种形式在前端页面进行可视化展现,最终为办案人员提供合理且操作简单的可视化平台。论文通过分析纪检监察案件调查初核知识图谱的构建、挖掘与分析以及可视化的结果,表明基于知识图谱相关技术对多维纪检监察案件调查初核数据进行处理与分析可以挖掘其中隐含的关联信息、异常信息和团体信息,为案件调查人员提供有效线索,使案件调查更为便利。
基于力导向算法的知识图谱可视化技术研究与实现
这是一篇关于力导向算法,知识图谱可视化,社区发现,可视化布局,图嵌入的论文, 主要内容为知识图谱以图的形式描述客观世界中实体及其之间的关系,但目前知识图谱的图结构主要用于后台的数据逻辑处理,前端的应用并不是很充分,为此论文将图的可视化技术引入到知识图谱应用系统前端技术中,以提升用户视觉体验,使用户能够更直观、更高效地获取知识图谱的重要节点信息及主要结构特性。图的可视化技术以图中节点和边的合理布局为核心,目前主流的布局模型为基于力学引力和斥力作用的力导向模型,论文以该模型为基础模型,以凸显节点局部聚类特性、反映节点多重隶属关系及提高布局执行效率为目标,开展了两种优化布局算法的研究,并将之应用到慢病知识图谱可视化问答原型系统中。论文的具体研究工作和研究成果如下。(1)基于重叠社区发现的可视化布局优化算法研究。社区包括重叠社区结构,是知识图谱的一种普遍存在,为从整体上反映知识图谱的结构组成,论文基于快速高效的Louvain社区发现算法,利用模糊c-means聚类算法获取节点的隶属度,以此设计模块度函数,实现重叠社区发现功能。同时论文增加社区引力和社区斥力属性改进力导向算法,优化社区布局效果。论文选取能够反映社区划分质量的模块度值、能够衡量布局质量的最小化边缘交叉、最小角度度量等为评估指标,进行了对比实验,结果表明论文所提出的算法的重叠社区检测能力优于CPM算法和COPRA算法,可视化布局结果也较为清晰。(2)基于图嵌入方法的可视化布局优化方法研究。大规模知识图谱常包含高维深层结构,为提高可视化执行效率、并能在有限布局空间内展现核心结构组成,论文基于深度学习图嵌入方法,构建能捕获图深层次的非线性结构、降低节点信息维度的压缩模型,以此提高算法效率。在此基础上,根据提取的图结构,论文设计基于力导向算法的多层迭代方法,优化斥力计算模型,实现布局算法对节点间距离的优化调整。论文选取布局运行时间、最小化边缘交叉作为评估指标,在拥有上万节点的数据集上进行对比实验,结果表明论文所提出方法的算法布局时间为0.336s,具有速度优势,可视化布局效果也得到了改善。(3)基于Echarts的可视化问答原型系统设计与实现。论文使用Echarts框架,集成所提出的两种优化布局算法,设计了慢病知识图谱可视化问答原型系统。论文给出了系统的需求分析、总体设计、数据集获取及主要功能实现,通过功能测试验证了系统设计的可行性和算法的有效性。
垂直知识图谱可视化服务平台的设计与实现
这是一篇关于知识图谱可视化,图谱可视化工具,行业报告生成工具,缓存加速的论文, 主要内容为随着互联网技术与大数据技术的不断发展,互联网信息呈指数形式增长,越来越多数据被人们获取。面向海量的数据,不同角色的行业从业人员面向不同用户场景,对数据有着不同的应用需求。但是当前所提供的垂直知识图谱可视化服务存在以下问题:1)鲜少将知识图谱与可视化知识相融合,从而造成了直观度和交互性较低且数据利用不充分等问题,且面向不同场景需要不同类型的可视化工具进行可视化,接口数据异构性大;2)对于垂直知识图谱的大数据量不能够做到物尽其用,缺少一个能够一站式将知识图谱进行可视化表达且支持知识图谱数据编辑及统计可视化表达、进一步生成高交互性行业报告的平台,不能够快速生成行业报告很大程度的影响了报告的时效性与交互性;3)面向知识图谱数据的可视化平台有着数据量庞大的特点,直接从终端数据库请求响应,尤其是请求量大的时候,会给数据库造成非常大的压力。数据库处理数据的能力给系统的吞吐量造成了很大局限性,甚至导致宕机。针对以上问题,通过对相关系统的研究,本文设计并实现了一款垂直知识图谱可视化服务平台,为行业用户提供查看实体关系、对图谱数据进行探索式分析以及提供创建行业报告的功能。本研究主要包含以下几点工作:(1)设计并发布基于Vue的知识图谱可视化工具Kgv.js,对ECharts和D3.js可视化工具进行二次封装,方便图谱可视化开发者的调用,提高知识图谱的可视化开发能力,达到可视化过程与数据解耦的目的,从而保证系统前端展现与后端业务逻辑的分离。(2)设计并实现了支持动态改变数据源的垂直知识图谱可视化服务平台,该平台包括基于图谱可视化的知识图谱数据管理系统、基于知识图谱及可视化技术的知识服务系统和基于知识驱动的行业资讯报告生成系统。包括多源数据的连接、图谱可视化、查看实体关系、探索式数据分析生成行业图表、行业报告的生成等功能。(3)设计并实现了基于Redis的系统响应优化机制,通过对Redis的主从模式的优化,实现垂直知识图谱可视化服务平台的加速响应,缓解数据库压力,设计缓存的持久化以及高可用性保证系统达到最佳使用状态,并通过功能和性能测试验证其提升性能的有效性。本文实现的垂直知识图谱可视化服务平台,支持包括动态改变数据源、通过页面交互导入数据和通过文件上传数据的多数据源,并通过简单的用户交互(如拖拽、输入等交互方式)实现行业统计数据信息的可视化。通过混合数据库的使用,实现对行业数据、行业报告的存储和实现系统快速响应的缓存。本平台提供的不同功能模块能够满足知识图谱数据管理、数据分析以及信息浏览。
基于知识图谱的涉毒案件法条预测方法研究与应用
这是一篇关于智慧法院,法条预测,知识图谱,涉毒案件,知识图谱可视化的论文, 主要内容为近年来,随着人工智能和大数据技术的飞速发展,“智慧法院”的建设备受关注,法条预测作为智慧法院建设的重要一环,旨在根据输入的案情信息自动预测出相匹配的法条结果。涉毒案件作为刑事案件中十分重要的组成部分,其社会危害性极大且易诱发其他类型的犯罪,对涉毒案件展开法条预测十分必要。而当通用的法条预测方法面对涉毒案件进行法条预测时,由于其案情的易混淆性等问题导致预测效果并不好,同时涉毒法条的具体款项之间差异较大,目前却缺乏对涉毒案件具体法律款项预测的研究。另一方面,知识图谱的研究方兴未艾,在各个领域已经取得了不俗的成果,其具备的获取知识之间结构信息等特殊能力,有望解决通用方法在涉毒案件法条预测领域面临的困难。所以,本文以涉毒案件裁判文书为数据基础,通过分析大量的毒品犯罪事实,结合知识图谱的功能特点,提出两种基于知识图谱的涉毒案件法条预测方法,并搭建预测原型工具将所提算法进行实际的应用。论文主要工作如下:(1)基于知识图谱的涉毒案件粗粒度法条预测方法:基于知识图谱补全方法KG-BERT,提出了KG-LFTE方法。该方法将法条和案件进行“法条-案件”图谱的构建,在法条预测过程中将法条结点文本描述和案件结点文本描述进行联合输入,同时利用Trans E对法条和案件结点进行空间结构的学习,最终法条结点可以聚集所有与之相连案件结点的语义信息和空间结构信息,提升粗粒度法条的预测性能,粗粒度法条指法条编号,如《刑法》第347条。(2)基于知识图谱的涉毒案件全粒度法条预测方法:在粗粒度法条预测的基础上,本文对细粒度法条进行进一步的探索,细粒度法条指法条的具体的款项,如《刑法》第347条第2款第1项。首先将案情的文本描述转化为案情知识图谱,然后该图谱进行路径的分解,最后借助基于核方法的路径分类算法实现法条的最终预测。该方法可以预测到全粒度法条并具有更好的预测可解释性,全粒度法条包括粗粒度法条和细粒度法条。(3)基于知识图谱的涉毒案件法条预测原型工具设计与实现:基于以上方法,本文设计并实现了基于知识图谱的涉毒案件自动法条预测原型工具。该工具利用知识图谱可视化功能将案情文本描述进行知识图谱可视化,同时将法条预测的结果绘制在图谱中,具有法条预测结果可解释性好、用户交互性好等优势。同时此工具也集成了一些案情审理辅助功能以促进智慧法院的建设。
交互型数据大屏可视化平台的研究与实现
这是一篇关于数据大屏可视化,知识图谱可视化,兄弟组件通信,组件动态交互,手势语音交互的论文, 主要内容为随着知识图谱在社会各行业领域中应用的发展和用户对人机交互体验要求的提高,交互型数据大屏可视化平台从知识数据探索式交互分析和人机交互体验两种不同的交互角度出发,重点解决知识数据可视化问题,利用前端组件化技术,为非专业人员提供无障碍搭建多场景多领域具备专业水准的数据可视化大屏的方法,实现对于知识数据的可视化展示及探索式交互分析,同时提供灵活多样的人机交互手段,多角度提升用户的交互体验。虽然国内外研究人员在数据可视化应用方面都进行了大量研究并取得了一定成效,但面对知识图谱可视化与传统数据大屏可视化平台融合的需求,目前大多数据大屏可视化平台仍然存在着以下问题与挑战:1)不支持知识数据可视化与探索交互:当前数据可视化平台的数据源与内部可视化组件库无法支持对于知识图谱等知识数据的可视化展示,同时缺乏知识数据探索交互功能;2)可视化组件二次开发效率低:为满足知识可视化需求,对传统图表类组件的二次开发缺乏统一有效的开发方法,大量重复性的代码工作导致开发效率降低;3)人机交互方式单一:当前大屏普遍仅提供传统鼠标操作作为人机交互方式。针对以上问题与挑战,本论文重点围绕组件的知识可视化二次开发技术、数据可视化大屏动态交互能力、数据可视化大屏人机交互方式进行研究与分析,完成了交互型数据大屏可视化平台的设计与实现,主要研究内容有以下四项:1)提出并实现了面向数据可视化大屏的知识可视化开发方法,解决了对传统图表类组件进行二次开发时因缺少统一的开发方法导致开发效率低的问题。2)设计并实现了知识可视化组件交互管理方法,解决平台知识数据探索式交互能力较弱的问题,满足知识可视化的查询需求,并为兄弟组件通信设计新的数据通信方案,进一步简化了数据流动路径。3)设计并实现了基于手势/语音技术的大屏交互方法,解决当前数据大屏可视化平台人机交互手段单一的问题,提升了平台的可交互性。4)设计并实现了交互型数据大屏可视化平台,提供功能齐全、图表类型丰富的可视化组件库,支持多种数据源,进一步实现知识数据可视化及探索式交互,满足动态特性的可视化需求,并提供手势和语音交互手段,从数据展示和用户使用两个方面综合提升平台交互性。最后,本平台应用于国家重点研发计划课题“科技咨询数据资源体系研究与资源建设”中,为课题中数据全景动态交付可视化部分提供数据交付技术支撑,验证了本文提出方法的有效性与平台的实际应用价值。
基于知识图谱的桥梁事故智能问答系统的设计与实现
这是一篇关于桥梁事故,知识图谱,知识图谱可视化,问答系统的论文, 主要内容为近年来,我国交通建设的发展日新月异。桥梁事故的研究对我国交通建设的发展具有重要的意义,然而目前桥梁事故领域的研究主要面临两个问题。一是桥梁事故领域的数据类型多源异构,难以有效整合。二是国内外缺少高效的桥梁事故领域数据相关的检索平台。针对以上两个问题,本文开展研究。知识图谱作为网络状的知识库,具有丰富的节点和关系,且由于其网状的知识结构,使其可以很好地整合结构化、半结构化和非结构化的数据,因此构建桥梁事故领域的知识图谱可以很好地解决第一个问题。搜索引擎作为传统的最广泛应用的检索平台,可以帮助人们快捷地获取信息,然而其返回的答案还需要人工二次筛选才可得到想要的结果。智能问答系统可以结合新兴人工智能技术,较好地对用户的问句进行分析,从而能够较为充分地识别用户意图,同时还可以对答案进行筛选,逐渐成为了人与互联网交互的新趋势。因此构建桥梁事故领域的智能问答问答系统可以很好地解决第二个问题。综上所述,本研究将知识图谱与智能问答系统结合。首先,完成了对桥梁事故领域核心本体的建模并据此构建了桥梁事故领域的知识图谱。在确认了桥梁事故领域内的实体和关系属性后,进而完成核心本体的建模,接着构建了桥梁事故领域的知识图谱。然后,提出了桥梁事故领域智能问答算法的流程图。该流程图结合了基于语义解析的方法和基于规则匹配的方法。具体来讲,使用BERT-Bi LSTMCRF组合模型来完成命名实体识别任务,并添加了实体映射步骤来提升实体识别的精度;使用SBERT组合模型来完成关系属性映射任务,并添加了属性字符串匹配步骤来加快整体的问答流程。最终,使用流行的B/S架构,将知识图谱和智能问答算法应用于桥梁事故领域,设计并实现了桥梁事故领域的智能问答系统。为使用者快速、精确地获取桥梁事故领域的相关数据提供了便利。基于上述论述,本文首先介绍了本研究的相关理论和技术分析。其中包括构建知识图谱相关的知识图谱相关理论基础、爬虫技术、知识存储等,以及与智能问答算法相关的命名实体识别和关系属性映射技术,以及开发智能问答系统所使用的Flask框架和系统前端的知识图谱可视化所使用的Echartxs组件等技术。然后详细地阐述了构建桥梁事故领域知识图谱的流程,主要包括桥梁事故领域核心本体研究、知识存储和知识抽取。接着,提出了本研究所设计的智能问答算法的工作流程。本研究将基于规则匹配的方法和基于语义解析的方法进行结合。在语义解析方面,确定了命名实体识别和关系属性映射两个子任务。首先设计了基于BERT-Bi LSTM-CRF模型的命名实体识别算法进行实体识别的工作。在关系属性映射部分,首先根据字符串匹配去匹配用户意图,如果匹配失败,再使用SBERT模型进行相似度计算,这样可以极大缩短系统的响应时间。在规则匹配方面,从桥梁管理学角度出发构造了相应的问题模板和Cypher语句查询模板,然后查询图数据库,最终返回结果。基于对智能问答算法的研究,设计并实现了基于桥梁事故领域知识图谱的智能问答系统,系统主要分为权限管理、图谱展示、图谱管理和图谱查询四个模块。本文围绕桥梁事故展开研究,首先对桥梁事故领域的核心本体进行研究,随后构建了基于桥梁事故领域的知识图谱,然后对提出的相关的智能问答算法进行了介绍,最终构建了基于桥梁事故领域知识图谱的智能问答系统,该系统可以帮助用户快速、精确地检索桥梁事故领域的事故信息,为桥梁事业的智能化、数字化发展注入了新的活力。
K12教育知识图谱管理系统设计与实现
这是一篇关于教育知识图谱,Neo4j图数据库,D3.js技术,知识图谱可视化,知识图谱管理的论文, 主要内容为近年来,人工智能、大数据等新兴信息技术与教育教学深度融合,知识图谱作为推动智能教育快速发展的核心驱动力,旨在将庞大冗余的知识体系化和规范化,以图形可视化的形式展现知识结构和知识间关系,为教育教学提供了新的赋能力量,因此教育界专家学者开始重视知识图谱在教育领域的重要作用。本文通过文献分析,了解到目前智能教育发展中的一个重要研究课题是教育知识图谱的构建,但由于教育知识图谱要求高准确性,知识具有延展性,因此需要不断地对教育知识图谱进行更新与维护。然而目前多数研究者专注于知识图谱构建技术及应用方面,知识图谱依然存在知识管理维护不规范、知识更新和组织困难等问题。基于以上诉求,本文旨在面向K12基础教育阶段设计实现教育知识图谱管理系统。主要研究内容如下:(1)系统设计。通过对教育知识图谱的数据管理和可视化交互需求进行充分分析,本研究将教育知识图谱管理系统划分为四个功能模块:知识图谱可视化模块通过D3.js可视化工具实现教育知识图谱的可视化展示与动态交互;知识图谱检索模块用于实现对教育知识节点和关系数据的多样化检索;知识图谱管理模块用于对教育知识图谱中节点及关系进行增、删、改、查等数据管理操作;知识图谱构建模块使用LOAD CSV方法导入知识图谱或手动创建知识图谱。(2)系统实现与测试。本文主要使用PHP Laravel框架搭建服务器端,并结合前端和后台开发技术、图数据库技术,一一实现系统相关功能。首先系统底层采用图数据库Neo4j存储知识图谱形式的教育知识数据,然后利用D3.js前端可视化技术对教育知识图谱进行可视化呈现及动态交互,使用不同颜色分类展示不同层级概念,之后利用Neo4j图数据库自带的Cypher语句实现对知识图谱的增删改查等多种操作,最后通过兼容性测试、功能测试和性能测试对系统进行评估与改进。由上可知,本文采用系统开发方法和相关技术工具构建了一个功能齐全的教育知识图谱管理系统,提高用户管理维护知识图谱的效率,为进一步利用教育知识图谱开展适应性学习诊断、个性化学习推荐等智能教育应用提供基础,也为其他领域知识图谱的管理提供参考。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码驿站 ,原文地址:https://m.bishedaima.com/lunwen/47752.html