融入知识的工艺文本命名实体识别研究
这是一篇关于工艺文本,命名实体识别,领域知识,BiLSTM,预识别特征编码,词信息编码的论文, 主要内容为融入知识的工艺文本命名实体识别是以某型飞机装配所遵循的工艺文本作为数据集,该工艺文本数据集来源于工艺标准、工艺大纲、工艺规范和指导书的操作说明语句,共包含工程图纸、零件、零件号、结构特征等12类实体。在民机装配过程中所有的整体都是有很多个组件共同构成,会造成不同场景不同工序下的相同实体不相同类型的情况,也存在命名不规范、命名构成方式相同的情况,会使工艺制造人员在工艺制造过程中不能够迅速且高效的辨别实体,同时融入知识的工艺文本命名实体识别对工艺知识库构建、工艺知识图谱的构建以及工艺自动生成等具有重要作用,本文通过融入工艺制造领域知识来提高工艺文本的命名实体的识别效果。本文根据工艺制造领域文本总结归纳领域知识并提出一种融入知识的工艺文本命名实体识别方法,该方法依据工艺领域知识对文本序列进行实体的预识别形成预识别特征矩阵,再使用编码器对预识别特征矩阵编码,并基于预识别训练词向量作为词信息编码,然后将两种编码融入到基于神经网络的实体识别模型中。实验结果表明,在使用双向长短时记忆网络为预识别特征矩阵编码器和Bi LSTM-CRF神经网络模型的F1值达到92.55%,融入知识的工艺文本命名实体识别方法能够有效提高工艺文本实体的识别效果。最后,本文设计实现了融入知识的工艺文本命名实体识别系统。该系统使用工艺文本输入,可添加自定义规则和工艺文本数据,可选择不同的预识别特征编码器,包括训练、测试、预测三种功能。该系统能够有效地提高工艺制造人员的工作效率,也能够为技术开发人员提供技术支持。
基于神经网络与领域知识的生物医学关系抽取
这是一篇关于生物医学关系抽取,图卷积神经网络,注意力机制,领域知识的论文, 主要内容为信息抽取技术为处理互联网中存在的海量数据提供了手段。生物医学文献是互联网文本数据的重要组成部分,隐藏在文献背后的知识可以服务于信息检索、推荐系统和问答系统等实际应用领域。关系抽取是用于挖掘文献中蕴含的知识的一种必不可少的技术。本文重点研究生物医学领域的篇章级关系抽取,区别于传统关系抽取局限于抽取单个句子内的实体关系,篇章级关系抽取则是从文献摘要中抽取实体关系,而摘要文本通常由多个句子组成,长度更长,语义更加复杂。本文提出一种基于图卷积神经网络和多头注意力机制的端到端关系抽取方法。为了更好地从长文本中提取特征,构建了文档级别依存图并使用图卷积神经网络对其进行建模,获得了文本的句法结构特征,另一方面使用多头注意力机制从不同的语义子空间中获取与关系抽取任务最相关的文本序列上下文特征,将得到的上下文特征和句法特征融合后用于关系分类。此外,传统的词向量是静态词向量,不能根据上下文确定词的语义表示,而本文使用了深度上下文相关词向量替换传统词向量,解决传统词向量存在的一词多义问题,从而丰富了文本输入特征的表达。除了文本信息以外,现有的生物领域知识也可以为关系抽取提供更多信息。本文提出了基于领域知识的关系抽取方法,探索如何从已有生物知识库中获得领域知识,并将知识信息与文本信息有效结合用于关系分类中。通过现有的生物知识库构建大量的知识三元组,并运用知识表示模型学习三元组中蕴含的领域知识,得到实体向量和关系向量。本文采用关系向量作为知识向量,提出知识注意力机制将领域知识与文本信息进行融合,以进一步提高关系抽取系统的性能。本文的研究是在BioCreative-V组织提出的化学物-疾病关系抽取数据集上展开的。设计并完成了充分的对比实验用于验证所构建模型的实际效果。最终的实验结果显示本文提出的建模方法可以有效地提高关系抽取系统的性能。
基于领域知识的贝叶斯网概率推理方法及其应用
这是一篇关于贝叶斯网,概率推理,知识图谱,领域知识,关联图的论文, 主要内容为贝叶斯网(Bayesian Network,BN)是概率推理及知识表示的重要框架,被广泛应用于故障诊断、金融投资决策、疾病风险评估等推理诊断系统,是辅助人们规避风险、做出正确决策的重要工具。高效的BN概率推理方法对增强推理诊断系统的推理能力具有重要的现实意义。然而,在基于BN概率推理的实际应用中,由于缺乏BN节点间间接存在的关联信息,过多的BN节点参与推理计算,导致BN推理效率不高。因此,如何筛选部分BN节点用于推理,是提高BN概率推理效率的关键。知识图谱(Knowledge Graph,KG)包含海量的结构化领域知识,是补充缺失知识及信息的有效工具。针对BN概率推理任务,如何利用KG中的领域知识,补充BN节点间缺乏的间接关联信息实现高效的概率推理,是本文研究的关键问题。为此,本文基于KG表示学习模型将KG实体向量化,计算KG实体相似度,并以KG实体相似度为依据抽取BN子图,称为节点关联图(Node Correlation Graph,NCG),将NCG嵌入到低维向量空间,将NCG的节点向量计算结果作为推理结果输出。本文的主要研究内容概括如下:(1)基于KG的NCG学习。针对BN概率推理的查询节点与证据节点,以KG实体相似度为依据,从BN结构中选择从查询节点到证据节点的最短路径,最短路径构成NCG结构,同时,基于KG实体相似度与BN节点参数计算NCG权值。(2)基于NCG嵌入的概率推理。将NCG嵌入低维向量空间获取NCG节点的向量表示,计算查询节点向量与证据节点向量内积,与NCG所有节点向量内积之和的比值,将比值作为BN概率推理的近似结果输出。(3)针对NCG概率推理方法的实验测试。实验结果表明,本文提出的基于NCG嵌入的概率推理方法的执行效率,相比于其他现有模型有较大提升,且推理结果与精确值接近。同时,为了向医护人员提供辅助诊疗的服务,设计并实现了以疾病风险评估为背景的NCG原型系统。
基于超宽带及领域知识融合的滑冰场定位系统设计与实现
这是一篇关于室内定位,UWB,领域知识,卡尔曼滤波的论文, 主要内容为随着国家对冰雪运动的大力发展,专业运动员和冰雪爱好者逐渐进入到室内冰场中运动训练、娱乐游玩。现有滑冰场希望引入高精度的室内定位系统为冰场中速度、位置变化频繁的滑冰人员提供辅助训练或娱乐服务。但因室内场馆对卫星信号的屏蔽,Wi-Fi/BLE等传统指纹定位精度不高、更新频率不足,致使无法使用北斗等卫星定位或传统指纹定位。超宽带(Ultra Wide Band,UWB)定位技术能够提供精度较高、更新频率较快的定位结果,现有UWB系统也都实现了简单的定位功能。本课题所依托横向项目要求在现有系统基础上设计实现针对滑冰场的高精度、低时延的UWB定位系统。但在实际生产过程中,还有以下问题亟待解决:(1)现有UWB定位系统定位精度无法满足课题需求,而传统优化方法没有利用滑冰者速度、运动状态等领域知识,针对滑冰场内人员速度变化大、运动状态多变的情况,其优化能力不足;(2)现有UWB定位系统缺乏用户管理、定位设施管理等系统管理功能,无法满足滑冰场定位系统需求。针对上述问题,本文将开展基于超宽带及领域知识融合的滑冰场定位系统算法研究及开发工作。该算法在经典卡尔曼滤波算法的基础上做了改进和优化,能够对分运动状态后的定位结果使用不同的优化方案,进一步提升定位精度,满足了课题需求。此外,根据冰场内人员定位需求,通过分析人员角色和用例图来确定系统的各项需求,并以原系统为基础增加新的功能。再由系统概要设计确定整体的系统架构,并划分系统的各部分功能模块。再通过ER图进行数据库分析以及数据库表设计,并对界面风格设计进行简单介绍。之后,设计并确定系统各功能模块类图与功能时序图,依照系统的详细设计进行编码。最后,在实验场地内进行充分测试,找到并改善系统中的开发、算法缺陷,确保系统能够满足各项需求。本课题已成功完成了 UWB定位系统全部工作,且在课题委托方的室内冰场中充分测试并成功上线运行。
特定领域知识共享系统的设计与实现
这是一篇关于领域知识,知识共享,可视化交互的论文, 主要内容为在互联网飞速发展的背景下,网络中的知识信息迎来了爆炸式的增长,大量的领域知识分散地隐藏在网络数据中。面对海量的领域知识,想要第一时间从中获得需要的关键信息变得非常困难。由于缺少统一的知识集成管理和可视化分析方式,导致知识的共享率不高,而且无法进行有效的分析和复用。此外,在数据多样化的发展趋势下,人们对于知识的多维度表示需求日益增加,这对知识的共享管理和可视化分析提出了更高的要求。目前已有一些知识平台的可以提供知识管理功能,但是无法对复杂冗余的知识进行有效地集成和融合,并且局限于知识的简单展示,无法提供丰富的展示形式。针对上述问题,本文设计并开发了一款面向领域数据的知识共享可视化系统,系统通过知识抽取、知识融合、知识图谱构建等技术将领域文本中复杂离散的信息组织为结构化知识,通过自动化构建知识库并可视化知识图谱构建过程,实现知识的自动化管理和应用,并从多维度、多层次对知识的语义逻辑和数据关联进行可视化展示。特定领域知识共享系统主要划分为四个模块:知识抽取模块、知识融合模块、知识图谱构建模块、可视化展示模块:(1)针对复杂多样的网络文本中隐含的离散领域知识,知识抽取模块通过依存句法分析匹配预定义的语义范式,对文本中的非结构化文本信息进行抽取并统一组织为结构化的事件多元组形式。(2)针对事件多元组中存在的冗余和冲突问题,知识融合模块采用了基于深度学习的实体对齐和交叉验真技术,保证知识的融合效率和准确性。(3)针对海量数据来源,知识图谱构建模块采用分布式架构进行海量知识存储,通过属性图模型重新对数据进行建模,最终利用查询语句优化算法进行存储查询,实现知识的共享管理。(4)针对知识共享系统中数据呈现方式单一的问题,通过图表、地图等方式优化系统交互效果,引入地图接口绘制含有地理位置信息的元素轨迹,最后采用层次划分算法解决海量数据下知识图谱可视化渲染卡顿的问题。完成系统的设计实现工作后,根据系统的功能性需求和非功能性需求进行了系统测试,特定领域知识共享系统的各项功能模块能够正常工作,达到预期结果。系统通过知识抽取融合技术对领域知识进行抽取并统一表示,通过可视化展示模块对领域知识进行多角度展示,实现领域知识的自动化管理和应用并提供知识共享的能力。
基于领域知识的贝叶斯网概率推理方法及其应用
这是一篇关于贝叶斯网,概率推理,知识图谱,领域知识,关联图的论文, 主要内容为贝叶斯网(Bayesian Network,BN)是概率推理及知识表示的重要框架,被广泛应用于故障诊断、金融投资决策、疾病风险评估等推理诊断系统,是辅助人们规避风险、做出正确决策的重要工具。高效的BN概率推理方法对增强推理诊断系统的推理能力具有重要的现实意义。然而,在基于BN概率推理的实际应用中,由于缺乏BN节点间间接存在的关联信息,过多的BN节点参与推理计算,导致BN推理效率不高。因此,如何筛选部分BN节点用于推理,是提高BN概率推理效率的关键。知识图谱(Knowledge Graph,KG)包含海量的结构化领域知识,是补充缺失知识及信息的有效工具。针对BN概率推理任务,如何利用KG中的领域知识,补充BN节点间缺乏的间接关联信息实现高效的概率推理,是本文研究的关键问题。为此,本文基于KG表示学习模型将KG实体向量化,计算KG实体相似度,并以KG实体相似度为依据抽取BN子图,称为节点关联图(Node Correlation Graph,NCG),将NCG嵌入到低维向量空间,将NCG的节点向量计算结果作为推理结果输出。本文的主要研究内容概括如下:(1)基于KG的NCG学习。针对BN概率推理的查询节点与证据节点,以KG实体相似度为依据,从BN结构中选择从查询节点到证据节点的最短路径,最短路径构成NCG结构,同时,基于KG实体相似度与BN节点参数计算NCG权值。(2)基于NCG嵌入的概率推理。将NCG嵌入低维向量空间获取NCG节点的向量表示,计算查询节点向量与证据节点向量内积,与NCG所有节点向量内积之和的比值,将比值作为BN概率推理的近似结果输出。(3)针对NCG概率推理方法的实验测试。实验结果表明,本文提出的基于NCG嵌入的概率推理方法的执行效率,相比于其他现有模型有较大提升,且推理结果与精确值接近。同时,为了向医护人员提供辅助诊疗的服务,设计并实现了以疾病风险评估为背景的NCG原型系统。
基于领域知识的线要素简化方法研究
这是一篇关于领域知识,线简化,弯曲,路网,空间方向关系的论文, 主要内容为线简化是地图综合的重要算子,制图时,制图者通常根据主观决策从散乱无序的线简化算法中选择合适的算法,而很少关注已有线简化算法的有序管理和自动选择。但是,已经存在的算法不能在所有应用场景中获得良好的结果,例如,高精地图的快速发展和广泛采集,要求研究能满足特定场景和该数据特点的路网简化算法。因此,仍需不断改进已有的和研究新的线简化算法。本文在对已有线简化算法的知识和经验进行抽象和归纳的基础上,针对线要素现有的算法的不足进行研究和改进,很好地解决了弯曲结构的有效识别问题,以及城市高精路网数据的简化和空间方向关系维护问题。主要研究成果和创新点如下:1)研究了地图上线要素简化的知识表达方法。对线简化知识和经验进行科学归纳和形式化表达,将知识封装在本体中,可以依据知识,自动选择满足某一特定线状目标简化要求的算法,有利于对已有算法的管理和维护。以简单海岸线和路网简化为例,构建了相关知识图谱。2)提出了弯曲识别的新算法并应用于线的渐进式简化。详细分析了直接以曲率极值点划分弯曲时存在的两个问题并研究了具体解决方案,形成符合空间认知规律的基本弯曲单元。然后根据需要选择并计算弯曲指标,对弯曲进行渐进式简化。将该方法应用到简单海岸线简化中,结果证明该弯曲识别方法保持了弯曲两侧结构的完整性,同时渐进式简化结果保持了线目标的拓扑关系和整体结构。3)改进了一种顾及导航约束的Opheim算法。该算法首先分析了导航路网的模型表达,提取满足语义约束的关键地形点,然后根据路段的长度、方位和拓扑特征按照一定的规则进行渐进式简化。应用于高精数据的简化结果能够最大程度地保持道路的空间关系和形状特征,同时能标注出最终无法处理的问题点。4)提出了城市高精路网数据表达精度降低时的空间方向关系智能化维护方法。针对路网结构特点,本文将多个直接连接的节点定义为特殊节点,其它路网节点定义为普通节点。分析了已有方法维护特殊节点的空间方向关系所引起的问题后,引入了带精英策略的遗传算法寻找最优解。针对四个城市的路网实验结果表明该方法是合理且有效的,维护后的道路形状与原始道路形状相似且拓扑关系正确。
特定领域知识共享系统的设计与实现
这是一篇关于领域知识,知识共享,可视化交互的论文, 主要内容为在互联网飞速发展的背景下,网络中的知识信息迎来了爆炸式的增长,大量的领域知识分散地隐藏在网络数据中。面对海量的领域知识,想要第一时间从中获得需要的关键信息变得非常困难。由于缺少统一的知识集成管理和可视化分析方式,导致知识的共享率不高,而且无法进行有效的分析和复用。此外,在数据多样化的发展趋势下,人们对于知识的多维度表示需求日益增加,这对知识的共享管理和可视化分析提出了更高的要求。目前已有一些知识平台的可以提供知识管理功能,但是无法对复杂冗余的知识进行有效地集成和融合,并且局限于知识的简单展示,无法提供丰富的展示形式。针对上述问题,本文设计并开发了一款面向领域数据的知识共享可视化系统,系统通过知识抽取、知识融合、知识图谱构建等技术将领域文本中复杂离散的信息组织为结构化知识,通过自动化构建知识库并可视化知识图谱构建过程,实现知识的自动化管理和应用,并从多维度、多层次对知识的语义逻辑和数据关联进行可视化展示。特定领域知识共享系统主要划分为四个模块:知识抽取模块、知识融合模块、知识图谱构建模块、可视化展示模块:(1)针对复杂多样的网络文本中隐含的离散领域知识,知识抽取模块通过依存句法分析匹配预定义的语义范式,对文本中的非结构化文本信息进行抽取并统一组织为结构化的事件多元组形式。(2)针对事件多元组中存在的冗余和冲突问题,知识融合模块采用了基于深度学习的实体对齐和交叉验真技术,保证知识的融合效率和准确性。(3)针对海量数据来源,知识图谱构建模块采用分布式架构进行海量知识存储,通过属性图模型重新对数据进行建模,最终利用查询语句优化算法进行存储查询,实现知识的共享管理。(4)针对知识共享系统中数据呈现方式单一的问题,通过图表、地图等方式优化系统交互效果,引入地图接口绘制含有地理位置信息的元素轨迹,最后采用层次划分算法解决海量数据下知识图谱可视化渲染卡顿的问题。完成系统的设计实现工作后,根据系统的功能性需求和非功能性需求进行了系统测试,特定领域知识共享系统的各项功能模块能够正常工作,达到预期结果。系统通过知识抽取融合技术对领域知识进行抽取并统一表示,通过可视化展示模块对领域知识进行多角度展示,实现领域知识的自动化管理和应用并提供知识共享的能力。
融合知识图谱的法律文本表示方法研究
这是一篇关于知识图谱,领域知识,知识嵌入,文本表示,神经网络的论文, 主要内容为随着司法领域信息化建设的广泛开展,法律文本作为司法领域的基础数据在司法智能化的过程中变得越发重要。如何高效地利用这些法律文本,对法律判决预测如罪名预测和法条推荐等任务有着十分重要的研究意义。现有的法律文本表示方法多是利用神经网络模型进行学习的,然而这些方法没有考虑过司法领域文本数据的一些独特性,也未考虑到知识图谱中蕴含的海量知识对于法律文本表示任务的帮助。从法律文本的角度来看,法律文本本身含有较多的专用词语,缺少对这些词语的解释。从知识图谱的角度来看,现有的法律知识图谱多以案件,涉案人员,审判人员和法院作为实体构建它们之间存在的关系,其中所蕴含的知识难以与法律文本表示相融合。出于法律文本的这些特点以及现有的法律知识图谱的不足,本文通过构建一个面向犯罪行为的法律知识图谱,并研究如何将知识图谱中的知识和法律文本的独特属性引入神经网络模型用以生成信息更加充分的法律文本向量表示。具体来说,本文的主要研究工作可以总结为如下几个方面:(1)针对文本中案情表示的需求,提出了面向犯罪行为的知识图谱构建方法。通过对法律文本中的案情分析,首先采用哈工大LTP工具对案情描述进行分词和词性标注等工作,接着通过依存句法分析算法分析处理过的文本中词与词之间的依存关系,然后根据语法规则的定义抽取得到相应的犯罪行为三元组的集合,最后将三元组形式的数据信息输入到Neo4j图数据库,利用Neo4j实现了面向犯罪行为的知识图谱的构建。(2)本文提出了一种融合外部犯罪行为特征的法律文本表示方法。通过对法律文本中的案情分析,解析案情中的犯罪特征关键词,并依据这些关键词去知识图谱中查询相关的实体,利用知识图谱嵌入的方法将这些实体转化为向量表示。对于犯罪特征词则是采用词嵌入的方法转化为向量表示。在模型结构上,将犯罪特征词的向量表示与相应知识实体的向量表示分别作为卷积神经网络的多通道输入,在卷积过程中分别从语义和知识两个层面进行学习。使得卷积神经网络能够捕获到更多的信息,进而可以得到更加完善的向量表示。(3)本文提出了一种融合犯罪行为序列的法律文本表示方法。在生成犯罪行为序列的表示部分,该模型通过引入知识图谱中的多条语义路径,来对案情描述的犯罪行为进行提取和拼接得到对应的犯罪行为序列,并使用双向长短记忆网络捕捉序列中前后的语义关系;在生成文本表示部分,对文本进行词向量表示,使用卷积神经网络提取文本的局部特征信息;最后将两个模型的表示结果结合起来得到当前文本的向量化表示。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码客栈网 ,原文地址:https://m.bishedaima.com/lunwen/54628.html