基于知识图谱的LNG储备库事故智能预警研究及可视化
这是一篇关于LNG储备库安全管理,知识图谱,因果关系抽取,风险因素泛化,事故智能预警的论文, 主要内容为从上世纪40年代至今,国内外LNG储备库共发生数十余次事故,包含事故信息的安全管理数据十分缺乏,可直接利用的安全管理文本较少;且仅靠人力难以准确、客观、快速地从非结构化的安全管理文本中提取价值知识。为了提高LNG储备库运行过程中的安全性,实现LNG储备库事故智能预警与安全保障决策推荐,本文利用知识图谱结构化文本表征方式和信息集成能力,将LNG储备库安全管理文本中隐藏因果规律信息有效整合,开展了以下三方面的研究:(1)针对人工处理文本效率低、领域性强的问题,为解决LNG储备库安全管理文本的小样本问题与深度学习方法之间的矛盾,本文提出了一种基于文本增强的LNG储备库风险因素因果关系抽取模型。通过加入特征加强层与词句拼接层,通过向神经网络中输入更多中文字词文本特征与长文本信息,使得因果关系抽取方法的特征提取能力与预测结果的准确性提高。本文以LNG储备库相关真实事故文本为例对所提方法进行应用,与不同抽取方法相比,本文提出方法的准确度提高了17.40%、召回率提高了15.78%、F1值提高了17.41。(2)针对常规文本泛化方法对无法较好表征LNG储备库安全管理文本语义的问题,减小由于中文分词误差对抽象知识图谱构建的影响,本文提出了一种基于字-词特征的LNG储备库风险因素演化知识图谱构建方法。通过加入字-二元词组的特征,优化了文本的特征表示,保留了更多有效的语义信息。以LNG储备库风险因素文本为例应用此方法,与其他泛化方法相比,各类风险因素泛化效果得到了0.81%~25.21%不同程度的提高。(3)针对常见事故预警方法无法有效集成因果关系、依赖先验知识等问题,同时为获取更加长期的事故预警与安全保障决策支持,本文提出了基于知识图谱的LNG储备库事故智能预警方法,并开发了LNG储备库事故演化预警及安全决策推荐系统。基于LNG储备库风险因素演化知识图谱,结合文本匹配与路径推理方法,实现了LNG储备库事故演化的多节点预测;并于系统中实现LNG储备库事故一键智能预警与安全保障决策推荐两个主要分析功能。案例结果表明,本文所提方法与系统在3个案例中的预警结果符合实际;相比于传统安全管理模式,本系统耗时短,人力消耗少,流程简便,实用性强。
多形态因果关系抽取及因果知识图谱构建
这是一篇关于信息抽取,因果关系抽取,知识图谱,深度学习,提示学习的论文, 主要内容为科学研究的一个基本目标就是了解事物之间的因果关系,探索现象背后的本质和事物发展的基本规律。然而,现有的人工智能研究方法更多的是从单纯数据关联的角度而非因果推理的角度出发的。为了更好地了解因果关系并推动因果推理的发展,最重要的一步便是从现实世界的各类数据中抽取因果信息。因此,本文主要是探究自然语言文本中的多形态因果关系抽取、篇章级事件因果关系识别和推理,并最终构建一个涵盖多个领域的因果知识图谱。首先,本文主要研究多形态因果关系抽取,包含句内因果关系抽取和句间因果关系识别两个任务。针对于句内因果关系抽取任务,本文采用流水线式的方法:先抽取句子中的所有名词性词或词组(Nominals),然后再通过句中因果信号词的语义信息来识别具有因果关系的Nominals对。这种方法避免了现有工作中直接采用序列标注方法所存在的因果嵌套问题。针对于句间因果关系识别任务,由于缺少因果信号词,隐式因果关系识别性能较差。本文采用提示学习的思想,将句间因果关系识别任务改造成更靠近大规模语言模型预训练任务的形式,以此来充分挖掘大规模预训练语言模型中所蕴含的常识知识,有效提升模型在隐式因果关系识别任务上的性能。其次,本文将研究篇章级事件因果关系识别,主要包括句子内和跨句子的事件因果关系识别。针对于现有研究工作中标注数据不足的问题,本文提出融入外部知识库中的常识知识的方法,将与事件相关的常识知识融入到事件的编码表示中,以此来帮助模型识别事件间的因果关系。与此同时,在跨句子事件因果关系识别任务中,由于句子跨度较大、上下文信息复杂繁多,导致模型无法有效进行因果关系识别的问题。本文通过上一章的句间因果关系识别研究过滤掉了大量的负样本对,从而提升了模型识别的准确率。在篇章级事件因果关系识别的基础上,本文进一步探索事件因果关系推理,尝试在给定上下文及原因(或结果)事件的前提下,推理出其对应的结果(或原因)事件是什么。最后,本文利用上述研究方法,在足球领域新闻、金融领域新闻和医疗领域诊断报告等文本数据上进行因果关系抽取。然后利用图数据库Neo4j来构建一个多领域因果知识图谱,并在对应领域上探索因果知识图谱的应用。
基于知识图谱的LNG储备库事故智能预警研究及可视化
这是一篇关于LNG储备库安全管理,知识图谱,因果关系抽取,风险因素泛化,事故智能预警的论文, 主要内容为从上世纪40年代至今,国内外LNG储备库共发生数十余次事故,包含事故信息的安全管理数据十分缺乏,可直接利用的安全管理文本较少;且仅靠人力难以准确、客观、快速地从非结构化的安全管理文本中提取价值知识。为了提高LNG储备库运行过程中的安全性,实现LNG储备库事故智能预警与安全保障决策推荐,本文利用知识图谱结构化文本表征方式和信息集成能力,将LNG储备库安全管理文本中隐藏因果规律信息有效整合,开展了以下三方面的研究:(1)针对人工处理文本效率低、领域性强的问题,为解决LNG储备库安全管理文本的小样本问题与深度学习方法之间的矛盾,本文提出了一种基于文本增强的LNG储备库风险因素因果关系抽取模型。通过加入特征加强层与词句拼接层,通过向神经网络中输入更多中文字词文本特征与长文本信息,使得因果关系抽取方法的特征提取能力与预测结果的准确性提高。本文以LNG储备库相关真实事故文本为例对所提方法进行应用,与不同抽取方法相比,本文提出方法的准确度提高了17.40%、召回率提高了15.78%、F1值提高了17.41。(2)针对常规文本泛化方法对无法较好表征LNG储备库安全管理文本语义的问题,减小由于中文分词误差对抽象知识图谱构建的影响,本文提出了一种基于字-词特征的LNG储备库风险因素演化知识图谱构建方法。通过加入字-二元词组的特征,优化了文本的特征表示,保留了更多有效的语义信息。以LNG储备库风险因素文本为例应用此方法,与其他泛化方法相比,各类风险因素泛化效果得到了0.81%~25.21%不同程度的提高。(3)针对常见事故预警方法无法有效集成因果关系、依赖先验知识等问题,同时为获取更加长期的事故预警与安全保障决策支持,本文提出了基于知识图谱的LNG储备库事故智能预警方法,并开发了LNG储备库事故演化预警及安全决策推荐系统。基于LNG储备库风险因素演化知识图谱,结合文本匹配与路径推理方法,实现了LNG储备库事故演化的多节点预测;并于系统中实现LNG储备库事故一键智能预警与安全保障决策推荐两个主要分析功能。案例结果表明,本文所提方法与系统在3个案例中的预警结果符合实际;相比于传统安全管理模式,本系统耗时短,人力消耗少,流程简便,实用性强。
基于多任务学习的序列标注式因果关系抽取
这是一篇关于因果关系抽取,多任务学习,稀疏共享,序列标注的论文, 主要内容为因果关系抽取任务是自然语言处理领域中的重要研究任务之一,它在知识图谱、问答系统以及事件预测等多个方向中发挥着至关重要的作用。现有的研究方法大部分是基于单任务学习,忽略了因果关系抽取任务与其它任务之间的联系。此外,语料库中含有一对多、多对多等复杂的因果关系,且非因果关系实体对(负实例)的数量通常远远超过因果关系实体对(正实例)的数量。面对文本中复杂的因果关系与因果数据稀缺的问题,这些研究方法通常不能达到很好的抽取效果。针对以上问题,本文引入多任务学习框架的参数共享机制,通过任务间的参数共享,使因果关系抽取任务充分捕捉辅助任务中隐藏的语义信息,解决不平衡语料库中因果关系抽取效果差的问题。通过“BIO”序列标注方法,将因果关系抽取任务转换成序列标注任务,解决语料库中复杂因果关系抽取不充分的问题。本文的主要研究工作如下:1.将口语理解系统中槽填充和意图识别的交互式Transformer框架引入到自然语言处理领域中,提出了基于多任务学习的因果强度分类和因果关系抽取模型(CIT-CSCR模型)。引入标签注意力机制获取两个任务的显式特征表示,通过多任务学习框架建立两个任务之间的双向连接,探究多任务学习对因果关系抽取任务的影响。实验结果表明:本文提出的方法在因果强度分类任务和因果关系抽取任务中,通过注意力机制间的交互作用,使因果关系抽取任务获得了丰富的语义信息,与单任务学习方法相比,在性能方面得到了显著的提高。2.为了进一步提高因果关系抽取的性能,结合BERT预训练语言模型和多任务学习框架,提出了基于BERT和稀疏共享机制的序列标注式因果关系抽取模型(MTLSS+BERT+BiLSTM+CRF模型)。首先,采用“BIO”序列标注方法来标注样本数据,将因果关系抽取任务转化为序列标注任务。然后,选取词性标注(POS)和组块分析(Chunk)作为因果关系抽取任务的辅助任务,并选取稀疏共享架构作为多任务学习框架。最后,引入BERT预训练模型从上下文中获取充分的因果语义信息,通过参数剪枝技术减少模型的冗余参数,并将该模型和基准模型在SemEval2010-Task8和自建的MTL-CE数据集上进行了大量实验。实验结果表明:与传统的单任务抽取方法相比,通过稀疏共享机制减少了模型的参数,促进了任务之间的交互,提升了因果关系抽取任务的性能,其F1值达到了最高。本文提出的多任务学习模型在因果关系抽取任务中达到了预期的效果,提高了复杂因果关系抽取的准确率,一定程度上缓解了不平衡语料库的因果关系抽取问题,本文工作为后续因果关系抽取任务的研究提供了一种新思路。
多形态因果关系抽取及因果知识图谱构建
这是一篇关于信息抽取,因果关系抽取,知识图谱,深度学习,提示学习的论文, 主要内容为科学研究的一个基本目标就是了解事物之间的因果关系,探索现象背后的本质和事物发展的基本规律。然而,现有的人工智能研究方法更多的是从单纯数据关联的角度而非因果推理的角度出发的。为了更好地了解因果关系并推动因果推理的发展,最重要的一步便是从现实世界的各类数据中抽取因果信息。因此,本文主要是探究自然语言文本中的多形态因果关系抽取、篇章级事件因果关系识别和推理,并最终构建一个涵盖多个领域的因果知识图谱。首先,本文主要研究多形态因果关系抽取,包含句内因果关系抽取和句间因果关系识别两个任务。针对于句内因果关系抽取任务,本文采用流水线式的方法:先抽取句子中的所有名词性词或词组(Nominals),然后再通过句中因果信号词的语义信息来识别具有因果关系的Nominals对。这种方法避免了现有工作中直接采用序列标注方法所存在的因果嵌套问题。针对于句间因果关系识别任务,由于缺少因果信号词,隐式因果关系识别性能较差。本文采用提示学习的思想,将句间因果关系识别任务改造成更靠近大规模语言模型预训练任务的形式,以此来充分挖掘大规模预训练语言模型中所蕴含的常识知识,有效提升模型在隐式因果关系识别任务上的性能。其次,本文将研究篇章级事件因果关系识别,主要包括句子内和跨句子的事件因果关系识别。针对于现有研究工作中标注数据不足的问题,本文提出融入外部知识库中的常识知识的方法,将与事件相关的常识知识融入到事件的编码表示中,以此来帮助模型识别事件间的因果关系。与此同时,在跨句子事件因果关系识别任务中,由于句子跨度较大、上下文信息复杂繁多,导致模型无法有效进行因果关系识别的问题。本文通过上一章的句间因果关系识别研究过滤掉了大量的负样本对,从而提升了模型识别的准确率。在篇章级事件因果关系识别的基础上,本文进一步探索事件因果关系推理,尝试在给定上下文及原因(或结果)事件的前提下,推理出其对应的结果(或原因)事件是什么。最后,本文利用上述研究方法,在足球领域新闻、金融领域新闻和医疗领域诊断报告等文本数据上进行因果关系抽取。然后利用图数据库Neo4j来构建一个多领域因果知识图谱,并在对应领域上探索因果知识图谱的应用。
基于时间的图注意力因果发现模型
这是一篇关于深度学习,因果关系抽取,时间关系,序列标注,图注意力的论文, 主要内容为提取实体之间的因果关系是获取因果关系知识的基础,也是自然语言理解(Natural language understanding,NLU)任务的一个基本步骤。因果关系往往伴随着实体的时间线索:一个实体的因果关系总是状态的变化或行为的变化,这些变化伴随着时间的变化。据我们所知,时间因果关系提取没有得到与其重要性相一致的足够重视,对于时间因果关系的研究几乎没有,同时带有时间关系和因果关系的数据集更是少之又少。针对当前的序列标注、文本分类和关系抽取这三种主流方法,本文根据基于时间因果关系抽取的研究任务需求,确定了采用序列标注的方法结合时间关系抽取文本中的因果实体,无需其他因果知识背景和特征工程。本文的主要贡献是:1.在基础概念和研究方法上,基于当前已经存在的因果关系抽取研究方法,列举当前国内外研究现状并做出详细地分析与总结,同时结合应用在因果抽取方向上的时间关系研究,使读者了解因果方向的领域研究;2.在算法模型上,使用基于时间关系的图注意力网络(T-GAT)的概念,即将图注意力机制应用于时间关系中;使用基于因果知识图谱的图注意力网络(C-GAT)的概念,即使用因果知识图谱提取GAT使用的邻接矩阵;提出均衡机制(Equilibrium mechanism)平衡两个模块的输出,平衡时间关系的负面影响。结合深度学习的知识,提出了TC-GAT(BERT+T-GAT+C-GAT+Equilibrium)因果关系抽取模型预测句子中每个词对应的因果标签。3.在标注方法上,首先介绍了时间关系类型,并根据实际需求确定时间标注类型,经过现有因果序列标注方法进行多角度分析,确定采用“核心因果词”的方法标注时间和因果关系,降低标注难度;4.在实验数据上,对现有的因果关系数据集进行了全面的分析和总结,列举其标注方法和标注准则;根据实验需要,最终选取了Sem Eval2010-Task8和Altlex数据集,对其进行行修正和扩展,同时标注了因果关系和时间关系标签,创建新的时间因果数据集TC-Sem Eval2010-Task8和TC-Altlex;5.在实验结果上,通过在时间因果数据集TC-Sem Eval2010-Task8和TC-Altlex上进行实验,实验结果表明,与传统的基线模型相比,我们的模型在因果关系提取任务上的性能有了明显的提高,证明了时间关系对抽取因果关系是有帮助作用的。最后,更进一步探究本文的模型在该方向的可延伸性。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码码头 ,原文地址:https://m.bishedaima.com/lunwen/56258.html