基于知识图谱的珍稀濒危植物自动问答研究
这是一篇关于珍稀濒危植物,自动问答,知识图谱,ALBERT,AC算法的论文, 主要内容为保护物种多样性是全人类共同的课题,而植物资源是物种多样性的重要组成部分,然而由于人们在进行人类活动的时候,缺乏对植物资源的正确认识,而导致目前已经有许多植物面临着灭绝的风险,因此为了明确这些珍稀濒危植物的物种信息,比如形态特征、生存条件、濒危系数、保护措施等,需要选择用一种有效且便捷直观的方式对珍稀濒危植物知识进行组织和管理。互联网上充斥着大量的珍稀濒危植物信息,然而这些信息高度分散、真假难辨、版本不一,从而导致从事与植物资源相关的工作人员和专业人员很难快速通过信息检索从庞大并且繁琐冗余的信息中获取所需知识。基于知识图谱的问答系统的出现可以有效的解决这一问题,它满足用户可以使用自然语言与机器进行交流的可能,知识图谱以数据库的方式服务于知识问答,从而满足了人们无需输入太多专业词汇和关键词即可实现知识获取,这种人性化、友好的交互方式使得问答系统在通用领域和专业领域都得到了广泛的应用。基于这样的背景,本文的研究工作从以下三个方面展开。(1)珍稀濒危植物多样性本体:分析通过爬虫获得的珍稀濒危植物文本数据,以数据、百度百科、基础植物学知识等为辅助数据来源,通过参考和复用现存植物本体,从而构建本文的珍稀濒危植物多样性本体;(2)珍稀濒危植物知识图谱构建:针对目前缺少珍稀濒危植物知识图谱这一问题,基于珍稀濒危植物多样性本体构建知识图谱,根据本体制定训练数据标注规则,本文采用管道式知识抽取模型进行知识抽取,首先,采用ALBERT模型对训练数据进行预训练处理,然后将训练数据送到Bi LSTM-CRF中进行训练,实现对文本中的实体识别,然后通过Bi GRU-Attention模型对实体的关系进行预测,最终抽取文本数据中的三元组,从而实现自动获取大批量的珍稀濒危植物三元组,并且将实体和关系储存在图数据库Neo4j当中,实验结果表明这两个模型在两个任务中的准确率分别达到了95.72%和96.00%;(3)基于知识图谱的珍稀濒危植物自动问答:知识图谱作为高质量的数据库可以服务于自动问答,由于目前缺少珍稀濒危植物领域问答语料数据集,本文采取传统语义解析方式,选择AC多模式匹配算法实现问句中实体识别和问题分类,然后通过问题模板匹配将原始问句转化为Neo4j中可读的Cypher语句进行知识库检索,最终返回答案给用户,实现自动问答。文本在构建珍稀濒危植物本体的基础上,通过融合ALBERT的管道式知识抽取方法构建了珍稀濒危植物知识图谱,最终基于该知识图谱,采用AC算法实现了珍稀濒危植物自动问答。
基于知识图谱的高考自动问答系统设计与实现
这是一篇关于高考自动问答系统,知识图谱,字词融合语义,ALBERT,知识向量,TransH的论文, 主要内容为近年的高考人数屡创新高,高考是我国青少年改变命运的最重要的一次机会,在高考结束之后的高考志愿填报至关重要。高校招生信息是考生和家长在高考后选择报考学校和报考专业的主要信息来源之一,如果考生能获取及时准确的高校招生信息,他们会更有把握进入心仪的高校专业学习。因此本文针对基于知识图谱的高考自动问答系统开展研究,主要包括以下几个方面:本文分析高考自动问答系统的设计需求,对系统架构进行研究,包括知识图谱构建模块和问答查询模块;设计高校信息知识图谱的结构,定义了知识图谱的5种实体、4种关系和11种属性;对问答系统的算法进行研究,分为实体识别任务和问答匹配任务。针对实体识别任务中词向量模型对词语语义信息提取不充分的缺点,采用预训练语言模型ALBERT代替传统word2vec训练词向量,针对只用词向量或者字向量训练实体识别模型,导致深层次的语义特征提取不足的问题,引入融合字词向量的CAW算法,采用CNN训练字向量获取词语语义、双向GRU初步提取上下文信息,经过拼接后再送入双向LSTM定位问句中实体位置。本文在人民日报和cluener数据集上进行实验,结果证明该模型能有效提高实体识别的准确率。本文在问答匹配任务中使用预训练语言模型ALBERT和双向GRU训练文本,获取问句的语义向量表示,针对知识图谱的分布式向量表示模型TransH无法处理一对多或者多对一的实体关系类型的问题,使用Bi GRU和超平面上的知识图谱的分布式向量表示模型Tran H获取知识实体关系的语义向量,最后通过计算问句、实体和关系的余弦相似度选取最相关的知识三元组。实验结果表明,采用本文的问答匹配算法,能够使问题回答的准确性得到提高。本文在上述基础上进行实验证明了算法模型的可靠性,并收集了3000余所院校信息构建高校招生知识图谱,实现了基于知识图谱的高考自动问答系统,实际运行展示效果。结果表明本文设计并实现的基于知识图谱的高考自动问答系统可以满足用户获取高校专业信息的需求,具有较好的可行性和实用价值。
NLP在智能消防接处警系统中的应用
这是一篇关于自然语言处理,ALBERT,命名实体识别,消防警情文本实体识别的论文, 主要内容为随着城市工业化、现代化进程的持续加快,城市规模扩张,工程建设量急剧增加造成事故频发,对消防救援队伍的救援响应速度、救援资源调度分配、现场救援作业、科学施救、重点单位预案录入等综合能力提出更高要求,越来越多的信息化手段全面融合消防业务管理和实战应用,为适应城市消防指挥中心的接处警工作要求,针对当前大多数接警系统信息录入、力量调配效率偏低等问题。本文提出一种基于ALBERT的预训练模型在接处警系统中对警情要素提取,再自行构建的消防警情语料库中进行实验,构建了ALBERT-Bi LSTM-CRF的消防警情文本实体识别模型,设计了基于字根的实体识别评分机制,进一步提高消防警情要素实体的识别效果。其F1值为81.660,由于该领域需要对语音信息转文本后快速提取,验证了该模型在同时保证时间开销和识别准确率的条件下可以提高接警录入效率、辅助决策。本课题的目标是将自然语言处理技术运用于消防接处警系统,尽可能提高接处警效率,并且尝试去构建消防警情要素知识图谱。基于此目标,本课题对以下内容进行探索研究:(1)首先对消防接处警的现状进行介绍,并对自然语言处理技术在消防领域的研究现状进行调研,再介绍了将自然语言处理技术运用于消防接处警系统的意义。紧接着对相关理论和技术进行介绍。(2)关于如何构建消防警情文本的数据集,以及对数据的预处理工作,通过数据增强等手段使得能够得到更好的数据集。(3)通过对比ALBERT-BiLSTM-CRF模型与BERT-BiLSTM-CRF、BiLSTM-CRF模型在命名实体识别中的性能差异,验证了基于ALBERT模型在的消防警情文本实体识别任务中的可行性,并引入了基于字根的评分机制提升模型的警情要素实体识别效果。(4)初步设计并实现了消防要素提取模块,通过模拟语音转警情文本作为系统输入,验证了基于ALBERT-Bi LSTM-CRF模型的消防警情文本实体识别模块对消防警情信息文本实体识别的情况,并将警情的地理位置在GIS地图上进行标注。并通过消防警情要素实体识别对数据集中的数据进去提取,初步构建了消防警情要素部分知识图谱。
NLP在智能消防接处警系统中的应用
这是一篇关于自然语言处理,ALBERT,命名实体识别,消防警情文本实体识别的论文, 主要内容为随着城市工业化、现代化进程的持续加快,城市规模扩张,工程建设量急剧增加造成事故频发,对消防救援队伍的救援响应速度、救援资源调度分配、现场救援作业、科学施救、重点单位预案录入等综合能力提出更高要求,越来越多的信息化手段全面融合消防业务管理和实战应用,为适应城市消防指挥中心的接处警工作要求,针对当前大多数接警系统信息录入、力量调配效率偏低等问题。本文提出一种基于ALBERT的预训练模型在接处警系统中对警情要素提取,再自行构建的消防警情语料库中进行实验,构建了ALBERT-Bi LSTM-CRF的消防警情文本实体识别模型,设计了基于字根的实体识别评分机制,进一步提高消防警情要素实体的识别效果。其F1值为81.660,由于该领域需要对语音信息转文本后快速提取,验证了该模型在同时保证时间开销和识别准确率的条件下可以提高接警录入效率、辅助决策。本课题的目标是将自然语言处理技术运用于消防接处警系统,尽可能提高接处警效率,并且尝试去构建消防警情要素知识图谱。基于此目标,本课题对以下内容进行探索研究:(1)首先对消防接处警的现状进行介绍,并对自然语言处理技术在消防领域的研究现状进行调研,再介绍了将自然语言处理技术运用于消防接处警系统的意义。紧接着对相关理论和技术进行介绍。(2)关于如何构建消防警情文本的数据集,以及对数据的预处理工作,通过数据增强等手段使得能够得到更好的数据集。(3)通过对比ALBERT-BiLSTM-CRF模型与BERT-BiLSTM-CRF、BiLSTM-CRF模型在命名实体识别中的性能差异,验证了基于ALBERT模型在的消防警情文本实体识别任务中的可行性,并引入了基于字根的评分机制提升模型的警情要素实体识别效果。(4)初步设计并实现了消防要素提取模块,通过模拟语音转警情文本作为系统输入,验证了基于ALBERT-Bi LSTM-CRF模型的消防警情文本实体识别模块对消防警情信息文本实体识别的情况,并将警情的地理位置在GIS地图上进行标注。并通过消防警情要素实体识别对数据集中的数据进去提取,初步构建了消防警情要素部分知识图谱。
基于Albert的猪病知识图谱构建研究与实现
这是一篇关于知识图谱,实体识别,ALBERT,Neo4j,猪病的论文, 主要内容为社会的快速发展推动了养猪行业的进步,但是生猪的活动范围较大,活动频率较高,进而导致生猪疾病的发病率和传染性较高。通过降低养殖环境的管控难度,可以有效降低生猪的死亡率,降低养殖户的经济损失。为了有效利用猪病专业的领域知识,本文对猪病领域知识图谱构建展开研究,抽取相关文献和网页数据中所蕴含的猪病知识,构建猪病知识库,为猪病的预防和治疗提供基础知识支撑。运用命名实体识别技术对非结构化数据源进行实体抽取,对结构化数据运用网页爬虫等方法,是构建本文猪病知识图谱的核心内容。本文针对领域知识图谱实体抽取和图谱构建,设计了实体抽取方法,主要研究结果包括:(1)针对猪病特定领域数据,本文对结构化数据和非结构化数据进行不同的方法处理,通过爬虫技术获取网上的结构化数据,结构化数据使用jieba分词进行预处理,从而对数据进行筛选,非结构化数据先用TF-IDF将数据进行关键词提取,使用BIO标注法为实体抽取提供数据语料库的基础,最后将所有数据通过知识融合等手段进行有效整合,为猪病实体抽取实验和知识图谱构建提供数据支持。(2)针对传统命名识别容易受上下文相对距离的影响、实体整体识别效果差的问题,本文设计了一种基于ALBERT-BiGRU-CRF的模型,该模型是将ALBERT与BiGRU,CRF结合用来实体抽取,首先基于ALBERT结构构建了新的实体抽取理论模型,然后对公开的人民日报语料库数据集进行数据处理和实体抽取实验,将提出的实体抽取模型与其他传统的机器学习模型进行实验对比,实验结果从条形统计图和表格各项评价指标上表明,在综合评价指标方面的提升度高于3.6%,验证此模型效果最佳,并在非结构化猪病数据中取得了有效的识别效果,猪病实体抽取结果也为猪病知识图谱的构建提高准确率。(3)集成以上研究中猪病结构化数据和非结构化数据,形成猪病数据部分知识库,并将提出的ALBERT-BiGRU-CRF模型实体抽取结果应用在知识图谱构建中,最后基于Neo4j构建了较高准确率的猪病知识图谱,在Neo4j中使用Py2neo进行知识图谱的构建工作,通过Cypher语句实现了猪病实体关系的知识存储,形成了可视化展示与管理界面。
NLP在智能消防接处警系统中的应用
这是一篇关于自然语言处理,ALBERT,命名实体识别,消防警情文本实体识别的论文, 主要内容为随着城市工业化、现代化进程的持续加快,城市规模扩张,工程建设量急剧增加造成事故频发,对消防救援队伍的救援响应速度、救援资源调度分配、现场救援作业、科学施救、重点单位预案录入等综合能力提出更高要求,越来越多的信息化手段全面融合消防业务管理和实战应用,为适应城市消防指挥中心的接处警工作要求,针对当前大多数接警系统信息录入、力量调配效率偏低等问题。本文提出一种基于ALBERT的预训练模型在接处警系统中对警情要素提取,再自行构建的消防警情语料库中进行实验,构建了ALBERT-Bi LSTM-CRF的消防警情文本实体识别模型,设计了基于字根的实体识别评分机制,进一步提高消防警情要素实体的识别效果。其F1值为81.660,由于该领域需要对语音信息转文本后快速提取,验证了该模型在同时保证时间开销和识别准确率的条件下可以提高接警录入效率、辅助决策。本课题的目标是将自然语言处理技术运用于消防接处警系统,尽可能提高接处警效率,并且尝试去构建消防警情要素知识图谱。基于此目标,本课题对以下内容进行探索研究:(1)首先对消防接处警的现状进行介绍,并对自然语言处理技术在消防领域的研究现状进行调研,再介绍了将自然语言处理技术运用于消防接处警系统的意义。紧接着对相关理论和技术进行介绍。(2)关于如何构建消防警情文本的数据集,以及对数据的预处理工作,通过数据增强等手段使得能够得到更好的数据集。(3)通过对比ALBERT-BiLSTM-CRF模型与BERT-BiLSTM-CRF、BiLSTM-CRF模型在命名实体识别中的性能差异,验证了基于ALBERT模型在的消防警情文本实体识别任务中的可行性,并引入了基于字根的评分机制提升模型的警情要素实体识别效果。(4)初步设计并实现了消防要素提取模块,通过模拟语音转警情文本作为系统输入,验证了基于ALBERT-Bi LSTM-CRF模型的消防警情文本实体识别模块对消防警情信息文本实体识别的情况,并将警情的地理位置在GIS地图上进行标注。并通过消防警情要素实体识别对数据集中的数据进去提取,初步构建了消防警情要素部分知识图谱。
基于知识图谱的影视知识问答系统研究与实现
这是一篇关于影视,知识图谱,ALBERT,问答系统的论文, 主要内容为随着国民经济的发展,人们对精神文化的需求日益增加,推动了我国影视行业的快速发展。现阶段,我国影视行业作品数量众多、风格迥异、精彩纷呈。但影视作品数量的快速增长却带来了一系列的矛盾,其中尤以用户影视信息的精准需求与网页搜索结果模糊之间的矛盾最为突出。用户搜索影视相关信息主要依赖于影视网页搜索,导致给用户返回的结果不够精确,并且搜索过程不够友好。因此,实现一个科学、有效的智能问答系统为用户提供影视信息精准查询来适应影视行业的快速发展尤为重要。本文构建了信息准确、内容新颖的影视领域知识图谱,提出了影视领域知识问答模型,设计并实现了基于知识图谱的影视知识问答系统。本文的研究工作如下:(1)构建了影视领域知识图谱。通过分析已有的领域本体构建技术,提出了一种适应于影视领域本体的构建方法,构建了面向问答场景的影视领域本体。通过设计并实现网络爬虫系统来获取影视领域知识,利用主流的图数据库存储影视知识,构建了面向应用场景的影视领域知识图谱。(2)提出了影视领域知识问答模型。该模型由问句关键词提取模块、问题分类模块、问题查询模块和人机交互模块构成。在问句关键词提取模块,采用了基于ALBERT-Bi LSTM-CRF的影视问句关键词提取模型,与基线模型相比取得了较好的模型效果。在问题分类模块,通过构建影视问答领域数据集,设计了影视问题分类模板,采用了基于ALBERT-Text CNN的影视问题分类模型并取得了较好的分类效果。在问题查询模块,依据影视问题的分类模板设计Cypher查询映射,利用图数据库Neo4j高效的完成复杂的查询任务。在人机交互模块,从用户的角度出发,确定以Web对话窗口的方式作为交互方式。(3)设计并实现了影视知识问答系统。基于领域驱动设计的经典分层架构模型,提出了适应问答系统的分层架构模型,设计了影视问答系统的整体架构。依据设计实现了基于知识图谱的影视知识问答系统。经测试后,该系统可以有效完成用户的影视知识的问答任务。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码驿站 ,原文地址:https://m.bishedaima.com/lunwen/47805.html