基于农业知识图谱的问答系统设计与研究
这是一篇关于农业知识图谱,命名实体识别,问句分类,知识问答系统的论文, 主要内容为随着农业现代化进程的推进,基于农业领域的知识服务体系成为农业信息化研究的热点问题。传统的信息获取方式以搜索引擎为主,搜索引擎返回大量网页链接,答案高度分散并且呈现多源异构的特点,无法迅速且准确地为农业相关工作者提供知识服务,用户体验感差。领域知识图谱的发展为特定领域内的知识问答提供了高质量的知识库基础。本文基于构建的农业知识图谱,对农业知识问答系统进行研究。主要研究内容如下:(1)构建农业领域知识图谱。本文首先使用Scrapy框架进行web农业文本数据的爬取,实现了农业领域数据的规模化采集。随后根据处理后数据的特征对知识图谱进行存储方案设计。最后利用Cypher语句将结构化的实体数据存入Neo4j知识图谱中,构建了数据质量高、覆盖面广、层次分明的农业领域知识图谱。(2)研究基于知识图谱的问答算法。基于已构建的知识图谱将本文的问答算法划分为命名实体识别和问句分类两个子任务。在实体关系类查询任务中,提出一种联合多特征的PBERT-BiLSTM-CRF模型对农业实体进行识别。集合农业文字的特殊性,添加字本身和部首偏旁的自定义联合多特征进行实验,最后与其他模型通过实验对比,结果表明,本文联合多特征的PBERT-BiLSTM-CRF模型在命名实体识别任务中有更好的效果。针对用户输入的症状类问题,本文使用了基于BiSLTM的自注意力分类模型。此模型给嵌入带来了一种简单的方式,可以看到句子的哪些特定部分被编码到嵌入中。通过与其他神经网络模型使用处理后的同一数据进行分类实验,结果表明,本文的问句分类模型能对用户的农业症状类问题进行准确的分类。问句分类扩大了问答系统的作用范围,提高了本文基于知识图谱的农业问答系统的价值。(3)设计并实现了基于知识图谱的i农-知识问答系统。通过系统需求分析、系统设计和系统测试,当用户输入农业领域病虫害以及农药相关的自然语言问题时,能够准确地给出相应的文本答案并且实现了知识图谱相应实体关系的可视化。
基于知识图谱的政府采购智能问答系统研究与实现
这是一篇关于问句分类,关系抽取,实体抽取,知识图谱,问答服务系统的论文, 主要内容为随着互联网信息技术的发展,基于传统搜索引擎的信息获取方式,已经很难满足人们知识获取的需求,而智能问答系统就应运而生。不同于传统搜索引擎,智能问答系统利用自然语言处理技术,获取答案,再直接返回给用户,提高了搜索效率。与此同时,近年来知识图谱发展迅速,为智能问答系统的升级提供了一种技术手段,使得问答系统的工作方式更接近于人类的思维方式。论文以一家耕耘于政府采购领域多年并实现了采购全过程、全时段、全领域的电子化系统平台的对话问答服务需求作为研究背景,展开课题研究工作。论文工作主要包括在问答服务中,引入政府采购知识图谱技术,并与自然语言处理技术、深度学习方法相结合,实现了政府采购智能问答服务。论文主要研究内容包括以下四个方面:(1)问答服务问题综述。立足于所选择企业的现实需要,分析了基于知识图谱的政府采购问答系统面临的问题,探讨了相关技术与算法。(2)构建面向政府采购封闭领域的知识图谱。论文提出了一种面向政府采购领域的知识图谱构建方法。(1)论文借鉴斯坦福提出的七步法对处于构建流程最上层的知识模式进行定义。(2)针对知识抽取任务,论文提出了一种基于Bi GRU的流水线抽取模型:先使用基于字词混合向量的Bi GRU-CRF模型抽取实体;后利用关系分类模型Bi GRU-Attention,获得实体之间的关系;最后形成知识图谱最小单位-三元组。(3)针对知识融合任务,论文使用Word2vec模型,以计算词间的空间距离方法,完成了词间语义相似度的度量。通过设置相似度阈值,完成实体间关系的分割,以完成实体对齐的需要。(4)针对知识更新与存储,引入专家经验、知识,通过数据层的更新以及人工复检提升知识图谱质量,将更新及审核过的内容存入neo4j图数据库。(3)完成用户问句分析与答案检索。论文研究并应用基于知识图谱的政府采购问句分类与答案检索技术:(1)使用实体抽取模型,识别出问句实体;(2)将问句实体与知识图谱中对应的实体链接;(3)基于Text CNN-Attention的问句分类模型识别问句意图,解析自然语言问题,将自然语言问句转换为用于在Neo4j中查询的Cypher语句;(4)借助Cypher查询技术,在图数据库中搜索并推送答案。(4)设计并实现基于知识图谱的政府采购智能问答系统。以html+query为前端框架,python+Sanic为后端框架,使用python语言,基于论文研究结果,开发了政府采购问答系统软件,按照软件工程方法,对软件进行测试,测试结果证明实现了课题设计目标。
电力领域知识图谱构建及问句查询研究
这是一篇关于电力文本,实体识别,关系抽取,知识图谱,问句分类的论文, 主要内容为电力文本数据中蕴含着大量可供挖掘和整理的重要信息。如何对这些文本数据进行有效的挖掘并实现智能化应用是当前电网智能化升级的重要工作。为了从各类电力文本数据中挖掘出实体并抽取出实体间关系,传统方法所采用的字典匹配和人工抽取的方式已经无法应付日益增加的文本数据量。为了提高电力文本的抽取效率,实现抽取信息的有效管理,本文主要研究电力文本的实体识别和实体间关系抽取方法,并基于抽取出的实体和关系构建了知识图谱,并运用问句分类模板实现自然语言的输入查询。主要工作如下:(1)电力实体识别。本文在对电力文本中实体的构词特性后进行分析后,采用了一套更加准确的标注策略来对电力实体的边界进行准确标注。选用电力科技文本、电力运行调度规程、电力故障工单三类电力文本作为原始语料,构建了实体识别数据集。将深度学习模型Bi-LSTM与统计学模型CRF进行结合,构建了电力实体识别模型,减少了人工制定实体特征的工作。使用自建数据集对模型进行训练后与单一模型进行性能对比。实验表明,组合模型能够更好的识别出具有较长实体边界的实体词,综合评价指标有所提高。(2)电力实体间关系抽取。本文通过构建关系匹配模板并结合实体间泛化度和相似度评价指标,对电力实体间存在的类属关系和部分整体关系进行抽取,将分散的电力实体集合建立起了有效的关系连接。有效提高了对实体间关系抽取的效率。(3)电力知识图谱构建。整理从非结构化文本中抽取得到实体及实体间关系,并结合已有电力调度数据库中的相关数据,划分出知识图谱中调度部分和设备实体部分的拓扑结构,采用Neo4j作为数据载体,对整理后数据进行存储,建立了电力知识图谱。(4)自然语言查询问句分类。为实现对知识图谱的智能查询运用,通过构建问句模板和问句集对朴素贝叶斯分类器进行训练,并在训练过程中自动地优化分类器的特征词表,进而在保证分类器性能的同时,有效的控制了分类器特征词表长度,实现了对自然语言输入问句的准确分类。
煤矿行业智能问答系统设计与实现
这是一篇关于煤矿领域,智能问答,知识图谱,问句分类的论文, 主要内容为现如今人们习惯通过网络获取信息,但是互联网返回的网页数据通常比较杂乱,用户需要自己花费时间和精力对繁多冗余的信息进行判断,并不能直接得到准确的答案,而煤矿行业的知识更是分布散列,细小繁多,难以快速查找。基于知识图谱的智能问答系统可以通过解析用户的问题,捕捉用户意图,在知识库中搜索出最为准确的答案直接返回给用户。本课题的主要研究内容包括:(1)知识库构建:使用Scrapy爬取下载煤矿知识网站上的文件获取数据源,然后将文件进行格式转换,再通过LTP对文件内容进行分词等预处理,利用基于词的Bi LSTM-CRF命名实体识别模型与基于Bi GRU融合Attention机制的关系抽取模型,从标注好的文本中数据得到<实体1,关系,实体2>的结构化数据,将其存储至Neo4j图形数据库中,构成煤矿知识库。(2)问答实现:首先爬取常见的问句,获得用户常问的问题类型,构造问句模板,然后预处理问句集,使用TF-IDF提取问句的特征词,构成特征词词典,再将问句集分别使用支持向量机和朴素贝叶斯行训练,得到问句分类器,并对两种分类器的训练结果进行测试与分析,最终选择效果更好的朴素贝叶斯分类器对用户在问答系统中输入的问句,进行类别判断,匹配问题模板,得到完整的Cypher查询语句,之后在煤矿知识库中搜索答案,将答案填充到回答模板返回给用户。(3)系统前后端交互:本文使用Django框架实现问答系统与煤矿知识库的连接和数据交互,使用Bootstrap和JS实现前端界面,最终得到完整的问答系统。本课题的研究可以为煤矿领域的专业人员提高获取信息的效率,减少时间上的浪费,对于其他领域知识库问答的研究也有重要的借鉴价值。
基于领域知识库的校园智能问答系统关键技术研究
这是一篇关于校园智能问答系统,领域知识库,问句分类,标签匹配的论文, 主要内容为随着互联网的飞速发展,信息的生产和传播速度与日剧增,如何有效地提高获取信息的效率成为人们广泛关注的焦点。与此同时,具有高效性与便捷性的智能问答系统的出现极大地解决了这一问题。在校园领域内,传统的信息化服务将各种信息分布在不同的部门信息门户下,信息杂乱多样,获取方式低效,这种模式已经满足不了广大师生高效获取信息的需求,因此,本文研究并实现一个易用且高效的校园智能问答系统,该系统作为校园信息获取的统一入口,不仅可以提供准确的问题答案信息,还能提供智能化的校园信息服务(查询成绩、预定教室等)。本文主要从知识库设计,问句分析及答案查询三个方面,结合国内外的研究成果,对校园智能问答系统的关键技术进行研究,主要工作及成果如下:1)通过分析现有的四类智能问答系统的特点和在本文应用环境下的不足,结合校园领域内用户的问题需求,提出了层次多标签知识库与领域知识图谱相结合的领域知识库模式,成功解决了校园智能问答系统中问题处理方式多样、问句信息缺失、问句粒度层次不同、人工构建知识库成本及对问答效率与准确率要求较高等难题。2)对问句进行基于领域词典的分词处理,提高了分词准确性,并对分词结果进行领域词性的标注,提出了领域词性结合问句中心语、关键词作为问句分类特征的SVM分类算法,并通过实验验证其在本文应用背景下的实用性,为后续基于标签匹配的答案搜索策略的生成提供了有力支持。3)制定了服务API的描述标准和规范,提供了标准的注册模板,使得服务API调用能够一体化地纳入层次多标签知识库,能够基于对用户问题的理解自动生成对相应服务API的调用,实现了智能问答形式的校园信息服务(查询成绩、预定教室等)。4)结合层次多标签的结构设计,提出了基于缩减规则的语义依存分析方法(R-SDP),来获取问句标签集,并提出相应的标签匹配算法来查询答案,同时利用领域知识图谱的上下位语义关系与层次多标签结构特征实现了与用户的智能交互。5)最后,基于对以上相关技术的研究,利用现有的开发工具与框架,设计实现了校园智能问答WisQA的原型系统,并基于财务领域的事实数据进行了实验测试,实验结果表明本文的解决方案是有效的。
基于知识图谱的问答系统问句理解方法研究
这是一篇关于知识图谱,问答系统,问句分类,实体链接,关系检测,胶囊网络的论文, 主要内容为从互联网的海量数据中获取信息已经成为人们的基本需要。由于搜索引擎不能直接得到所需的答案,因此本文对基于知识图谱的问答系统进行研究,旨在提出可以理解用户以自然语言提出的问句,并返回一个简洁答案的模型。在知识图谱中,知识以三元组<实体,关系,实体>的方式进行存储,因此基于知识图谱的问答系统主要解决由三元组构成的事实类问题。在问答系统中,准确理解用户问句,需要理解多样化的自然语言表述,这是本文的研究重点。根据问句信息的不同层次,本文将对问句的理解分为宏观和微观两个部分。宏观理解从句子层面进行,微观理解则从实体层面和关系层面来开展。具体工作主要有:1.本文提出一个基于胶囊网络的问句分类模型(Cap-net)。该模型能够结合双向LSTM和注意力机制,再加上胶囊网络,提取问句更多的特征。然后根据需要,将问句按照用户意图或者答案类型进行分类。2.本文提出一个基于语义相似性的实体链接和关系检测模型。该模型使用卷积神经网络,对问句和知识图谱中的实体与关系进行向量化表示。在实体链接任务中,本文提出,将问句中识别出来的实体表述,通过实体-表述映射表,得到候选实体。然后通过本文提出基于语义相似性的实体链接模型,将问句中的实体表述链接到知识图谱的实体上。在关系检测任务中,本文提出了基于层级序列匹配的知识图谱上的关系检测模型。能够将关系分为关系层次和单词层次,更好地获取关系相关信息,来和问句进行相似性匹配。3.为验证模型的有效性,本文分别构建中英文知识图谱,然后分别对上述模型在中英文数据集上进行实验,并与其它算法进行比较,验证本文模型的可行性和有效性,结果表明本文的模型能较好完成文本分类、实体链接和关系检测任务。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设助手 ,原文地址:https://m.bishedaima.com/lunwen/46720.html