基于深度学习的租房问答系统的研究与实现
这是一篇关于租房问答系统,CNN,问句意图分类,中文命名实体,BERT,BiGRU,注意力机制,CRF的论文, 主要内容为随着大数据时代的到来,信息爆炸和信息过载的问题逐渐明显,搜索引擎只能返回与人们需求相关的一系列网页,已经无法满足用户需要。在此背景下,问答系统的提出弥补了搜索引擎的缺陷,问答系统让用户以自然语言的方式提出问题,紧接着系统返回给用户准确、简洁的答案。近年来越来越多的研究人员尝试使用深度学习的方法完成问答领域的关键任务,并得到了较好的效果。因此,基于深度学习的问答系统逐渐成为国内外研究中自然语言处理领域最热门的研究方向之一。本文结合深度学习算法对用户自然语言进行理解,构建了一种基于CNN的租房领域问句意图识别模型(QIRCNN),以及一种基于BERT-Bi GRU-Attention-CRF的中文命名实体识别模型,并基于本文模型实现了一个基于租房领域知识库的问答系统。本文具体内容如下:本文首先介绍了本课题的研究背景与意义、国内外研究现状以及本论文的研究内容及章节安排。然后,简要介绍了本课题所需的相关理论与技术基础。接着,本文研究了基于深度学习的领域问答系统中的问句理解部分。在问句意图识别方面,本文将问句意图识别问题看成问句的多分类问题,在研究基于卷积神经网络的文本分类方法的基础上,将该方法用于识别租房领域问句的意图,构建了一种基于CNN的租房领域问句意图识别模型,并通过对比实验证明了所提模型的有效性。在命名实体的识别方面,本文将非限定值关键信息的提取问题看成命名实体识别问题,提出了一种新的命名实体识别模型,即BERT-Bi GRU-Attention-CRF模型。该模型使用经典Bi LSTM-CRF实体识别模型作为基础模型,用Bi GRU替换Bi LSTM使得参数更少,结构更简单,收敛性更好;采用预训练语言模型BERT训练中文词向量,能够较完整地保存文本语义信息,较好地解决了命名实体一词多义问题;使用Attention机制挖掘文本序列之间的潜在特征,对语义信息的利用更为充分。实验结果表明,本文的BERT-Bi GRU-Attention-CRF模型具有较高的识别准确率。之后,利用本文研究的深度学习模型,本文设计并实现了一个基于知识库的租房领域问答系统。分析了系统需求、设计了系统总体架构、功能模块和数据库表,整个系统包括知识图谱建立、意图识别、关键信息提取、问句转换和答案检索等模块,利用Python、XPath、Sparql等编码实现了本系统,并展示了系统运行的效果。最后,总结了全文并展望了进一步的研究工作。
农作物属性实体识别模型研究
这是一篇关于农作物属性实体识别,HMM,BiLSTM,CRF,Bert的论文, 主要内容为命名实体识别是自然语言处理的一个基础任务,是信息提取、句法分析、问答系统和机器翻译等自然语言处理任务的重要基础工具。基于中国农业科学叙词表构建的农业知识图谱仅含有农业中的抽象概念、实体名以及用、代、属、分、参等关系,缺乏概念和实体的属性信息以及他们之间更有意义的关系,影响基于知识图谱大量智能应用的开发。本文在研究一般命名实体识别模型的基础上,开展农作物属性和属性值实体识别模型的研究。通过农作物属性实体识别模型的研究,总结出一套切实可行的农作物属性和属性值实体识别方法,为属性提取打下基础,为其他农业实体属性识别提供借鉴。本研究包括如下几个方面的工作:1.对目前基于统计学和基于深度学习的五种命名实体识别方法HMM、CRF、BiLSTM、BiLSTM-CRF和Bert-BiLSTM-CRF进行了研究,在标准数据集上进行了评价比较,模型BiLSTM-CRF的性能是相对最好的,其精确率达到了95.60%;2.以中国农业科学叙词表中的农作物实体名为线索,爬取百度百科有关农作物描述的语料,使用开源标注工具Doccano,按照BIEOS标注格式,构建了农作物属性实体识别数据集;3.将HMM、CRF、BiLSTM、BiLSTM-CRF和Bert-BiLSTM-CRF五种模型在农作物属性实体识别数据集上进行了训练和评价,模型BiLSTM-CRF在该数据集上的精确率达到了90.71%;4.构建了基于Java EE Struts 2框架的农作物属性实体识别WEB系统,能识别输入文本所包含的农作物属性实体。
基于知识图谱的健康医疗知识推送系统研究
这是一篇关于医疗知识图谱,CRF,朴素贝叶斯,Neo4j,疾病判断的论文, 主要内容为人们在没有大病痛时往往不会去往医院就诊,而是希望通过搜索引擎或者在线医疗问答系统获取自己的病症信息,而现有的医疗问答系统太过于依赖医生个人的经验,不符合数据驱动的科学医学理念。大数据,人工智能,物联网等信息技术的发展使得医疗行业与计算机信息技术融合成为了必然,知识图谱提供了一种从“关系”的角度去分析事物的方法,基于知识图谱的健康医疗知识推送系统能够根据用户输入的症状对用户所患疾病进行判断,从而为患者推送和患者所患疾病相关的医疗知识。首先分析了电子病历的结构特征,提出构建知识图谱的主要知识来源是电子病历中的首次病程记录和出院小结,随后提出了电子病历医疗实体提取任务,并使用CRF模型作为医疗实体提取的方法,对部分电子病历进行标注,然后使用CRF++工具对中文电子病历中的医疗实体进行提取,并将提取出的实体转换成为了 SOP三元组形式。其次,针对如何计算病症实体对于某一个疾病实体的影响因子IMPT,选用了朴素贝叶斯算法来计算病症实体的IMPT值。之后对实体节点设置了约束条件,然后再使用Neo4j提供的Jdbc将医疗实体和病症的权重因子导入到了 Neo4j中,完成了知识图谱的构建。最后对医疗知识推送系统进行系统结构设计和技术路线分析,使用Spring Boot集成Spring Data Neo4j以及Spring Data JPA完成系统框架搭建,在系统功能实现时提出了一种基于知识图谱的疾病判断策略,并根据制定的疾病判断策略选择出用户最有可能患有疾病和其他可能患有的疾病推荐给用户,最后根据患者所有可能患有的疾病为患者提供相应的医疗知识。本文采用知识图谱作为核心技术,通过对用户输入的症状在知识图谱中进行查询,并根据查询结果为用户提供与其患有疾病相关的医疗知识,实验结果表明,本医疗知识推送系统对用户的疾病有一定的辅助诊断作用。
基于深度学习的租房问答系统的研究与实现
这是一篇关于租房问答系统,CNN,问句意图分类,中文命名实体,BERT,BiGRU,注意力机制,CRF的论文, 主要内容为随着大数据时代的到来,信息爆炸和信息过载的问题逐渐明显,搜索引擎只能返回与人们需求相关的一系列网页,已经无法满足用户需要。在此背景下,问答系统的提出弥补了搜索引擎的缺陷,问答系统让用户以自然语言的方式提出问题,紧接着系统返回给用户准确、简洁的答案。近年来越来越多的研究人员尝试使用深度学习的方法完成问答领域的关键任务,并得到了较好的效果。因此,基于深度学习的问答系统逐渐成为国内外研究中自然语言处理领域最热门的研究方向之一。本文结合深度学习算法对用户自然语言进行理解,构建了一种基于CNN的租房领域问句意图识别模型(QIRCNN),以及一种基于BERT-Bi GRU-Attention-CRF的中文命名实体识别模型,并基于本文模型实现了一个基于租房领域知识库的问答系统。本文具体内容如下:本文首先介绍了本课题的研究背景与意义、国内外研究现状以及本论文的研究内容及章节安排。然后,简要介绍了本课题所需的相关理论与技术基础。接着,本文研究了基于深度学习的领域问答系统中的问句理解部分。在问句意图识别方面,本文将问句意图识别问题看成问句的多分类问题,在研究基于卷积神经网络的文本分类方法的基础上,将该方法用于识别租房领域问句的意图,构建了一种基于CNN的租房领域问句意图识别模型,并通过对比实验证明了所提模型的有效性。在命名实体的识别方面,本文将非限定值关键信息的提取问题看成命名实体识别问题,提出了一种新的命名实体识别模型,即BERT-Bi GRU-Attention-CRF模型。该模型使用经典Bi LSTM-CRF实体识别模型作为基础模型,用Bi GRU替换Bi LSTM使得参数更少,结构更简单,收敛性更好;采用预训练语言模型BERT训练中文词向量,能够较完整地保存文本语义信息,较好地解决了命名实体一词多义问题;使用Attention机制挖掘文本序列之间的潜在特征,对语义信息的利用更为充分。实验结果表明,本文的BERT-Bi GRU-Attention-CRF模型具有较高的识别准确率。之后,利用本文研究的深度学习模型,本文设计并实现了一个基于知识库的租房领域问答系统。分析了系统需求、设计了系统总体架构、功能模块和数据库表,整个系统包括知识图谱建立、意图识别、关键信息提取、问句转换和答案检索等模块,利用Python、XPath、Sparql等编码实现了本系统,并展示了系统运行的效果。最后,总结了全文并展望了进一步的研究工作。
基于知识图谱的健康医疗知识推送系统研究
这是一篇关于医疗知识图谱,CRF,朴素贝叶斯,Neo4j,疾病判断的论文, 主要内容为人们在没有大病痛时往往不会去往医院就诊,而是希望通过搜索引擎或者在线医疗问答系统获取自己的病症信息,而现有的医疗问答系统太过于依赖医生个人的经验,不符合数据驱动的科学医学理念。大数据,人工智能,物联网等信息技术的发展使得医疗行业与计算机信息技术融合成为了必然,知识图谱提供了一种从“关系”的角度去分析事物的方法,基于知识图谱的健康医疗知识推送系统能够根据用户输入的症状对用户所患疾病进行判断,从而为患者推送和患者所患疾病相关的医疗知识。首先分析了电子病历的结构特征,提出构建知识图谱的主要知识来源是电子病历中的首次病程记录和出院小结,随后提出了电子病历医疗实体提取任务,并使用CRF模型作为医疗实体提取的方法,对部分电子病历进行标注,然后使用CRF++工具对中文电子病历中的医疗实体进行提取,并将提取出的实体转换成为了 SOP三元组形式。其次,针对如何计算病症实体对于某一个疾病实体的影响因子IMPT,选用了朴素贝叶斯算法来计算病症实体的IMPT值。之后对实体节点设置了约束条件,然后再使用Neo4j提供的Jdbc将医疗实体和病症的权重因子导入到了 Neo4j中,完成了知识图谱的构建。最后对医疗知识推送系统进行系统结构设计和技术路线分析,使用Spring Boot集成Spring Data Neo4j以及Spring Data JPA完成系统框架搭建,在系统功能实现时提出了一种基于知识图谱的疾病判断策略,并根据制定的疾病判断策略选择出用户最有可能患有疾病和其他可能患有的疾病推荐给用户,最后根据患者所有可能患有的疾病为患者提供相应的医疗知识。本文采用知识图谱作为核心技术,通过对用户输入的症状在知识图谱中进行查询,并根据查询结果为用户提供与其患有疾病相关的医疗知识,实验结果表明,本医疗知识推送系统对用户的疾病有一定的辅助诊断作用。
农作物属性实体识别模型研究
这是一篇关于农作物属性实体识别,HMM,BiLSTM,CRF,Bert的论文, 主要内容为命名实体识别是自然语言处理的一个基础任务,是信息提取、句法分析、问答系统和机器翻译等自然语言处理任务的重要基础工具。基于中国农业科学叙词表构建的农业知识图谱仅含有农业中的抽象概念、实体名以及用、代、属、分、参等关系,缺乏概念和实体的属性信息以及他们之间更有意义的关系,影响基于知识图谱大量智能应用的开发。本文在研究一般命名实体识别模型的基础上,开展农作物属性和属性值实体识别模型的研究。通过农作物属性实体识别模型的研究,总结出一套切实可行的农作物属性和属性值实体识别方法,为属性提取打下基础,为其他农业实体属性识别提供借鉴。本研究包括如下几个方面的工作:1.对目前基于统计学和基于深度学习的五种命名实体识别方法HMM、CRF、BiLSTM、BiLSTM-CRF和Bert-BiLSTM-CRF进行了研究,在标准数据集上进行了评价比较,模型BiLSTM-CRF的性能是相对最好的,其精确率达到了95.60%;2.以中国农业科学叙词表中的农作物实体名为线索,爬取百度百科有关农作物描述的语料,使用开源标注工具Doccano,按照BIEOS标注格式,构建了农作物属性实体识别数据集;3.将HMM、CRF、BiLSTM、BiLSTM-CRF和Bert-BiLSTM-CRF五种模型在农作物属性实体识别数据集上进行了训练和评价,模型BiLSTM-CRF在该数据集上的精确率达到了90.71%;4.构建了基于Java EE Struts 2框架的农作物属性实体识别WEB系统,能识别输入文本所包含的农作物属性实体。
战场资源知识图谱的构建与应用
这是一篇关于战场资源,知识图谱,数据抽取,关系推理,资源推荐,CRF的论文, 主要内容为针对一体化联合作战发展环境下,各兵种数据无法有效地进行集中管理和调度。本文提出战场资源知识图谱,用以统一描述计算存储、通信网络、传感器和武器平台四大类战场资源,在此基础上实现各战场资源协同调度。本文基于开放知识图谱的构建方法,研究了如何构建战场资源知识图谱及其应用问题,如战场资源本体构建问题、战场资源数据抽取问题、战场资源关系推理问题、在特定战场环境下进行战场资源推荐问题。首先,采用七步法和METHONTOLOGY结合的方法为指导思想,利用Protégé工具构建战场资源本体。其次,从作战想定文本、知名军事网站和百科网站中利用不同的抽取方法获得战场资源三元组数据,并将其清洗融合后存入数据库中。然后,利用Protégé工具自带的推理机进行战场资源关系推理和战场资源本体校验。最后,对特定战场环境下进行战场资源选址建模,利用改进的遗传算法(Improved Genetic Algorithm,IGA)对模型求解得到战场资源选址,接着对战场环境和目标进行分析,构建战场资源选址和战场资源模型,利用条件随机场(Conditional Random Field,CRF)算法给特定战场环境下战场资源选址推荐最优战场资源组合。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码工坊 ,原文地址:https://m.bishedaima.com/lunwen/56034.html