基于答案选择结合知识图谱的问答模型研究
这是一篇关于问答模型,答案选择,知识库问答,知识图谱,深度学习的论文, 主要内容为问答系统能够满足人们想要快速、准确地获取信息的需求。虽然目前学者们对问答系统的研究已经取得了很大进步,但仍然存在一些问题。目前大多数的问答系统都是基于问题与问题之间的相似度,或者问题与答案之间的相似度,当用户提出的问题超出系统的训练语料库的范围时,会导致算法预测答案的准确度下降。为了解决这一问题,本文将知识图谱的信息应用于问答系统中以扩展问答系统的范围。同时,为了更好的利用和学习知识库的信息,本文利用知识图谱的已知事实,结合答案选择(AS)和知识库问答(KBQA)的共同点,采用传统的问答模型来提高知识库检索的准确性。本文的主要内容包括以下几点:(1)AS-KBQA模型的设计:本文提出基于答案选择与知识图谱的问答模型,即AS-KBQA问答模型,该模型设计为三个模块:问题理解模块、答案选择模块和翻译模块。问题理解模块使用CNN与bi LSTM相结合的算法提取给定问题的实体以及问题与答案之间的关系,并通过大量的探索设计了一个提取实体的启发式算法。答案选择模块使用bi LSTM结合Attention和Soft Max的深度学习模型来选择一组候选答案实体。翻译模块包括三部分:1.使用BERT模型将知识库信息映射到向量空间,并将实体关系转化为空间向量;2.处理上两个模块传递来的数据;3.结合训练好的Trans R模型,检索出答案。(2)医疗领域知识图谱的构建:本文从两个大型的医疗网站中爬取了大量数据,并将收集到的数据进行处理,包括实体、数据属性、关系的处理操作,然后构建了一个中文的医疗领域知识图谱。针对AS-KBQA模型,本文进行了两个实验以验证其准确性和适应性。实验1:选择Freebase开源数据(英文)作为知识库,在Simple Question、Yahoo QA和Web QSP三个数据集上进行实验,并且选取了近几年提出的六个问答模型用作对比实验。以精度作为每个模型的评价指标,在FB2M和FB5M两个数据集上,本文的AS-KBQA模型具有更好的效果。实验结果证明了基于知识图谱的答案选择模型能够提高知识库问答的准确性。实验2;选择本文构建的医疗领域知识图谱(中文)作为知识库,在MIE数据集上进行实验以验证AS-KBQA模型的适应性,实验结果表明该模型不仅能适应英文问答,也可以适应不同领域的中文问答。因此,本文提出的AS-KBQA模型拥有高准确性和强适应性,只需要扩展知识图谱中的信息就可以扩展问答系统的应用范围。
职业-专业知识图谱构建技术研究及其系统实现
这是一篇关于知识图谱,职业-专业,可视化,动态知识图谱,问答模型,智能化服务的论文, 主要内容为近年来我国在校大学生数量一直在持续增加,现已达到了4000余万。大学生毕业后总是希望从事“专业对口”的职业。社会职业与大学专业间的关联性很强,而大部分学生却对专业和职业缺乏足够的了解与认知。特别是在社会经济迅猛发展的今天,新职业不断出现,大学生对当前社会各行业有哪些与自己所学专业对口的职业更加不了解。另外,就业地区也是大学生就业时的重要考量因素,因为同一个职业在不同的地区和城市其薪资水平可能会有很大的差异。因此,研发反映当前社会各行业用工现状,体现职业与专业之间复杂对应关系,同时涵盖各职业在不同地区和城市薪资数据的智能化信息服务平台具有重要现实意义。知识图谱是当前人工智能领域一种热门的技术方法,它通过图的方式直观、清晰地表达知识与世界万物之间的关联。经过这些年的探索与发展,知识图谱相关理论与技术越来越成熟,并在诸多领域得到广泛应用,尤其在医疗、教育、金融等领域已经发挥了重要作用。但目前市场上还没有出现面向大学生就业的完备的职业-专业知识图谱,及基于知识图谱的智能化信息服务平台。基于对领域研究现状的分析,本文以招聘网站中的招聘信息为数据集,通过命名实体识别从招聘启事的任职资格中提取相关专业及专业与职业之间的对应关系,通过动态知识图谱推理算法完成图谱实体的推理预测,构建职业-专业动态知识图谱,并在此基础上提出知识图谱问答模型,最后设计开发了一个职业-专业智能化信息服务平台。本文主要研究内容包括:(1)基于自注意力机制的职业-专业领域命名实体识别算法。基于招聘信息的特性以及针对传统的命名实体识别方法不能很好地表示语句局部特征的问题,提出融合自注意力机制的命名实体识别模型BBISC(BERT-Bi LSTM-IDCNNSAT-CRF)。首先利用BERT模型完成词向量预训练,再将训练好的词向量分别输入双向长短期记忆网络Bi LSTM和迭代扩张卷积网络IDCNN中,识别出相关特征并进行特征融合,然后将结果输入至自注意力层,最后利用条件随机场CRF对预测结果进行校正。该模型在招聘信息数据集上取得了理想效果。(2)基于线索归纳的多关系动态知识图谱推理算法。由于职业对应的地域、薪资是动态变化的,并且职业所需的专业随着时间推移可能也会发生变化,所以构建的职业-专业知识图谱必须是可以动态更新的。提出以线索归纳和时序推理为核心的多关系循环事件推理模型Clue-Multi-Net。在进行线索归纳时,基于强化学习的方式快速探寻出与语义信息有关的线索路径,为时序推理阶段提供线索路径和候选实体;在时序推理阶段对线索事实之间的时间信息进行细致建模从而得到最终结果。在通用数据集及最新招聘数据集上进行的实验表明,该模型在动态知识图谱的实体及关系预测中具有较好的效果。(3)职业-专业知识图谱构建。以从招聘网站上爬取的实时招聘信息作为数据集(包括职业名称、地域、薪资以及岗位需求等),通过去重、合并、筛选等操作对获取的数据进行降噪处理,并对职业名称、地域、薪资进行规范化处理;引入谱聚类技术对职业名称进行聚类操作,引入BBISC命名实体识别方法提取岗位需求中的专业名称,并在此基础上计算职业和专业之间的关联度。最后基于Neo4j图数据库,结合职业的地域信息和薪资信息构建了职业-专业知识图谱,并利用动态知识图谱推理模型Clue-Multi-Net实现了知识图谱的动态更新。(4)职业-专业知识图谱问答模型构建。面向构建的职业-专业知识图谱,提出基于命名实体识别、意图识别以及模板匹配相结合的知识图谱问答模型ALBERT-NER-Match。首先对用户输入的问句使用BBISC模型进行命名实体识别,再通过ALBERT模型进行语句意图识别,然后将实体及意图进行组合得到语句类别,最终匹配Cypher语句模板从Neo4j图数据库中查询结果。在自建的问答语句数据集上进行了实验,取得了较好的结果。(5)职业-专业智能化信息服务平台设计与实现。基于职业-专业知识图谱及问答模型,设计、实现了一个职业-专业智能化信息服务平台。该平台为用户提供了热门职业与专业的相互查询、职业与地域薪资的对应关系查询以及职业、专业、地域、薪资的问答功能。同时基于Echarts插件实现了查询及问答结果的知识图谱可视化。
职业-专业知识图谱构建技术研究及其系统实现
这是一篇关于知识图谱,职业-专业,可视化,动态知识图谱,问答模型,智能化服务的论文, 主要内容为近年来我国在校大学生数量一直在持续增加,现已达到了4000余万。大学生毕业后总是希望从事“专业对口”的职业。社会职业与大学专业间的关联性很强,而大部分学生却对专业和职业缺乏足够的了解与认知。特别是在社会经济迅猛发展的今天,新职业不断出现,大学生对当前社会各行业有哪些与自己所学专业对口的职业更加不了解。另外,就业地区也是大学生就业时的重要考量因素,因为同一个职业在不同的地区和城市其薪资水平可能会有很大的差异。因此,研发反映当前社会各行业用工现状,体现职业与专业之间复杂对应关系,同时涵盖各职业在不同地区和城市薪资数据的智能化信息服务平台具有重要现实意义。知识图谱是当前人工智能领域一种热门的技术方法,它通过图的方式直观、清晰地表达知识与世界万物之间的关联。经过这些年的探索与发展,知识图谱相关理论与技术越来越成熟,并在诸多领域得到广泛应用,尤其在医疗、教育、金融等领域已经发挥了重要作用。但目前市场上还没有出现面向大学生就业的完备的职业-专业知识图谱,及基于知识图谱的智能化信息服务平台。基于对领域研究现状的分析,本文以招聘网站中的招聘信息为数据集,通过命名实体识别从招聘启事的任职资格中提取相关专业及专业与职业之间的对应关系,通过动态知识图谱推理算法完成图谱实体的推理预测,构建职业-专业动态知识图谱,并在此基础上提出知识图谱问答模型,最后设计开发了一个职业-专业智能化信息服务平台。本文主要研究内容包括:(1)基于自注意力机制的职业-专业领域命名实体识别算法。基于招聘信息的特性以及针对传统的命名实体识别方法不能很好地表示语句局部特征的问题,提出融合自注意力机制的命名实体识别模型BBISC(BERT-Bi LSTM-IDCNNSAT-CRF)。首先利用BERT模型完成词向量预训练,再将训练好的词向量分别输入双向长短期记忆网络Bi LSTM和迭代扩张卷积网络IDCNN中,识别出相关特征并进行特征融合,然后将结果输入至自注意力层,最后利用条件随机场CRF对预测结果进行校正。该模型在招聘信息数据集上取得了理想效果。(2)基于线索归纳的多关系动态知识图谱推理算法。由于职业对应的地域、薪资是动态变化的,并且职业所需的专业随着时间推移可能也会发生变化,所以构建的职业-专业知识图谱必须是可以动态更新的。提出以线索归纳和时序推理为核心的多关系循环事件推理模型Clue-Multi-Net。在进行线索归纳时,基于强化学习的方式快速探寻出与语义信息有关的线索路径,为时序推理阶段提供线索路径和候选实体;在时序推理阶段对线索事实之间的时间信息进行细致建模从而得到最终结果。在通用数据集及最新招聘数据集上进行的实验表明,该模型在动态知识图谱的实体及关系预测中具有较好的效果。(3)职业-专业知识图谱构建。以从招聘网站上爬取的实时招聘信息作为数据集(包括职业名称、地域、薪资以及岗位需求等),通过去重、合并、筛选等操作对获取的数据进行降噪处理,并对职业名称、地域、薪资进行规范化处理;引入谱聚类技术对职业名称进行聚类操作,引入BBISC命名实体识别方法提取岗位需求中的专业名称,并在此基础上计算职业和专业之间的关联度。最后基于Neo4j图数据库,结合职业的地域信息和薪资信息构建了职业-专业知识图谱,并利用动态知识图谱推理模型Clue-Multi-Net实现了知识图谱的动态更新。(4)职业-专业知识图谱问答模型构建。面向构建的职业-专业知识图谱,提出基于命名实体识别、意图识别以及模板匹配相结合的知识图谱问答模型ALBERT-NER-Match。首先对用户输入的问句使用BBISC模型进行命名实体识别,再通过ALBERT模型进行语句意图识别,然后将实体及意图进行组合得到语句类别,最终匹配Cypher语句模板从Neo4j图数据库中查询结果。在自建的问答语句数据集上进行了实验,取得了较好的结果。(5)职业-专业智能化信息服务平台设计与实现。基于职业-专业知识图谱及问答模型,设计、实现了一个职业-专业智能化信息服务平台。该平台为用户提供了热门职业与专业的相互查询、职业与地域薪资的对应关系查询以及职业、专业、地域、薪资的问答功能。同时基于Echarts插件实现了查询及问答结果的知识图谱可视化。
职业-专业知识图谱构建技术研究及其系统实现
这是一篇关于知识图谱,职业-专业,可视化,动态知识图谱,问答模型,智能化服务的论文, 主要内容为近年来我国在校大学生数量一直在持续增加,现已达到了4000余万。大学生毕业后总是希望从事“专业对口”的职业。社会职业与大学专业间的关联性很强,而大部分学生却对专业和职业缺乏足够的了解与认知。特别是在社会经济迅猛发展的今天,新职业不断出现,大学生对当前社会各行业有哪些与自己所学专业对口的职业更加不了解。另外,就业地区也是大学生就业时的重要考量因素,因为同一个职业在不同的地区和城市其薪资水平可能会有很大的差异。因此,研发反映当前社会各行业用工现状,体现职业与专业之间复杂对应关系,同时涵盖各职业在不同地区和城市薪资数据的智能化信息服务平台具有重要现实意义。知识图谱是当前人工智能领域一种热门的技术方法,它通过图的方式直观、清晰地表达知识与世界万物之间的关联。经过这些年的探索与发展,知识图谱相关理论与技术越来越成熟,并在诸多领域得到广泛应用,尤其在医疗、教育、金融等领域已经发挥了重要作用。但目前市场上还没有出现面向大学生就业的完备的职业-专业知识图谱,及基于知识图谱的智能化信息服务平台。基于对领域研究现状的分析,本文以招聘网站中的招聘信息为数据集,通过命名实体识别从招聘启事的任职资格中提取相关专业及专业与职业之间的对应关系,通过动态知识图谱推理算法完成图谱实体的推理预测,构建职业-专业动态知识图谱,并在此基础上提出知识图谱问答模型,最后设计开发了一个职业-专业智能化信息服务平台。本文主要研究内容包括:(1)基于自注意力机制的职业-专业领域命名实体识别算法。基于招聘信息的特性以及针对传统的命名实体识别方法不能很好地表示语句局部特征的问题,提出融合自注意力机制的命名实体识别模型BBISC(BERT-Bi LSTM-IDCNNSAT-CRF)。首先利用BERT模型完成词向量预训练,再将训练好的词向量分别输入双向长短期记忆网络Bi LSTM和迭代扩张卷积网络IDCNN中,识别出相关特征并进行特征融合,然后将结果输入至自注意力层,最后利用条件随机场CRF对预测结果进行校正。该模型在招聘信息数据集上取得了理想效果。(2)基于线索归纳的多关系动态知识图谱推理算法。由于职业对应的地域、薪资是动态变化的,并且职业所需的专业随着时间推移可能也会发生变化,所以构建的职业-专业知识图谱必须是可以动态更新的。提出以线索归纳和时序推理为核心的多关系循环事件推理模型Clue-Multi-Net。在进行线索归纳时,基于强化学习的方式快速探寻出与语义信息有关的线索路径,为时序推理阶段提供线索路径和候选实体;在时序推理阶段对线索事实之间的时间信息进行细致建模从而得到最终结果。在通用数据集及最新招聘数据集上进行的实验表明,该模型在动态知识图谱的实体及关系预测中具有较好的效果。(3)职业-专业知识图谱构建。以从招聘网站上爬取的实时招聘信息作为数据集(包括职业名称、地域、薪资以及岗位需求等),通过去重、合并、筛选等操作对获取的数据进行降噪处理,并对职业名称、地域、薪资进行规范化处理;引入谱聚类技术对职业名称进行聚类操作,引入BBISC命名实体识别方法提取岗位需求中的专业名称,并在此基础上计算职业和专业之间的关联度。最后基于Neo4j图数据库,结合职业的地域信息和薪资信息构建了职业-专业知识图谱,并利用动态知识图谱推理模型Clue-Multi-Net实现了知识图谱的动态更新。(4)职业-专业知识图谱问答模型构建。面向构建的职业-专业知识图谱,提出基于命名实体识别、意图识别以及模板匹配相结合的知识图谱问答模型ALBERT-NER-Match。首先对用户输入的问句使用BBISC模型进行命名实体识别,再通过ALBERT模型进行语句意图识别,然后将实体及意图进行组合得到语句类别,最终匹配Cypher语句模板从Neo4j图数据库中查询结果。在自建的问答语句数据集上进行了实验,取得了较好的结果。(5)职业-专业智能化信息服务平台设计与实现。基于职业-专业知识图谱及问答模型,设计、实现了一个职业-专业智能化信息服务平台。该平台为用户提供了热门职业与专业的相互查询、职业与地域薪资的对应关系查询以及职业、专业、地域、薪资的问答功能。同时基于Echarts插件实现了查询及问答结果的知识图谱可视化。
基于时序知识图谱的智能问答系统研究与原型实现
这是一篇关于时序知识图谱,知识抽取,智能问答系统,时序知识图谱嵌入,问答模型的论文, 主要内容为基于知识图谱的智能问答系统为人们提供了更加便捷化、精确化的信息服务。然而时间对于刻画事实本身起着不可或缺的作用。时序知识图谱虽然包含了时间信息,但是目前对它的研究还处于起步阶段。本文主要为了实现基于时序知识图谱的智能问答系统。该系统的实现需要构建时序知识图谱以及相应的问答模型。其中,时序知识图谱为整个系统提供知识来源,问答模型将输入的问题处理之后给出相应的答案。为了实现上述问答系统,本文主要研究了以下三方面内容:(1)本文构建了时序知识抽取模型T-CASREL用来完成时序知识图谱的构建。时序知识图谱的构建需要从文本中抽取时间信息,而现有的知识抽取模型只关注实体和关系的抽取,无法完成时间信息的抽取。T-CASREL模型由专门的时间抽取层来完成时间信息的抽取,并将时间信息融入到相应的实体和关系信息中,解决了时序知识图谱中时间维度的获取问题。此外,T-CASREL模型还采用了预训练模型和联合抽取模型进行实体关系抽取,通过对比实验验证了其性能方面的优势。(2)本文构建了时序知识图谱问答模型TTrans KGQA来实现问答系统的问题搜索功能。传统的问答模型对于涉及时间信息和多条知识推理的问题性能欠佳。而最新的基于知识图谱嵌入问答模型虽然在多条知识推理的问题上取得了较好的结果,但是其不能用于回答时间信息相关的问题。本文首先将已有的知识图谱嵌入模型进行了时间维度的拓展,使其能够将时序知识图谱进行嵌入表达。然后将拓展后的嵌入模型应用到TTrans KGQA模型中,并且通过实验验证了该模型在涉及时间信息和多条知识推理问题的能力。最后就TTrans KGQA中使用不同知识图谱嵌入模型进行了对比实验,选出表现最优的模型用于问答模型的实现。(3)本文以T-CASREL模型构建的时序知识图谱为知识储备,以TTrans KGQA作为问答模型构造了一个基于时序知识图谱的智能问答系统。该系统实现了问题搜索、最近提问、知识图谱可视化以及知识添加四个功能,并且每个功能都通过了测试,可以满足用户需求。
基于时序知识图谱的智能问答系统研究与原型实现
这是一篇关于时序知识图谱,知识抽取,智能问答系统,时序知识图谱嵌入,问答模型的论文, 主要内容为基于知识图谱的智能问答系统为人们提供了更加便捷化、精确化的信息服务。然而时间对于刻画事实本身起着不可或缺的作用。时序知识图谱虽然包含了时间信息,但是目前对它的研究还处于起步阶段。本文主要为了实现基于时序知识图谱的智能问答系统。该系统的实现需要构建时序知识图谱以及相应的问答模型。其中,时序知识图谱为整个系统提供知识来源,问答模型将输入的问题处理之后给出相应的答案。为了实现上述问答系统,本文主要研究了以下三方面内容:(1)本文构建了时序知识抽取模型T-CASREL用来完成时序知识图谱的构建。时序知识图谱的构建需要从文本中抽取时间信息,而现有的知识抽取模型只关注实体和关系的抽取,无法完成时间信息的抽取。T-CASREL模型由专门的时间抽取层来完成时间信息的抽取,并将时间信息融入到相应的实体和关系信息中,解决了时序知识图谱中时间维度的获取问题。此外,T-CASREL模型还采用了预训练模型和联合抽取模型进行实体关系抽取,通过对比实验验证了其性能方面的优势。(2)本文构建了时序知识图谱问答模型TTrans KGQA来实现问答系统的问题搜索功能。传统的问答模型对于涉及时间信息和多条知识推理的问题性能欠佳。而最新的基于知识图谱嵌入问答模型虽然在多条知识推理的问题上取得了较好的结果,但是其不能用于回答时间信息相关的问题。本文首先将已有的知识图谱嵌入模型进行了时间维度的拓展,使其能够将时序知识图谱进行嵌入表达。然后将拓展后的嵌入模型应用到TTrans KGQA模型中,并且通过实验验证了该模型在涉及时间信息和多条知识推理问题的能力。最后就TTrans KGQA中使用不同知识图谱嵌入模型进行了对比实验,选出表现最优的模型用于问答模型的实现。(3)本文以T-CASREL模型构建的时序知识图谱为知识储备,以TTrans KGQA作为问答模型构造了一个基于时序知识图谱的智能问答系统。该系统实现了问题搜索、最近提问、知识图谱可视化以及知识添加四个功能,并且每个功能都通过了测试,可以满足用户需求。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码港湾 ,原文地址:https://m.bishedaima.com/lunwen/56178.html