基于知识图谱的高校招生信息问答系统研究与实现
这是一篇关于知识图谱,问答技术,BERT,ALBERT的论文, 主要内容为自动问答研究是自然语言处理方向的分支及热点研究之一。从最早的图灵测试到如今的基于深度学习模型,自动问答一直在迭代进步。知识图谱是通过将知识转换为三元组形式形成的知识网络,并采用图数据库存储,避免了关系数据库在调用时的错综复杂。基于知识图谱构建的某一领域的自动问答系统可以根据用户的自然语言问句在知识图谱内遍历问句中的实体及实体关系等,通过一定方式方法回答用户所提出的问题。如今,基于知识图谱的自动问答系统已经开始逐步发展,目前这方面研究热点多为医疗、农业等,教育方向甚少。本文针对高校招生信息构建服务于招生咨询的知识图谱自动问答系统。本文的主要研究工作有:1.搜集基于高校招生信息的多源数据,通过网络爬虫技术下载数据,清洗数据和标注数据,形成招生咨询服务的知识图谱所需数据集。2.构建多个命名实体识别模型,同一种模型在不同数据集上进行实验对比,不同模型在同一个数据集上进行实验对比,后将流水线方式模型与联合抽取模型进行对比,选定最佳模型构建起知识图谱。3.针对问题集数据集进行分析,确定问题意图类别,通过使用ALBERT-TEXTCNN模型对问题进行意图识别。设计槽位填充模板,实现槽位填充。4.构建前后端分离的自动问答系统,前端使用Vue及Java Script等构建,后端使用Python,构建起一个自动问答系统。同时,为保证知识图谱实时性与准确性构建了知识图谱管理系统。本研究的创新之处在于(1)提出以ALBERT与CRF结合作为新的命名实体识别模型,该模型与其他模型进行实验对比,实验数据表明效果更优;(2)为保证信息的准确性、实时性及可维护性,在问答系统后搭建知识图谱管理系统,实现信息的不断更迭。
基于知识图谱的高考咨询问答技术研究
这是一篇关于高考咨询,知识图谱,Neo4j图数据库,问答技术,BERT模型的论文, 主要内容为高考是众多高三学子步入大学的一个重要环节,对于学子而言由于高考成绩公布后会立刻进入志愿填报环节,所以迅速了解各大高校以及各个专业的详细情况,了解合适自己的专业,寻找合适自己的院校显得至关重要。但是,如今的网络信息增长迅速,在海量信息中寻找与此相关的信息时难免存在盲目性、耗时性。因此,提升考生及家长了解高校以及专业相关信息的速度和准确度,显得十分重要。而近年来,计算机领域各技术的飞速发展为解决这个问题奠定了良好的基础。如:因中文的自然语言处理技术(NLP)的不断完善而变得更加智能的问答系统,以及2012年被提出的谷歌知识图谱,其以图谱结构存储知识的特点使知识库表达更加简洁、清晰并可提供强大的推理能力。特别是在具体领域,制作领域内知识图谱,可以直观、有效的表达领域内各实体及其间关系。从而,基于知识图谱的高考志愿填报方面的问答式智能咨询有其发展的土壤。其可以使得高考方面信息检索变的更便捷与高效,可以将考生与家长所关心的高校及专业信息以图结构进行存储,以卡片信息形式进行展示,具有更强的直观性。因此,本文对高考咨询领域问答技术的研究着重从作为答案库的知识图谱的制作及考生与家长在咨询时会使用的问句的解析出发进行研究。主要工作有:1.构建高考咨询领域知识图谱所需知识库。运用爬虫技术从多个提供高校录取信息数据的网址及高校官网收集云南省25所本科高校的近3年各专业的录取最底分、平均分、最低位次、录取批次以及录取计划数详情和各院校的招生简章、机构设置。从而形成构建知识图谱所需数据集。2.高考咨询知识图谱的构建。利用获取的相关知识库,提出高考咨询领域知识图谱的模式层构建方案,定义知识图谱节点属性与边关系,并使用Python编程语言调用py2neo连接Neo4j图数据库,将整体知识库按照设计进行存储并展示。3.高考咨询中文问句文本分类模型创新。提出C&W-CNN-BiLSTM-Attention循环神经网络模型构架。基于CNN-BiLSTM-Attention模型,在原模型的基础上进行探索,创新性的在中文高考咨询问句分类领域进行创新,将原模型基于词向量的模式拓展为基于中文句子特点的字、词向量双通道。在原本通过词向量进行语义特征提取的基础上增添字向量分支,使得模型能够更深层次的挖掘中文句子的关键信息。4.高考咨询领域问句实体识别优化。首次使用BERT模型在高考咨询领域问句实体识别任务中与BiLSTM-CRF模型进行融合。形成BERT-BiLSTM-CRF实体识别模型。以BERT模型作为词嵌入方式替代传统Word2vec等方法解决传统Word2vec等词向量无法表征一词多义和考虑上下文语义等局限性。并且以其强大的迁移能力,使命名实体识别任务可以加快词向量训练环节,从而大大节省时间成本。
基于知识图谱的高校招生信息问答系统研究与实现
这是一篇关于知识图谱,问答技术,BERT,ALBERT的论文, 主要内容为自动问答研究是自然语言处理方向的分支及热点研究之一。从最早的图灵测试到如今的基于深度学习模型,自动问答一直在迭代进步。知识图谱是通过将知识转换为三元组形式形成的知识网络,并采用图数据库存储,避免了关系数据库在调用时的错综复杂。基于知识图谱构建的某一领域的自动问答系统可以根据用户的自然语言问句在知识图谱内遍历问句中的实体及实体关系等,通过一定方式方法回答用户所提出的问题。如今,基于知识图谱的自动问答系统已经开始逐步发展,目前这方面研究热点多为医疗、农业等,教育方向甚少。本文针对高校招生信息构建服务于招生咨询的知识图谱自动问答系统。本文的主要研究工作有:1.搜集基于高校招生信息的多源数据,通过网络爬虫技术下载数据,清洗数据和标注数据,形成招生咨询服务的知识图谱所需数据集。2.构建多个命名实体识别模型,同一种模型在不同数据集上进行实验对比,不同模型在同一个数据集上进行实验对比,后将流水线方式模型与联合抽取模型进行对比,选定最佳模型构建起知识图谱。3.针对问题集数据集进行分析,确定问题意图类别,通过使用ALBERT-TEXTCNN模型对问题进行意图识别。设计槽位填充模板,实现槽位填充。4.构建前后端分离的自动问答系统,前端使用Vue及Java Script等构建,后端使用Python,构建起一个自动问答系统。同时,为保证知识图谱实时性与准确性构建了知识图谱管理系统。本研究的创新之处在于(1)提出以ALBERT与CRF结合作为新的命名实体识别模型,该模型与其他模型进行实验对比,实验数据表明效果更优;(2)为保证信息的准确性、实时性及可维护性,在问答系统后搭建知识图谱管理系统,实现信息的不断更迭。
基于实体关系抽取的社保领域知识图谱构建及应用研究
这是一篇关于实体关系抽取,自然语言处理,知识图谱,命名实体识别,关系抽取,问答技术,社会保险的论文, 主要内容为社会保险作为社会保障制度的重要组成部分,与每个人的生活息息相关。而随着互联网的发展,人们对社会保险的关注度越来越高。如何在纷繁杂乱的数据海洋中快速获取社会保险知识成为人们迫切需要解决的问题。最近的研究中,知识图谱由于能够直观便捷的构建结构化知识体系而备受关注。而实体关系抽取能够从非结构化的文本中抽取结构化的知识表示,所以在知识图谱的构建过程中具有重要意义。因此,基于实体关系抽取的社保领域知识图谱构建在实际应用中具有重要意义。基于以上背景,本文对实体关系抽取、知识图谱的构建和基于知识图谱的问答系统相关工作进行了大量研究。本文研究内容主要包括以下几个方面:(1)为从非结构化文本中抽取结构化知识,本文首先研究了命名实体识别和关系抽取方法。为解决社保领域没有公开可用的语料集问题,本文利用网络爬虫技术从百度百科等网站中获取大量社保领域相关文本。然后,构建了用于社保领域命名实体识别和关系抽取的数据集。随后,本文提出了基于单词对关系分类的命名实体识别模型,通过对实体中字与字之间的相邻字关系(NAW)和实体尾指向实体头关系(THW_*)两种语义关系进行建模来进行实体识别任务。随后在关系抽取中,本文在BERT对输入句子编码后接入Bi LSTM获取句子语义特征,并利用句子语义特征与两个实体的表示进行特征融合操作来提高模型的关系分类效果。实验证明,基于单词对关系分类的命名实体识别模型和融合句子语义特征和实体特征的关系抽取模型在社保领域实体关系抽取中取得了较好的效果。且在公开数据集上的实验结果表明,与现有模型方法相比,本文提出的模型在准确率、召回率以及F1值三项评价指标上均有一定提高。(2)本文使用图数据库Neo4j将上述研究中抽取的实体关系三元组进行存储,并以知识图谱形式进行可视化展示,然后深入研究了基于社保领域知识图谱的问答技术。基于知识图谱的问答技术主要包括实体链接和关系预测两个部分。在实体链接中,本文通过Levenshtein Distance算法计算问句实体和知识图谱实体间的相似性,并在此基础上提出多特征融合的实体相似性计算方法。而在关系预测中提出了基于孪生网络的关系预测模型,该模型通过两个相同的网络模型对问句和预定义关系进行编码,并计算问句与关系之间的相似性方式来预测问句中的关系。问句经过实体链接和关系预测后生成Cypher查询语句,并在知识图谱中检索答案。(3)基于以上研究,完成社保领域问答系统的设计与实现。本文利用Python,Vue.js、Django等系统开发技术,并采用前后端分离方式设计并实现了基于社保领域知识图谱的问答系统,系统实现了知识图谱可视化以及知识图谱查询功能,实体关系抽取功能和自动问答功能。研究中的实验结果表明,本文提出的命名实体识别和关系抽取方法有一定的优越性,且在社保领域具有实际应用价值;通过构建社保领域知识图谱并在问答系统中进行应用是可行的。本文的研究对于知识图谱的构建及其应用具有积极推动作用。
基于知识图谱的高校招生信息问答系统研究与实现
这是一篇关于知识图谱,问答技术,BERT,ALBERT的论文, 主要内容为自动问答研究是自然语言处理方向的分支及热点研究之一。从最早的图灵测试到如今的基于深度学习模型,自动问答一直在迭代进步。知识图谱是通过将知识转换为三元组形式形成的知识网络,并采用图数据库存储,避免了关系数据库在调用时的错综复杂。基于知识图谱构建的某一领域的自动问答系统可以根据用户的自然语言问句在知识图谱内遍历问句中的实体及实体关系等,通过一定方式方法回答用户所提出的问题。如今,基于知识图谱的自动问答系统已经开始逐步发展,目前这方面研究热点多为医疗、农业等,教育方向甚少。本文针对高校招生信息构建服务于招生咨询的知识图谱自动问答系统。本文的主要研究工作有:1.搜集基于高校招生信息的多源数据,通过网络爬虫技术下载数据,清洗数据和标注数据,形成招生咨询服务的知识图谱所需数据集。2.构建多个命名实体识别模型,同一种模型在不同数据集上进行实验对比,不同模型在同一个数据集上进行实验对比,后将流水线方式模型与联合抽取模型进行对比,选定最佳模型构建起知识图谱。3.针对问题集数据集进行分析,确定问题意图类别,通过使用ALBERT-TEXTCNN模型对问题进行意图识别。设计槽位填充模板,实现槽位填充。4.构建前后端分离的自动问答系统,前端使用Vue及Java Script等构建,后端使用Python,构建起一个自动问答系统。同时,为保证知识图谱实时性与准确性构建了知识图谱管理系统。本研究的创新之处在于(1)提出以ALBERT与CRF结合作为新的命名实体识别模型,该模型与其他模型进行实验对比,实验数据表明效果更优;(2)为保证信息的准确性、实时性及可维护性,在问答系统后搭建知识图谱管理系统,实现信息的不断更迭。
基于知识图谱的高校招生信息问答系统研究与实现
这是一篇关于知识图谱,问答技术,BERT,ALBERT的论文, 主要内容为自动问答研究是自然语言处理方向的分支及热点研究之一。从最早的图灵测试到如今的基于深度学习模型,自动问答一直在迭代进步。知识图谱是通过将知识转换为三元组形式形成的知识网络,并采用图数据库存储,避免了关系数据库在调用时的错综复杂。基于知识图谱构建的某一领域的自动问答系统可以根据用户的自然语言问句在知识图谱内遍历问句中的实体及实体关系等,通过一定方式方法回答用户所提出的问题。如今,基于知识图谱的自动问答系统已经开始逐步发展,目前这方面研究热点多为医疗、农业等,教育方向甚少。本文针对高校招生信息构建服务于招生咨询的知识图谱自动问答系统。本文的主要研究工作有:1.搜集基于高校招生信息的多源数据,通过网络爬虫技术下载数据,清洗数据和标注数据,形成招生咨询服务的知识图谱所需数据集。2.构建多个命名实体识别模型,同一种模型在不同数据集上进行实验对比,不同模型在同一个数据集上进行实验对比,后将流水线方式模型与联合抽取模型进行对比,选定最佳模型构建起知识图谱。3.针对问题集数据集进行分析,确定问题意图类别,通过使用ALBERT-TEXTCNN模型对问题进行意图识别。设计槽位填充模板,实现槽位填充。4.构建前后端分离的自动问答系统,前端使用Vue及Java Script等构建,后端使用Python,构建起一个自动问答系统。同时,为保证知识图谱实时性与准确性构建了知识图谱管理系统。本研究的创新之处在于(1)提出以ALBERT与CRF结合作为新的命名实体识别模型,该模型与其他模型进行实验对比,实验数据表明效果更优;(2)为保证信息的准确性、实时性及可维护性,在问答系统后搭建知识图谱管理系统,实现信息的不断更迭。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码项目助手 ,原文地址:https://m.bishedaima.com/lunwen/52347.html