从文本到SQL的自动语义解析算法研究
这是一篇关于语义解析,知识增强,实体链接,课程学习的论文, 主要内容为关系型数据库中存储了大量数据,是信息系统的基础和核心。用户可以使用SQL语句来检索数据库中的数据,但这通常对用户的SQL掌握水平有一定要求。为降低用户的学习成本,提高其使用效率和体验,面向关系型数据库的自然语言查询技术应运而生。它允许用户通过自然语言的方式直接与数据库交互从而获取到所需数据,其核心是将自然语言解析成SQL语句(NL2SQL)。然而,目前的NL2SQL模型仍存在如下两点挑战,包括1)问句中存在语义不足的问题;2)数据集信息未被充分利用。本文针对上述挑战展开了以下研究:(1)针对问句中存在语义不足的问题,本文提出了基于知识增强的NL2SQL方法,通过知识图谱来补充自然语言问句中命名实体的背景知识。具体来说,该模型首先使用实体链接技术将问句中的命名实体链接到外部知识图谱上,然后通过引入问句中命名实体在外部知识图谱的四类知识(摘要、类型、标签和语义关系),来增强NL2SQL模型对于问句的理解能力,进而提高解析效果。本文提出了一种基于符号化和两种基于向量化(文本向量化和图谱向量化)的知识增强方案,并系统地论证了引入不同知识的效果及不同增强方式的优劣。(2)针对数据集信息未被充分利用的问题,本文提出基于两阶段课程学习(预习+上课)的NL2SQL方法来使用数据中的信息来指导模型训练。具体来说,预习阶段的目标是训练NL2SQL模型的编码器,为了使其能学习到问句和表格的一致性编码,额外考虑了数据集中问句和表格的对应关系,设计了一个意图(表格)识别的新任务。上课阶段的目标是训练NL2SQL模型,为使其能找到更好的局部最优点,额外考虑了数据集中数据的难度差异,设计了一个模型无关的从简单到困难的课程框架。(3)在Wiki SQL数据集上进行实验。对于基于知识增强的NL2SQL方法,本文分别比较了知识图谱中四类不同的知识在一种符号化和两种向量化的知识增强方法上的效果。实验结果表明使用这四类知识进行符号化和向量化的增强均可以提升模型表现,其中使用类型和语义关系知识进行文本向量化增强的效果最好。对于基于两阶段课程学习的NL2SQL方法,本文分别比较了使用两个阶段以及联合来训练NL2SQL模型的效果。实验结果表明两个阶段都必不可少,预习阶段为NL2SQL模型提供了学到问句和表格一致性表示的编码器,上课阶段为NL2SQL模型提供了更好的训练框架。
大学生IT技术在线学习平台的设计与实现
这是一篇关于在线学习,在线考试,课程学习的论文, 主要内容为目前,我国信息产业及互联网产业发展迅猛,这同时带动促进了各类IT技术的发展,各种前端、后台、数据分析开发框架与技术的更新迭代十分迅速,使得处于该行业的从业人员为了获得好的职业发展及开发出高质量、成熟的产品,必须积极地拓宽自己的视野,加强自我学习和驱动的步伐。同时当代在线教育的兴起突破空间了时间的限制,使得人们可以低成本高效的进行学习,为当前教育形式带来了翻天覆地的变化。而这些信息技术行业从业人员的后备军就是相关专业的大学生,他们的IT技术水平对将来自我职业发展以及未来行业的发展有着重大影响。为此本文着眼于大学生群体,针对目前信息产业大发展、各种IT技术全方位的兴起的情况,分析和设计了大学生IT技术在线学习平台,借助该平台,大学生群体能够更加便捷的获取和学习自己感兴趣的IT技术内容。平台主要包含在线视频课程学习,在线考试等模块,帮助学生群体利用零碎时间,随时随地地进行学习,激发学生的学习兴趣。在系统的构建过程中,严格遵循软件工程的理论方法,整篇文章将分为系统需求分析,系统设计(概要设计与详细设计),系统实现及系统测试几个部分来阐述。平台以B/S的服务模式为用户提供服务,使用Java语言作为开发语言,Eclipse作为开发环境,按照Java开发企业级应用的标准,使用JSP、Servlet等技术,使用mySql数据库,完成了整个项目的开发与部署。实现过程中使用了文件上传脚本、JDBC等关键技术,帮助系统快速高效地开发实现。经过系统测试,结果表明系统功能符合需求,运行稳定、操作便捷、结果正确,基本满足系统设计的最初要求。
基于强化学习的知识图谱推理算法研究与实现
这是一篇关于知识图谱,知识图谱推理,强化学习,课程学习,路径质量判别的论文, 主要内容为知识图谱应用广泛,不仅是许多NLP(Natural Language Processing,自然语言处理)子任务的上游任务,还是推荐系统、问答系统中的重要组成部分。但主要来源于各类百科的结构化图谱存在大量缺失的关系,而经过关系抽取的图谱存在许多错误元组,这些问题影响了图谱应用系统的正确性。为解决以上问题,知识图谱推理(Knowledge Graph Reasoning,KGR)算法可用于对不完整的图谱中的事实进行补全,也可用于对抽取得到的图谱进行质量评估。本文工作与贡献如下:1.针对在使用强化学习的实体关系补全过程中出现的虚假路径难题,即智能体游走得到的训练序列(路径)不完美导致智能体被误导,深入课程学习方向的研究,本文第三章按头实体的度(degree)预处理训练样本,使用基于知识的软奖励方法,将智能体在环境中游走得到的路径映射到LSTM策略网络,再使用实体和关系嵌入作为参数组成的打分函数进行软奖励构造,同时在智能体于路径中多次跳转时采用动作丢弃策略进行出边的随机掩盖。最终实现较为准确的实体预测,该算法通用性高且额外开销几乎可忽略不计。MINERVA的改进模型的指标Hit@1,Hit@10,MRR在数据集WN18RR上分别增长了1.7%,1.5%,1.3%,在数据集NELL-995上分别增长了1.9%,4.8%,3.7%。2.针对基于强化学习的知识图谱推理方法以及第三章提出的算法均存在的样本质量未知问题,本文第四章提出复杂语义环境下的路径质量判断算法,使用额外文本信息,以语义相似度的方式对智能体采样到的路径进行质量评估,再把路径评估模块的输出作为强化学习过程中的奖励部分来激励智能体选择高质量路径。该算法可提升在大型数据集FB15K-237上的指标,但依赖于数据集相关的实体描述信息。在数据集FB15K-237上,改进方法的指标Hits@1,Hits@10,MRR分别增加2.2%,6.8%,4.8%;在数据集NELL-995上,Hits@1,Hits@10,MRR分别增加了0.6%,2.8%,1.7%。3.本文实现知识图谱补全与检验系统,知识图谱可作为许多NLP任务的上游任务,也可作为推荐系统和问答系统中的知识补充。本文设计的知识图谱补全系统用于提高应用中的图谱质量。选择结合第三章提出的算法和目前主流的前后端框架构建系统,提供对输入图谱的补全、置信度评估和查询问答功能。使用UMLS数据集对系统进行测试,证明算法的有效性与通用性。
从文本到SQL的自动语义解析算法研究
这是一篇关于语义解析,知识增强,实体链接,课程学习的论文, 主要内容为关系型数据库中存储了大量数据,是信息系统的基础和核心。用户可以使用SQL语句来检索数据库中的数据,但这通常对用户的SQL掌握水平有一定要求。为降低用户的学习成本,提高其使用效率和体验,面向关系型数据库的自然语言查询技术应运而生。它允许用户通过自然语言的方式直接与数据库交互从而获取到所需数据,其核心是将自然语言解析成SQL语句(NL2SQL)。然而,目前的NL2SQL模型仍存在如下两点挑战,包括1)问句中存在语义不足的问题;2)数据集信息未被充分利用。本文针对上述挑战展开了以下研究:(1)针对问句中存在语义不足的问题,本文提出了基于知识增强的NL2SQL方法,通过知识图谱来补充自然语言问句中命名实体的背景知识。具体来说,该模型首先使用实体链接技术将问句中的命名实体链接到外部知识图谱上,然后通过引入问句中命名实体在外部知识图谱的四类知识(摘要、类型、标签和语义关系),来增强NL2SQL模型对于问句的理解能力,进而提高解析效果。本文提出了一种基于符号化和两种基于向量化(文本向量化和图谱向量化)的知识增强方案,并系统地论证了引入不同知识的效果及不同增强方式的优劣。(2)针对数据集信息未被充分利用的问题,本文提出基于两阶段课程学习(预习+上课)的NL2SQL方法来使用数据中的信息来指导模型训练。具体来说,预习阶段的目标是训练NL2SQL模型的编码器,为了使其能学习到问句和表格的一致性编码,额外考虑了数据集中问句和表格的对应关系,设计了一个意图(表格)识别的新任务。上课阶段的目标是训练NL2SQL模型,为使其能找到更好的局部最优点,额外考虑了数据集中数据的难度差异,设计了一个模型无关的从简单到困难的课程框架。(3)在Wiki SQL数据集上进行实验。对于基于知识增强的NL2SQL方法,本文分别比较了知识图谱中四类不同的知识在一种符号化和两种向量化的知识增强方法上的效果。实验结果表明使用这四类知识进行符号化和向量化的增强均可以提升模型表现,其中使用类型和语义关系知识进行文本向量化增强的效果最好。对于基于两阶段课程学习的NL2SQL方法,本文分别比较了使用两个阶段以及联合来训练NL2SQL模型的效果。实验结果表明两个阶段都必不可少,预习阶段为NL2SQL模型提供了学到问句和表格一致性表示的编码器,上课阶段为NL2SQL模型提供了更好的训练框架。
基于强化学习的知识图谱推理算法研究与实现
这是一篇关于知识图谱,知识图谱推理,强化学习,课程学习,路径质量判别的论文, 主要内容为知识图谱应用广泛,不仅是许多NLP(Natural Language Processing,自然语言处理)子任务的上游任务,还是推荐系统、问答系统中的重要组成部分。但主要来源于各类百科的结构化图谱存在大量缺失的关系,而经过关系抽取的图谱存在许多错误元组,这些问题影响了图谱应用系统的正确性。为解决以上问题,知识图谱推理(Knowledge Graph Reasoning,KGR)算法可用于对不完整的图谱中的事实进行补全,也可用于对抽取得到的图谱进行质量评估。本文工作与贡献如下:1.针对在使用强化学习的实体关系补全过程中出现的虚假路径难题,即智能体游走得到的训练序列(路径)不完美导致智能体被误导,深入课程学习方向的研究,本文第三章按头实体的度(degree)预处理训练样本,使用基于知识的软奖励方法,将智能体在环境中游走得到的路径映射到LSTM策略网络,再使用实体和关系嵌入作为参数组成的打分函数进行软奖励构造,同时在智能体于路径中多次跳转时采用动作丢弃策略进行出边的随机掩盖。最终实现较为准确的实体预测,该算法通用性高且额外开销几乎可忽略不计。MINERVA的改进模型的指标Hit@1,Hit@10,MRR在数据集WN18RR上分别增长了1.7%,1.5%,1.3%,在数据集NELL-995上分别增长了1.9%,4.8%,3.7%。2.针对基于强化学习的知识图谱推理方法以及第三章提出的算法均存在的样本质量未知问题,本文第四章提出复杂语义环境下的路径质量判断算法,使用额外文本信息,以语义相似度的方式对智能体采样到的路径进行质量评估,再把路径评估模块的输出作为强化学习过程中的奖励部分来激励智能体选择高质量路径。该算法可提升在大型数据集FB15K-237上的指标,但依赖于数据集相关的实体描述信息。在数据集FB15K-237上,改进方法的指标Hits@1,Hits@10,MRR分别增加2.2%,6.8%,4.8%;在数据集NELL-995上,Hits@1,Hits@10,MRR分别增加了0.6%,2.8%,1.7%。3.本文实现知识图谱补全与检验系统,知识图谱可作为许多NLP任务的上游任务,也可作为推荐系统和问答系统中的知识补充。本文设计的知识图谱补全系统用于提高应用中的图谱质量。选择结合第三章提出的算法和目前主流的前后端框架构建系统,提供对输入图谱的补全、置信度评估和查询问答功能。使用UMLS数据集对系统进行测试,证明算法的有效性与通用性。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设导航 ,原文地址:https://m.bishedaima.com/lunwen/53587.html