面向人机对话的非标产品知识图谱构建研究——以南康家具虚拟主播为例
这是一篇关于人机对话,非标产品,知识图谱,命名实体识别,实体关系抽取的论文, 主要内容为非标产品即不是通过统一的参数标准制造的产品,而是生产商面向客户和市场的需求制造的产品,非标产品知识图谱能够助力非标产品领域向智能化转型升级。构建面向人机对话的非标产品知识图谱难点在于非标产品不具备统一的属性,所以针对不同类型的产品需有不同的知识本体体系,且文本语料存在关系语义层次多、数据结构复杂等特点,需结合领域语料特征进行知识抽取。基于以上,本文以人机对话为应用场景,以南康家具虚拟主播为例,依据行业业务需求构建非标产品知识图谱,具体研究内容如下:(1)提出了一种基于Bert-Bi LSTM-CRF的命名实体识别模型。首先,针对人机对话的应用场景,通过文献分析等方法对非标产品领域知识本体进行建模;其次,采用爬虫等方式获取非结构化数据,进行多源数据融合工作,生成原始语料库;最后,完成基于BertBi LSTM-CRF命名实体识别模型的实体抽取,利用预训练语言模型Bert提供的深层语义信息获取数据的词级别嵌入向量表示,结合Bi LSTM捕获语料的上下文特征,生成序列语义特征矩阵,最后将序列特征矩阵输入进CRF模块进行解码,得到输出的预测标签序列,并对命名实体识别模型进行对比实验。(2)提出了一种基于Bi LSTM-Attention+Position的关系抽取方法。根据非标产品语料数据特点进行了分析,在嵌入层融合词嵌入向量与位置特征嵌入向量,拼合形成联合特征嵌入向量,输入到Bi LSTM-Attention+Position模型中进行关系抽取。此外,本文将非标产品数据输入到不融合位置特征向量的Bi LSTM-Attention关系抽取模型中进行对比实验,实验表明,Bi LSTM-Attention+Position关系抽取模型拥有更优的效果,评价指标有明显提升。(3)提出以南康家具为例的非标产品知识图谱构建与应用研究。首先,以南康家具虚拟主播为例,完成面向人机对话的非标产品知识图谱的构建研究;其次介绍了将知识库导入Neo4j图数据库的方法,利用Neo4j进行知识库存储与可视化,以图的方式展示非标产品领域知识的脉络关系;此外,使用Cypher语句提供前端交互的知识服务;最后,为了更好地服务于人机对话的需求,提出了基于平移距离Trans E推理模型的知识推理,补充更新知识图谱。面向人机对话的非标产品知识图谱构建研究能够从非标产品数据中获取知识三元组,完成知识图谱全流程构建。本文以南康家具虚拟主播为例,为面向人机对话的非标产品知识图谱构建提供了方案,为人机对话等下游应用提供丰富准确的底层语料库支撑,具有实际的应用价值。
基于人机对话的护士执业资格考试平台设计与实现
这是一篇关于考试管理,人机对话,JavaEE的论文, 主要内容为护士执业资格考试是卫生行业职业资格考试的重要组成部分,于2001年开始正式实施,一直采用传统的纸笔考试方式,2013年开始,护士执业资格考试选取部分省市作为试点实施人机对话考试,实现考试管理和考试形式完全信息化,以促进资格考试管理和服务水平的提高。该项工作具有工作量大、涉及面广、政策性强、技术要求高等特点,必须利用先进信息技术为护士执业资格考试工作的开展提供考试平台和运行环境。基于以上需求,本文对山东、江苏等省市卫生行业主管部门的护士执业考试业务开展情况进行调研,结合对卫生行业考试考务管理工作经验的总结与研究,采用服务的建模和架构方法,自顶向下的完成基于人机对话的护士执业职格考试平台的功能与业务模块的设计与实现。平台遵循人社部发布的职业资格技术体系规范,利用成熟的Eclipse开发环境,基于Java语言和JavaEE规范,采用Eclipse插件体系结构,包含界面、流程、服务、数据上的开发插件,UI、数据的定制/约束文件生成工具,保证了业务服务在各个层次的实现结果与规范保持一致,可通过拖拽、可视化等手段方便完成开发。使用的数据库是Oracle数据库10g。平台实现了考试计划管理、考试报名、在线考试、成绩管理、成绩发布等功能,并针对人机对话考试业务特点,采用考试网关、服务器、考试机数据同步设计和考生宕机、断网切换考试机设计方案,确保弱网络环境下考试平台的高可用性,保证多地区同步进行考试,具有承载能力强,安全性高,硬件适应范围广的特点。平台采用面向服务的SOA架构模式,应用功能与组件以服务的形式呈现,可以通过服务的添加和更新达到业务功能的改变,实现了应用系统的灵活构建和业务流程的重组,能很好的满足考试业务、流程等不断变化的需求,同时可以与其它采用相同技术规范的资格考试平台无缝衔接,有利于实现职业资格服务模式的转变,改变职业资格管理机构资源浪费、效率低下的局面,提升资格考试服务体系的服务效率。
基于人机对话的护士执业资格考试平台设计与实现
这是一篇关于考试管理,人机对话,JavaEE的论文, 主要内容为护士执业资格考试是卫生行业职业资格考试的重要组成部分,于2001年开始正式实施,一直采用传统的纸笔考试方式,2013年开始,护士执业资格考试选取部分省市作为试点实施人机对话考试,实现考试管理和考试形式完全信息化,以促进资格考试管理和服务水平的提高。该项工作具有工作量大、涉及面广、政策性强、技术要求高等特点,必须利用先进信息技术为护士执业资格考试工作的开展提供考试平台和运行环境。基于以上需求,本文对山东、江苏等省市卫生行业主管部门的护士执业考试业务开展情况进行调研,结合对卫生行业考试考务管理工作经验的总结与研究,采用服务的建模和架构方法,自顶向下的完成基于人机对话的护士执业职格考试平台的功能与业务模块的设计与实现。平台遵循人社部发布的职业资格技术体系规范,利用成熟的Eclipse开发环境,基于Java语言和JavaEE规范,采用Eclipse插件体系结构,包含界面、流程、服务、数据上的开发插件,UI、数据的定制/约束文件生成工具,保证了业务服务在各个层次的实现结果与规范保持一致,可通过拖拽、可视化等手段方便完成开发。使用的数据库是Oracle数据库10g。平台实现了考试计划管理、考试报名、在线考试、成绩管理、成绩发布等功能,并针对人机对话考试业务特点,采用考试网关、服务器、考试机数据同步设计和考生宕机、断网切换考试机设计方案,确保弱网络环境下考试平台的高可用性,保证多地区同步进行考试,具有承载能力强,安全性高,硬件适应范围广的特点。平台采用面向服务的SOA架构模式,应用功能与组件以服务的形式呈现,可以通过服务的添加和更新达到业务功能的改变,实现了应用系统的灵活构建和业务流程的重组,能很好的满足考试业务、流程等不断变化的需求,同时可以与其它采用相同技术规范的资格考试平台无缝衔接,有利于实现职业资格服务模式的转变,改变职业资格管理机构资源浪费、效率低下的局面,提升资格考试服务体系的服务效率。
面向人机对话的非标产品知识图谱构建研究——以南康家具虚拟主播为例
这是一篇关于人机对话,非标产品,知识图谱,命名实体识别,实体关系抽取的论文, 主要内容为非标产品即不是通过统一的参数标准制造的产品,而是生产商面向客户和市场的需求制造的产品,非标产品知识图谱能够助力非标产品领域向智能化转型升级。构建面向人机对话的非标产品知识图谱难点在于非标产品不具备统一的属性,所以针对不同类型的产品需有不同的知识本体体系,且文本语料存在关系语义层次多、数据结构复杂等特点,需结合领域语料特征进行知识抽取。基于以上,本文以人机对话为应用场景,以南康家具虚拟主播为例,依据行业业务需求构建非标产品知识图谱,具体研究内容如下:(1)提出了一种基于Bert-Bi LSTM-CRF的命名实体识别模型。首先,针对人机对话的应用场景,通过文献分析等方法对非标产品领域知识本体进行建模;其次,采用爬虫等方式获取非结构化数据,进行多源数据融合工作,生成原始语料库;最后,完成基于BertBi LSTM-CRF命名实体识别模型的实体抽取,利用预训练语言模型Bert提供的深层语义信息获取数据的词级别嵌入向量表示,结合Bi LSTM捕获语料的上下文特征,生成序列语义特征矩阵,最后将序列特征矩阵输入进CRF模块进行解码,得到输出的预测标签序列,并对命名实体识别模型进行对比实验。(2)提出了一种基于Bi LSTM-Attention+Position的关系抽取方法。根据非标产品语料数据特点进行了分析,在嵌入层融合词嵌入向量与位置特征嵌入向量,拼合形成联合特征嵌入向量,输入到Bi LSTM-Attention+Position模型中进行关系抽取。此外,本文将非标产品数据输入到不融合位置特征向量的Bi LSTM-Attention关系抽取模型中进行对比实验,实验表明,Bi LSTM-Attention+Position关系抽取模型拥有更优的效果,评价指标有明显提升。(3)提出以南康家具为例的非标产品知识图谱构建与应用研究。首先,以南康家具虚拟主播为例,完成面向人机对话的非标产品知识图谱的构建研究;其次介绍了将知识库导入Neo4j图数据库的方法,利用Neo4j进行知识库存储与可视化,以图的方式展示非标产品领域知识的脉络关系;此外,使用Cypher语句提供前端交互的知识服务;最后,为了更好地服务于人机对话的需求,提出了基于平移距离Trans E推理模型的知识推理,补充更新知识图谱。面向人机对话的非标产品知识图谱构建研究能够从非标产品数据中获取知识三元组,完成知识图谱全流程构建。本文以南康家具虚拟主播为例,为面向人机对话的非标产品知识图谱构建提供了方案,为人机对话等下游应用提供丰富准确的底层语料库支撑,具有实际的应用价值。
大规模知识图谱下的融入知识对话生成方法研究
这是一篇关于人机对话,知识选择,知识融入,预训练模型,图神经网络的论文, 主要内容为随着深度学习技术的快速发展,以深度学习为基础的对话系统有望成为下一代人机交互的一种方式。其中的对话生成是对话系统中最重要的环节之一,也是最具有挑战性的研究问题之一。当前的主流对话系统大多基于序列到序列模型,此模型能够从海量训练数据中自动学习生成回复的逻辑,但是由于模型在生成时仅利用了输入语句中的有限信息,造成模型在生成时往往倾向于生成例如“对不起,我不知道。”这样的安全回复。因此学者们尝试引入外部知识,通过相关知识的指导使模型生成包含更多信息、更有意义的回复。但是其面临着两个挑战:一个是知识的来源,另一个是知识的融入。目前知识的存储常常以知识图谱的形式存在,现存知识图谱中知识的数据量往往十分巨大,因此如何从巨大的知识图谱中选择出合适的知识是一个值得研究的问题。同时,在真实的对话中,人们在进行对话时往往会利用很多条相关知识,“综合考虑”后进行回答,如何合理地融入多条知识指导模型生成回复也是一个很重要的问题。针对以上两个问题,本文开展了如下两个研究工作:(1)提出了一种基于BERT的多轮知识选择模型(MKS-BERT)。MKS-BERT首先设计了多轮对话实体转移算法,同步得到对话的主题实体,根据当前对话的主题缩小候选知识范围。然后,利用BERT预训练语言模型中上下句预测任务与知识选择任务的相似度,使用基于BERT的知识选择器从缩小范围后的候选知识中选择最终要使用的知识。实验表明,相较于传统非预训练知识选择器,其知识选择准确率显著提高。(2)提出了一种基于图神经网络的融入知识对话生成模型(KDG-GN)。目前的知识图谱大多以图的形式呈现,而图神经网络天然擅长处理图结构的数据,KDG-GN在考虑用户输入的情况下利用图神经网络对候选知识子图逐层卷积,得到知识子图的编码向量,这个向量包含了知识子图中知识的相关信息,并最终用于指导对话生成。与对比模型的实验结果表明此模型生成的回复更丰富,语句更自然。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码导航 ,原文地址:https://m.bishedaima.com/lunwen/50196.html