面向地产领域的智能问答系统研究与实现
这是一篇关于地产,问答系统,文本分类,语义相似度计算,本体的论文, 主要内容为企业客服服务的质量会直接影响客户对公司产品的满意度。随着互联网用户的爆炸式增长,传统人工客服难以应对庞大的用户量,并且无法24小时解决问题。人工客服的效率也无法保证,并且传统人工客服需要消耗大量的人力、财力。因此使用智能问答系统代替或者辅助人工客服可以大大降低成本,提高效率。智能问答系统从应用领域可以分为开放域问答系统和封闭域问答系统。从技术层面可以分为:基于检索(答案选择排序)的问答系统,基于本体库或者知识图谱的问答系统,基于深度学习模型的生成式问答系统。本文使用两种问答系统解决方案,分别是FAQ问答方案和本体问答方案,实现面向地产领域的智能客服问答系统。本文主要的研究内容如下:(1)本文提出一种多元特征融合+命名实体识别的问题分类方法。在FAQ问答和本体问答两种方案选择时,本文使用问题分类的方法作为调度两种方案的重要依据。命名实体识别采用LSTM+CRF的方法。文本分类采用多元特征融合模型的方法,通过命名实体识别的结果对文本分类的预测概率进行加权修正。通过实验证明多元特征融合+命名实体的问题分类方法比单一的深度学习文本分类的模型效果要好。(2)本文在Matchpyramid模型和BIMPM模型的基础上提出一种改进的语义相似度计算模型。在FAQ方案中,语义相似度计算是核心内容。最近几年随着深度学习的迅猛发展,基于深度学习模型的语义相似度计算方法在效果上几乎已经碾压传统NLP方法。本文使用改进的深度学习模型来完成语义相似度计算任务,并通过实验证明该模型的在测试集上的表现要比Matchpyramid模型和BIMPM模型要好。(3)本文同时采用FAQ问答和本体问答两种方案。因为FAQ问答技术也就是基于检索的方案只能从现有的答案当中抽取答案,对于一些地产信息的问题并不能完全覆盖,所以引入本体问答方案。本体问答方案是对FAQ方案的补充。在本体问答方案中,依照分词之后的语料对本体库进行手工构建。对问句进行关键字匹配和命名实体识别,利用其结果构造SPARQL表达式,完成对于本体库的检索,进而获得用户的回答。并基于FAQ问答和本体问答两种方案,设计一个完整的面向地产领域的问答系统。
基于命名实体识别和语义相似度计算的人才评价系统的设计与实现
这是一篇关于人才评价,命名实体识别,语义相似度计算,Bert,微服务的论文, 主要内容为对于国家来说,发展需要人才的支撑,而培养人才需要消耗大量的时间和资源,为节省人才培养成本,我国政府提出了一系列人才引进政策。因此,如何根据这些政策建立起科学、公正、高效的人才评价系统则变得至关重要。目前,我国各地区建立的人才评价体系主观性过强,评价效率低下,无法对人才信息进行有效的分类。为提高人才评价的效率和准确性,本文基于命名实体识别和语义相似度计算技术改进现有的人才信息解析和评估方式,结合微服务框架搭建人才评价系统,实现对人才信息的自动化评估。本文的主要工作如下:(1)通过梳理国家和浙江省政府的人才引进政策,结合国家高级工程师任职资格量化评价标准对人才信息进行评估和量化,设计了一套人才类型和分值评价模型;结合前后端分离的微服务框架设计出系统的软件方案。(2)针对人才信息量大、文本序列过长导致人才信息难以进行评估的问题,采用融合双向长短记忆网络和条件随机场的命名实体识别技术对人才的文本数据进行识别和抽取,并按照人才类型评价流程将人才数据划分为九种类型的实体标签,进而实现对人才信息的分类。(3)针对人才和分值标签匹配不准确的问题,通过分析人才标签和分值标签的文本特征,使用基于深度学习的语义相似度计算方法,加入Bi LSTM网络和注意力机制改进Bert模型,设计和实现了人才标签分值计算模块。(4)搭建人才评价系统,通过人才评价流程和人才类别划分系统模块,采用微服务架构,利用Mysql+Neo4j+Mongo DB数据库设计完成了人才评价系统,实现系统测试和验证。研究结果表明,本文提出的人才评价量化方案降低了人才评估的难度,提高了人才评估的效率和准确性;采用前后端分离的微服务架构进行设计与实现人才评价系统,能够满足系统可扩展性和易维护行的需求;此外,融合双向长短记忆网络和条件随机场的命名实体识别模型,实现了对人才信息的预处理,提高了人才评价的速度;改进后的Bert模型解决了Bert模型词向量分布不均匀以及无法关注重点语义信息的问题,提高了文本匹配的准确性。
基于命名实体识别和语义相似度计算的人才评价系统的设计与实现
这是一篇关于人才评价,命名实体识别,语义相似度计算,Bert,微服务的论文, 主要内容为对于国家来说,发展需要人才的支撑,而培养人才需要消耗大量的时间和资源,为节省人才培养成本,我国政府提出了一系列人才引进政策。因此,如何根据这些政策建立起科学、公正、高效的人才评价系统则变得至关重要。目前,我国各地区建立的人才评价体系主观性过强,评价效率低下,无法对人才信息进行有效的分类。为提高人才评价的效率和准确性,本文基于命名实体识别和语义相似度计算技术改进现有的人才信息解析和评估方式,结合微服务框架搭建人才评价系统,实现对人才信息的自动化评估。本文的主要工作如下:(1)通过梳理国家和浙江省政府的人才引进政策,结合国家高级工程师任职资格量化评价标准对人才信息进行评估和量化,设计了一套人才类型和分值评价模型;结合前后端分离的微服务框架设计出系统的软件方案。(2)针对人才信息量大、文本序列过长导致人才信息难以进行评估的问题,采用融合双向长短记忆网络和条件随机场的命名实体识别技术对人才的文本数据进行识别和抽取,并按照人才类型评价流程将人才数据划分为九种类型的实体标签,进而实现对人才信息的分类。(3)针对人才和分值标签匹配不准确的问题,通过分析人才标签和分值标签的文本特征,使用基于深度学习的语义相似度计算方法,加入Bi LSTM网络和注意力机制改进Bert模型,设计和实现了人才标签分值计算模块。(4)搭建人才评价系统,通过人才评价流程和人才类别划分系统模块,采用微服务架构,利用Mysql+Neo4j+Mongo DB数据库设计完成了人才评价系统,实现系统测试和验证。研究结果表明,本文提出的人才评价量化方案降低了人才评估的难度,提高了人才评估的效率和准确性;采用前后端分离的微服务架构进行设计与实现人才评价系统,能够满足系统可扩展性和易维护行的需求;此外,融合双向长短记忆网络和条件随机场的命名实体识别模型,实现了对人才信息的预处理,提高了人才评价的速度;改进后的Bert模型解决了Bert模型词向量分布不均匀以及无法关注重点语义信息的问题,提高了文本匹配的准确性。
基于命名实体识别和语义相似度计算的人才评价系统的设计与实现
这是一篇关于人才评价,命名实体识别,语义相似度计算,Bert,微服务的论文, 主要内容为对于国家来说,发展需要人才的支撑,而培养人才需要消耗大量的时间和资源,为节省人才培养成本,我国政府提出了一系列人才引进政策。因此,如何根据这些政策建立起科学、公正、高效的人才评价系统则变得至关重要。目前,我国各地区建立的人才评价体系主观性过强,评价效率低下,无法对人才信息进行有效的分类。为提高人才评价的效率和准确性,本文基于命名实体识别和语义相似度计算技术改进现有的人才信息解析和评估方式,结合微服务框架搭建人才评价系统,实现对人才信息的自动化评估。本文的主要工作如下:(1)通过梳理国家和浙江省政府的人才引进政策,结合国家高级工程师任职资格量化评价标准对人才信息进行评估和量化,设计了一套人才类型和分值评价模型;结合前后端分离的微服务框架设计出系统的软件方案。(2)针对人才信息量大、文本序列过长导致人才信息难以进行评估的问题,采用融合双向长短记忆网络和条件随机场的命名实体识别技术对人才的文本数据进行识别和抽取,并按照人才类型评价流程将人才数据划分为九种类型的实体标签,进而实现对人才信息的分类。(3)针对人才和分值标签匹配不准确的问题,通过分析人才标签和分值标签的文本特征,使用基于深度学习的语义相似度计算方法,加入Bi LSTM网络和注意力机制改进Bert模型,设计和实现了人才标签分值计算模块。(4)搭建人才评价系统,通过人才评价流程和人才类别划分系统模块,采用微服务架构,利用Mysql+Neo4j+Mongo DB数据库设计完成了人才评价系统,实现系统测试和验证。研究结果表明,本文提出的人才评价量化方案降低了人才评估的难度,提高了人才评估的效率和准确性;采用前后端分离的微服务架构进行设计与实现人才评价系统,能够满足系统可扩展性和易维护行的需求;此外,融合双向长短记忆网络和条件随机场的命名实体识别模型,实现了对人才信息的预处理,提高了人才评价的速度;改进后的Bert模型解决了Bert模型词向量分布不均匀以及无法关注重点语义信息的问题,提高了文本匹配的准确性。
基于意图识别的客服机器人框架设计与关键技术研究
这是一篇关于问答系统,关键词自动抽取,意图识别,语义相似度计算的论文, 主要内容为聊天机器人是自然语言处理领域的一个重要研究方向,旨在让用户能用自然语言的方式与机器进行沟通。基于常见问答对的问答系统,是聊天机器人的一种重要实现方法,通过比较用户的问题与问答对中问题的相似程度,快速地返回一个准确而简洁的答案,其中全面而准确的问答对是问答系统的基础,也是发展瓶颈。在客服领域,大量且真实的人工客服数据为问答系统的使用提供非常合适的应用场景,而且准确且高效的问答系统也为企业节约了客服成本,提高了客服效率。本文以母婴行业的电商客服为背景,主要做了以下几方面的工作:首先,本文针对传统基于常见问答对的问答系统(Frequently Asked Questions,FAQ)框架的不足,在传统FAQ框架的基础,加入意图识别模块,设计了一个新的客服机器人框架。然后,本文针对客服机器人框架中的三个关键技术,关键词自动抽取,意图识别和语义相似度计算,结合本文的实际应用场景,进行了深入的研究。设计了多种关键词特征,利用XGBOOST(eXtreme Gradient Boosting)算法构建了一个关键词自动抽取模型;设计了一个意图分类模板和多种意图识别特征,利用Softmax算法建立一个多分类模型进行意图识别;设计了多种语义相似度特征,基于XGBOOST算法构造语义相似度计算模型。最后,对本文所建立的三种模型进行了实验和评估。本文提出的关键词自动抽取方法相比传统的无监督方法和有监督方法准确率都有大幅提高;意图识别的平均准确率为78.4%;在不同相似性阈值的情况下,基于关键词自动抽取模型的语义相似度计算模型相比基于TF-IDF(Term Frequency–Inverse Document Frequency)的语义相似度计算模型准确率都有提高。将这三种模型用于本文提出的客服机器人框架和传统的FAQ框架,实验结果证明,本文提出的框架比传统的FAQ框架准确率更高。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码客栈 ,原文地址:https://m.bishedaima.com/lunwen/52651.html