基于知识图谱的自然语言问答方法研究
这是一篇关于知识图谱,信息检索,语义解析,特征工程的论文, 主要内容为在问答场景中,回答问题需要依赖大量的背景知识,基于规则和文本匹配方式的自然语言问答无法利用现有的大量人类背景知识。传统的基于知识图谱的检索式问答采用流水线的方式实现,这会导致错误传播。为了减少累积错误,一般会采用多召回后排序的方式。但是,这种方式会导致召回的候选路径过多,增加了路径排序的难度。为了解决以上问题,本文提出了一种将生成路径模型与信息检索相结合的方法。其中本文的主要工作如下:(1)构建了传统的检索式问答方法。针对其错误传播导致叠加的问题,本文提出的方法采用将传统的方法与语义生成式方法相结合的方式,降低由于错误的传播而导致最终结果产生错误的偏差。(2)构建了语义解析与特征工程集成式问答方法。针对其生成候选路径过多的问题,本文提出了采用生成模型对其候选查询路径先生成后扩展的方法,减少了候选路径的数量以及不必要的候选路径生成。(3)针对生成模型训练数据不足的问题,本文采用了简单的规则扩展了训练数据集,使得生成模型融合了知识图谱中的节点以及节点之间的连接关系,对生成查询路径任务更友好。(4)针对候选路径排序模型太复杂的问题,本文将自然语言问句的候选查询路径按照一定的规则转换成文本描述,通过对比问题与转换之后的文本描述的语义信息来对候选路径进行排序,减少了其他不必要信息的干扰,简化了候选路径排序模型的复杂度。本文选用了2021年全国计算语义大会中的开放领域知识库问答任务的知识图谱及数据集,针对该任务,提出了一种新的基于知识图谱的自然语言问答方法,该方法互补地结合了更通用的信息检索模型和更准确的语义解析模型。本文所提出的方法在比赛的最终排行榜上排名第三,获得了78.52%的F1分数(第一名78.86%)。
汽车智能客户服务系统的设计与实现
这是一篇关于智能问答,信息检索,BERT,实体识别的论文, 主要内容为智能问答系统是将自然语言技术和信息检索技术进行深度融合的人工智能产品。汽车领域作为一个特殊领域,运用大数据、云计算、人工智能等前沿技术来创新服务和管理模式,已经成为汽车相关行业发展新的方向。本系统通过爬虫获取网上公开的数据,然后经过RDF数据转化构建知识关系图谱。同时,在实体识别、实体链接以及用户意图识别等问答系统核心部分采用深度学习结合字典匹配的模型进行实现。在实体识别和意图识别算法实现中,使用BERT词向量进行句子语义级别的信息利用,提高识别准确率,相对于传统的Word2Vec的方法,在当前语料下,识别准确率提高约6个百分点。在此基础上,系统加入对话状态管理机制,在一定基础上提高应答准确率。最终,经系统的模块和功能测试,系统表现出符合期望的应答准确率和负载性能。本文主要的研究工作如下:1)知识库构建通过爬虫获取互联网上众多网站上的汽车数据,然后基于汽车领域知识调研,构建本体,然后进行数据清洗、数据填充、知识融合等,完成知识库的构建工作。2)汽车领域问答系统核心算法设计通过汽车相关的问题获取数据,结合人工标注的方式构建一份数据集。系统使用BERT训练词向量提升了词向量的表征能力,改进了词语边界的划分问题;为了解决有效实体数量分布不均匀的问题,还使用注意力机制改进经典的命名实体识别模型;在意图识别的过程中,使用标准化实体进行用户意图的识别,获取到用户的期望动作,并结合实体和用户意图从知识图谱中查询问题答案。3)问答系统实现系统可以提供Web服务和接口服务,满足不同类型用户的需求。系统对于单个用户可以实现秒级响应,并且可支持50人同时在线使用,可以较好地满足用户对系统性能的需求。
基于SSH框架的公司信息管理系统设计与实现
这是一篇关于信息管理系统,信息检索,产品管理的论文, 主要内容为目前,很多企业发现并清楚了解到公司管理系统对于一个公司管理的重要作用,公司管理系统决定着该公司经济效益,也与公司的影响力执行力密切相关。一个好的公司管理系统可以达到员工效率事半功倍的效果。本系统采用eclipse集成开发工具进行开发,结合JSP,jQuery,Ajax,JavaScript等技术。并且运用当今主流的Spring+Struts2+Hibernate三层框架以及B/S架构实现系统的功能,数据库方面,结合Java连接数据库JDBC技术对数据库进行增加修改删除的操作。本系统是为小型公司打造的管理系统,随着现在企业竞争力的增大,一个合适的公司管理系统显得尤为重要。本系统设计的目标是通过系统增强公司的竞争力,在众多同类公司中得以立足;另外通过系统这一平台,提高员工的工作效率,降低管理成本,提高企业管理能力,同时也增强员工对企业以及企业文化的了解。为方便系统的扩展,本系统以模块划分。本系统主要实现了公告模块、我的TODO模块、对技术负责人和管理员的客户信息管理模块、客户信息检索模块、产品信息管理模块、还有对于管理员权限管理模块。这些模块可以让公司的信息实时化,安全化,简单化,给企业的管理带来了高效、方便、安全等特性。系统经过严格的测试,实现了如上几种功能,并且拥有较好的健壮性,符合软件开发的标准。
基于B/S架构的知识共享库设计与实现
这是一篇关于信息检索,搜索引擎,社会化问答,知识共享的论文, 主要内容为知识共享是指员工彼此之间相互交流的知识,使知识由个人的经验扩散到组织的层面。这样在组织内部,员工可以通过查询组织知识获得解决问题的方法和工具。反过来,员工好的方法和工具通过反馈系统可以扩散到组织知识里,让更多的员工来使用,从而提高组织的效率。本文通过分析信息检索与搜索引擎的发展历史,结合国内、国际存在信息检索技术的发展趋势,借助定性和定量的分析方法,给出我国问答系统在大环境下的发展趋势,并结合我国现在此类系统的发展需求,对问答系统业务流程和功能进行全面规划,着重在知识共享库系统的理论研究:主要研究问答系统、知识共享库系统国内外的研究发展现状,对实现知识共享库系统的技术进行对比分析;知识共享库系统的需求分析:主要进行知识共享库系统的需求分析、功能模块设计;知识共享库系统的设计实现:针对上述的研究,对知识共享库系统,进行详细设计,并针对期中几个特定模块详细描述具体实现思路;知识共享库系统的发展前景和应用展望:分析知识共享库系统在未来企业中应用前景;等方面做具体工作,给出一个具有针对性极强、合理科学的问答系统整体逻辑规划方案,为基于web知识共享库系统的开发思路、模式、方法和系统构建提供有力支持。通过本文研究,采用B/S架构,基于MVC设计模式,借鉴了维基共享、开放、协助、奉献的思想,运用了J2EE主流轻量级开源框架Struts2、Spring、Hibernate并采用ApacheJackrabbit作为内容管理仓库进行设计和开发从而实现知识共享库系统。为互联网用户提供一个分享和传播知识的工具,将每个人的知识聚集起来,高效地挖掘和利用高质量信息,降低互联网时代人们的学习成本。
用于高维空间中近似最近邻搜索的图索引设计与实现
这是一篇关于信息检索,近邻搜索,单调搜索图,近邻图算法的论文, 主要内容为随着大数据时代的到来,各行业各领域上数据分析需求日趋扩大,所需的数据挖掘技术飞速发展,针对大规模高维数据集的检索技术是其中必不可少的重要基础。在数据库,推荐系统,人脸识别等计算机专业领域,近邻搜索有着广泛而基础的应用。在低维空间性能表现优异的准确近邻搜索技术在高维空间效率出现严重下降,因此研究者开始转向对近似近邻搜索技术的研究。其中近邻图算法是目前所有算法中查询效率最高的,尤其对于高召回率的查询,近邻图算法的效率是其它算法的数倍乃至数十倍。针对目前近邻图算法存在的问题,本文提出了多方面的改进设计,具体的研究成果可以体现在以下几个方面:单调搜索图是当前图算法查询效率最高的算法,它致力于通过最小的节点平均出度实现单调搜索从而降低搜索路径的长度来实现查询效率的最大化。然而根据计算,目前的单调搜索图设计并不能很好保证单调搜索的实现。根据本文的研究发现,导致单调搜索失败的两大因素是高维向量空间的复杂性和查询向量的不可预测。为此,本文提出单调搜索图的改进设计,称为(r,p)-MSNET。当查询向量与最近邻的距离小于r时,(r,p)-MSNET保证单调搜索的概率不低于p。由于建立(r,p)-MSNET的时间复杂度过高,本文提出它的近似实现TBSG。在多个常用的高维向量数据集上的实验发现,TBSG在查询效率明显优于其它所有算法,并且有着更快的索引构建速度。另外,通过进一步实验发现,把TBSG的邻居筛选策略移植到其余图算法能有效提升它们的查询效率。针对当前图算法普遍存在的索引所需内存量巨大,索引构建速度过慢的问题,本文提出了分布式索引设计。分布式索引是指将原本的大规模数据集切割成多个子数据集分配到不同的主机节点上并分别构建子索引。在实际查询时,算法根据查询向量与子数据集的相近关系排序,根据目标召回率需要只在前数个子索引查询,最后聚合结果返回。分布式索引能够显著降低图算法对单结点的内存压力,提高图算法在特大规模数据集上的可扩展性。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码项目助手 ,原文地址:https://m.bishedaima.com/lunwen/45850.html