分享5篇关于词语相似度的计算机专业论文

今天分享的是关于词语相似度的5篇计算机毕业论文范文, 如果你的论文涉及到词语相似度等主题,本文能够帮助到你 机务WBT系统框架设计与实现 这是一篇关于WBT,系统设计

今天分享的是关于词语相似度的5篇计算机毕业论文范文, 如果你的论文涉及到词语相似度等主题,本文能够帮助到你

机务WBT系统框架设计与实现

这是一篇关于WBT,系统设计,MVC设计模式,XSL,词语相似度的论文, 主要内容为机务WBT是借助计算机对航空从业人员进行培训的一种新型训练方式。相对于传统的训练方式,具有费用低、效率高、指导性强的特点。但由于国内对机务WBT的研究起步晚、底子薄,导致推出的产品不多,功能和内容也不能完全满足培训的需求。 随着互联网技术的发展,利用网络技术发展WBT已经成为趋势。本文在软件工程以及现代教育理论的指导下,结合网络相关技术,设计开发了机务WBT软件中的素材管理系统、课件开发平台和自动测试系统,并对其关键技术进行研究: (1)根据软件工程理论,使用MFC框架设计开发了素材管理系统和课件开发平台。素材管理系统用来保存和管理素材资源,所有客户机在局域网中共享服务器中的数据库,能加速素材资源的积累,达到资源共享的目的。课件开发平台则利用这些素材资源进行课件开发。 (2)在考虑到用户的广泛性和具体技术的针对性后,制作考核系统,搭建一种新的基于J2EE的MVC框架,将传统的JSP+SERVLETt+JAVABEAN框架进行改进,利用XSLT转换XML取代了原来较为复杂的JSP视图部分,将视图以静态页的方式呈现给用户,减少了服务器压力保证了测试系统的稳定性。为了让考核系统中的选择题干扰项更具有干扰效果,本系统借鉴语义网词汇相似度概念,选择使用一种对选择题干扰项评估的方法,并对概念相似度算法进行适当改变,在原来只考虑类结构相似度的基础上,增加了本体属性方面的计算,提高了本体相似度计算的精度。利用此方法,可以生成有较好干扰度的选择题选项来干扰学员,达到考核的目的。

基于张量分解的知识图谱融合研究及其在对话中的应用

这是一篇关于知识图谱,知识融合,词语相似度,对话系统,意图识别的论文, 主要内容为互联网的极速发展带来了信息的爆炸式增长及其结构的杂乱无章。为此,知识图谱应运而生并获得了长足的发展。现如今,知识图谱被普遍应用于搜索引擎,推荐系统,智能问答,对话系统等领域中。本文主要侧重于知识图谱在任务型对话系统中的应用。在实际应用中,一个任务型对话系统一般会涉及多个领域的知识,分别对应着不同领域的知识库。这些知识库往往有着不同的来源。这些不同的知识源往往会由不同的技术人员进行维护,且具有异构的分布和属性。这会导致知识库很难甚至无法直接应用于任务型对话系统中。所以,我们需要借助于知识融合模型,将这些异源的知识库融合为一个知识库,然后再将融合后的知识库应用于任务型对话系统中。在任务型对话系统中,用户的意图识别具有非常重要的作用。准确地理解用户的意图可以加快解决用户的问题,提升用户的对话体验。然而,当前很多研究选择采用深度神经网络作为意图识别分类器。这种分类器是一个黑匣子,缺乏可解释性。而知识图谱则富含大量的结构化的知识,为意图识别模型的可解释性提供了可能。因此,在基于知识图谱的任务型对话系统中,知识融合和基于知识图谱的用户的意图识别成为了两个至关重要的技术。其中,知识融合是构建基于知识图谱的对话系统的理论基础。用户的意图识别则是任务型对话中不可或缺的一部分。于是,本文主要对知识融合和基于知识图谱的用户意图识别展开研究。首先,本文以融合具有部分-整体关系的知识图谱为例,对具有大量完全独立的连通分支,并且训练集和测试集之间没有重叠实体的知识图谱融合进行研究。为了解决此类问题,我们引入了相似度作为辅助信息,并提出了一种基于三元组张量和相似度矩阵进行联合分解的模型。其中,由于知识图谱中关系的独立性,模型使用RESCAL方法对三元组张量进行分解。之后,我们采用交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)对模型进行优化。在实验中,通过和RESCAL模型以及TransE系列的模型进行对比,本文提出的模型在准确率上表现了最好的效果,很好地解决了即将融合的知识图谱中具有大量完全独立的连通分支,以及训练集和测试集之间没有重叠实体的问题。借助于知识融合技术,我们可以将多个领域的知识库融合为一个知识库,并应用于任务型对话系统中。在任务型对话系统中,知识图谱能够帮助系统快速准确地识别用户的意图,并使得系统具有很强的可解释性。因此,本文提出了基于意图图谱的用户意图识别模型。该模型将融合后的多领域知识库转换为表示用户意图的知识图谱,即意图图谱。然后,模型使用强化学习的方法在图谱中进行推理来获取合适的路径。该路径中的最后一个节点即为用户的意图。在实验中,通过和监督学习的模型对比,该模型在表现出较高的意图识别准确率的同时,具备了很强的可解释性。这有助于我们能够快速了解模型产生的错误样例,并及时提出方法进行改进。综上所述,本文主要围绕知识图谱在任务型对话系统中的两个关键技术展开研究。这两个技术为知识融合和基于知识图谱的用户意图识别。其中,知识融合是构建基于知识图谱的对话系统的理论基础。为了便于在任务型对话中使用多领域知识库,我们使用知识融合技术将多领域知识库融合为一个知识库。用户的意图识别则是任务型对话中不可或缺的一部分。知识图谱的应用使得用户的意图识别模型具有很强的可解释性。首先,我们提出了张量和矩阵的联合分解模型,对具有大量完全独立的连通分支,并且训练集和测试集之间没有重叠实体的知识图谱进行融合。之后,我们基于融合后的知识图谱提出了用户的意图识别模型。该模型将融合后的多领域知识库转换意图图谱,并使用了强化学习的方式生成路径,对应于用户的意图。这两种模型都具有很好的实验结果。不过它们还有很多的提升空间。例如知识融合模型产生的一些错误样例是有悖于常识;意图识别模型在准确率上仍然不如监督学习模型等。这些都需要我们进一步的深入研究。

基于词相似度检索的环保执法数据系统研发

这是一篇关于词语相似度,关键词,JSP,执法数据管理的论文, 主要内容为现如今,互联网信息技术及相关技术发展日新月异,互联网越来越多的应用到人们的学习、生活及工作当中。政府等相关部门、系统也为提高工作效率,实施采用一系列电子政务系统。电子政务系统将越来越多的取代传统的办公方式与系统。对于环境保护方面,目前由于工农业、旅游业的发展,给环境带来的压力越来越大,生态等环境问题也比较突出。但是现有的环保执法法律法规的查询受制于时间、空间、设备等的限制,执法人员无法快速执法,从而影响执法效率,导致执法力量明显薄弱。如何使执法人员都能快速并有效地查询到执法所需法规,并且普通民众也可通过该系统查询环境保护法律法规,实现执法信息共享成为一个关键问题。为满足大理洱海环保局对环保法律法规管理系统建设的需求,做出需求分析,建立系统各功能模块,并对系统体系结构、平台、语言及所涉及到的知识和技术进行了研究。本文采用B/S结构,J2EE平台,使用JSP语言和MySQL数据库,设计开发了一个基于web的系统。在此基础上,本文重点研究了词语相似度的计算,结合法律法规用词具有专业性特殊性的特点和《知网》知识库,生成相似度不同的关键词集。基于关键词相似度的检索,可解决查询时所用词与具有特殊性的法律法规用词不匹配所造成的无法检索到结果的问题。最后进行系统测试,验证本文系统设计和算法的可行性。

机务WBT系统框架设计与实现

这是一篇关于WBT,系统设计,MVC设计模式,XSL,词语相似度的论文, 主要内容为机务WBT是借助计算机对航空从业人员进行培训的一种新型训练方式。相对于传统的训练方式,具有费用低、效率高、指导性强的特点。但由于国内对机务WBT的研究起步晚、底子薄,导致推出的产品不多,功能和内容也不能完全满足培训的需求。 随着互联网技术的发展,利用网络技术发展WBT已经成为趋势。本文在软件工程以及现代教育理论的指导下,结合网络相关技术,设计开发了机务WBT软件中的素材管理系统、课件开发平台和自动测试系统,并对其关键技术进行研究: (1)根据软件工程理论,使用MFC框架设计开发了素材管理系统和课件开发平台。素材管理系统用来保存和管理素材资源,所有客户机在局域网中共享服务器中的数据库,能加速素材资源的积累,达到资源共享的目的。课件开发平台则利用这些素材资源进行课件开发。 (2)在考虑到用户的广泛性和具体技术的针对性后,制作考核系统,搭建一种新的基于J2EE的MVC框架,将传统的JSP+SERVLETt+JAVABEAN框架进行改进,利用XSLT转换XML取代了原来较为复杂的JSP视图部分,将视图以静态页的方式呈现给用户,减少了服务器压力保证了测试系统的稳定性。为了让考核系统中的选择题干扰项更具有干扰效果,本系统借鉴语义网词汇相似度概念,选择使用一种对选择题干扰项评估的方法,并对概念相似度算法进行适当改变,在原来只考虑类结构相似度的基础上,增加了本体属性方面的计算,提高了本体相似度计算的精度。利用此方法,可以生成有较好干扰度的选择题选项来干扰学员,达到考核的目的。

知识图谱构建中的多数据源实体匹配研究

这是一篇关于实体匹配,知识图谱,词语相似度,候选键,top-K的论文, 主要内容为随着电子商务和移动互联网技术的迅速发展,互联网上的数据开始呈现爆炸式增长。大规模增长的数据中,信息通常呈现出松散、碎片化,包含冗余甚至错误信息的特点。如何从大规模数据中有效地提取信息,实现不同机构和组织间信息共享,成为了大数据分析和人工智能领域的关键。知识图谱技术作为一种支持从海量数据中抽取结构化知识的有效手段,受到了学术界的广泛关注。单一数据源的信息普遍存在信息描述不完整,覆盖率低等特点,难以满足知识图谱固有的知识数量巨大,内容丰富的特点。如何将大规模松散的,多来源,多类型,结构不一致的数据高效地合并、集成并整合组织在一起成为了构建大规模知识图谱的关键问题。这正是本文开展多数据源实体匹配研究的主要原因。本文的主要研究工作分为以下三个方面:(1)针对现有中文词语相似度计算的不足,在改进两种已有方法的基础之上提出了一种基于融合策略的词语相似度计算。该方法首先以中文词典《知网》作为语料库,通过分析中文词语的语义信息分布特点和《知网》中中文词语信息结构提出了一种基于共性和个性的词语相似度计算。然后改进了一种基于搜索引擎的词语相似度计算,最后采用多种融合策略融合了本文改进的两种相似度计算方法。实验结果表明,基于线性融合策略的词语相似计算方法,在NLPCC2016的中文词语相似度评测任务的数据集上取得了较好的实验结果,其中皮尔森系数值达到了0.458,斯皮尔曼系数达到了0.461。(2)提出了一种基于top-K的多级实体匹配算法。这种方法将关系数据库中候选键的思想扩展到实体匹配过程,认为在实体中存在一个最大的属性集,其中包含多组实体候选键,利用属性候选键的相似度来获取实体匹配结果。这种方法可以充分利用实体间属性分布的特点,简化实体匹配过程相似值计算的复杂度。在字符串类型的属性值相似度计算中首次考虑属性值的语义信息,使用一种中文词语相似度计算方法取代了传统的基于编辑距离的字符串相似度计算。实验结果表明,在电影和图书两组真实的数据集上该算法稳定,且实体匹配的平均准确率达到了0.97以上。(3)分别以百度百科,360百科,豆瓣电影和时光网作为数据源,使用本文提出的实体匹配算法,融合了以上4个数据源中的影视信息,设计并构建了一个中文影视知识图谱。在构建知识图谱的多数据源实体匹配过程中,以百度百科作为参考知识库,依次实现了将360百科,豆瓣电影和时光网三个数据源中的数据自动识别并融合到了一个知识库,构建了中文影视知识图谱。

本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设向导 ,原文地址:https://m.bishedaima.com/lunwen/53388.html

相关推荐

发表回复

登录后才能评论