7篇关于领域知识图谱的计算机毕业论文

今天分享的是关于领域知识图谱的7篇计算机毕业论文范文, 如果你的论文涉及到领域知识图谱等主题,本文能够帮助到你 融合知识图谱和情感评分的连衣裙个性化推荐 这是一篇关于个性化推荐

今天分享的是关于领域知识图谱的7篇计算机毕业论文范文, 如果你的论文涉及到领域知识图谱等主题,本文能够帮助到你

融合知识图谱和情感评分的连衣裙个性化推荐

这是一篇关于个性化推荐,用户偏好,领域知识图谱,在线评论,情感分析,连衣裙的论文, 主要内容为随着生活水平的不断提高,人们的消费理念逐步偏向个性化。服装个性化推荐系统根据用户的需求和偏好推荐服装,进而减少用户检索时间,提高用户购物效率,增强用户对所推荐服装的购买意愿。因此,提高服装个性化推荐效果至关重要。本论文以消费者就连衣裙属性的偏好对产品购买意向的影响为研究对象,首先根据文献梳理、专家访谈及电商平台连衣裙属性的调研结果构建连衣裙知识图谱;继而通过对电商平台连衣裙在线评论的情感分析构建产品综合情感评分模型;然后融合连衣裙知识图谱和情感分析模型建立连衣裙个性化推荐系统;最后通过对20名资深网购消费者就连衣裙购买意向的对比实验验证该系统的准确有效性。本论文得到以下结论:1、从基础、表现和外在三个维度对服装属性分类,得到15个服装属性,组成<服装,属性,属性值>三元组,通过Neo4j图数据库构建连衣裙知识图谱。2、连衣裙在线评论文本分词中增加343个服装停用词,提取前50个高频词汇,归纳得到5个连衣裙评论特征词。3、在SnowNLP库自身所含语料基础上增加连衣裙情感语料,经实验验证,扩充语料后SnowNLP库对连衣裙情感打分准确率均值达到82.86%。4、通过层次分析法得到5个评论特征词权重,构建以外观、价格、质量、物流和服务为5个指标层的连衣裙评论情感评分模型。5、构建融合知识图谱和情感评分模型的连衣裙个性化推荐系统。经对比,实验验证系统推荐结果的准确率高于电商平台推荐,推荐结果排序和实验对象打分列表排序的Kendall’s Tau-c系数约为85.19%,系统推荐排序准确度良好,连衣裙种类覆盖率总体达到81.2%。

基于深度学习的垂直领域知识图谱构建方法研究与实现

这是一篇关于领域知识图谱,知识抽取,数据增强,序列标注,概率图模型的论文, 主要内容为随着人工智能的发展,智能的信息服务持续升级,在各种智能信息服务领域均能看到知识图谱的应用,如智能问答、个性化推送、信息检索等。知识图谱帮助计算机学习人的语言交流方式,使计算机像人类一样“思考”,使得各种信息服务反馈给用户更加智能的答案。可以说知识图谱是传统行业和人工智能进行融合的方向,也是人工智能从研究走向落地应用的过程中必不可少的环节。垂直领域知识图谱是针对某个行业,根据该领域的数据来构建的知识图谱,相比于通用知识图谱,更强调知识的深度。虽然在通用领域,学术界和工业界都已经有大规模的标注数据可供知识图谱构建模型进行训练,并且实体和关系抽取技术已经取得了长足进步。但在垂直领域的场景下,存在着标注语料数据量不足,人工标注耗费钱力和精力等难题,并且随着业务的变更,实体和关系的类型会不断地更新,已有的标注数据无法应用在新的实体和关系类型上,这些难题使得在垂直领域构建知识图谱变得非常困难。为了解决垂直领域知识图谱构建困难和低效的问题,本文主要研究如何进行行业知识的抽取,并自动高效准确地构建垂直领域知识图谱。首先,为了构建用于进行知识抽取模型训练的增强数据集,本文提出基于词典和实例交叉的增强数据生成算法。其次,针对行业产品文档中的半结构化数据和非结构化数据,分别设计并实现了基于序列标注和子模式生成的表格知识抽取算法Bi-LSTM-CRF-SSG和基于BERT和概率图模型的联合实体关系抽取模型BERT-PGM。实验结果表明,经过后续容错处理,在测试数据集上,半结构化数据抽取算法能达到99.13%的抽取准确率,非结构化数据抽取算法能达到95.7%的抽取准确率。最后,本文实现了一个垂直领域知识图谱自动构建系统,并从功能和性能两个方面进行了系统测试,测试结果表明系统的功能和性能均满足用户需求。

基于预训练模型的新冠领域知识图谱构建

这是一篇关于领域知识图谱,预训练模型,实体抽取,关系抽取的论文, 主要内容为自Google公司2012年第一次提出知识图谱概念以来,知识图谱已经成为自然语言处理领域火热研究方向之一,其应用也是层出不穷。如今的时代是大数据时代,各个行业中的数据处理、数据应用也一定离不开知识图谱。但是,在不同领域就会存在不同知识图谱,如金融知识图谱、医疗知识图谱等,所以构建知识图谱的方法也是各种各样,目前在常用自然语言的知识图谱构建技术多种多样,然而对于领域知识图谱的构建却正处于起步阶段,因为在领域知识图谱构建时往往会伴随这个行业的领域数据缺乏、需要专家进行标注等困难。因此,在缺少领域数据的情况下,如何构建领域知识图谱是亟待解决的问题。本文围绕领域知识图谱构建关键技术展开工作,如数据处理、知识获取、知识消歧和知识储存等,重点放在知识获取上,如领域实体抽取、领域实体关系抽取。针对现有技术的缺点进行改进,提出新的方法。本文主要研究内容为以下三个方面。(1)针对领域知识缺乏的问题,本文提出一种基于自定义规则构建领域本体方法,然后利用这些本体对结构化、非结构化领域文本进行领域数据扩建,然后基于这些领域数据利用预训练模型进行领域实体及领域实体关系抽取,其中预训练模型使用的是领域BERT(Bio BERT),这样有利于领域知识抽取,经过设置实验,验证了该模型的可行性,最终本文提出的模型比通用领域模型在领域数据集上实体抽取和领域实体关系抽取的F1值分别提升5.94%、4.23%。(2)针对工作1中存在的误差传递和实体重叠等问题,本工作不使用传统的管道方法(Pipeline),而是用联合抽取方法(Joint),创新性地提出基于预训练模型和Tree LSTM的领域知识抽取方法,该方法将依存句法树揉进BERT嵌入层,并和嵌入层共享参数,这样做可以使实体识别和关系抽取同时进行,避免了由于实体抽取不准确而影响关系抽取任务,通过设置实验,验证了该模型的可行性,整体在常用通用数据集NYT和领域数据集NCBI-disease上F1值分别提升7.6%和4.1%。(3)针对工作1和工作2,本文构建出新冠领域知识图谱,本知识图谱提高了领域知识图谱的质量。并且本文利用构建出的新冠领域知识图谱和目前主流的前后端框架搭建了一个可视化系统进行测试,前端可以调用后端数据接口进行图谱的可视化,查询想要了解的知识节点,并可以进行简单问答。

基于知识图谱的云服务推荐系统研究与实现

这是一篇关于推荐系统,云服务,领域知识图谱,语义增强的论文, 主要内容为随着云计算相关技术的快速发展,越来越多的信息基础设施与应用被搬上云端,即云服务。现有的云服务商针对客户的上云需求,依赖于人工客服系统提供解决方案,但由于云服务种类繁多、专业性强、产品之间关系复杂,服务效率较低,迫切需要辅助推荐系统的支持。因其具有购买低频性的特点,传统的协同过滤等推荐算法无法发挥效力,而知识图谱因其独有的图形结构,对丰富语义信息表达的支持,为研究云服务推荐提供新思路。因此,本文提出基于知识图谱推荐云服务的方法。重点分析和探索了云服务领域图谱的构建技术,以及基于已构建的领域知识图谱,进一步定义云服务领域概念图谱以增强文本语义理解与搜索答案推荐。本文的主要工作内容如下:1.提出了一种融合云场景的云服务领域本体概念模型。基于自顶向下的方法,重点分析了当前云服务领域的产品以及应用场景解决方案,归纳总结与提炼云服务领域的相关知识特征,完成实体以及关系的划分,设计云服务领域本体概念模型。2.提出了一种针对云服务领域的知识抽取方法。针对云服务领域的数据源特点,按照本体概念模型中实体以及关系的定义,本文综合采用基于规则的方法与基于Bi LSTM-CRF的方法进行命名实体的抽取以及关系的抽取,最后将抽取的实体与关系数据整合,存入Neo4J图数据库,构建云服务知识图谱。3.提出了一种基于知识的云服务推荐方法。本文进一步构建了云服务领域概念图谱,并基于概念图谱和已构建的云服务实体关系知识图谱进行搜索文本的多维度语义增强理解,提出了基于知识的云服务可解释推荐方法以及云场景泛化推荐与样本增强方法。4.基于知识图谱的云服务推荐系统研发。基于以上研究工作,本文开发了一个基于知识图谱的云服务推荐系统,该系统支持云服务个性化搜索推荐、云服务知识查询、云应用场景解决方案查询以及云客户相关云应用案例查询。

面向领域知识图谱的信息抽取方法及其在医学文本中的应用

这是一篇关于领域知识图谱,医学文本,命名实体识别,实体关系抽取,深度学习的论文, 主要内容为大数据时代下,信息技术的快速发展与广泛应用,推动着医学行业朝着医学信息化的方向探索发展,并成为了一种主流趋势。在医学领域中,蕴含有效信息的非结构化文本数据源源不断的产生,尤其是糖尿病这种常见的慢性疾病,每天产生的数据量更是数以万计。如何从这些海量医学文本中提取出有效信息并加以存储管理对医学信息化的发展具有重大意义。知识图谱作为一种具备语义表达、检索和推理等能力的知识管理与应用的基础设施,能够有效地解决这一问题。信息抽取作为构建知识图谱的核心部分,其抽取效果的好坏直接影响到知识图谱是否具备高质量、可扩展更新的特性。因此,本文主要研究医学领域的信息抽取方法,并将其应用于知识图谱的构建与应用中。首先,本文设计了一种基于多特征融合的深度学习医学命名实体识别方法。针对中文医学文本数据,在经典的Bi LSTM-CRF命名实体识别模型基础上,以字符为识别粒度,融合字符本身、部首、拼音、笔画及上下文短语等多种特征,其中短语特征借助多尺度CNN学习得到。该方法不仅能避免中文分词带来的传递误差,还能弥补短语信息的缺失,能够有效提升医学命名实体的识别效果。其次,提出了一种基于深度学习的有监督医学实体关系抽取方法。该方法通过滑动窗口技术将数据转换成多维层次序列,采用Conv LSTM实现上下文的信息建模与多轮学习,利用层级注意力池化机制汇总上下文语义信息并捕获与语义关系密切关联的文本片段和短语。该方法不仅能够提升实体关系的整体分类效果,也能缓解因样本不均衡与多实例共存导致的错误分类问题。最后,基于上述医学命名实体识别和实体关系抽取工作,采用自顶向下的方式构建以糖尿病为例的领域知识图谱,整个构建过程包含模式层定义、数据获取、信息抽取、知识融合与知识存储五部分。并基于此,设计实现了一个糖尿病知识问答系统,不仅可以验证知识图谱的实用性,也能为糖尿病患者了解糖尿病本身的知识与糖尿病的日常管理提供一定的帮助。

基于预训练模型的新冠领域知识图谱构建

这是一篇关于领域知识图谱,预训练模型,实体抽取,关系抽取的论文, 主要内容为自Google公司2012年第一次提出知识图谱概念以来,知识图谱已经成为自然语言处理领域火热研究方向之一,其应用也是层出不穷。如今的时代是大数据时代,各个行业中的数据处理、数据应用也一定离不开知识图谱。但是,在不同领域就会存在不同知识图谱,如金融知识图谱、医疗知识图谱等,所以构建知识图谱的方法也是各种各样,目前在常用自然语言的知识图谱构建技术多种多样,然而对于领域知识图谱的构建却正处于起步阶段,因为在领域知识图谱构建时往往会伴随这个行业的领域数据缺乏、需要专家进行标注等困难。因此,在缺少领域数据的情况下,如何构建领域知识图谱是亟待解决的问题。本文围绕领域知识图谱构建关键技术展开工作,如数据处理、知识获取、知识消歧和知识储存等,重点放在知识获取上,如领域实体抽取、领域实体关系抽取。针对现有技术的缺点进行改进,提出新的方法。本文主要研究内容为以下三个方面。(1)针对领域知识缺乏的问题,本文提出一种基于自定义规则构建领域本体方法,然后利用这些本体对结构化、非结构化领域文本进行领域数据扩建,然后基于这些领域数据利用预训练模型进行领域实体及领域实体关系抽取,其中预训练模型使用的是领域BERT(Bio BERT),这样有利于领域知识抽取,经过设置实验,验证了该模型的可行性,最终本文提出的模型比通用领域模型在领域数据集上实体抽取和领域实体关系抽取的F1值分别提升5.94%、4.23%。(2)针对工作1中存在的误差传递和实体重叠等问题,本工作不使用传统的管道方法(Pipeline),而是用联合抽取方法(Joint),创新性地提出基于预训练模型和Tree LSTM的领域知识抽取方法,该方法将依存句法树揉进BERT嵌入层,并和嵌入层共享参数,这样做可以使实体识别和关系抽取同时进行,避免了由于实体抽取不准确而影响关系抽取任务,通过设置实验,验证了该模型的可行性,整体在常用通用数据集NYT和领域数据集NCBI-disease上F1值分别提升7.6%和4.1%。(3)针对工作1和工作2,本文构建出新冠领域知识图谱,本知识图谱提高了领域知识图谱的质量。并且本文利用构建出的新冠领域知识图谱和目前主流的前后端框架搭建了一个可视化系统进行测试,前端可以调用后端数据接口进行图谱的可视化,查询想要了解的知识节点,并可以进行简单问答。

基于领域知识图谱的弱监督行为识别算法

这是一篇关于行为识别,骨架行为识别算法,领域知识图谱,图卷积的论文, 主要内容为随着人工智能技术的日益成熟,人工智能与竞技体育技战术分析相融合是提高技战术分析水平的重要途径。本论文研究针对空手道运动的技术特点,来改进人体行为识别算法,以提高算法在空手道技战术分析系统中的鲁棒性、实用性。目前,利用人体骨骼数据的时空图卷积模型的行为识别算法得到了越来越多的关注,也取得了很好的效果,但是应用在空手道技战术分析中,还是存在一些不足,针对这些问题,论文开展了如下工作:(1)很多行为识别算法所用到的训练及测试视频中都只包含单个行为动作,而在空手道技战术分析的实际应用中,只有长时间视频,包含多个行为动作,这导致识别精确度严重下降。本文利用已有的时序动作检测算法,将长时视频分割为一个个仅包含单个行为动作的视频片段,为行为识别算法提供更有效的输入数据源。(2)传统行为识别算法模型,大多都是基于开放领域的通用数据集进行训练,难以泛化到特定领域,而空手道这类竞技体育运动的数据集严重缺失,为运动行为识别增加了挑战与难度。本文设计了一个融入表达外部先验信息的领域知识图谱的端到端弱监督行为识别算法,有效的解决了空手道数据集严重缺失的问题。(3)在空手道这类竞技体育运动中,运动行为具有外界干扰因素多、方向变化频繁、移动快的特点,时空图卷积模型的性能又严重依赖于图的拓扑结构,目前常规拓扑图结构难以获取空手道这类竞技体育运动中有效的特征信息。论文利用德劳内三角剖分算法,改进拓扑图构建方式,并融入知识图谱的外部先验信息,增强了算法的鲁棒性与实用性。本论文针对上述传统方法的不足进行了详细研究,并提出了自己的创新思路。针对第(1)不足,本论文利用了已有的时序动作检测算法。论文解决其他几个不足的主要创新点如下:(1)本文预构建领域知识图谱,以及在算法过程中动态构建关键关节点知识图谱,设计了一个融入表达外部先验信息的领域知识图谱的端到端弱监督行为识别模型,可以在小样本空手道数据集上训练,并达到较高的识别精确度。(2)针对行为识别模型中拓扑图结构特征表达能力不强的问题,论文利用德劳内三角剖分算法,实现一种全新的拓扑图结构,能够更有效的提取骨架数据中的空间结构信息。(3)针对空手道运动的技术特点,融入知识图谱外部先验信息,使模型能够更充分的表达空手道技术动作的特征信息,增强了算法的鲁棒性与实用性。

本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码港湾 ,原文地址:https://m.bishedaima.com/lunwen/45326.html

相关推荐

发表回复

登录后才能评论