面向稀疏数据的可解释性推荐方法研究
这是一篇关于推荐系统,知识图谱,深度学习,数据稀疏性,可解释性推荐的论文, 主要内容为如今,从网上购物、视听娱乐到生活旅游等方面,人们的日常行为和决定越来越多地受到推荐系统的影响。所谓推荐即是根据用户的历史、项目的相关属性进行建模,从海量的信息中,推断出用户的兴趣爱好,帮助用户找到感兴趣的项目。推荐系统的技术核心是如何从巨量信息中为用户挖掘出有效的信息。然而,传统的推荐算法里已有的数据稀疏性问题,会致使推荐质量不太理想,无法更好地提升用户对系统的满意度。再而,因缺少系统给出的推荐结果的解释说明,降低了用户对系统的信任度。现为解决这样的问题,提升推荐系统给用户的体验,本文从推荐系统存在的数据稀疏性问题和不可解释性问题出发,在提升推荐系统的准确性和可解释性两方面展开,通过将知识图谱引入推荐系统,分别提出了推荐概率预测模型和路径级的推荐解释模型。推荐的准确性作为本文的第一个任务,其依然是推荐算法的首要研究点,数据稀疏性问题目前仍是制约推荐质量进一步提高的瓶颈。为缓解推荐算法中数据稀疏的问题,提升推荐的准确性,目前存在的相关工作从不同切入点对用户和项目信息进行分析、处理,以降低数据的稀疏程度,但仍然存在以下不足:1)在传统协同过滤算法中,将附加信息融入推荐以缓解数据稀疏,存在数据间相关性无法捕捉的问题,会限制推荐准确性进一步提升;2)在深度协同过滤算法中,以学习到的特征来缓解数据稀疏,存在对数据深层次理解的问题,因机械式地特征拟合会造成推荐准确度的偏差,且深度学习具有“数据饥饿”的特点。针对推荐准确性任务在现有研究中的不足,本文的主要工作如下:●提出了KGE-CF模型,此模型首先从用户的交互历史项目出发,利用一种多源结构化的数据,即项目之间的知识图谱。该模型首先通过实体间语义依赖关系,来丰富项目数据信息,以缓解稀疏。其次,KGE-CF模型将学习到的用户偏好向量与项目向量结合输入到多层感知机中,充分学习出用户与项目间的高阶交互信息,从而预测用户偏爱项目的概率,此模型具有良好的推荐效果。推荐的可解释性是本文研究的第二个任务,推荐结果的可解释性是提升系统透明度、用户信任度及满意度的关键所在。作为可解释人工智能领域的一个重要分支,可解释推荐系统的研究现已受到金融、医疗等多个领域的关注。推荐系统的可解释性能够进一步增强用户认可度和信任度,并为开发和研究可解释机器学习提供合适的背景。为了使推荐内容更容易被用户所接受,改善用户体验。本文做出的主要工作如下:●提出了KPCRN模型,首先利用深度搜索从知识图谱中提取用户历史交互项目的语义路径,然后通过文本卷积神经网络与循环神经网络对用户与项目的连接路径建模,最后利用权重池化得到用户对项目的偏好概率。对于提取出的路径都能显式推断,从而达到使推荐系统具有路径级推荐解释的目的。通过在真实数据集(Movielens,Book-Crossings,Last.FM和KKBox)上的实验,结果证明了本文提出的基于知识图谱的高阶协同过滤KGE-CF推荐模型能够缓解数据稀疏,提高推荐准确率,具有良好的预测效果;提出的知识路径卷积循环网络KPCRN模型,在提升推荐系统性能的同时,能有效解决推荐结果不可解释的问题,对推荐结果具有路径级的显式解释。
中文旅游领域命名实体识别关系抽取及推荐算法研究
这是一篇关于知识图谱,命名实体识别,关系抽取,词向量,可解释性推荐的论文, 主要内容为近年来,人们对信息服务的要求由简单的信息获取转变为知识获取,知识图谱的快速发展为此提供了诸多便利。但通用知识图谱在应用于特定领域时缺乏专业性,旅游领域也不例外,实现旅游服务需要专业的旅游领域知识图谱作为基础。而要构建领域知识图谱,最基本的任务就是领域知识的抽取。由于旅游领域的知识实体关系大多数以非结构化文本的形式存在,使得其获取过程变得非常困难;而在构建好领域知识图谱接下来的研究中,如何有效结合知识图谱进行可解释性的推荐也是目前的热点问题。因此本文主要针对旅游领域非结构化文本的知识抽取和基于知识图谱的可解释性推荐这两个方面的存在的如下问题进行研究:首先,在中文旅游领域知识抽取命名实体识别的任务上,目前主流模型无法有效解决歧义及词语嵌套问题,且由于训练数据集的制约,无法对旅游领域中诸如时间、事物等实体进行识别;其次,在中文旅游领域知识抽取中实体关系抽取(分类)的任务中,目前加入注意力机制(Attention)的卷积神经网络模型无法有效考虑实体对所在位置及所在语句上下文的局部信息,且同样受制于中文实体关系抽语料库的缺失,导致训练出的模型实体关系抽取(分类)不够准确;最后,当前在知识图谱可解释性Top-N推荐任务中表现最优异的KPRN模型训练时间成本较大。从以上问题出发本文提出了如下研究内容:(1)命名实体识别任务中使用谷歌预训练模型Bert来代替word2vec进行词嵌入,并构建Bert-BiLSTM-CRF的组合模型实现领域文本知识实体抽取工作,构建包含了五类旅游领域实体的BIO标注集对模型进行训练;(2)提出中文旅游关系抽取模型Transformer-PCNN,其中Transformer的自注意力机制对网络模型进行深化,分段池化的PCNN可以有效提取语句局部特征,可有效解决上述问题;构建中文旅游关系抽取语料库将其用于模型的训练;(3)使用GRU代替KPRN模型中的LSTM层,利用GRU计算单元比LSTM少一个门控单元所带来的参数减少的特点来提升模型训练效率;所有研究内容通过实验结果表明:基于Bert-BiLSTM-CRF的命名实体识别方法的准确率在时间地点等重要实方面得到了提升;基于Transformer-PCNN的旅游领域实体关系抽取方法相比现有方法在部分类型准确率方面取得了一定的进步;而基于改进KPRN模型的模型在训练效率方面也得到了进一步提升。
基于知识图谱的合作者推荐系统设计与实现
这是一篇关于知识图谱,相似度计算,可解释性推荐,图数据库的论文, 主要内容为随着互联网和信息技术的不断发展,学术交流与合作不再受地理因素的限制,变得愈加频繁,学者之间的学术合作行为分析逐渐成为科学研究的重要组成。在大数据背景下,如何有效地利用海量学术数据对学者合作网络进行构建,并通过该网络帮助学者挖掘、推荐合适的合作伙伴,成为当前学术网络研究的热点问题。本文提出了基于学术知识图谱的合作者推荐算法,以知识图谱的方式对领域学术网络进行构建,结合基于内容的推荐方法,为学者推荐合作伙伴,并且推荐的结果具有一定的可解释性。首先,对学术数据中学者、研究领域及论文等多源异构信息进行抽取和处理,以图数据库为主要载体,自顶向下的方式构建出计算机领域内的科研知识图谱。其次,通过在知识图谱中定义的元路径组,利用基于网络结构的相似度,为源学者过滤出无直接合作关系但相似度极高的推荐候选集合。然后,利用基于内容过滤推荐中Itembased的思想,根据已经是源学者的合作者的相关特征,计算候选推荐集合中学者与源学者的相似度,依据相似度综合评分生成合作者列表,即为最终推荐结果。最后,在知识图谱中查找推荐的学者与源学者的最短路径,生成对推荐结果的解释。本文提出的基于学术知识图谱的合作者推荐算法已实现为具体的推荐模块,并部署在Web of Scholar系统中。用户可在使用系统时完善个人信息以获得个性化的合作者推荐,推荐结果已经实现可视化展示,供科研人员参考。
面向稀疏数据的可解释性推荐方法研究
这是一篇关于推荐系统,知识图谱,深度学习,数据稀疏性,可解释性推荐的论文, 主要内容为如今,从网上购物、视听娱乐到生活旅游等方面,人们的日常行为和决定越来越多地受到推荐系统的影响。所谓推荐即是根据用户的历史、项目的相关属性进行建模,从海量的信息中,推断出用户的兴趣爱好,帮助用户找到感兴趣的项目。推荐系统的技术核心是如何从巨量信息中为用户挖掘出有效的信息。然而,传统的推荐算法里已有的数据稀疏性问题,会致使推荐质量不太理想,无法更好地提升用户对系统的满意度。再而,因缺少系统给出的推荐结果的解释说明,降低了用户对系统的信任度。现为解决这样的问题,提升推荐系统给用户的体验,本文从推荐系统存在的数据稀疏性问题和不可解释性问题出发,在提升推荐系统的准确性和可解释性两方面展开,通过将知识图谱引入推荐系统,分别提出了推荐概率预测模型和路径级的推荐解释模型。推荐的准确性作为本文的第一个任务,其依然是推荐算法的首要研究点,数据稀疏性问题目前仍是制约推荐质量进一步提高的瓶颈。为缓解推荐算法中数据稀疏的问题,提升推荐的准确性,目前存在的相关工作从不同切入点对用户和项目信息进行分析、处理,以降低数据的稀疏程度,但仍然存在以下不足:1)在传统协同过滤算法中,将附加信息融入推荐以缓解数据稀疏,存在数据间相关性无法捕捉的问题,会限制推荐准确性进一步提升;2)在深度协同过滤算法中,以学习到的特征来缓解数据稀疏,存在对数据深层次理解的问题,因机械式地特征拟合会造成推荐准确度的偏差,且深度学习具有“数据饥饿”的特点。针对推荐准确性任务在现有研究中的不足,本文的主要工作如下:●提出了KGE-CF模型,此模型首先从用户的交互历史项目出发,利用一种多源结构化的数据,即项目之间的知识图谱。该模型首先通过实体间语义依赖关系,来丰富项目数据信息,以缓解稀疏。其次,KGE-CF模型将学习到的用户偏好向量与项目向量结合输入到多层感知机中,充分学习出用户与项目间的高阶交互信息,从而预测用户偏爱项目的概率,此模型具有良好的推荐效果。推荐的可解释性是本文研究的第二个任务,推荐结果的可解释性是提升系统透明度、用户信任度及满意度的关键所在。作为可解释人工智能领域的一个重要分支,可解释推荐系统的研究现已受到金融、医疗等多个领域的关注。推荐系统的可解释性能够进一步增强用户认可度和信任度,并为开发和研究可解释机器学习提供合适的背景。为了使推荐内容更容易被用户所接受,改善用户体验。本文做出的主要工作如下:●提出了KPCRN模型,首先利用深度搜索从知识图谱中提取用户历史交互项目的语义路径,然后通过文本卷积神经网络与循环神经网络对用户与项目的连接路径建模,最后利用权重池化得到用户对项目的偏好概率。对于提取出的路径都能显式推断,从而达到使推荐系统具有路径级推荐解释的目的。通过在真实数据集(Movielens,Book-Crossings,Last.FM和KKBox)上的实验,结果证明了本文提出的基于知识图谱的高阶协同过滤KGE-CF推荐模型能够缓解数据稀疏,提高推荐准确率,具有良好的预测效果;提出的知识路径卷积循环网络KPCRN模型,在提升推荐系统性能的同时,能有效解决推荐结果不可解释的问题,对推荐结果具有路径级的显式解释。
基于属性和评论的可解释性推荐算法研究
这是一篇关于推荐系统,可解释性推荐,XGBoost,卷积神经网络的论文, 主要内容为随着电子商务网站和各种网络信息平台的发展,人们可以通过推荐系统可以找到自己感兴趣的物品和信息。而推荐算法作为推荐系统的核心,近年来在学术界和工业界大受追捧。传统的个性化推荐算法是基于用户和物品的交互信息进行推荐的,但系统中物品的数量和种类时刻都在增长和变化,冷启动成为推荐系统的一大难题。随着深度学习在推荐领域的深入,推荐算法在准确性以及可扩展性都有了一定的提高,然而深度学习算法都具有黑盒模型的不可解释性,其生成的推荐结果往往不能向用户提供令人信服的解释,缺乏透明度和信任度让推荐系统和用户都陷入困境。基于以上原因,本文重点研究了推荐算法的准确性和可解释性,并做了以下工作:(1)针对推荐系统中的冷启动问题,利用物品客观存在的属性信息构建XGBoost回归树,通过把物品属性信息输入到XGBoost模型中进行一系列有监督的训练,完成对物品的评分预测任务,在生成树模型的同时从模型中提取出物品属性的交叉特性,作为推荐结果的解释。并使用K-means聚类的方法对用户和物品进行粗粒度划分,节省后续XGBoost训练时间。并在在Amazon数据集上进行了大量的实验和分析,结果显示,本文提出算法不仅在推荐效果上有了一定的提升,同时还能提取物品的重要属性作为推荐解释。此外,K-means的引入节省了模型训练的时间,降低了计算成本。(2)针对推荐系统的解释性问题,提出一种基于评论的可解释推荐算法。该算法由两个串联的模块组成,分别是用于评分预测的推荐模型以及用于生成解释性语句的文本生成模型。在评分预测模块,利用卷积神经网络,对用户和商品的评论信息进行特征提取,并通过双层注意力网络自动为评论分配权重,保留高权重的评论为生成解释语句做准备,最后通过隐语义模型融合用户和商品的特征来进行评分预测。在文本生成模块,利用HSS模型中双层GRU网络对前一步保留的高权重评论进行训练,生成完整且具有解释含义的语句。通过实验证明,本文提出的方法不仅在评分预测上有良好的表现,其生成的解释性语句完整且流畅,能包含用户和物品重要的特征词语,具有良好的解释意义。
基于知识图谱的合作者推荐系统设计与实现
这是一篇关于知识图谱,相似度计算,可解释性推荐,图数据库的论文, 主要内容为随着互联网和信息技术的不断发展,学术交流与合作不再受地理因素的限制,变得愈加频繁,学者之间的学术合作行为分析逐渐成为科学研究的重要组成。在大数据背景下,如何有效地利用海量学术数据对学者合作网络进行构建,并通过该网络帮助学者挖掘、推荐合适的合作伙伴,成为当前学术网络研究的热点问题。本文提出了基于学术知识图谱的合作者推荐算法,以知识图谱的方式对领域学术网络进行构建,结合基于内容的推荐方法,为学者推荐合作伙伴,并且推荐的结果具有一定的可解释性。首先,对学术数据中学者、研究领域及论文等多源异构信息进行抽取和处理,以图数据库为主要载体,自顶向下的方式构建出计算机领域内的科研知识图谱。其次,通过在知识图谱中定义的元路径组,利用基于网络结构的相似度,为源学者过滤出无直接合作关系但相似度极高的推荐候选集合。然后,利用基于内容过滤推荐中Itembased的思想,根据已经是源学者的合作者的相关特征,计算候选推荐集合中学者与源学者的相似度,依据相似度综合评分生成合作者列表,即为最终推荐结果。最后,在知识图谱中查找推荐的学者与源学者的最短路径,生成对推荐结果的解释。本文提出的基于学术知识图谱的合作者推荐算法已实现为具体的推荐模块,并部署在Web of Scholar系统中。用户可在使用系统时完善个人信息以获得个性化的合作者推荐,推荐结果已经实现可视化展示,供科研人员参考。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码海岸 ,原文地址:https://m.bishedaima.com/lunwen/56249.html