基于评论文本的个性化推荐算法研究
这是一篇关于注意力机制,推荐算法,文本数据,文本特征提取,卷积神经网络,电影推荐的论文, 主要内容为在当今大数据时代的环境背景下,规模庞大的互联网数据信息无法得到有效的利用,“信息过载”日益加重。使用推荐系统可以有效地为用户建立模型,从而为用户过滤互联网信息,极大地降低“信息过载”带来的不利影响。传统的推荐系统在进行用户建模时,仅从用户的历史评分数据中提取信息,推测用户的偏好,从而为用户实现推荐。但随着互联网中数据量的不断增多,如网络购物平台中新注册用户数量和商品的种类数量日益增加,冷启动问题严重的同时也使得用户历史评分数据的稀疏性不断增大,传统推荐系统的推荐性能受到很大的影响。为解决以上问题,最常见的方法是引入其他辅助信息,而用户的文本评论信息代表着用户对物品的主观评价,含有大量的用户信息和物品信息,因此用户的历史评论信息被广泛地应用在各类推荐系统中,但如何从用户的历史评论文本中挖掘更多、更具个性化的用户和物品信息是当前各推荐系统亟待解决的问题。为获得更好的推荐性能,本文的主要研究内容如下:(1)针对冷启动问题,引入用户和物品的属性信息,利用用户、物品的属性相似度实现对新用户和新物品的推荐,缓解冷启动对推荐性能的影响。(2)为更好的从评论文本中提取用户和物品的特征,本文提出一种基于评论文本的个性化推荐算法,算法模型采用两个并行的卷积神经网络分别对用户和物品进行文本特征提取,同时在算法模型中引入三级注意力机制,分别从单词级别、语句级别、评论级别为用户和物品挖掘更具个性化的特征。目前大多数基于评论文本的推荐算法模型在进行文本特征提取过程中缺少用户与物品之间的交互特征,因此本文在使用两个并行卷积神经网络模型的同时,在模型中引入共同注意力网络,模拟用户与物品之间的交互从而挖掘更细粒度的用户和物品特征。(3)为验证本文算法模型在提升推荐效果上的有效性,在Amazon不同领域的五个数据集上设置了对比实验,实验结果显示本文算法在推荐效果上表现最优;最终为验证本文主要研究内容在提升推荐效果上的作用,本文设置了退化实验,实验结果显示本文研究内容皆有助于挖掘用户和物品的文本数据特征,从而达到提升推荐效果的作用。(4)以本文算法模型为系统核心设计并完成了个性化电影推荐系统,并通过设置系统测试验证了系统能够稳定运行。
数据驱动的知识图谱补全
这是一篇关于知识图谱补全,表示学习,关系抽取,文本数据的论文, 主要内容为知识图谱(KG,Knowledge Graph)由于具有良好的结构化特征以及容易支持计算、推理等特点,目前已经成为各大AI应用的重要知识来源,且能够为搜索引擎以及问答系统等提供知识储备,典型的KG案例有FreeBase以及WordNet等。KG作为AI应用的底层核心技术,需要为上层提供足量且可靠的知识。因此,KG内容的丰富程度决定了一个AI应用的价值。即便目前的KG内容丰富且体积庞大,但所包含的事实还远远不足,仍需进一步补充完善,即补全KG。KG的补全旨在完成不同实体间的链接预测,从而发掘新的有效事实。互联网文本数据中通常蕴含着许多潜在的知识,这对KG而言是一个重要的补充。同时,从互联网文本数据中抽取结构化信息(称为外部信息)并补全KG,不仅能够反映当下知识的最新变化,且能够和KG中已有的知识建立起相应的联系,从而帮助我们发现更多的知识。不可忽略的是,来自互联网新闻媒体的文本数据通常未必准确可靠,如何从这些有待验证的文本数据中获取有效的信息,并和KG中已有的知识相融合,是完成补全KG任务的关键,也是重要的挑战。近年来,随着TransE等模型的提出,表示学习在KG补全领域起到了关键的作用。本文基于表示学习技术,主要工作分为以下几个方面:(1)介绍了一种从文本数据中抽取结构化信息的方法及其模型。(2)对几种典型的知识表示模型进行了介绍及评述。(3)提出了一种使用互联网文本数据针对KG进行补全的有效方法:首先从文本数据中抽取结构化信息并以三元组的形式保存;其次建立KG的知识表示模型;最后利用知识表示模型为抽取到的结构化信息进行合理性评估,并将合理有效的信息补充到KG中,从而完成KG的补全。本文以典型的Freebase知识图谱为例,分别基于三种不同的知识表示模型完成了KG的补全任务,后以精确率、召回率以及F1值作为主要指标针对本文提出的方法进行了有效性实验。结果显示,对比传统方法,本文结合KG外部信息的补全方法在F1值上有了一定的提升,从而证明本文的思路是有效且可行的。
基于文本数据的行业事理图谱构建系统的设计与实现
这是一篇关于行业事理图谱,文本数据,自然语言处理,神经网络的论文, 主要内容为随着对知识图谱的研究不断深入,以事件为核心进行知识组织表示的方式逐渐被提出。已有的知识库通常关注“实体”以及“实体间的关系”,而忽视“事件间的逻辑”。但是,在真实场景的应用中,事理逻辑是一种极具价值的认知知识,对于这种知识的挖掘将使得人们对自身行为和社会发展变化规律的认识更加深刻。事理图谱就是以“事件”为核心而提出的新型知识存储形式,本质上它同样是一种知识的结构化表示方式,但由于其对事件的演化,通常在实际应用中能发挥更大的价值。本文聚焦于具体行业事理图谱的构建,主要完成的工作如下:梳理行业事理图谱构建系统的开发背景,提出切实可行的行业事理图谱构建框架。在详细调研了概念和知识的基础上,说明了行业事理图谱在行业研究中的重要性;随后展示了行业事理图谱构建系统的模块设计,用以从文本数据中构建行业事理图谱。分析行业事理图谱构建系统的各个模块,并给出具体实现方案。本文首先给出了实现中采用的事件定义方式,并运用自然语言处理技术提取要素,结合依存句法分析与语义角色标注提取事件。随后比较事件间的相似度,通过向量空间模型与余弦相似度的计算完成事件融合。事件关系抽取部分主要聚焦于因果事件关系的抽取,本文采用BERT模型实现输入数据的特征编码。后续经实际测试,最终采用Bi-LSTM+CRF模型完成相关工作。对行业事理图谱构建系统的总结与展望。本文基于所构建的行业事理图谱给出了相关描述,并揭示其在实际生产生活中的意义;分析行业事理图谱的挑战,展望其未来,并对本文提出的系统设计进行总结。
基于文本数据的行业事理图谱构建系统的设计与实现
这是一篇关于行业事理图谱,文本数据,自然语言处理,神经网络的论文, 主要内容为随着对知识图谱的研究不断深入,以事件为核心进行知识组织表示的方式逐渐被提出。已有的知识库通常关注“实体”以及“实体间的关系”,而忽视“事件间的逻辑”。但是,在真实场景的应用中,事理逻辑是一种极具价值的认知知识,对于这种知识的挖掘将使得人们对自身行为和社会发展变化规律的认识更加深刻。事理图谱就是以“事件”为核心而提出的新型知识存储形式,本质上它同样是一种知识的结构化表示方式,但由于其对事件的演化,通常在实际应用中能发挥更大的价值。本文聚焦于具体行业事理图谱的构建,主要完成的工作如下:梳理行业事理图谱构建系统的开发背景,提出切实可行的行业事理图谱构建框架。在详细调研了概念和知识的基础上,说明了行业事理图谱在行业研究中的重要性;随后展示了行业事理图谱构建系统的模块设计,用以从文本数据中构建行业事理图谱。分析行业事理图谱构建系统的各个模块,并给出具体实现方案。本文首先给出了实现中采用的事件定义方式,并运用自然语言处理技术提取要素,结合依存句法分析与语义角色标注提取事件。随后比较事件间的相似度,通过向量空间模型与余弦相似度的计算完成事件融合。事件关系抽取部分主要聚焦于因果事件关系的抽取,本文采用BERT模型实现输入数据的特征编码。后续经实际测试,最终采用Bi-LSTM+CRF模型完成相关工作。对行业事理图谱构建系统的总结与展望。本文基于所构建的行业事理图谱给出了相关描述,并揭示其在实际生产生活中的意义;分析行业事理图谱的挑战,展望其未来,并对本文提出的系统设计进行总结。
基于文本数据的行业事理图谱构建系统的设计与实现
这是一篇关于行业事理图谱,文本数据,自然语言处理,神经网络的论文, 主要内容为随着对知识图谱的研究不断深入,以事件为核心进行知识组织表示的方式逐渐被提出。已有的知识库通常关注“实体”以及“实体间的关系”,而忽视“事件间的逻辑”。但是,在真实场景的应用中,事理逻辑是一种极具价值的认知知识,对于这种知识的挖掘将使得人们对自身行为和社会发展变化规律的认识更加深刻。事理图谱就是以“事件”为核心而提出的新型知识存储形式,本质上它同样是一种知识的结构化表示方式,但由于其对事件的演化,通常在实际应用中能发挥更大的价值。本文聚焦于具体行业事理图谱的构建,主要完成的工作如下:梳理行业事理图谱构建系统的开发背景,提出切实可行的行业事理图谱构建框架。在详细调研了概念和知识的基础上,说明了行业事理图谱在行业研究中的重要性;随后展示了行业事理图谱构建系统的模块设计,用以从文本数据中构建行业事理图谱。分析行业事理图谱构建系统的各个模块,并给出具体实现方案。本文首先给出了实现中采用的事件定义方式,并运用自然语言处理技术提取要素,结合依存句法分析与语义角色标注提取事件。随后比较事件间的相似度,通过向量空间模型与余弦相似度的计算完成事件融合。事件关系抽取部分主要聚焦于因果事件关系的抽取,本文采用BERT模型实现输入数据的特征编码。后续经实际测试,最终采用Bi-LSTM+CRF模型完成相关工作。对行业事理图谱构建系统的总结与展望。本文基于所构建的行业事理图谱给出了相关描述,并揭示其在实际生产生活中的意义;分析行业事理图谱的挑战,展望其未来,并对本文提出的系统设计进行总结。
基于文本数据的行业事理图谱构建系统的设计与实现
这是一篇关于行业事理图谱,文本数据,自然语言处理,神经网络的论文, 主要内容为随着对知识图谱的研究不断深入,以事件为核心进行知识组织表示的方式逐渐被提出。已有的知识库通常关注“实体”以及“实体间的关系”,而忽视“事件间的逻辑”。但是,在真实场景的应用中,事理逻辑是一种极具价值的认知知识,对于这种知识的挖掘将使得人们对自身行为和社会发展变化规律的认识更加深刻。事理图谱就是以“事件”为核心而提出的新型知识存储形式,本质上它同样是一种知识的结构化表示方式,但由于其对事件的演化,通常在实际应用中能发挥更大的价值。本文聚焦于具体行业事理图谱的构建,主要完成的工作如下:梳理行业事理图谱构建系统的开发背景,提出切实可行的行业事理图谱构建框架。在详细调研了概念和知识的基础上,说明了行业事理图谱在行业研究中的重要性;随后展示了行业事理图谱构建系统的模块设计,用以从文本数据中构建行业事理图谱。分析行业事理图谱构建系统的各个模块,并给出具体实现方案。本文首先给出了实现中采用的事件定义方式,并运用自然语言处理技术提取要素,结合依存句法分析与语义角色标注提取事件。随后比较事件间的相似度,通过向量空间模型与余弦相似度的计算完成事件融合。事件关系抽取部分主要聚焦于因果事件关系的抽取,本文采用BERT模型实现输入数据的特征编码。后续经实际测试,最终采用Bi-LSTM+CRF模型完成相关工作。对行业事理图谱构建系统的总结与展望。本文基于所构建的行业事理图谱给出了相关描述,并揭示其在实际生产生活中的意义;分析行业事理图谱的挑战,展望其未来,并对本文提出的系统设计进行总结。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设工厂 ,原文地址:https://m.bishedaima.com/lunwen/53704.html