基于深度学习的方面级情感分析方法研究
这是一篇关于方面级情感分析,深度学习,LSTM,多头自注意力机制,依赖树的论文, 主要内容为随着互联网的快速发展,人们几乎每天都会在电商平台和社交软件中发表自己的观点、看法。通过情感分析技术能够自动从海量的等带有情感极性的评论文本中获取人们对事件、商品的情感倾向,这对于很多行业来说都有着巨大的价值。然而传统的粗粒度情感分析已经不能够满足人们的需求,人们往往希望获得对于某些事物或商品更加全面的了解。细粒度的方面级情感分析旨在分析不同方面所表达的不同情感,能够帮助人们更好的了解事物或商品的各个方面。在本文针对方面级情感分析任务进行了重点研究,提出两种深度学习模型,主要工作包括以下两点:(1)针对上下文和方面信息之间的交互信息和位置信息,提出了基于局部信息选择机制(Local Information Selection,LIS)的方面级情感分析模型。LIS首先根据上下文单词与方面词之间的位置关系计算语义相对距离(Semantic Relative Distance,SRD),利用两种处理方式和SRD阈值将句子分为两部分局部信息。然后设计规则选择出合适的局部信息与全局信息进行拼接。最后利用多头自注意力机制学习包含句子表征,输出隐藏状态并分类。模型在Sem Eval 2014的Restaurant、Laptop数据集和Twitter数据集上进行实验验证,结果表明LIS模型在三个数据集上分别达到87.24%、82.97%与75.58%的准确率。(2)针对LIS模型在获取局部信息时丢失句子原本的句法和语义的问题,以及对于学习句子表征的学习过于简单,提出了基于依赖树距离模型(Dependency-Tree Distance,DTD)。DTD模型使用句法依赖树结构重新定义语义相对距离(SRD),根据上下文单词与方面词在依赖树结构中的位置计算SRD,并据此截取局部信息。模型使用LSTM网络和多头(自)注意力机制学习句子表征,设计了交互式学习方式,能够更加深层次的提取句子信息,并将每一步的输出通过池化操作,在最后进行拼接作为最终的句子表达用于分类。模型在Sem Eval 2014的Restaurant、Laptop数据集和Twitter数据集上进行实验验证,结果表明DTD模型在三个数据集上分别达到87.91%、84.68%与75.81%的准确率。两种模型都分别采用了Glo Ve和BERT预训练词向量模型,并与三种Non-BERT模型和三种BERT-base模型进行对比实验,以验证模型的有效性。另外,设置了不同的SRD阈值进行对比实验,结果表明两种模型在Sem Eval2014和Twitter数据集上都有不同的SRD阈值以达到最优效果。
基于生成对抗网络的序列推荐的研究
这是一篇关于序列推荐,生成对抗网络模型,Bert,多头自注意力机制,协同过滤的论文, 主要内容为目前,推荐系统的应用范围越来越广泛,已经成为电商平台、视频播放平台、娱乐社交等平台的基础设施。序列推荐是推荐系统的一个分支,能够从用户与项的信息中挖掘隐含信息并建立用户交互的依赖关系模型。隐含信息包括各个项之间的联系、用户的偏好以及偏好的变化、商品的流行度变化等。依赖关系是指用户在不同时刻交互的产品之间存在联系,例如交易序列中的商品之间存在顺序依赖关系。序列推荐中存在许多问题,如序列数据的稀疏问题、长期依赖的挖掘问题等。针对这些问题,本文对序列推荐进行深入研究,提出了两个算法,并使用真实数据进行实验。本文的主要研究工作如下:(1)针对序列推荐的数据稀疏性问题,本文首次提出基于生成对抗网络的协同过滤算法。该算法将用户的序列数据使用向量表示,从向量中学习隐式反馈信息。在生成对抗网络模型中,生成器学习用户与项的特征并生成虚假的用户交互数据,判别器判别真实数据与生成数据,并将结果反馈给生成器,指导生成器的更新。该算法学习序列的潜在信息,并使用学习到的用户与项的特征解决序列数据的稀疏性问题。生成对抗网络模型容易产生模式崩溃问题,模式崩溃是指生成器仅学习真实数据的某一分布特征并以此生成数据骗过判别器,从而导致模型的损失值震荡太小,推荐的精确率无法提升,影响数据稀疏性问题的解决性能。本文使用权重截断和增加梯度惩罚项的方法对算法进行改进,权重截断能够改善训练过程中的梯度消失问题,但是会造成权重两极化现象,导致训练不稳定,收敛速度慢。据此本文为判别器的损失函数添加了梯度惩罚项,满足了判别器梯度的Lipschitz限制。实验结果表明该算法能够解决序列推荐的数据稀疏性问题,模型的精确率同比神经协同过滤算法提高了 61.1%。(2)针对序列推荐的长期依赖的挖掘问题,本文提出了嵌入双向编码表示的生成对抗网络算法。该算法使用双向编码表示模型解读用户与项的二元关系序列,并使用生成对抗网络模型的对抗训练生成更多与真实数据分布相似的样本数据对模型的学习进行指导,得到更好的结果。算法包括三个步骤,首先本文使用双向编码表示模型解读序列数据,其中双向模型能够考虑序列中任意项的上下文信息,多头自注意力机制能够捕捉任意项与其上下文之间的依赖关系,将捕获内容进行编码,并从中提取特征。然后根据用户与项的特征训练生成对抗网络模型,使得其生成器能够生成近似真实数据分布的样本,再使用判别器对真实数据与生成数据进行判别,并将结果反馈给生成器。最后,本文使用基于生成对抗网络的协同过滤算法的训练结果,将其使用嵌入双向编码表示的生成对抗网络算法进行实验,实验结果表明嵌入双向编码表示的生成对抗网络算法同时也能够解决序列推荐的数据稀疏性问题。该算法在真实数据集上进行实验,NDCG@10最高达到93.0%。
面向产品在线评论文本的属性级情感分析研究
这是一篇关于属性级情感分析,属性提取,多头自注意力机制,门控卷积网络的论文, 主要内容为电商的兴起使得在线购物逐渐成为人们生活中主要的购物方式,消费者在各大电商平台积累了大量与产品相关的带有情感偏好的评价文本,全方位挖掘评论文本的情感信息对厂商和消费者都具有重要的意义和参考价值。传统的基于句子级或文档级的情感分析无法精准反映出消费者对产品某一属性的情感倾向,难以满足消费者和企业的精细化需求。因此,本文针对产品在线评论文本展开属性级情感分析研究,挖掘出消费者所关心的产品属性以及其对应的情感极性。本文以手机在线评论文本为研究对象,从属性提取和特定属性情感分类两个方面来展开属性级情感分析研究。本文的主要工作内容如下:(1)构建数据集。本文首先利用网络爬虫技术从电商平台爬取大量手机在线评论文本,然后针对本文研究课题的特点和内容,对数据进行预处理及可视化分析。(2)产品属性提取。为了从在线评论文本中挖掘潜在的产品属性,本文利用基于句法关系的方法来提取产品属性词,该方法首先利用依存句法分析文本的句法结构,并根据总结的依存关系和词性搭配规则,构建出适合本文评论文本的属性词提取模板,从而抽取得到属性词集合。同时,为了从词义相近的属性词集中归纳出对应的属性主题,本文提出基于余弦相似度的近邻传播聚类算法(APCCS)对属性词进行聚类,并提取各聚类中心作为对应类簇的属性主题词。(3)特定属性情感分类。为了针对每条评论文本所包含的多个属性主题分别进行情感分类,本文构建了一种基于多头自注意力的门控卷积网络模型,并在本文标注的数据集上与基准模型展开对比实验,结果表明,本文提出的模型在准确率和Macro-F1值两个指标上均优于其他模型。最后以产品属性主题为基本维度对在线评论文本进行情感极性的统计,分析产品在各基本属性维度的优劣势并提出针对性的产品迭代建议。
基于深度学习的商品推荐系统技术研究
这是一篇关于商品推荐,深度学习,图神经网络,多头自注意力机制的论文, 主要内容为人类社会高度信息化时代的到来离不开互联网各项技术的飞速发展,人们获取各种信息往往都借助于网络。伴随着时代的不断进步,互联网世界得到了飞速发展,与此同时互联网中的数据产生速度快且产生数量多,庞大的资源造成了信息的过载。而推荐系统的出现给人们提供了一种新思路,在对这一问题的解决上起到了至关重要的作用。在电子商务这一领域逐渐衍化迅猛的时代,推荐系统不仅可以解决海量信息难处理的问题,可为使用者推荐其偏好的产品汇总,同时还为企业的运营带来了更多的效益。本文通过对电商平台系统特性及当前商品推荐系统相关技术原理进行研究,并对当前推荐系统存在的特点和难点进行综合分析,针对传统的推荐算法浅层学习能力不足,通常只能捕获用户一般的静态的兴趣偏好,且缺乏推荐的可解释性的问题,进一步引出将深度学习融入商品推荐的改进思路,利用深度学习强大的处理数据的能力,为推荐系统提供可靠的数据来源,同时提高推荐的准确性,可解释性和个性化。本文的主要工作如下:(1)通过图神经网络来建模用户行为序列,并应用至商品推荐场景中,详细介绍本文所使用的门控图神经网络,利用其自身的结构优势,捕获序列之间的复杂转换,增加推荐的可解释性;(2)进一步新颖地将Transformer引入到基于图神经的序列推荐中来,利用其多头自注意力机制来更好的捕获用户的兴趣偏好,进一步加强推荐的准确性和可解释性。将门控图神经网络和Transformer相结合,构建基于深度学习的商品推荐系统模型,来为用户提供更准确和更个性化的商品推荐;(3)然后,在Yoochoose和Diginetica两个真实的电商数据集上,选择HR和MRR为评估指标,与GRU、SR-GNN、SR-GNN变体这三个序列推荐模型进行多组对比实验,验证本文模型的有效性和优势;(4)除此以外,为了更好模拟和演示推荐在实际电商业务场景中的应用,进行电商平台的系统设计,并将推荐结果进行可视化展示。
基于生成对抗网络的序列推荐的研究
这是一篇关于序列推荐,生成对抗网络模型,Bert,多头自注意力机制,协同过滤的论文, 主要内容为目前,推荐系统的应用范围越来越广泛,已经成为电商平台、视频播放平台、娱乐社交等平台的基础设施。序列推荐是推荐系统的一个分支,能够从用户与项的信息中挖掘隐含信息并建立用户交互的依赖关系模型。隐含信息包括各个项之间的联系、用户的偏好以及偏好的变化、商品的流行度变化等。依赖关系是指用户在不同时刻交互的产品之间存在联系,例如交易序列中的商品之间存在顺序依赖关系。序列推荐中存在许多问题,如序列数据的稀疏问题、长期依赖的挖掘问题等。针对这些问题,本文对序列推荐进行深入研究,提出了两个算法,并使用真实数据进行实验。本文的主要研究工作如下:(1)针对序列推荐的数据稀疏性问题,本文首次提出基于生成对抗网络的协同过滤算法。该算法将用户的序列数据使用向量表示,从向量中学习隐式反馈信息。在生成对抗网络模型中,生成器学习用户与项的特征并生成虚假的用户交互数据,判别器判别真实数据与生成数据,并将结果反馈给生成器,指导生成器的更新。该算法学习序列的潜在信息,并使用学习到的用户与项的特征解决序列数据的稀疏性问题。生成对抗网络模型容易产生模式崩溃问题,模式崩溃是指生成器仅学习真实数据的某一分布特征并以此生成数据骗过判别器,从而导致模型的损失值震荡太小,推荐的精确率无法提升,影响数据稀疏性问题的解决性能。本文使用权重截断和增加梯度惩罚项的方法对算法进行改进,权重截断能够改善训练过程中的梯度消失问题,但是会造成权重两极化现象,导致训练不稳定,收敛速度慢。据此本文为判别器的损失函数添加了梯度惩罚项,满足了判别器梯度的Lipschitz限制。实验结果表明该算法能够解决序列推荐的数据稀疏性问题,模型的精确率同比神经协同过滤算法提高了 61.1%。(2)针对序列推荐的长期依赖的挖掘问题,本文提出了嵌入双向编码表示的生成对抗网络算法。该算法使用双向编码表示模型解读用户与项的二元关系序列,并使用生成对抗网络模型的对抗训练生成更多与真实数据分布相似的样本数据对模型的学习进行指导,得到更好的结果。算法包括三个步骤,首先本文使用双向编码表示模型解读序列数据,其中双向模型能够考虑序列中任意项的上下文信息,多头自注意力机制能够捕捉任意项与其上下文之间的依赖关系,将捕获内容进行编码,并从中提取特征。然后根据用户与项的特征训练生成对抗网络模型,使得其生成器能够生成近似真实数据分布的样本,再使用判别器对真实数据与生成数据进行判别,并将结果反馈给生成器。最后,本文使用基于生成对抗网络的协同过滤算法的训练结果,将其使用嵌入双向编码表示的生成对抗网络算法进行实验,实验结果表明嵌入双向编码表示的生成对抗网络算法同时也能够解决序列推荐的数据稀疏性问题。该算法在真实数据集上进行实验,NDCG@10最高达到93.0%。
基于深度学习与情感分析的电影推荐系统研究与实现
这是一篇关于电影推荐,XLNet,BiLSTM,多头自注意力机制,CNN,GRU的论文, 主要内容为互联网的快速发展让网络信息爆炸式增长,这导致了极其严重的信息过载问题。而推荐系统作为主要的信息过滤技术之一,面临用户评分数据稀疏、用户评分和评论情感取向存在较大偏差、对用户和项目的深层次特征挖掘不充分等问题。因此,本文针对电影推荐,研究并实现了一种基于深度学习和评论情感分析的推荐系统。本文旨在结合用户评论、评分数据,以及电影描述信息,使用深度学习方法构建个性化电影推荐模型。首先,使用爬虫技术获取豆瓣电影的相关数据。然后,使用情感分析技术对评论数据进行极性划分,并建立基于深度学习的混合电影推荐模型。最后,完成电影推荐系统的设计与实现。具体研究内容如下:(1)阐述了课题研究的背景与意义,分析了有关情感分析和推荐算法的国内外研究现状;同时,研究了传统的协同过滤推荐算法以及目前主要的深度学习推荐技术,剖析了其各自的优势与不足。(2)在对影评进行情感分析时,针对Word2vec等静态词向量技术不能学习文本的深层信息、解决一词多义,以及RNN存在的长期依赖和上下文深层语义挖掘不充分的问题,本文提出了一种新的中文影评情感分类模型XL-MHA-Bi LSTM(XMB)。首先,使用XLNet预训练语言模型生成具有上下文依赖的词向量来对影评信息进行分布式表征;然后,将词向量输入到Bi LSTM网络中,对评论的深层语义进行分析和计算;之后,使用多头自注意力机制(Multi-head Self Attention mechanism,MHA)对评论进行多维语义特征筛查;接着,使用Sigmoid函数实现影评情感极性分类。最后,通过实验验证了本文模型的有效性。(3)针对传统的系统过滤推荐算法受到数据稀疏问题的制约,电影评论和描述信息未得到充分的利用,无法学习到用户和电影的深层次特征表述,而各种混合推荐算法又面临辅助信息表示不当等各种问题,本文提出一种新的混合推荐模型XMB-CNNGRU。首先,使用本文所提出的XMB情感分类模型进行评论情感分析,并将评论的情感分析结果和评分矩阵以及电影描述信息融合;之后,将矩阵分解得到的用户和电影隐向量输入卷积神经网络CNN中,利用CNN强大的局部特征学习能力得到用户和电影的深层特征表示;最后,将用户和电影的特征向量输入GRU网络中,预测用户对电影的评分,并通过实验验证模型的预测准确性。(4)利用本文提出的推荐模型,使用My SQL数据库和Django框架设计并实现了一个电影推荐系统。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码项目助手 ,原文地址:https://m.bishedaima.com/lunwen/48673.html