电商产品评论问答系统研究
这是一篇关于电子商务,产品评论,问答系统,深度学习的论文, 主要内容为产品相关的问答系统(Product-Related Question Answering,PRQA)是一项旨在利用产品相关的评论来回答给定问题的任务,近年来受到了广泛的关注。与传统的问答系统任务不同,产品相关的问答系统采用真实的电商领域数据集,海量的用户评论数据缺少精确的标注,无法直接建立起问题与评论之间的联系。因此,如何挖掘和利用评论中问题有关的信息是产品相关的问答系统研究所面对的主要挑战。依据采用的方法不同,产品相关的问答系统可分为三个子任务:(1)基于分类方法的问答系统预测一个“是”或“否”的答案标签;(2)基于检索方法的问答系统对所有的评论进行排序,并返回与问题最相关的评论;(3)基于文本生成方法的问答系统直接生成给定问题的答案。本文对产品相关的问答系统的三个子任务分别进行了研究,具体包含以下三个工作:1.针对基于分类方法的产品相关的问答系统,提出了一个基于多任务学习的答案预测模型。它将问题的可回答性预测与答案预测视为一个两阶段的任务,并通过多任务学习框架来学习。此外,还设计了多层次注意力机制和联合编码层来更好地整合评论中的问题有关的信息。实验结果表明,该模型在多数评估指标上超过了当前最好的模型,并在模拟实际应用场景的统一评估实验中获得了最优的性能。2.针对基于检索方法的产品相关的问答系统,提出了一个基于关系图卷积网络的答案相关评论检索模型。它通过在问题、答案和每条评论语句之间显式地建立语义关联来增强相关信息的传递和表达,同时还引入了更细粒度的关键词表示,在关系图中建立关键词与相关语句之间的关联来融合细粒度的信息。实验结果表明,该模型优于所有的对比模型,在实际的评论检索情景中也能够准确地检索出与问题相关的评论。3.针对基于文本生成方法的产品相关的问答系统,提出了一个细粒度的属性和观点感知的答案生成模型。它通过利用语句中细粒度的属性和观点信息来更准确地匹配问题和评论中的有关内容。此外,还引入了一个新的评估指标PRENR来衡量模型生成答案的评论一致性。在三个真实的电商平台数据集上的实验结果表明,该模型不仅在所有评价指标上都优于最好的方法,而且能够生成更加准确、与评论一致的答案。
基于微博平台的产品评论情感分类研究
这是一篇关于微博,产品评论,情感分类,层次分析法,观点分析的论文, 主要内容为Web 2.0的出现促进了电子商务和微博的迅速发展。微博作为热门的web2.0应用,允许用户发表观点、获取信息和表达情感,越来越多的人通过微博发表对产品的看法,使微博产生了海量的包含情感的产品文本信息。微博平台上的产品评论是消费者对产品的好坏的一种情感表达,对这些信息进行情感分类研究,不仅有利于消费者根据评论做出好的购买决策,同时也能够使生产商及时获得用户对产品的购后评价,根据评价进行产品质量改善和营销策略调整,从而提高产品的受欢迎度。微博产品评论作为产品评论在互联网存在的一种新模式,融合了微博文本多主题、表达口语化和语言碎片化的特点,相对于传统文本,针对微博产品评论的情感分析将面临更多的挑战和困难。目前关于产品评论的情感分析的研究对象大部分集中在传统电商或产品论坛的评论文本上,针对微博产品评论的情感分析尚处于起步阶段,因此对微博产品评论进行情感分析,具有较高的理论价值和应用价值。论文以新浪微博产品评论为研究对象,使用情感词典和语义规则相结合的方法对微博产品评论进行情感分类,并在此基础上进行用户观点分析,实现理论研究和应用的结合,开展了以下的研究。一、根据微博的特点,构建了一种微博产品评论的情感分类方法。该方法分为四个部分:首先,根据微博文本口语化的特点,进行基于NLPIR汉语分词系统(ICTCLAS2013)的新词发现,并根据分词结果提取出评价新词集和评价对象新词集;其次,构建基于知网(Hownet)的基础情感词典,并融合评价新词集,以提高对情感词的识别率;再次,根据评价对象的词性特点,构建基于词性的评价搭配识别规则。该规则以情感词为中心,以评价对象的词性重要程度为顺序,以词语间的距离为衡量准则,来寻找识别评价搭配;最后,文本情感值。综合考虑程度副词和否定副词对文本修辞关系的影响,提出六种情感组合,并根据情感组合计算评论文本的情感值。实验结果表明该方法能有效提取评价搭配及进行微博情感分类。二、通过上述微博产品评论情感分类方法,对用户观点进行量化,并综合考虑了微博的转发数和评论数,构建用户观点分析指标,对用户的观点进行两个方面的分析:一是进行基于产品属性认可度的分析,通过图表展示用户对产品属性的评价情况,分析产品属性的优劣势;二是进行基于层次分析法的产品评价分析。利用层次分析法将影响产品评价的因素进行重要性的排序,计算出相关因素的权重,结合产品属性认可度,衡量产品的总体口碑情况。
基于微博平台的产品评论情感分类研究
这是一篇关于微博,产品评论,情感分类,层次分析法,观点分析的论文, 主要内容为Web 2.0的出现促进了电子商务和微博的迅速发展。微博作为热门的web2.0应用,允许用户发表观点、获取信息和表达情感,越来越多的人通过微博发表对产品的看法,使微博产生了海量的包含情感的产品文本信息。微博平台上的产品评论是消费者对产品的好坏的一种情感表达,对这些信息进行情感分类研究,不仅有利于消费者根据评论做出好的购买决策,同时也能够使生产商及时获得用户对产品的购后评价,根据评价进行产品质量改善和营销策略调整,从而提高产品的受欢迎度。微博产品评论作为产品评论在互联网存在的一种新模式,融合了微博文本多主题、表达口语化和语言碎片化的特点,相对于传统文本,针对微博产品评论的情感分析将面临更多的挑战和困难。目前关于产品评论的情感分析的研究对象大部分集中在传统电商或产品论坛的评论文本上,针对微博产品评论的情感分析尚处于起步阶段,因此对微博产品评论进行情感分析,具有较高的理论价值和应用价值。论文以新浪微博产品评论为研究对象,使用情感词典和语义规则相结合的方法对微博产品评论进行情感分类,并在此基础上进行用户观点分析,实现理论研究和应用的结合,开展了以下的研究。一、根据微博的特点,构建了一种微博产品评论的情感分类方法。该方法分为四个部分:首先,根据微博文本口语化的特点,进行基于NLPIR汉语分词系统(ICTCLAS2013)的新词发现,并根据分词结果提取出评价新词集和评价对象新词集;其次,构建基于知网(Hownet)的基础情感词典,并融合评价新词集,以提高对情感词的识别率;再次,根据评价对象的词性特点,构建基于词性的评价搭配识别规则。该规则以情感词为中心,以评价对象的词性重要程度为顺序,以词语间的距离为衡量准则,来寻找识别评价搭配;最后,文本情感值。综合考虑程度副词和否定副词对文本修辞关系的影响,提出六种情感组合,并根据情感组合计算评论文本的情感值。实验结果表明该方法能有效提取评价搭配及进行微博情感分类。二、通过上述微博产品评论情感分类方法,对用户观点进行量化,并综合考虑了微博的转发数和评论数,构建用户观点分析指标,对用户的观点进行两个方面的分析:一是进行基于产品属性认可度的分析,通过图表展示用户对产品属性的评价情况,分析产品属性的优劣势;二是进行基于层次分析法的产品评价分析。利用层次分析法将影响产品评价的因素进行重要性的排序,计算出相关因素的权重,结合产品属性认可度,衡量产品的总体口碑情况。
基于注意力机制的产品评论方面级情感分析方法研究
这是一篇关于产品评论,方面级情感分析,位置信息,注意力机制,递归神经网络的论文, 主要内容为随着互联网在国内外的发展,在线购物、在线点餐以及在线打车等平台受到了人们的广泛青睐。人们习惯通过在电商平台消费后将自己对产品的体验感受进行了阐述,从而获得了大量的评论文本。当我们想要快速了解产品信息的时候就可以通过每条评论推断出该产品的好坏,这样不仅帮助了用户快速定位到产品的具体某个方面的评价信息,而且也帮助了商家对产品某个方面进行高效优化。因此,方面级的情感分析在工业界也得到了很高的关注度。在传统情感分析方法中不仅需要耗费大量的人工要对文本进行标记还要进行特征提取,而且最终的精确度却没有很高。然而,深度学习的方法克服了传统的情感分析方法的缺点逐渐成为了学者们的首选技术。方面级情感分析是情感分析任务中一项细粒度的分类任务。这种任务可以通过给定句子提取出方面词以及方面词所对应的情感极性。虽然现在大多数的研究的效果都取得了较好的结果,但是一部分的研究者忽略了句子中的位置信息的作用以及不能充分注意到方面词相关的最优的向量信息,因此本文提出了研究点一,该研究是基于联合方面和位置层次注意机制网络的方面级的情感分析,这个方法通过将位置信息的结合,进一步的加强了特征信息,从而提高了最终模型的性能。但是这种方法采用了长短期记忆网络,这种模型虽然可以对序列信息有较长的依赖,但是长短期记忆网络不能实现并行化的问题使得计算量较大。基于这个问题,我们又提出了研究点二,该研究是基于位置的双向注意力机制网络的方面级的情感分析。主要工作如下:(1)由于许多模型忽略了位置信息对方面术语的重要性。为了解决这个问题,我们在模型中增加了位置信息特征。现有研究表明,对于方面级的情感分析来说,方面词与上下文之间的相互作用是非常重要的。利用这一思路,本文提出了一种联合方面和位置层次注意机制。同时,该模型采用了联合方法建立方面词的特征信息和位置特征信息的模型。一方面,当输入词向量信息时这种方法能够清晰地捕获到方面词与上下文之间的交互作用。另一方面,该方法可以提高句子中位置信息的重要性,从而提高模型的信息检索能力。此外,该模型利用层次注意机制来提取特征信息,从而得到不同的情感极性,这样的方式类似于再次过滤了句子中的无用信息。通过在餐厅数据集和笔记本电脑数据集上采用多个基准模型的实验表明,我们的模型不论在餐厅数据集还是在笔记本电脑数据集上性能都得到了一定的提升。(2)在以往的工作中,许多研究人员都是基于递归神经网络的变体来提取特征信息的。由于递归神经网络不能对数据进行并行处理使得网络的数据计算缓慢,而且当序列的长度超过一定的限制时,递归神经网络也会存在梯度消失的问题。因此,对于以上问题,我们提出了一种基于位置语法依赖矩阵的双向注意力网络来克服递归神经网络的不足。首先,该模型采用了多头注意机制和卷积网络来提取句子中的重要特征信息。其次,该模型对位置相关矩阵和上下文嵌入相结合,从而增强了句子中单词的位置信息。最后,该网络利用双向注意机制,更准确地定位和识别方面词并且对重要信息进行加权,从而更好地判断方面词对应的情感方向。通过在数据集上对模型进行测试以及与其他基准模型对比后发现,我们的模型的效果得到了一定的提升。
基于情感分类的产品评论垂直搜索引擎的研究
这是一篇关于产品评论,评价对象,情感分类,评价短语,垂直搜索的论文, 主要内容为随着互联网技术的不断发展,电子商务的不断兴起,BBS、博客、微博的不断涌现,商家与购买者的网上交互日趋频繁。越来越多的购买者在使用产品后,将产品的评论发表在网上,评论的数量与日俱增,评论的本身口语化较多并呈非结构化。商家在决策市场供求关系、潜在购买者在购买产品时,若从海量的产品评论中人工的挑选出自己关心的信息,是耗时和费力的,并带有片面性和滞后性。因此搜索引擎在当今互联网中扮演着重要的角色,像百度、谷歌这样强大的搜索引擎是针对不同领域、不同种类的通用搜索引擎。在特定的产品评论领域中,却显得力不从心。所以,在这样的背景下,一款具有情感分类的产品评论垂直搜索引擎的研究与开发是很有必要的。 在国内外研究现状的基础上,针对中文产品评论文本中评价对象的识别、评价短语的识别、评价对象与评价短语的搭配识别及评价短语的情感倾向性分析,做了进一步研究。主要工作如下: (1)在识别评价对象方法上,利用词性序列获取评价对象候选集,并提出了评价对象的完整性和稳定性的概念及算法,用来过滤评价对象的噪声。利用评价对象与评价短语的同现规则及评价对象在整篇评论文本中或整个语料集中出现的频率,进行评价对象的置信度排序,最终抽取出评价对象。 (2)对连词词典、情感词词典、程度词词典及否定词词典进行了完善,用以识别评价短语及分析评价短语的情感倾向性。并通过评价对象与评价短语之间关系的8个特征,利用支持向量机来识别评价对象与评价短语的搭配关系,最终判断整篇评论文本的情感倾向性。 (3)以中文产品评论文本的情感倾向为基础,利用目前流行的SSH框架、mysql数据库及开源软件包lucene,构建了一个垂直搜索引擎,用户可以方便、快捷的查询自己感兴趣的相关信息。 通过上述的研究所构建的具有情感分类的垂直搜索引擎,使得商家和潜在客户可以从浩如烟海的评论文章中快速而准确的找到对自己有用的信息,具有一定的商业价值。提出的中文文本情感分类的研究方法,具有一定的学术价值。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设小屋 ,原文地址:https://m.bishedaima.com/lunwen/53081.html