面向网络评论的方面级用户情感分析技术
这是一篇关于方面词-观点词对抽取,自注意力机制,依赖联系,观点挖掘,情感分析的论文, 主要内容为随着在线购物的普及,用户越来越热衷于网上购物,并对商品发表在线评论。这些评论对于顾客购买商品和商家改进其产品与服务具有十分重要的参考价值。然而,日益增长的网购用户产生海量的用户评论,使得用户和商家难以快速地检索到期望的评论。因此,如何对大量的在线评论进行自动的细粒度的分析是需要解决的主要问题。本文的主要工作围绕面向网络评论的方面级观点分析展开,包含方面词-观点词对的抽取和基于方面的用户评论情感分析两部分的研究,具体工作如下:(1)从在线评论中抽取方面词-观点词对是一项细粒度的观点挖掘任务。之前的工作将方面词和观点词分开提取而忽略它们之间的关系,然而,关系对于下游任务(情感分类,推荐系统)十分重要。最近有研究采用基于跨度的方法将生成的跨度随机组成候选词对用于方面词-观点词对判断。庞大的候选词对为模型训练带来了挑战。本文提出了基于跨度的关系图Transformer网络(Relationship Graph Transformer networks,RGT)用于方面词-观点词对提取。为了解决候选词对过多的问题,首先训练一个判别器识别方面词和观点词,然后将识别的方面词和观点词组合用于方面词-观点词对识别。同时,采用强大的Transformer进行编码,提出关系图卷积网络来捕获方面词和观点词的依赖联系。实验表明,RGT模型优于其他先进的方法。(2)基于方面的情感分析旨在分析输入句子在特定方面下的情感极性。现有的方法大多采用长-短期记忆网络和注意力机制。然而,注意力机制只对输入信息的局部依赖性进行建模,未能捕捉到输入信息的全局依赖性。简单地改善注意力机制无法解决目标敏感情绪表达的问题,这已被证明会降低预测的有效性。在本研究中,提出了多头自注意力转换网络(Multi-head Self-AttentionTransformation networks,MSAT)模型,该模型利用目标特定的自注意力和动态目标表示进行更有效的情感分析。在给定一组评论句子的情况下,MSAT首先利用多头的特定目标自注意力来更好地捕获全局依赖,然后引入目标敏感转换模块来有效地解决目标敏感情感问题。其次,将词性特征整合到MSAT中,以捕获句子的语法特征。在Sem Eval 2014和Twitter数据集上进行的一系列实验表明,与几种最先进的方法相比,本文提出的模型具有更好效果。
基于BERT的电商评论观点挖掘系统设计与实现
这是一篇关于观点挖掘,预训练,BERT模型,电商评论,Flask框架的论文, 主要内容为电商行业的兴起,各类货品的流通速度加快。既方便了消费者购买,又让人们对商品的品质产生更高的要求。基于电商平台的载体,一种评论导向的消费方式逐步在市场上扩充开来。消费者购物时候,会参考以前买过该商品用户提供的评价信息,从而调整自己的消费意愿。这意味着电商评论数据对商品销量、商家利益产生了直接的影响。当前,电商平台上存在着庞大的评论文本数据,其中涵盖着店家想要急切知道的用户观点等信息。这些信息可有效帮助商家进行舆情分析、用户理解、产品优化和营销决策等,具有非常大的实用价值和应用前景。本文针对电商产品评论进行了方面级的观点挖掘,首先利用Bert预训练模型在Pytorch框架上使用监督学习的方法,训练出一个深度神经网络模型,并使用交叉验证的方法进行验证。实验结果证明,对于化妆品领域和笔记本电脑领域的精准率和召回率都可以达到70%以上,F1-score也因此达到了75%左右,这是一个十分理想的结果。但是化妆品领域的F1结果总是高于笔记本电脑领域,这是因为笔记本电脑的有标注数据集只有约900条,在数量上远小于14000条化妆品的有标注数据集。针对有标签的训练数据集数量小、训练效果欠佳的缺陷,提出一种基于深度迁移学习的改进方法,即基于不同的预训练模型,使用其他领域的数据重新对模型进行预训练,然后通过微调过程将模型迁移到目标领域,并通过集成学习的方法合并各模型,进一步改进了模型。实验结果表示,在精准率上,改进后的模型有5%-6%的提升,召回率有4%-7%的提升,F1-score值有5%左右的提升。无论是精准率、召回率还是F1-score值,经过再次预训练的模型的各项得分都远高于未经改进的Bert模型,特别地,经过集成学习以后,模型的F1-score值达到了82%,相较于改进前有8%的提升。本文最后设计并实现了一个B/S架构的基于Flask的电商评论观点挖掘系统,该系统包含注册登录、用户管理、观点挖掘、后台管理等模块,重点将改进后的深度神经网络模型部署到系统中,用户可以在友好的界面下与系统各模块进行交互,对商品评论数据进行观点挖掘,最终结果以图形化方式展现给用户。
互联网评论文本观点挖掘策略研究
这是一篇关于自然语言处理,观点挖掘,情感分析,条件随机场,点排序的论文, 主要内容为互联网时代,人们越来越多地在线购物、在线订餐、在线预定酒店等等。国内最大的电子商务网站阿里巴巴,其各款商品展示页面通常都积累有成千上万的购买者评论,国内最大的生活服务类电商,如美团,则有庞大的外卖、美食的评论数据,再者,像携程这样的线上OTA企业则有海量的酒店、旅游体验评价。如今,数据越来越成为各互联网企业最宝贵的财富,据2016年CNNIC(中国互联网络信息中心)数据显示,71.1%的用户认为产品评论是影响购买决策的最主要因素,而如此庞大的各类评论数据,正是用来分析各类商品价值、商家品质的绝好原材料。但是原始评论数据数量大、句式复杂、争议性大,需要相应方法,将其结构化成观点维度、观点词、情感类别三元组的形式,便于直观的分析。本文分别从观点抽取和评论文本情感倾向两个子方向进行研究,研究主要内容及贡献如下:(1)由硬匹配、软匹配方法构成的第一、二层观点维度词、观点词挖掘模块。“硬匹配”指的是评论句直接与种子词典中候选词进行搜索,若评论句中存在种子词典内词汇则挖掘成功;“软匹配”指的是通过word2vec的方式,扩充了种子词典,若评论文本中出现了扩充词典的词,则归一至与其对应的种子词典的词条上,其实现原理是词向量的相似度。(2)条件随机场标注方法构成的第三层观点维度词、观点词挖掘模块。若第一、二层模块没有挖掘出任何维度词或观点词,本层模块使用基于栈式双向长短时记忆网络的条件随机场标注模型,对评论句进行BIO方式标注。该模块旨在挖掘那些出现在评论文本中,但是没有被收录在词典中的观点维度词和观点词。(3)点排序构成的第四层观点维度词、观点词挖掘模块。若前面三层模块都没有挖掘出任何维度词或观点词,本层模块先使用栈式双向长短时记忆网络学习出评论句语义表示向量,再经过排序系统,筛选出最符合该评论句并没有在在评论句中出现的观点维度词、观点词。(4)互联网评论文本反映出的评论者的情感倾向,对于服务或产品的提供商都有着非常大的反馈作用。本文在挖掘出评论句的观点维度词和观点词后,采用栈式双向长短时记忆深层神经网络,学习出评论语料中各词的词向量,再通过深度学习网络抽取特征,最后经过全连接层,输出该句情感类别分布。最后为了验证该互联网评论文本观点抽取方法的有效性,本文选取了宾馆、丽人、旅行三个垂类的测试集数据,进行实验,结果证实了本方法对于互联网评论文本观点挖掘的可行性。
基于BERT的电商评论观点挖掘系统设计与实现
这是一篇关于观点挖掘,预训练,BERT模型,电商评论,Flask框架的论文, 主要内容为电商行业的兴起,各类货品的流通速度加快。既方便了消费者购买,又让人们对商品的品质产生更高的要求。基于电商平台的载体,一种评论导向的消费方式逐步在市场上扩充开来。消费者购物时候,会参考以前买过该商品用户提供的评价信息,从而调整自己的消费意愿。这意味着电商评论数据对商品销量、商家利益产生了直接的影响。当前,电商平台上存在着庞大的评论文本数据,其中涵盖着店家想要急切知道的用户观点等信息。这些信息可有效帮助商家进行舆情分析、用户理解、产品优化和营销决策等,具有非常大的实用价值和应用前景。本文针对电商产品评论进行了方面级的观点挖掘,首先利用Bert预训练模型在Pytorch框架上使用监督学习的方法,训练出一个深度神经网络模型,并使用交叉验证的方法进行验证。实验结果证明,对于化妆品领域和笔记本电脑领域的精准率和召回率都可以达到70%以上,F1-score也因此达到了75%左右,这是一个十分理想的结果。但是化妆品领域的F1结果总是高于笔记本电脑领域,这是因为笔记本电脑的有标注数据集只有约900条,在数量上远小于14000条化妆品的有标注数据集。针对有标签的训练数据集数量小、训练效果欠佳的缺陷,提出一种基于深度迁移学习的改进方法,即基于不同的预训练模型,使用其他领域的数据重新对模型进行预训练,然后通过微调过程将模型迁移到目标领域,并通过集成学习的方法合并各模型,进一步改进了模型。实验结果表示,在精准率上,改进后的模型有5%-6%的提升,召回率有4%-7%的提升,F1-score值有5%左右的提升。无论是精准率、召回率还是F1-score值,经过再次预训练的模型的各项得分都远高于未经改进的Bert模型,特别地,经过集成学习以后,模型的F1-score值达到了82%,相较于改进前有8%的提升。本文最后设计并实现了一个B/S架构的基于Flask的电商评论观点挖掘系统,该系统包含注册登录、用户管理、观点挖掘、后台管理等模块,重点将改进后的深度神经网络模型部署到系统中,用户可以在友好的界面下与系统各模块进行交互,对商品评论数据进行观点挖掘,最终结果以图形化方式展现给用户。
基于BERT的电商评论观点挖掘系统设计与实现
这是一篇关于观点挖掘,预训练,BERT模型,电商评论,Flask框架的论文, 主要内容为电商行业的兴起,各类货品的流通速度加快。既方便了消费者购买,又让人们对商品的品质产生更高的要求。基于电商平台的载体,一种评论导向的消费方式逐步在市场上扩充开来。消费者购物时候,会参考以前买过该商品用户提供的评价信息,从而调整自己的消费意愿。这意味着电商评论数据对商品销量、商家利益产生了直接的影响。当前,电商平台上存在着庞大的评论文本数据,其中涵盖着店家想要急切知道的用户观点等信息。这些信息可有效帮助商家进行舆情分析、用户理解、产品优化和营销决策等,具有非常大的实用价值和应用前景。本文针对电商产品评论进行了方面级的观点挖掘,首先利用Bert预训练模型在Pytorch框架上使用监督学习的方法,训练出一个深度神经网络模型,并使用交叉验证的方法进行验证。实验结果证明,对于化妆品领域和笔记本电脑领域的精准率和召回率都可以达到70%以上,F1-score也因此达到了75%左右,这是一个十分理想的结果。但是化妆品领域的F1结果总是高于笔记本电脑领域,这是因为笔记本电脑的有标注数据集只有约900条,在数量上远小于14000条化妆品的有标注数据集。针对有标签的训练数据集数量小、训练效果欠佳的缺陷,提出一种基于深度迁移学习的改进方法,即基于不同的预训练模型,使用其他领域的数据重新对模型进行预训练,然后通过微调过程将模型迁移到目标领域,并通过集成学习的方法合并各模型,进一步改进了模型。实验结果表示,在精准率上,改进后的模型有5%-6%的提升,召回率有4%-7%的提升,F1-score值有5%左右的提升。无论是精准率、召回率还是F1-score值,经过再次预训练的模型的各项得分都远高于未经改进的Bert模型,特别地,经过集成学习以后,模型的F1-score值达到了82%,相较于改进前有8%的提升。本文最后设计并实现了一个B/S架构的基于Flask的电商评论观点挖掘系统,该系统包含注册登录、用户管理、观点挖掘、后台管理等模块,重点将改进后的深度神经网络模型部署到系统中,用户可以在友好的界面下与系统各模块进行交互,对商品评论数据进行观点挖掘,最终结果以图形化方式展现给用户。
基于BERT的电商评论观点挖掘系统设计与实现
这是一篇关于观点挖掘,预训练,BERT模型,电商评论,Flask框架的论文, 主要内容为电商行业的兴起,各类货品的流通速度加快。既方便了消费者购买,又让人们对商品的品质产生更高的要求。基于电商平台的载体,一种评论导向的消费方式逐步在市场上扩充开来。消费者购物时候,会参考以前买过该商品用户提供的评价信息,从而调整自己的消费意愿。这意味着电商评论数据对商品销量、商家利益产生了直接的影响。当前,电商平台上存在着庞大的评论文本数据,其中涵盖着店家想要急切知道的用户观点等信息。这些信息可有效帮助商家进行舆情分析、用户理解、产品优化和营销决策等,具有非常大的实用价值和应用前景。本文针对电商产品评论进行了方面级的观点挖掘,首先利用Bert预训练模型在Pytorch框架上使用监督学习的方法,训练出一个深度神经网络模型,并使用交叉验证的方法进行验证。实验结果证明,对于化妆品领域和笔记本电脑领域的精准率和召回率都可以达到70%以上,F1-score也因此达到了75%左右,这是一个十分理想的结果。但是化妆品领域的F1结果总是高于笔记本电脑领域,这是因为笔记本电脑的有标注数据集只有约900条,在数量上远小于14000条化妆品的有标注数据集。针对有标签的训练数据集数量小、训练效果欠佳的缺陷,提出一种基于深度迁移学习的改进方法,即基于不同的预训练模型,使用其他领域的数据重新对模型进行预训练,然后通过微调过程将模型迁移到目标领域,并通过集成学习的方法合并各模型,进一步改进了模型。实验结果表示,在精准率上,改进后的模型有5%-6%的提升,召回率有4%-7%的提升,F1-score值有5%左右的提升。无论是精准率、召回率还是F1-score值,经过再次预训练的模型的各项得分都远高于未经改进的Bert模型,特别地,经过集成学习以后,模型的F1-score值达到了82%,相较于改进前有8%的提升。本文最后设计并实现了一个B/S架构的基于Flask的电商评论观点挖掘系统,该系统包含注册登录、用户管理、观点挖掘、后台管理等模块,重点将改进后的深度神经网络模型部署到系统中,用户可以在友好的界面下与系统各模块进行交互,对商品评论数据进行观点挖掘,最终结果以图形化方式展现给用户。
基于评论文本分析的推荐系统研究
这是一篇关于观点挖掘,推荐系统,多任务学习,神经网络,机器学习的论文, 主要内容为随着互联网规模的指数级增长,信息过载的问题也愈发严峻。推荐系统针对不同用户提供个性化的推荐,被视为解决信息过载问题的富有前景的方法。但传统的推荐方法,如协同过滤,只考虑了用户对商品的打分信息(隐式的或显式的),而忽视了大量可以利用的用户评论。本文研究目的是采用文本挖掘和深度学习技术从用户对商品的评论文本中提取结构化的有价值的信息,将这部分信息融入传统的推荐模型中,以解决传统推荐方法存在的种种弊端,提高推荐系统的健壮性、可靠性,改进推荐效果。本文首先介绍在评论文本分析、推荐系统和基于评论文本的推荐这三个领域内国内外具有代表性的学者的研究成果,然后针对本文所要研究的问题对这些传统的方法进行了比较、分析,以及改进。首先,在对评论文本的分析过程中,本文分别应用了属性挖掘和情感计算以及深度神经网络doc2vec语言模型来获取各个评论的嵌入表示。其次,在对评分矩阵的分析过程中,本文应用了基于矩阵分解的隐因子模型来获取商品和用户的隐式表示。最后,用基于概率图的方法和基于多任务学习的方法结合以上成果,提出了一种具有创新性的推荐模型,它无缝地结合了doc2vec模型和经典的基于矩阵分解的推荐算法。在中英文的数据集上对算法的不同设置进行的对比实验表明,本文提出的模型能有效利用评论中隐含的语义以改进评分推荐任务。
基于情感倾向的网络舆情分析系统的设计与实现
这是一篇关于情感倾向分析,观点挖掘,网络舆情的论文, 主要内容为如今,人们对于网络的认识发展趋势是由浅至深的,网络也逐渐变得更加普遍化、大众化,以博客为例,博客正在慢慢变成沟通联络的平台,人们立足于博客可以进行信息浏览、发表观点。由于平台言论的自由性以及开放性,博客上的舆情得到了越来越多人的关注与参与。同时,正是因为网络自身的普遍化与大众化,人们对于情感倾向的探析也必不可少。本文通过对网络舆情情感倾向进行深层次的探析,在了解本文目标的基础上,研究相应的技术理论,进行资料调查和技术分析工作,以用户需求为指导,对系统进行了设计和实现。本文主要研究了以下内容:第一步、借助网络爬虫技术进行博客素材的搜索与下载,同时借助Jsoup技术进行剖析,精炼出文章题目与内容,并对内容进行预处理操作,对于那些没办法进行辨 识的文章片段与空行进行删除。完成第一步,紧接着就是利用HowNet和BosonNLP情感词典进行处理,再结合中科院ICTCLAS分词系统2011版进行分词,对于文章里面的人称代词以及标点等进行删除。完成以上两个步骤,随后根据公式,针对文章里面相关词语的出现次数,找出每个词语之于文章的重要程度。并且立足于此,通过相关计算,分析得到每个句子之于该文章段落的重要程度,将其视成舆情分析的关键句且可选择性输出,为分析情感变化趋势做准备。再将句子的权重大小进行对比,并筛选出里面排名前三的句子。本文以情感词典为基础,对情感关键词词语进行比较且通过相关算式知悉舆情分析内容的情感分数,然后通过分数阈值,了解舆情情感倾向,大致能够划分为三种情感,依次是成正面情感(认可夸赞)、中立情感(客观公正)、负面情感(评判否定),再把功能与结果表现于GUI界面上。网络舆情分析系统实现了舆情计算、内容提取和存储、用户管理等相关功能。通过本文的分析结果表明,本系统可以正确地下载指定的题目以及正文,并进行较准确的分词以及计算,最后通过科学的计算方法得出的情感倾向,并能得出较关键的情感词,实现了快速分析及观点倾向获取。
基于评论的多维度观点挖掘的方法研究和实现
这是一篇关于观点挖掘,情感分析,序列标注,互联网评论的论文, 主要内容为电商及网络媒体中的评论,反映了消费者对商品或服务的满意度,对商家和其他消费者的决策具有参考价值。互联网评论文本数量庞大、增长速度快,使其难以用人工方式进行处理,而评论多维度的特点又使处理算法面临困难。本文针对评论文本中的多维度问题进行研究,采用神经网络构建观点挖掘模型,并设计开发观点挖掘系统。本文的工作如下:(1)提出了一种字向量和词向量结合的文本表示作为模型输入,并将注意力机制引入Bi LSTM-CRF模型,构建了一种优化的观点挖掘模型Bi LSTM-attentionCRF。字向量与词向量相结合的文本表示,可获得更丰富的语义信息;Bi LSTMattention-CRF观点挖掘模型,能专注于与观点维度有关的内容,挖掘出评论文本的潜在信息。在AI challenger算法竞赛的餐饮中文评论数据集上设计验证实验,实验结果表明使用词向量和字向量进行组合文本表示对比利用词向量作为文本输入时Macro-F1值提升了0.03,准确率方面提升了2%。Bi LSTM-attention-CRF模型对比基线模型Macro-F1值提升了近0.02,准确率提升了2.3%。(2)提出一个结合长短期记忆网络和卷积门控网络的情感分析模型。在观点维度被挖掘后,利用基于维度的情感分析得到评论中相应维度的情感倾向。针对上下文特征提取问题,给出了选用观点维度词以及右侧上下文的提取方案;基于该方案下的句式特征,构建了LSTM-GCAE的情感分析模型。实验结果表明,LSTMGCAE相比于GCAE模型,Macro-F1值提升了近0.015,准确率提升了近2%。(3)设计开发了一个针对在线评论的观点挖掘系统,实现了对互联网评论的在线抽取和分析处理,利用提出的算法模型进行维度挖掘和情感分析,并将结果可视化呈现。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码导航 ,原文地址:https://m.bishedaima.com/lunwen/48064.html