句子级情感倾向性分析与研究
这是一篇关于情感倾向性分析,句法关系,机器学习,情感词典,特征抽取的论文, 主要内容为随着互联网2.0时代的到来,使得网络信息以近乎爆炸的速度进行增长。面对数量如此众多的信息,如何能够快速判断其中的正负情感意图,进而帮助用户、企业和政府做出决策判断呢?本文针对于此问题,研究了文本情感分析体系的分支,即句子级的情感倾向性分析。 首先,调查和分析了情感倾向性的研究现状,并在此基础上构建了情感倾向判断的基线系统。明确了本课题中情感倾向性的研究边界和目标,调研了国内外情感倾向性分析的主流方法,确定了一般情感倾向性分析系统所需要的处理过程和方法。重点调研了句子级情感倾向性分析的3种技术:词典法、句法结构方法和机器学习算法。 其次,提出了基于三重句法结构的句子级情感倾向性算法。这是隶属于句法结构的算法,在词典法的基础上引入了句间元素的依存修饰关系,并根据关系的远近进行了三个层次的分类。同时,引入树形的句子表示结构。最终结合了树形表示结构和三层句法结构确定了计算顺序。 然后,基于三重句法结构算法,提出并实现了用以处理中文语料的情感倾向性判断方法。在观察大量的中文文本后抽象出主要的中文句法关系,并根据关系的递进关系进行了层次划分。根据算法构建模型,结合实验的数据效果与词典方法和分类算法进行了比较。明确了算法的特点和优劣势。 另外,基于三重句法结构算法,提出并实现了用以处理英文在线评论的情感倾向性判断方法。设计了英文在线评论摘要系统,该系统完成对英文在线电商网站的评论信息的情感分析。结合网页信息爬取和解析、通用和属性词典建立、产品属性的抽取以及情感分析算法,并根据英文语法的关系对算法模型进行了调整和适配,最终得到情感分析结果。 最后,对算法进行总结,并指出可以改进的地方,对算法的未来进行了展望。
电商在线评论的情感与量化分析——以平板电脑为例
这是一篇关于在线评论,情感倾向性分析,LDA模型,TF-IDF算法,量化分析的论文, 主要内容为得益于互联网时代的发展,消费者对于线上购物的需求与日俱增,这给电商平台带来了巨大的发展机遇,如何提升自己的竞争力成为电商平台关注的要点。在线评论是一类蕴含消费者情感信息的文本数据,是发生在消费者购买行为之后的体验反馈,可以反映消费者的购物感受,能够为电商未来发展和消费者进行决策提供重要参考。一方面,电商平台可以根据消费者的在线评论来评估自身产品存在的优势和不足,进而有针对性地改善产品的服务和质量;另一方面,在线评论可以帮助消费者在购买未知商品前进行了解,为购物选择提供参考依据。因此,对在线评论的分析研究具有极高的实际意义和参考价值。本文基于文本分析技术,通过爬虫获取了京东商城不同品牌平板电脑的在线评论数据,针对评论数据特点进行预处理和中文分词。进一步地,基于Word2vec词向量化技术对通用情感词典进行扩展改进,对评论数据的情感倾向性进行分类。然后对分类后的评论数据分别构建LDA主题模型,挖掘在线评论潜在主题,并结合TF-IDF特征提取算法,构建平板电脑评价指标体系,从指标提及率和差评率两个方面对各品牌平板电脑进行综合评价。本文由以下六个部分构成:第一部分为绪论,阐述了在线评论研究背景与意义、总结国内外研究现状、对全文脉络进行概述。第二部分是相关理论基础,介绍了文本文本分析、情感倾向性分析和主题模型的相关理论和方法。第三部分对平板电脑在线评论数据进行预处理,并进行语义网络分析。第四部分为实证部分,基于Word2vec词向量化技术扩充通用情感词典,对评论文本进行情感倾向性分类,分类结果准确度达到93.29%。第五部分对分类后正负面评论分别构建LDA主题模型,挖掘各品牌平板电脑在线评论潜在主题,结合TF-IDF算法提取特征关键词,构建平板电脑评价指标体系,从指标提及率和差评率两个角度对各品牌平板电脑进行综合评价。研究得到用户在线评论中提到最多的是产品属性,其次是购买体验,服务质量的提及率最低,但服务质量的差评率最高,售后服务的平均差评率更是高达90%,客户服务的平均差评率达到78%,各品牌应不断提升自身服务水平。品牌进行分析,荣耀的售后服务差评率最高,小米的物流服务和客户服务差评率最高,微软的物流和客户服务差评率最低,表明微软较为注重服务质量,小米和荣耀在服务质量方面有待提升。第六部分是结论和建议,总结本文的研究。
电商空调产品的评论数据情感分析
这是一篇关于格力空调,情感倾向性分析,语义网络,LDA主题模型,TF-IDF的论文, 主要内容为在网络上,对大量的评论数据进行情感分析是Web挖掘的最新范畴,受到各个学科的普遍关注。伴随着信息技术的快速成长,人们更加倾向于用网络的方式来购买自己喜欢的东西,中国现在有很多的电商平台,网络购物的盛行为各大电商平台和对应商品的生产厂家带来了机遇,但同时也为各大平台与生产厂家带来了挑战和竞争,所以各个电商如果希望商品销量增长,除了保证正品、提高商品质量和降低商品价格之外,还需要去了解消费者的心声。现在越来越多的人选择在电商平台上购物,很多的电商平台也相应地有了评论系统,用户可以在系统中表达对商品的看法,用户的看法也日渐成为电商平台和生产厂家发展的重要依据。因此对消费者的文本评论数据进行情感分析,可以使对应的生产厂家和电商平台的自身竞争力得到大幅度的提升,可以为相应的生产厂家和电商平台制定新的营销策略。利用计算机帮助生产厂家和电商平台挖掘并处理相关的文本评价信息是本文的重要工作。我们选择京东电商的格力品牌空调的三种产品格力KFR-35GW/(35592)FNhDaA3、格力KFR-72LW/(72596)FNAa-A3、格力KFR-35GW/(35559)FNAd-A3(WIFI),对这三种产品的评论进行挖掘,通过爬虫软件-八爪鱼采集器去抓取2016年7月11日之前的评论数据评论信息。接下来对获取的数据进行基本的数据处理工作,主要有文本去重、机械压缩去词、中文评论分词、去掉英文及英文字符等工作。文本评论数据经过预处理之后,对处理好的文本数据用基于情感词典的方式对文本的情感倾向做判断和处理,从而把文本数据分成积极情绪和负面情绪两大部分;接下来对评论数据进行语义网络分析,构建语义网络,实现数据可视化;紧接着分别对把三种空调产品的正面和负面评论进行基于LDA模型的主题分析,提取三个潜在主题,寻找评论数据中的高频特征词,挖掘商品的特征;最后对空调产品评论数据用tf/idf的方法来提取商品属性,对三种商品的属性做出对比。最后通过上述的分析结果中获取挖掘出文本评论数据中有价值的内容,寻找三种空调中,最具优势和潜力的商品,为京东电商和格力厂商提供建议。
基于微博数据的股市投资行为预测系统
这是一篇关于微博,情感倾向性分析,行为金融学,投资者情绪,情感词典的论文, 主要内容为在各国的股市发展进程中,都出现过大面积的暴涨暴跌的情况,当然这背后有很多偶然和必然因素。不过对于大多数投资者,特别是中小散户来说,其投资行为有时是非理性的,很多时候会选择盲目追涨杀跌,最终造成严重亏损。行为金融学因此应运而生,它解释了投资者个体容易出现从众跟风的心理,为投资者情绪的研究奠定了坚实的理论基础。不论是国外的Twitter,还是国内的新浪微博,社交网络已经越来越深入到我们每个人的生活,学习,工作之中。现在,我们习惯于,也乐于在这些平台上面发布自己感兴趣的事物,表达对外界的观点,抒发内心的情感等等,这对于互联网分析人员来说,相当于蕴含了丰富价值的信息宝库。在金融专业领域,我们希望从中了解当前市场对于股市的情绪,看多或者看空的情绪,对于投资者的行为来说是非常重要的。现代行为金融学的理论指出,投资者的心理因素在投资决策及市场波动起到了重要的作用。那么如何度量投资者情绪成为了需要进一步解决的问题。为此,本文设计并实现了基于微博数据的股市投资行为预测系统,主要工作是通过利用自然语言处理等计算机信息技术,结合金融领域的情感词典对微博文本的内容进行情感分析,从而在大量数据之上计算得到个股的总体情绪指数,并基于此对个股的走势做出分析和预判,最终给用户以一定的投资建议。本文的工作内容主要有几个方面:1.鉴于微博开放平台API对于调用频次有比较严格的限制,本系统中使用了Http Client客户端,模拟登录新浪微博,并采集微博股票相关页面作为数据来源,同时也实现了从网页中抽取出有效字段的网页解析器。2.分析了当前情感分析常用的两种方法:基于情感词典的规则方法和基于机器学习的统计方法,考虑到后者在前期准备工作中需要投入大量的精力标注训练语料,并非适合原型系统的开发,因此本系统采用前者的方法。在实现系统之前,以知网Hownet为基础,构建了一批适用于金融行业的情感词汇,另外我们将微博表情做了情感极性的映射,如此,在文本情感分析的同时,就可以引入微博表情作为计算因子。3.因为要综合考察个股总体的情绪指数,所以还需要该个股相关的所有微博的情感倾向性进行加权平均,其中权值为发布微博对应账号的影响力,我们提出了一种计算微博账号影响力的方法,比较客观地评估了其影响力。4.本系统采用的是基于Java EE框架的B/S架构,用户打开浏览器即可使用本系统,另外在前端,使用了数据可视化的插件,使得信息显示更加具有可读性和表现力,提升了用户体验。
基于SVM的电商评论文本情感倾向性分析
这是一篇关于情感倾向性分析,Word2vec,特征组合,SVM,MNB的论文, 主要内容为当今世界,电子商务平台飞速发展,海量的用户评论文本也由此产生。这些评论文本中包含了购买者对产品的情感倾向,如:“正向”、“负向”等。研究这些评论文本的情感倾向性,有助于平台管理者了解产品的优势和不足之处,便于日后的产品改进。同时,在获取到评论文本中的情感信息后,潜在的用户更容易做出正确的消费决策。而本文的研究方向是对电商平台的评论文本进行情感倾向性分析,在实验与研究过程中发现了模型构建的向量空间质量不够好,并且在长评论文本与短评论文本数据集上,SVM与MNB算法的表现刚好相反,因此由两个算法单独构建的模型并不具有一般适用性。为了解决这些问题,本文提出了两种改进方法:首先,将语料库及情感词典投入Word2vec模型中,构建两个词向量空间,并将两者进行特征组合;其次改进传统机器学习算法SVM,将其与MNB算法结合,构建分类器。本文的主要内容由以下几个部分组成:首先,本文介绍了文本情感倾向性分析目前的研究现状,对目前主流的文本情感倾向性分析方法做了简要概述,分析了已有的方法的现状及不足,并介绍了常用的文本向量化和文本情感分类的相关方法。其次,本文对Word2vec算法进行了深入研究,提出了基于Word2vec的特征优化算法。该算法加入了大型语料库及情感词典,将常用特征和特定特征进行组合,对特征进行了组合与优化。再次,本文对SVM与MNB算法进行了简要介绍,并且深入研究了两个算法在情感分类器上的各自的优点。在此基础上,将SVM算法与MNB算法进行融合,构建了SVM-MNB情感分类模型。最后,本文通过相关实验对改进的模型进行了验证,并与其它模型进行对比和分析。
基于微博数据的股市投资行为预测系统
这是一篇关于微博,情感倾向性分析,行为金融学,投资者情绪,情感词典的论文, 主要内容为在各国的股市发展进程中,都出现过大面积的暴涨暴跌的情况,当然这背后有很多偶然和必然因素。不过对于大多数投资者,特别是中小散户来说,其投资行为有时是非理性的,很多时候会选择盲目追涨杀跌,最终造成严重亏损。行为金融学因此应运而生,它解释了投资者个体容易出现从众跟风的心理,为投资者情绪的研究奠定了坚实的理论基础。不论是国外的Twitter,还是国内的新浪微博,社交网络已经越来越深入到我们每个人的生活,学习,工作之中。现在,我们习惯于,也乐于在这些平台上面发布自己感兴趣的事物,表达对外界的观点,抒发内心的情感等等,这对于互联网分析人员来说,相当于蕴含了丰富价值的信息宝库。在金融专业领域,我们希望从中了解当前市场对于股市的情绪,看多或者看空的情绪,对于投资者的行为来说是非常重要的。现代行为金融学的理论指出,投资者的心理因素在投资决策及市场波动起到了重要的作用。那么如何度量投资者情绪成为了需要进一步解决的问题。为此,本文设计并实现了基于微博数据的股市投资行为预测系统,主要工作是通过利用自然语言处理等计算机信息技术,结合金融领域的情感词典对微博文本的内容进行情感分析,从而在大量数据之上计算得到个股的总体情绪指数,并基于此对个股的走势做出分析和预判,最终给用户以一定的投资建议。本文的工作内容主要有几个方面:1.鉴于微博开放平台API对于调用频次有比较严格的限制,本系统中使用了Http Client客户端,模拟登录新浪微博,并采集微博股票相关页面作为数据来源,同时也实现了从网页中抽取出有效字段的网页解析器。2.分析了当前情感分析常用的两种方法:基于情感词典的规则方法和基于机器学习的统计方法,考虑到后者在前期准备工作中需要投入大量的精力标注训练语料,并非适合原型系统的开发,因此本系统采用前者的方法。在实现系统之前,以知网Hownet为基础,构建了一批适用于金融行业的情感词汇,另外我们将微博表情做了情感极性的映射,如此,在文本情感分析的同时,就可以引入微博表情作为计算因子。3.因为要综合考察个股总体的情绪指数,所以还需要该个股相关的所有微博的情感倾向性进行加权平均,其中权值为发布微博对应账号的影响力,我们提出了一种计算微博账号影响力的方法,比较客观地评估了其影响力。4.本系统采用的是基于Java EE框架的B/S架构,用户打开浏览器即可使用本系统,另外在前端,使用了数据可视化的插件,使得信息显示更加具有可读性和表现力,提升了用户体验。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码海岸 ,原文地址:https://m.bishedaima.com/lunwen/55898.html