B2C网站商品评论挖掘技术的研究
这是一篇关于商品评论,评论挖掘,情感分类,支持向量机,情感分析的论文, 主要内容为随着B2C市场规模的增大,消费者在互联网上对商品的评论数量也呈爆炸式增长。由于这些商品评论中隐藏许多对商家和消费者有价值的信息,因此准确高效地识别这些信息并加以利用会带来巨大的经济效益和广阔的应用前景,这使得商品评论的挖掘与分析成为近年来研究的热点。本文以大型B2C网站京东商城的手机评论为研究对象,对商品评论文本的情感分类和情感极性分析两方面进行了研究,主要工作如下: 使用支持向量机方法和朴素贝叶斯方法对商品评论文本的情感分类进行研究。首先对网上获取的评论进行人工选择获得训练集,然后利用NLPIR分词系统预处理语料,并用TF-IDF方法计算特征词的权重。最后,使用MI、IG、CHI特征选择方法在分类器SVM、NB上进行实验对比分析。实验结果表明,使用CHI特征提取方法,SVM和NB的分类效果能达到80%以上。另外,在同一特征提取方法上,SVM的分类效果要优于NB,正确率可到83%。 采用基于邻近原则的“双向迭代法”对商品评论文本进行细粒度情感极性分析。首先利用PMI-IR算法构建情感种子集,然后利用基于邻近原则的“双向迭代法”获取特征词-情感词关联关系对,以此提出了一种情感词典的构建方法,构建了一个基于HowNet的三元组情感词典Tri-HowNet,并且通过实验对比分析了基于HowNet极性词典与基于Tri-HowNet情感词典的两种极性判定方法。实验结果表明,后者在判定多语义情感词极性时表现优于前者。 设计并实现了基于SSH框架的评论挖掘系统。该系统主要包括词典维护、评论收集、评论分类、评论情感分析和可视化展示等5个模块。首先,利用开源:Java类库Crawler4j提供的接口,通过post模拟登陆的方法来获取评论。其次,由文本情感分类和情感分析两个方向出发,对商品评论进行研究分析。最后,将结果存入商品的分析库中,并能够以3D柱状图的形式展现,方便用户查询与使用。
B2C网站商品评论挖掘技术的研究
这是一篇关于商品评论,评论挖掘,情感分类,支持向量机,情感分析的论文, 主要内容为随着B2C市场规模的增大,消费者在互联网上对商品的评论数量也呈爆炸式增长。由于这些商品评论中隐藏许多对商家和消费者有价值的信息,因此准确高效地识别这些信息并加以利用会带来巨大的经济效益和广阔的应用前景,这使得商品评论的挖掘与分析成为近年来研究的热点。本文以大型B2C网站京东商城的手机评论为研究对象,对商品评论文本的情感分类和情感极性分析两方面进行了研究,主要工作如下: 使用支持向量机方法和朴素贝叶斯方法对商品评论文本的情感分类进行研究。首先对网上获取的评论进行人工选择获得训练集,然后利用NLPIR分词系统预处理语料,并用TF-IDF方法计算特征词的权重。最后,使用MI、IG、CHI特征选择方法在分类器SVM、NB上进行实验对比分析。实验结果表明,使用CHI特征提取方法,SVM和NB的分类效果能达到80%以上。另外,在同一特征提取方法上,SVM的分类效果要优于NB,正确率可到83%。 采用基于邻近原则的“双向迭代法”对商品评论文本进行细粒度情感极性分析。首先利用PMI-IR算法构建情感种子集,然后利用基于邻近原则的“双向迭代法”获取特征词-情感词关联关系对,以此提出了一种情感词典的构建方法,构建了一个基于HowNet的三元组情感词典Tri-HowNet,并且通过实验对比分析了基于HowNet极性词典与基于Tri-HowNet情感词典的两种极性判定方法。实验结果表明,后者在判定多语义情感词极性时表现优于前者。 设计并实现了基于SSH框架的评论挖掘系统。该系统主要包括词典维护、评论收集、评论分类、评论情感分析和可视化展示等5个模块。首先,利用开源:Java类库Crawler4j提供的接口,通过post模拟登陆的方法来获取评论。其次,由文本情感分类和情感分析两个方向出发,对商品评论进行研究分析。最后,将结果存入商品的分析库中,并能够以3D柱状图的形式展现,方便用户查询与使用。
B2C网站商品评论挖掘技术的研究
这是一篇关于商品评论,评论挖掘,情感分类,支持向量机,情感分析的论文, 主要内容为随着B2C市场规模的增大,消费者在互联网上对商品的评论数量也呈爆炸式增长。由于这些商品评论中隐藏许多对商家和消费者有价值的信息,因此准确高效地识别这些信息并加以利用会带来巨大的经济效益和广阔的应用前景,这使得商品评论的挖掘与分析成为近年来研究的热点。本文以大型B2C网站京东商城的手机评论为研究对象,对商品评论文本的情感分类和情感极性分析两方面进行了研究,主要工作如下: 使用支持向量机方法和朴素贝叶斯方法对商品评论文本的情感分类进行研究。首先对网上获取的评论进行人工选择获得训练集,然后利用NLPIR分词系统预处理语料,并用TF-IDF方法计算特征词的权重。最后,使用MI、IG、CHI特征选择方法在分类器SVM、NB上进行实验对比分析。实验结果表明,使用CHI特征提取方法,SVM和NB的分类效果能达到80%以上。另外,在同一特征提取方法上,SVM的分类效果要优于NB,正确率可到83%。 采用基于邻近原则的“双向迭代法”对商品评论文本进行细粒度情感极性分析。首先利用PMI-IR算法构建情感种子集,然后利用基于邻近原则的“双向迭代法”获取特征词-情感词关联关系对,以此提出了一种情感词典的构建方法,构建了一个基于HowNet的三元组情感词典Tri-HowNet,并且通过实验对比分析了基于HowNet极性词典与基于Tri-HowNet情感词典的两种极性判定方法。实验结果表明,后者在判定多语义情感词极性时表现优于前者。 设计并实现了基于SSH框架的评论挖掘系统。该系统主要包括词典维护、评论收集、评论分类、评论情感分析和可视化展示等5个模块。首先,利用开源:Java类库Crawler4j提供的接口,通过post模拟登陆的方法来获取评论。其次,由文本情感分类和情感分析两个方向出发,对商品评论进行研究分析。最后,将结果存入商品的分析库中,并能够以3D柱状图的形式展现,方便用户查询与使用。
基于情感分类和主题挖掘的评论文本研究
这是一篇关于情感分类,主题挖掘,词嵌入,深度学习,评论文本的论文, 主要内容为随着互联网普及率的提高,各种网络平台开始快速发展,随之而来的是大量蕴含着用户主观情感的评论文本。文本情感分析是近年来的研究热点之一,它通过对海量文本数据进行情感倾向性分类以及观点提取,挖掘其中隐含的信息,从而为不同人群提供不同角度的参考意见。本文从应用角度出发,基于情感分类和主题挖掘的技术,对不同手机的用户评论进行分析挖掘并提出相应建议,丰富了现有中文文本挖掘在网购用户评论方面的应用研究,研究思路与方法可以为不同行业的文本研究提供理论参考,具有较大的理论与现实意义。本文首先采用Python爬虫技术从京东平台上收集四个价位段下12款手机的用户评论数据,对其进行分词和停用词处理后,采用ALBERT词嵌入技术进行文本向量化。将得到的向量化文本在不同的深度学习情感分类框架下进行训练,比较不同框架下分类模型的分类效果,寻找相对最优的情感分类框架。同时将评论文本通过LDA主题挖掘及可视化展示,全面了解不同价位段手机的优势和劣势,并以此为依据,从人、货、场,即消费者、手机开发商以及电商平台三个角度提出相应的建议。从四个情感分类框架的评价指标来看,基于Bi GRU模型和Attention机制的深度学习情感分类效果相对最好,同时得到以下两点结论:1.在处理文本这类时序性数据时,Bi GRU模型更能捕捉文本的上下文信息,具有较大优势;2.Attention机制可以通过权重分配使得句子语义表达更准确。LDA主题模型结果显示,低价位段手机音量大、续航能力强,但运行卡顿、屏幕分辨率低、拍照不清晰;中低价位段手机有明确的细分功能(拍照或游戏),但信号差、容易发烫卡顿;中高价位段手机具有“三高”(高显示、高像素、高音质)优势,但易发烫卡顿、耗电快;高价位段手机的关键优势是运行流畅,但存在屏幕绿边或者配件不配套出售的缺点。基于此,本文提出以下建议:1.对于消费者,应根据自身需求,避免盲从,理性消费;2.对于开发商,在扬优补缺、保证品控的同时,潜心研发各自的核心技术;3.对于电商平台,应继续提高服务水平,制定保价服务。
基于情感分类和主题挖掘的冬奥微博舆情演化研究
这是一篇关于北京冬奥会,微博,情感分类,主题挖掘,舆情演化的论文, 主要内容为2022年2月,我国承办北京冬奥会和冬残奥会以来,“冬奥”一度成为微博热议话题,社会各界对奥运遗产分配再利用、冰雪运动发展等话题的关注度明显高涨。在微博社交媒体平台上,除用户发表的博文内容外,用户的转发、评论和点赞等交互行为容易感染其他用户的情感态度和话题走向,直接促进了舆论的发酵、演变和传播,对网络舆情治理与社会安全产生影响。本文以冬奥微博资讯为数据来源,着眼于利用情感分类和主题挖掘方法提取微博文本潜藏信息,探索在资源限制条件下如何提高微博舆情情感分类性能,如何将微博用户行为融合到舆情主题挖掘过程,通过可视化展示、解读冬奥微博舆情情感主题演化情况,总结演化规律,为不同平台不同类型事件的舆情管理工作形成一定参考。本文的主要工作分为以下三个方面:首先,提出了一种改进的情感分类模型。基于知识蒸馏技术,采用加权三重蒸馏损失函数,提高了低复杂度的简单神经网络模型的情感预测性能。该模型的提出对于资源限制条件下部署情感分类及其他自然语言处理任务有所助益。其次,提出了一种融合用户行为的微博主题挖掘方法。采用传播贡献度量化转发、评论和点赞行为的传播影响力,将其融合到文本主题挖掘过程。从用户内容评测角度设计问卷,利用层次分析法进行主题识别结果可信度评价,结果显示,融合用户行为的主题识别结果可信度更高。该方法的提出深化了社交网络分析和文本挖掘方法的交叉研究,为舆情分析提供了一种更为全面的分析思路。最后,基于所提出的情感分类方法和主题挖掘方法,结合时间维度上微博发文量、微博用户行为以及舆情情感与主题变化情况,可视化展示了北京冬奥微博舆情演化脉络,解读了北京冬奥会前后微博平台上舆论热点分布和变化原因,总结了冬奥微博舆情演化规律,有望为后疫情时代、后冬奥时代相关产业发展提供决策支持。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设客栈 ,原文地址:https://m.bishedaima.com/lunwen/47900.html