9篇关于文本挖掘的计算机毕业论文

今天分享的是关于文本挖掘的9篇计算机毕业论文范文, 如果你的论文涉及到文本挖掘等主题,本文能够帮助到你 追加评论对电商平台美妆产品销量的影响研究 这是一篇关于追加评论

今天分享的是关于文本挖掘的9篇计算机毕业论文范文, 如果你的论文涉及到文本挖掘等主题,本文能够帮助到你

追加评论对电商平台美妆产品销量的影响研究

这是一篇关于追加评论,ELM理论,情感强度修正,销量预测,文本挖掘的论文, 主要内容为目前,中国移动互联网发展速度较快,美妆产品通过电商平台等线上渠道的交易规模大幅增加,现已成为新的研究热点领域。由于美妆产品的特殊性,对真实质量的认识往往需要经历时间的考验,消费者常将商品使用一段时间后的效果发布在追加评论中。因此加入追加评论的在线评论会对消费者网络购买产生一定的作用,同样影响着美妆产品的销量。本文首先对美妆消费心理及行为特征进行总结,分别从评论维度、店铺维度、消费者维度和产品特征维度选取相应要素进行研究假设,并基于ELM模型构建了美妆产品销量的影响模型,选取天猫商城中美妆产品评论数据进行多元回归分析、调节效应分析等。研究发现评论情感、评论数量、店铺信誉均对产品的网络销量存在显著的正向影响,而追评数量负向作用于产品销量。研究证实了消费者的会员级别会对美妆产品销量产生调节作用,普通消费者对于会员等级较高用户所发表的评论信息持有更为信任的态度,更容易作出购买决策。其次,本文在影响因素的研究中发现追加评论对销量存在一定的影响,为了深入研究追加评论情感,首先对初始评论与追加评论的情感趋同和矛盾现象进行解释,当出现正-正追加组合时,消费者对评论的印象是积极的;当出现负-负追加组合时,对评论的印象是消极的。对于正-负追加组合的在线评论,消费者在做出购买决策更多的被负向追评内容所影响。对于负-正追加组合的在线评论,尽管追加评论表达了积极的情感,但初始评论中的负面情绪对消费者影响较大。本文运用文本挖掘技术分析在线评论的情感倾向及强度,根据评论趋同和差异现象的不同情形,提出基于追加评论的情感强度修正策略。最后,本文采用优化后的BP神经网络构建美妆产品销量预测模型。对于评论情感这一重要指标,分别选取基于追加评论情感修正值和基于评论特征情感修正值两种数据应用到预测模型中,选取10款天猫商城美妆产品近一年的销售及评论数据进行试验,验证结果显示,采用基于追加评论的情感强度修正能有效提高美妆产品销量预测的准确性。本文还对于商家从提高在线评论丰富度、重视追加评论的情感、丰富预测模型的指标三个方面提出了管理启示与建议。

基于文本挖掘的西塘古镇网络口碑评价研究

这是一篇关于文本挖掘,网络评论,网络口碑,LDA主题模型,情感分析的论文, 主要内容为我国互联网技术和旅游电商平台快速发展,游客不仅可以在旅游网站上浏览其他游客发布的景点图片和评论信息,也能够分享自己的旅行经验并对景点进行点评,供其他游客参考,由此便形成了景区的网络口碑。景区的网络口碑影响着旅游目的地形象和旅游者的旅游决策,同时也为景区管理者改善旅游服务质量提供了重要契机。基于此,本文运用文本挖掘工具,通过对游客在旅游电商平台发布的评论文本数据进行挖掘分析,建立西塘古镇网络口碑评价体系,从而确定影响景区网络口碑的主要因素,并提出提升西塘古镇网络口碑的对策及建议。本文运用网络爬虫软件爬取旅游网站的游客评论数据,以“西塘”、“西塘古镇”为关键词,分别在百度旅游网、携程旅行网、去哪儿网、驴妈妈、同程旅游国内5家旅游电商平台进行评论文本数据的抓取采集,共得到28047条评论数据。采用正则表达式的方法对评论文本进行特征词对提取,得到33040个景区特征词对。然后,运用LDA主题模型对所得样本进行主题分类,共得到12个主题,即为西塘古镇网络口碑评价体系的12个三级评价指标。根据LDA主题模型建模结果,运用Python的Snow NLP模块对各个评价指标进行情感分析,得到12个三级评价指标的好评率。利用LDA主题模型对海量评论文本进行主题分类,构建西塘古镇网络口碑综合评价指标体系,保证了选取样本的客观性和数据获取的全面性。本文对西塘古镇网络口碑的综合评价通过层次分析法实现。根据LDA主题模型构建的西塘古镇网络口碑评价体系,以评价指标间特征词对数量比的近似值建立两两比较判断矩阵,一定程度上克服了专家评判构造两两比较矩阵主观性较强的缺点。然后,求解矩阵,得到西塘古镇网络口碑三级评价指标总排序权重,结合情感分析结果计算出准则层综合好评率,再由准则层对目标层的权重得到目标层的综合好评率。通过计算得到西塘古镇网络口碑综合好评率为0.7422,游客对西塘古镇网络口碑的总体评价比较满意,但在旅游消费和公共服务两个方面好评率较低。最后通过对综合评价结果进行分析,提出了提升西塘古镇网络口碑的对策。

变电站告警信息数据挖掘及故障诊断应用研究

这是一篇关于告警信息,文本挖掘,语义解析,故障知识的论文, 主要内容为随着智能变电站的建设和发展,众多智能电子设备广泛投入使用,各类设备监测信息的广度和量级大幅提升,变电站也逐步转向少人或无人值守、集中监控的运维管理模式。多座变电站的各类监控告警信息会同时发送至集控中心,由中心监控人员对这些信息进行分析处理并进一步完成控制和决策。变电站告警信息包含大量蕴含电网运行和设备状态的潜在重要信息,具有数量庞大、含义丰富、出现频率高的特点。但在现有情况下,变电站告警信息经采集上传后,仅按照时间顺序简单排列直接显示在监控窗口中,并未对其进行有效梳理、分析和利用,很多的重要信息隐藏在大量刷屏信号中无法被及时发现。因此本文以变电站告警信息为研究对象,对告警信息进行数据挖掘,通过智能算法梳理、解析并挖掘告警信息内部包含的故障知识与规则,并在此基础上进一步探究故障诊断应用,帮助监控人员提升工作效率的同时也为他们及时地提供故障后决策辅助,具有很好的现场应用价值。本文具体的工作及成果如下:针对现有变电站告警信息的无规律显示问题,本文首先分析并设定告警信息的三种类别,采用深度学习中的深层网络模型进行告警信息分类。通过分词和文本向量化方法将信号语句转化为词汇组合并进一步将词汇转化为分布式词向量。随后分析了长短期记忆网络的基本原理和双向长短期记忆网络的模型结构,利用MATLAB构建BiLSTM模型并进行告警信号分类,通过实验结果分析证明分类模型的准确性。为能够获取变电站告警信息文本中的各类关键信息,实现对变电站告警信号文本的解读,本文分析了告警信息中包含的关键内容属性,进而形成解析内容的规范化框架。随后设计基于字符串匹配算法的告警信息语义解析方法,完成信号文本中包含的设备、部件、行为等实际含义的词语获取。为了使信号解析内容可供计算机识别和后续智能应用,建立告警信号解析内容XML模板并分析了基于DOM的XML文档操作方式。为了实现从告警信息数据到有效知识的提升,在告警信号分类和语义解析的基础上,本文利用知识图谱技术挖掘告警信息中隐含的可用于故障诊断的故障知识。“实体-关系-实体”三元组是知识图谱的基本单元,本文定义了适合告警信号的实体与关系,之后设计描述两两告警信号对的特征向量,并基于分类算法实现关系抽取。根据告警信息分类结果,由事故动作告警信号集构建事故类告警信号行为图谱,由设备异常告警信号集构建异常类告警信号设备行为图谱,并实现图谱可视化。最后结合知识推理方法进行故障诊断应用,案例分析表明了利用构建完成的知识图谱进行发生事故后的信号行为判别和故障诊断的可行性,为故障诊断提供决策支持。

基于文本挖掘中药复方治疗胶原诱导型关节炎大鼠的研究

这是一篇关于文本挖掘,复方,类风湿关节炎,CIA大鼠的论文, 主要内容为目的:运用文本挖掘技术总结中医药治疗类风湿关节炎的用药规律,并按照这些规律拟定复方,初步研究文本挖掘复方对类风湿关节炎模型大鼠的药效作用,探索其对胶原诱导型类风湿关节炎大鼠的免疫调节系统的影响,并以此讨论该文本挖掘方法在中医药治疗类风湿关节炎复方的应用前景。 方法:以“类风湿关节炎”为主题检索关键词,检索中国生物医药文献数据库,获取类风湿关节炎用药的相关信息,提取中药用药品种与频次,统计分析后得出潜在治疗类风湿关节炎的中药复方。复方由桂枝、知母、白芍、黄芪、当归、独活、羌活等七味中药组成,经由提取、浓缩、干燥之后,制得复方干粉,作为动物实验用药。60只雄性SD大鼠,随机分为正常组和造模组,造模组采用尾根部注射Ⅱ型胶原的方法建立CIA模型,大鼠成模后又分为模型组、地塞米松组、低剂量组、中剂量组、高剂量组。地塞米松组腹腔注射给药地塞米松,复方低、中、高剂量组分别灌胃给予不同浓度的复方干粉溶液,正常组和模型组大鼠灌胃给予等体积的生理盐水。连续给药3周,初次给药后每3天评定一次双侧关节积分。末次给药24h后麻醉采血,测定血清中IL-1β、IFγ TNF-a、IL-17的含量,并测定C-Ⅱ抗体IgG的含量:流式细胞术测定脾中CD4+、CD8+T细胞含量。同时采集大鼠膝关节,经多聚甲醛固定并进行脱钙处理后,石蜡包埋切片,伊红-苏木素染色后镜下观察病理变化。 结果:病理方面,复方给药后,模型组大鼠的病理改变有所缓解,主要表现为滑膜细胞增生抑制,血管翳形成减少,炎症细胞浸润明显减少,关节软骨损伤有所减轻,软骨表面较为光滑平整。经给予文本挖掘复方治疗后,CIA大鼠的关节积分与模型组相比无明显变化,脾脏和胸腺的脏器指数有下降趋势,但差异不明显。血清中IL-1β、TNF-a和IL-17的含量下降,IFN-γ含量上升,IgG含量提高,脾细胞中CD4+T/CD8+T的比例下降。 结论:该文本挖掘复方对CIA大鼠的关节肿胀无明显影响,但可以延缓大鼠关节病变速度,改善病变程度,并可调节其免疫系统功能。这提示文本挖掘技术在类风湿关节炎用药规律探索中有一定作用和意义,但具体操作方法尚有待改进。

基于文本挖掘的科学家多样性评价及分析

这是一篇关于文本挖掘,科学家评价方法,学科分类,多样性指标的论文, 主要内容为科学家评价体系可为创新科学、认识科学家、提高国家科研水平提供依据。目前的科学家评估体系主要是分析学者的科研属性指标,即通过其论文产出相关指标、获奖项目指标等评估科学家,虽然这些科研指标与科学家评估有着密切联系,但不意味着科学家评估就是单一的科研评估。目前的中国社会经济处于高速发展的变革时期,许多关键问题、技术难点的解决需要融合多学科知识的人才,若将科学家评估简化为科研评估,可能会对国家和科研人才的培养产生阻碍,不利于科学家多样化发展。针对该问题,本文将以科学家的学科多样性为基本视角,从科学家的网页分析着手,引入文本挖掘技术来对科学家的所属学科进行分类,并基于分类结果从本质上去分析科学家所属学科之间的多样性来评价科学家,以国家为整体来比较国家之间的科学家学科多样性,促进科学家评价体系的改革以及学科多样化发展,不失为一条有效途径。本文的研究主要包括以下阶段:1)整理国内外有关于科学家评价的文献,得出本文的研究内容、方法、意义,并介绍相关理论知识。2)基于WOS公开发布的截至2021年全球Top科学家排名数据,使用知识图谱与可视化技术,从宏观层面分析了全球科学家分布形式及其论文产出,得出了领先国家与领先学科,对科学家产生主观认识。3)使用网络爬虫技术,爬取19万个科学家的网页文本信息,使用前沿的自然语言处理算法挖掘科学家网页信息,从而构建了科学家学科多分类模型,并基于分类模型的结果得出科学家的潜在学科,并对各个国家的科学家进行了学科多样性分析及比较,得出相关结论。研究结果表明:1)基于知识图谱、可视化分析方法,根据科学家的特征数据得出在WOS的排名体系下,国家的上榜科学家人数与是与其发文总数成正比的。2)通过文本挖掘技术,爬取到了上榜的190067名科学家的网页信息,对其进行分词、关键词提取、词向量转化后,使用分类模型进行建模,通过混淆矩阵以及宏平均等指标对分类算法的结果进行对比分析,计算模型的查全率、查准率、AUC、F1值来评判模型的性能,并找出了最适合学科多分类及多样性分析的算法。3)基于学科分类的结果,使用层次分析法计算指标权重,得出丰富度、均衡度、差异度等维度的指标权重,对科学家的学科多样性进行量化,最终给出了科学家学科多样性的综合得分及其排名。结果表明:相较于美国、英国等国家,以色列、挪威等国家上榜的科学家人数较少,但其科学家多样性得分较高,从现实的科技发展情况来讲,与本文的研究初衷较为符合。我国的科学家多样性综合得分排名第九,相较于发文排名没有变化,相较于美国、英国等科学家而言其h指数、学科均衡度较高,但学科差异度、丰富度较低,由此得出我国的科学家在诸多个学科领域的研究水平较为均衡,在学术产出的数量上有较大优势。对于本文的研究内容,主要有以下贡献:一是提出了以文本挖掘为主导的相关理论,能够从网页文本中挖掘出科学家的潜在学科来分析学科多样性,创新了学科多样性分析的思路及学科分类的意义。二是丛科学家学科多样性角度入手,一定程度上改变了传统的科学家评价方法,是一次全新的尝试,有利于科学、教育部门对学科多样性建设、科学家评价等提出意见。

基于迁移学习和文本挖掘的PubMed文献数据库药物不良反应识别通用算法与系统研究

这是一篇关于药物不良反应,文本挖掘,迁移学习,文献数据库的论文, 主要内容为目的:药物不良反应(Adverse drug reaction,ADR)是在新药研发过程中必须考虑的核心因素之一。随着步入老龄化社会,复杂和多发的并发症与合并疾病患者数量激增,治疗方法日益复杂。药物不良反应(ADR)已经是现代医疗保健系统面临的一大挑战。然而,目前尚无从文献数据库中一站式自动化提取药物不良反应的高效率开源式的解决方案。本研究旨在开发一个通用算法系统,使用者仅需提供目标药物的Me SH词检索策略(例如,"Aspirin/adverse effects"[MAJR]),能够自动地实现从Pub Med文献数据库中识别并提取药物不良反应功能,帮助科研工作者从生物医学文献中发掘药物不良反应信息,为辅助临床用药和公共卫生药物监测提供参考依据。研究方法:本研究主要分为两部分:1、ADRNLP药物不良反应识别通用算法系统的设计。2、利用该算法系统进行案例应用(二甲双胍、奥马珠单抗、100种FDA获批的新药)1、设计ADRNLP药物不良反应识别通用算法系统:(1)利用文本挖掘技术构建基准数据库。本项目收集了近20年间Pub Med文献数据库中与阿司匹林不良反应相关的文献,借助文本挖掘技术对文献进行信息提取和文本处理,从而构建阿司匹林基准语料库,用于下游训练并微调迁移学习模型。(2)基于Bio BERT模型微调训练迁移学习模型Bio BERT+Aspirin模型。本研究以随机从阿司匹林基准数据集抽取的10000个阿司匹林句子为训练集,对Bio BERT模型进行微调训练,训练形成Bio BERT+Aspirin迁移学习模型。针对模型的评估与验证,本项目以业界金标准ADE数据集和自行归纳数据集(阿司匹林数据集)为校验基准,以F1-score值作为评估指标,比较基准模型(Bio BERT)和微调模型(Bio BERT+Aspirin)的性能。(3)利用可视化知识图谱分析系统Grakn软件可视化预测结果。本研究针对迁移学习模型的预测结果,构建一个Grakn软件可视化ADR的算法可视化模型预测结果,便于研究者分析和研究ADR。2、利用ADRNLP算法系统进行案例应用。本研究通过3个案例详实展示ADRNLP算法系统在药物不良反应识别领域应用的巨大潜力。(1)识别/预测二甲双胍的不良反应;(2)识别/预测奥马珠单抗的不良反应;(3)识别/预测100种2018至2020年FDA获批的新药不良反应。结果:1、本研究成功搭建ADRNLP算法系统,且ADRNLP算法系统的核心模型性能表现优异。在模型基本性能方面,迁移学习模型Bio BERT+Aspirin模型在预测阿司匹林验证集获得的F1-score值为0.949,较基准模型Bio BERT模型(F1-score值:0.697)有大幅提高,提高了0.252。在迁移学习能力方面,Bio BERT+Aspirin模型在预测ADE数据集获得的F1-score值达到0.833(Bio BERT为0.733),Bio BERT+Aspirin模型提高了0.100,Bio BERT+Aspirin模型迁移学习能力表现更优异。2、ADRNLP算法系统在识别ADR应用取得巨大的潜力。(1)ADRNLP算法系统从Pub Med数据库中总共识别出107种二甲双胍的不良反应。本研究从文本挖掘形成的二甲双胍数据集共识别出771个包含二甲双胍不良反应的句子,累计107种ADRs。我们将此结果与SIDER数据库对比发现其中35种不良反应在SIDER数据库有记录,其余72种ADR尚未被SIDER收录。我们还利用Cytoscape软件构建ADRNLP结果与SIDER数据库交互网络图,发现与二甲双胍相关的临床研究的热门趋势。(2)本研究算法系统从Pub Med数据库检索发现144篇文献与奥马珠单抗不良反应相关的文献。迁移学习模型最终识别出13句包含奥马珠单抗不良反应的句子。经Grakn知识图谱软件分析表明其存在9大不良反应,分别为:三相性过敏性休克、荨麻疹、头痛、中风、血管性水肿、嗜酸性肉芽肿性多血管炎、过敏反应、脱发和变应性肉芽肿性血管炎。(3)ADRNLP算法系统应用于100种FDA批准新药的结果发现,算法系统从Pub Med文献数据库中识别出72种药物的290种不良反应,研究频次最高的药物和不良反应分别是氨磺必利和腹泻,分别占总频次的19%和5.03%。我们利用Cytoscape软件分析药物不良反应交互网络发现,59种药物之间具有相同的不良反应,其余13种药物与其他药物不存在重叠的不良反应。此外,利用g CLUTO软件对药物—ADR共现矩阵进行聚类分析,最终将72种药物—290不良反应共现矩阵聚为7类。结论:本研究成功构建一个药物不良反应识别算法系统。研究者只需提供药物的Me SH检索策略,我们研发的药物不良反应识别系统ADRNLP就可以自动、准确并稳定地从Pub Med文献数据库识别并提取药物不良反应。我们证明了用小型数据集微调的迁移学习模型是检测各种药物不良反应的合适的通用解决方案。鉴于从大规模医学文献出版物中识别药物不良反应的需求不断增加,我们认为我们的算法系统是应对当前药物不良反应挑战的潜在有力选择。

基于文本挖掘构造投资者情绪对股票市场表现的影响

这是一篇关于文本挖掘,TF-IDF特征,朴素贝叶斯算法,股票市场,网络信息的论文, 主要内容为随着科技带领我们进入新的时代,以机器学习为基础的数据挖掘方法已被广泛应用于许多领域。在金融领域中财股票股吧的兴起,使得我国的个人投资者习惯于在该类互联网平台上收集所需的金融信息并共享自己的投资观点。所以本文采取了交叉学科的研究视角,采用文本挖掘的方法构造投资者情绪,并和相应的个股市场表现进行实证研究。本文以流量第一的东方财富个股吧作为文本原始数据来源,通过搭建爬虫系统抓取3,484,860条帖子,并以机器学习的视角,结合TF-IDF特征和朴素贝叶斯算法建立了文本情感分类模型。最终,本文构建了四种类型的投资者情绪来研究不同网络信息特征对市场的影响。本文结果表明:首先,投资者情绪趋势指数在解释股票收益率上有很好的表现,并且在未来股票市场中可以获得短期收益。基于文本挖掘方法构造的投资者情绪指标比通过传统方式构建的投资者情绪指标有更强的解释能力。其次,在间接关注类指标中,日访问量对于交易量和波动率的解释能力最强,而且带滞后期的日访问量对波动率有很强的解释能力。在不同市场周期下,熊市中构建的投资者情绪对股票市场表现的影响较牛市时更强。最后结合网络发帖的特征,构建了不同月份和周内的投资者情绪并进行了差异分析。

农产品消费者满意度影响因素研究——以京东稻米评论为例

这是一篇关于文本挖掘,情感词典,PMI算法,情感分析,CCSI,消费者满意度的论文, 主要内容为在互联网+的信息时代,随着农产品电商平台的不断发展、交易量的迅猛增长,消费者对产品或服务的满意程度对商家、电商平台的发展起到至关重要的作用。由于当前基于评论的消费者满意度研究鲜有面向农产品的研究,学者们对于农产品消费者的满意度情况关注度较低。并且,多数研究中的分析方法和模型获取方式难以客观、有效地衡量消费者的真实情感态度。因此,合理量化消费者对产品特征的情感,是深入探究消费者满意度影响因素的有效手段。本文运用JAVA语言设计了爬虫程序以采集稻米在线评论数据;结合语义分析技术和情感分析手段量化产品特征的情感值;以消费者满意度理论、文本情感分析技术为基础构建了改进的CCSI消费者满意度指数模型;并应用多元回归分析法研究了产品特征与消费者整体满意度的关系,为产品商家及电商平台营销策略的制定与提升提供理论依据。论文主要从以下几个方面展开了创新性研究:(1)为有效利用评论文本数据,深入挖掘了消费者的满意度情况。首先,重构了知网、NTUSD及中文词汇本体库三种主流情感词典。其次,采用改进的PMI算法,结合人工标注候选情感词方法,构建了基础情感词典,为评论文本中的特征评价单元合理量化提供依据。(2)研究了抽取评价单元并计算情感值的方法。首先,基于LTP语言技术平台中分词、词性标注及语义分析功能模块识别评价单元,同时应用JAVA语言解析XML结果文档,抽取特征评价单元及情感评价单元。其次,结合评价单元的句法依存关系以及标注的词性,设计情感值计算规则,定量化评价单元承载的情感态度,将量化结果作为CSI模型中解释变量数据。(3)为研究传统CCSI模型中前置变量与消费者满意度的关系,构建了消费者满意度指数模型。同时,为压缩结果变量及解释变量量纲,运用min-max方法对模型数据进行标准化处理。(4)运用统计学方法研究评论文本中挖掘的产品特征对消费者整体满意度的影响。研究了各个特征在整体满意度中的影响权重,其中对稻米消费者满意度影响最显著的因素是口感和服务,其次是品牌、外观及物流,影响最小的因素是价格。

基于电商平台数据的网购风险测度及消费行为选择

这是一篇关于消费者行为,网购风险,评论有用性,贝叶斯网络模型,文本挖掘的论文, 主要内容为近年来,在数据作为关键生产要素的背景下,数字经济已经成为我国经济高质量发展的重要驱动力,以京东、天猫、拼多多为代表的电子商务平台作为数字经济的重要组成部分得到了迅猛发展。电子商务的发展伴随着新兴的购物模式,电商平台积累的海量数据成为消费者认知网购风险的主要信息来源,消费者面对异于传统购物模式的网购风险时如何做出购物选择值得研究。采集天猫和京东平台共计820个智能手机商品详情和店铺信息及42万余条智能手机在线评论数据,提出有用在线评论提取方法和网购风险评估方法,融合在线评论、商品参数和店铺信息,依据网购风险评估结果建立消费者网购行为选择因果关系模型。主要研究内容如下:(1)基于随机森林的有用在线评论提取方法研究。利用双重过程理论将在线评论有用性的影响因素分为11个信息因素和4个规范性因素;利用特征分析和情感分析方法将在线评论数据结构化,据此挖掘这15个影响因素。针对京东评论数据构建在线评论有用性随机森林预测模型,模型的为0.855,利用该预测模型提取天猫平台的有用评论,结果发现24%的天猫智能手机在线评论为无用评论。(2)融合在线评论、商品参数和店铺信息的网购风险评估方法研究。首先对网购风险的形成机制进行分析,将网购风险划分为商品风险、商家风险和物流风险三个维度,并构建网购风险评价指标体系。利用K-means聚类方法将网购风险划分为低风险(I)、中低风险(II)、中高风险(III)和高风险(IV)4个等级。将指标数据以4:1的比例分为训练集和测试集,利用朴素贝叶斯、决策树、随机森林、支持向量机分类器,对网购风险评估的准确性进行验证,结果表明基于有用在线评论的指标数据能够提高风险评估的准确性,且随机森林的分类效果高于其他三类分类器,预测的准确率为99%。(3)基于贝叶斯网的消费者行为选择研究。考虑指标间的结构关联和相互影响程度,利用决策树反推风险指标的划分区间,选择“消费者行为选择-三维网购风险-风险指标”三层贝叶斯网络模型对消费者行为选择进行动态建模。通过敏感性分析发现商品风险、物流风险和商家风险对消费者行为选择的影响依次减弱,且风险指标中物流服务得分和物流服务评论情感得分对消费者行为选择的影响大于商家风险;进行因果推理和诊断推理,结果发现高风险是消费者选择拒绝购买产品的充分条件。本文提出的有用在线评论提取方法能够有效缓解信息过载问题;网购风险评估方法有助于防范和化解网购风险,净化网络购物环境,提高消费者的满意度;消费者行为选择规律能够为电子商务平台挖掘消费者行为特征、促进消费升级提供可行的途径。

本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码小屋 ,原文地址:https://m.bishedaima.com/lunwen/45484.html

相关推荐

发表回复

登录后才能评论