基于深度学习的多维特征虚假评论检测算法研究
这是一篇关于虚假评论检测,多维特征,深度学习,注意力机制的论文, 主要内容为随着电子商务的迅速发展,网上购物逐渐发展成为人们购物的主要方式。由于网上购物中的消费者与电商平台商家信息不对称的特点,在网上购物的过程中,电商平台中的商品评论信息逐渐成为消费者网购决策的主要依据。但是,由于利益的驱使,越来越多的商品虚假评论信息出现在消费者面前,并且由于网络水军、网络职业写手的存在使得商品的虚假评论与真实评论的区分难度越来越大,使得消费者不能直观的获取到买家对商品购买体验与使用体验的反馈信息,因此商品虚假评论检测研究随之展开。随着研究者的不断努力,越来越多的虚假评论检测方法被提出来。然而面对当今虚假评论具有很高仿真性的特点,当前的虚假评论检测方法慢慢暴露出局限性:基于评论内容特征的检测的传统机器学习方法,对于自然语言处理领域,语言特征的提取对于领域知识具有很强的依赖性,算法识别能力较差,泛化能力较弱,误判率较高;人为虚假评论具有很高的仿真性,单纯从评论内容这一维度特征构建模型对虚假评论识别具有一定困难。针对以上问题,本文提出了一种基于深度学习的多维特征虚假评论检测模型。该模型使用深度学习中的双向长短时记忆网络模型(Bi-LSTM)来获取商品评论文本内容的上下文语义信息特征来取代传统机器学习中人工特征选择过程。同时加入评论内容自身特征、评论者行为相关特征、商家行为相关特征并使用卷积神经网络(CNN)通过不同步长的卷积核(filter)进行特征组合来帮助区分仿真性很高的难以识别的虚假评论。最后本文将注意力机制(Attention Mechanism)加入到基于深度学习的虚假评论检测模型中来调整多维特征对最终分类结果的影响权重,提高模型检测的准确率与召回率,同时注意力机制可以对特征权重高可视化输出展示,提高用户对虚假评论识别的置信度。
基于信任度和虚假评论检测的推荐算法研究
这是一篇关于推荐系统,协同过滤,用户信任,虚假评论检测的论文, 主要内容为随着互联网技术的飞快发展,互联网信息爆炸式增长,导致信息过载问题。推荐系统是解决信息过载的重要工具。个性化推荐系统中的协同过滤推荐是目前为止应用最广泛的推荐技术。但是随着推荐系统的广泛应用,推荐算法存在着严重的数据稀疏、冷启动和数据安全等问题。推荐算法自身不能有效去除恶意数据,为有效解决这几个问题,本文对推荐系统中的虚假信息进行处理,并围绕基于信任度以及矩阵分解技术的协同过滤推荐算法展开研究。本文的主要工作和创新如下:随着电子商务的快速发展,平台内存在大量的虚假信息,严重干扰了平台的推荐系统,使得推荐给用户的项目满意度下降,本文提出融合情感极性与D-S理论的虚假评论检测方法,综合考虑了评论者行为特征,评论文本特征以及评论文本情感极性特征,构建多维特征模型。利用单特征下的支持向量机模型初步识别结果作为独立证据计算基本信任函数,再利用D-S证据理论进行决策级融合,并根据识别框架下的证据支持度对评论进行判断。从大众平台爬取数据作为数据集进行实验。在算法对比中,本文提出的算法在检测性能上优于相关文献提出的检测算法。在web2.0时代社交网络普及,基于社交网络推荐算法引起研究者的关注。针对目前信任关系考虑不全问题,本文提出基于综合信任的社会化混合推荐算法。该算法考虑了用户的综合信任度,构建信任矩阵。并且考虑了项目间的关联度,结合概率矩阵分解模型实现混合推荐算法。该算法在Epinions数据集上实验取得了不错的效果。然后结合数据检测技术再一次实验,通过虚假评论检测技术处理后的数据运用到基于综合信任的推荐算法系统中,与没有经过处理的数据推荐结果对比。检验本文算法的鲁棒性以及推荐效果是否得到提升。在Epinions数据集上实验表明,通过数据处理后的基于信任推荐算法在推荐评分误差以及算法鲁棒性都取得了提高。
基于混合神经网络与注意力机制的虚假评论检测研究与实现
这是一篇关于虚假评论检测,BERT,混合神经网络,注意力机制的论文, 主要内容为近年来,随着互联网的高速普及与发展,特别是4G、5G移动网络的不断建设与完善,网络购物逐渐成为了人们的日常生活习惯,越来越多的网民愿意在电商平台或点评网站上通过发表评论的方式与其他用户分享它们对于所购商品的消费体验与使用评价,而这些评论内容也成为了潜在意向用户做出消费决策时的重要参考,这同时驱使了一批不法商家及群体刻意制造虚假评论干扰消费者的购买意向,进而损害消费者与合法商家的权益。虚假评论的产生严重扰乱了网购平台的购物秩序,破坏了公平的购物环境,影响了消费者正常的购物取向与消费体验。因此,实现对虚假评论的检测与过滤具有十分重要的社会价值与现实意义。本文基于评论文本特征对词嵌入技术、神经网络模型与注意力机制进行了研究与改进,提出了一种结合注意力机制的混合神经网络模型实现对虚假评论的检测,具体研究内容如下:(1)本文研究和分析了适用于虚假评论检测的深度学习模型,针对目前基于评论文本的虚假评论检测只能提取单一文本特征而无法同时兼顾的问题,提出了双通道并行混合神经网络思想,构建了基于混合神经网络与注意力机制的虚假评论检测模型(CAHHAN)。CAHHAN模型在特征提取层并行设置了 Text-CNN与HHAN双通道混合神经网络分别提取评论信息的局部文本特征与全局文本特征,通过特征融合得到同时具有局部特征与全局特征的文本特征向量;(2)为解决前述研究常用的静态词向量所面临的单一语义表征与一词多义问题,CAHHAN模型在词嵌入层运用BERT预训练模型,利用BERT模型的多头自注意力机制结合上下文语境获得符合单词实际语义的动态词向量,并进一步通过可视化研究验证了其捕获目标词上下文相互关系的能力;(3)本文进一步改进了注意力机制,提出了融合全局向量与最大池化向量的混合层次注意力机制与混合层次注意力网络(HHAN),并将其作为全局特征通道应用于CAHHAN模型中提取融合词、句两层注意力的段落层次化全局文本特征,获得更为明显的分类特征。本文通过对比实验分别检验了 CAHHAN模型中所运用的BERT预训练模型、混合神经网络思想与混合层次注意力机制的有效性,在九组对照模型实验中CAHHAN模型取得了最高的ACC与F1值,验证了 CAHHAN模型的检测效果。最后以CAHHAN模型为基础设计并开发了一套基于B/S架构的虚假评论检测系统。
基于深度学习的虚假评论检测
这是一篇关于虚假评论检测,深度学习,卷积神经网络,FastText,产品特征的论文, 主要内容为随着互联网的迅速发展,网上购物以其方便快捷的优势代替了实体店购物,已成为时下最流行的消费方式。出于谋利的目的,电商平台中出现越来越多的虚假评论,这在一定程度上误导消费者的购买趋向,致使消费者买到的商品与描述不符,逐渐丧失对电商平台的信任。为了净化电商环境,研究学者通过提取评论文本和评论者的各项特征并利用传统分类器进行虚假评论检测,虽然这类方法取得了一定的成果,但是提取特征的过程中依赖于专家知识,而且没有考虑相关产品的特征,不具有广泛应用性。虚假评论一般会比真实评论使用更多情感词描述目标产品的特征,针对不同的目标产品,虚假评论者会对不同的特征进行描述,为了使得检测方法适用于不同领域,本文利用产品的相关特征,结合深度学习方法提出了两种虚假评论检测模型。第一种是融合产品相关特征的虚假评论检测方法,该方法将产品相关特征与评论文本组合,以此作为输入来训练卷积神经网络模型实现虚假评论检测,最后将该算法与两个有效的传统分类器组合,降低了过拟合问题,提高检测准确率。第二种是基于FastText的虚假评论检测方法,该方法首先使用语料库训练Word2Vec模型,基于该模型扩充了产品特征词汇集,并建立文本向量,经过卷积层、池化层提取特征后,利用FastText实现分类,解决了产品评论数据集存在的类别不均衡问题,同时提高了模型的训练速度。为了验证算法的有效性,利用Python语言爬取了亚马逊网站的商品评论数据集,并基于该数据集分别针对上述两种算法设计了多组对比实验。实验结果表明,算法一利用产品相关特征有助于提高虚假评论检测的准确度,使用模型组合的方式可以降低过拟合问题。算法二训练Word2Vec进行文本建模能够更好地表示文本的深层语义,使用FastText分类能够解决类别不均衡的问题,提高准确度,同时缩短模型在数据量较大情况下的训练时间。
商品虚假评论检测技术研究及软件实现
这是一篇关于虚假评论检测,数据集构建,深度学习,BERT,BiLSTM的论文, 主要内容为电商平台已成为各类商品的重要销售渠道,消费者在电商平台购买商品时,往往会将商品评价作为重要的参考。面对利益诱惑,一些商家会采用雇佣网络水军刷单、返现奖励等方式诱导消费者发布商品的好评信息,制造虚假评论。虚假评论不是评论者对商品的真实使用体验,会误导消费者,严重损害消费者权益,因此,对商品虚假评论进行检测识别具有重要的现实意义。本文对商品虚假评论的特征及检测方法进行研究,在此基础上,使用Tensor Flow深度学习平台与WEB开发技术设计、实现针对中文的商品虚假评论检测软件,使用神经网络模型对商品评论进行分类检测,为消费者在购买商品时,对商品评论的真伪进行甄别提供参考。本文的主要工作有:首先,对电商平台中的商品虚假评论进行研究,发现其特征。其次,针对缺乏相关中文虚假评论数据集的问题,利用爬虫工具获取中文电商平台的商品评论数据,并进行标注,构建商品虚假评论数据集。最后,根据中文评论数据字词含义与上下文相关联,灵活多变的特点,本文采用深度学习技术,将虚假评论检测作为文本分类任务,建立BERT-BiLSTM商品中文虚假评论检测模型。与只采用评论文本内容作为训练数据的模型相比较,将评论者ID数据项作为一维特征加入模型训练数据后,模型准确率提升超过12%,达到95.26%,召回率提升超过32%,达到94.96%,F1值提升超过15%,达到95.22%,实验结果表明,通过加入评论者ID数据项为模型提供了更丰富的虚假评论特征,同时证明BERT-BiLSTM模型在虚假评论检测任务中具有良好的效果。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设向导 ,原文地址:https://m.bishedaima.com/lunwen/49159.html