基于粗糙集和注意力的协同过滤推荐方法研究
这是一篇关于协同过滤,数据稀疏性,评论文本,注意力机制,粗糙集,评分预测的论文, 主要内容为随着互联网技术的迅猛发展,衍生了海量网络数据资源,信息过载问题愈发严重,如何高效获取有用信息成为当今社会的热点关注问题。推荐系统能够有效过滤不相关信息,主动为用户推荐符合其兴趣或需求的内容,缓解了信息过载问题对用户造成的困扰。目前,主流的推荐算法是协同过滤技术,它通过从用户历史行为信息中挖掘用户偏好进行推荐,但评分数据稀疏性和冷启动问题一直制约着协同过滤技术的发展。为解决上述问题,提升推荐准确性,本文从两个方面展开了研究,一方面添加评论文本作为辅助信息,通过充分挖掘评论文本来全面刻画用户偏好和商品属性特征,进而提升推荐质量;另一方面将稀疏的评分矩阵看作是不完备信息系统,利用粗糙集在处理在不完备数据上的优势,有效填补缺失评分值,从而改善数据稀疏性。具体的工作体现在三个方面:(1)提出了一种融合双重注意力机制的深度推荐模型(MSDA)。该模型在基于矩阵分解的协同过滤推荐算法中引入了评论文本信息,首先采用卷积神经网络提取评论文本特征,然后为学习有用性评论下用户-商品特征之间的相关性,先后设计了评论级别的注意力机制和共同注意力机制;最后,为全面刻画用户偏好和商品属性特征,将评论潜在特征与矩阵分解得到的评分潜在特征相融合,并利用神经因子分解机建模复杂的用户-商品评分行为,以实现评分预测。实验结果表明,相比于NARRE、HRDR等基准方法,MSDA能有效挖掘评论文本信息提升推荐质量。(2)提出了一种基于粗糙集的不完备混合信息系统填补算法(HIRS)。首先,为避免决策规则冲突,该算法优先填补决策属性缺失值,并将填补后的决策属性作为等价关系来划分信息系统;其次,为提高样本在混合属性下的相似度量准确性,从定性和定量角度对属性进行了细分,并针对不同类型属性定义了相应的距离度量方式;最后,结合k近邻思想填补缺失条件属性值,从而得到完备化的信息系统。实验结果表明,相比于ROUSTIDA、RSHISMIA等基准方法,HIRS的填补性能得到了显著提升。(3)在前两个工作的基础上,结合评论文本和粗糙集理论在缓解数据稀疏性上的优势,提出了一种基于粗糙集的协同过滤推荐模型(MSDA-RS)。该模型首先结合K-means++算法和改进的HIRS-SM算法对原始稀疏的评分矩阵进行缺失值填补,得到稠密的评分矩阵;然后,将稀疏性处理后的稠密评分矩阵输入到第一个工作提出的推荐算法中,与评论文本一起进行深度建模,最终输出评分预测值。实验结果表明,相比于MSDA模型,MSDA-RS的评分预测性能进一步得到了显著提升,充分验证了本文所提方法的有效性。
基于机器学习的评论情感分析系统设计与实现
这是一篇关于情感分析系统,情感分析,关键词提取,粗糙集,词向量的论文, 主要内容为随着移动互联网的快速普及,人们使用网络的目的也发生了巨大变化,电商平台的出现也极大的改变了人们的消费方式,随之而来的互联网评论信息也使得人们在进行决策行动之前有了更多的参考。就各大酒店预定平台使用过程来说,用户通过浏览酒店的评论信息来获得更直观的判断。通过对酒店的评论数据进行情感分析,可以清晰地了解到用户对于酒店的客观评价以及入住体验,从而帮助其它用户进行快速决策,选到合适的入住酒店,降低用户的选择时间成本。对于中文文本情感分析任务来说,结果的好坏很大程度上取决于情感特征的构建,由于中文文本表达形式多样,情感特征往往存在空间维数高,表示稀疏,缺乏文本语义信息等问题。为了解决以上问题,本文以机器学习算法为基础,结合自然语言处理的语言模型,对文本情感特征提取与表示方法进行研究,使用机器学习模型来进行情感极性判别分析。并且基于所提情感分析模型,设计并实现了酒店评论情感分析系统,用户可以通过本系统查询太原市的酒店分布地图,酒店满意度地图,以及酒店评论的情感分布等信息,最重要的是,本系统可以针对用户酒店评论信息进行实时情感分析。具体来说,本文主要包括以下3个方面的工作:(1)酒店评论语料库的构建:由于标准数据集在实际情感分析任务过程当中的不足,本文结合现有的网络爬虫原理以及相关技术方法,对去哪儿网酒店评论信息进行采集与存储,构建了积极、消极两种情感类别的大规模酒店评论语料库。(2)中文文本特征提取与表示方法的研究:本文将结合不同的词向量在进行文本表示中的差异,融合多种词向量的优势,详细介绍了基于粗糙集和多通道词向量的文本情感词特征表示方法RS-Word2vec⊕Glo Ve(RS-Wv Gv)的实现过程。(3)酒店评论情感分析系统的设计与实现:本文设计并实现了基于机器学习的酒店用户评论情感分析系统,将所提中文文本情感分析模型嵌入到情感分析系统相关模块当中,满足用户的数据可视化与情感分析的需求。
基于机器学习的评论情感分析系统设计与实现
这是一篇关于情感分析系统,情感分析,关键词提取,粗糙集,词向量的论文, 主要内容为随着移动互联网的快速普及,人们使用网络的目的也发生了巨大变化,电商平台的出现也极大的改变了人们的消费方式,随之而来的互联网评论信息也使得人们在进行决策行动之前有了更多的参考。就各大酒店预定平台使用过程来说,用户通过浏览酒店的评论信息来获得更直观的判断。通过对酒店的评论数据进行情感分析,可以清晰地了解到用户对于酒店的客观评价以及入住体验,从而帮助其它用户进行快速决策,选到合适的入住酒店,降低用户的选择时间成本。对于中文文本情感分析任务来说,结果的好坏很大程度上取决于情感特征的构建,由于中文文本表达形式多样,情感特征往往存在空间维数高,表示稀疏,缺乏文本语义信息等问题。为了解决以上问题,本文以机器学习算法为基础,结合自然语言处理的语言模型,对文本情感特征提取与表示方法进行研究,使用机器学习模型来进行情感极性判别分析。并且基于所提情感分析模型,设计并实现了酒店评论情感分析系统,用户可以通过本系统查询太原市的酒店分布地图,酒店满意度地图,以及酒店评论的情感分布等信息,最重要的是,本系统可以针对用户酒店评论信息进行实时情感分析。具体来说,本文主要包括以下3个方面的工作:(1)酒店评论语料库的构建:由于标准数据集在实际情感分析任务过程当中的不足,本文结合现有的网络爬虫原理以及相关技术方法,对去哪儿网酒店评论信息进行采集与存储,构建了积极、消极两种情感类别的大规模酒店评论语料库。(2)中文文本特征提取与表示方法的研究:本文将结合不同的词向量在进行文本表示中的差异,融合多种词向量的优势,详细介绍了基于粗糙集和多通道词向量的文本情感词特征表示方法RS-Word2vec⊕Glo Ve(RS-Wv Gv)的实现过程。(3)酒店评论情感分析系统的设计与实现:本文设计并实现了基于机器学习的酒店用户评论情感分析系统,将所提中文文本情感分析模型嵌入到情感分析系统相关模块当中,满足用户的数据可视化与情感分析的需求。
基于云计算的图像数据补全系统的设计与实现
这是一篇关于WSDCA,Spark,图像修复,粗糙集,样本块的论文, 主要内容为数字图像修复技术的目的是恢复受损图像的完整性。修复过程是指根据一定的规则填充受损区域中的图像像素,并且需要填充后的破损区域与原始图像的其他区域之间在视觉上过渡自然平滑,最大限度地减少修复的痕迹。随着大数据时代的到来,图像数据呈爆炸式增长,传统的算法存在时间复杂度高的问题,以Spark为代表的云计算框架成为分析处理海量图像数据的一个优秀解决方案。本文研究的是图像数据补全系统的设计与实现,重点是改进了基于匹配的样本块的图像修复算法。针对现有的Criminisi算法及其改进算法存在匹配准则不合理以及难以满足大规模图像处理的问题,本文结合粗糙集的理念,提出一种基于WSDCA(Weighted similarity Data completion algorithm)算法的样本块图像修复算法,并基于Spark框架设计实现了一套图像修复系统。本文所作的主要工作及取得的成果包括:(1)深入研究了基于匹配的样本块图像修复算法的三个关键步骤和存在的问题,找到了改进算法的思路。(2)提出了一种基于WSDCA算法的样本块图像修复算法。该算法使用WSDCA算法作为匹配准则的改进基础,结合粗糙集理论在填补缺失数据的良好效果,较好地解决了匹配准则的不合理问题。实验结果表明,改进后的算法在PSNR上提高了 0.2-3dB。(3)设计并实现了一个基于Spark框架的图像数据修复系统。系统主要包括图像上传模块、数据预处理模块、图像修复模块和数据可视化模块,并使用Java编程语言、SpringMVC和Mybatis软件体系架构编码实现了系统。(4)搭建测试环境,对设计、实现的系统进行了测试。测试结果表明,本系统能够有效地完成图像修复。
高端装备多项目协调机制及其平台技术架构研究
这是一篇关于高端装备,多项目管理,冲突消解,评价指标体系,粗糙集,平台技术架构的论文, 主要内容为高端装备制造业在国民经济发展和国家战略中占有重要地位。高端装备制造业具有行业范围广、产品门类多、应用领域广泛、拉动力强等特点。随着体制改革的深入,国家对高端装备制造业愈加关注,对其投资力度也不断加强,高端装备项目也随之不断增加。此时传统的人工的、粗放式的管理方式已难以满足高端装备多项目管理的要求,借助信息化技术和多项目管理方法建立合理有效的多项目管理平台,提高项目管理效率,辅助相关决策制定,成为当前行业主管部门面临的挑战。本文在信息化网络平台建设为背景的前提下,以多项目管理思想为基础,提出高端装备多项目管理存在问题。针对这些问题,寻求合理的解决方案并设计实现高端装备项目管理系统。主要研究体现在:(1)从高端装备多项目管理体系设计入手,分析高端装备多项目管理的业务流程、组织层次结构、及多项目管理各个阶段与组织层次的交互关系,提出面向首台套高端装备多项目管理的技术方法,为问题的解决提供方案。对面向首台套高端装备多项目管理系统建设的需求进行分析。(2)以多项目协调管理为目标,对高端装备多项目管理的冲突进行深层次分析,运用冲突消解技术方法,提出不同冲突主体的冲突解决方案。其中对于资源冲突采用基于二次分配的多项目资源优化配置方法,对多项目进行优先级排序,以此为基础对多项目的预留资源进行再分配,并运用实例进行验证。(3)为利用相关信息有效地辅助装备制造业相关决策制定,对装备制造多项目进行评价。首先建立与其相适应的评价指标体系,以评价指标为依据,运用粗糙集理论及数据挖掘方法对多项目的大量信息进行数据挖掘,从而提取相关的知识并进行知识表达。为多项目的评价建立相适应的衡量标准。(4)从平台技术架构方面探讨设计多项目管理系统,在此基础上本文选择J2EE体系,运用B/S架构与MySQL数据库开发此系统,最后将此平台运用于实践。
基于粗糙集理论的个性化推荐系统研究
这是一篇关于个性化推荐,粗糙集,协同过滤,规则提取的论文, 主要内容为随着互联网的发展,人们能够获取的信息资源愈加丰富,这些信息资源在方便人们生活的同时也引发了一定的问题。人们通常需要消耗大量的精力与时间来从庞大的信息库中找到自己想要的,所以使得“信息超载”越发严重,怎样从杂乱的信息里面搜集到人们真正需要的信息也需要快速的解决。推荐系统可以解决上述问题,它能够准确地给用户推荐其感兴趣的内容,进而实现个性化服务。然而,推荐系统发展至今仍面临一些问题:一是由于现实生活中物品的数量及种类多,用户对物品的评价数目有限,因此,在用户-物品评分矩阵中有许多未评分的项,导致用户-物品评分矩阵稀疏,产生了稀疏性的问题;二是每当有新物品加入时,往往会因为没有用户对新物品的评分信息,而使得新物品得不到推荐,产生了冷启动的问题;三是现有的推荐系统往往不能对用户进行准确地推荐,存在推荐质量较低的问题。本文阐述了个性化推荐系统的基础知识及相关理论,分析比较了现有的推荐算法,针对现有推荐算法的稀疏性、冷启动以及推荐质量低等问题进行研究并提出改进方法。本文主要工作如下:1、当前推荐系统的数据集较为稀疏,基于这个现象,本文先利用粗糙集理论对规则进行了提取,通过用户-物品评分矩阵和用户、物品属性搭建了相应的决策表,紧接着对获得的决策表进行约简以获得各条规则对应的核值形成核值表,最后得到核值决策规则,实现对其全部的约简,进而对还没评分的物品给予预测评分并填充原始的用户-物品评分矩阵以在协同过滤中计算相似度,缓解用户-物品评分矩阵中数据稀疏性的问题。实验表明,通过粗糙集理论进行规则提取,能有效缓解用户-物品评分矩阵的稀疏性问题,提高推荐算法的准确性。2、基于物品的协同过滤算法在计算相似度时仅仅依赖于用户-物品评分矩阵,没有考虑物品彼此之间存在的关联,当用户主观上对某些物品存在偏见时,往往会对该物品进行较低的评分,由于这些低质量评分的存在,使得推荐系统的准确性偏低。为降低用户主观偏见对推荐结果的影响,本文引入物品分类的概念,通过物品自身的属性信息,将物品进行分类。结合用户-物品评分矩阵,通过这两方面计算物品之间的相似度,实现符合目标用户偏好的个性化推荐。实验表明,通过引入物品的分类信息来计算物品之间的相似度,能有效提高推荐算法的准确性。
基于粗糙集的重叠社区发现算法研究
这是一篇关于重叠社区发现,粗糙集,密度峰值,距离动态模型,属性节点的论文, 主要内容为随着互联网的发展和社会的进步,各个领域每天都会产生大量相互关联、彼此依赖的数据,这些数据根据不同的主题形成了不同的复杂系统。我们将复杂系统抽象成复杂网络,即将复杂系统中的研究对象看作复杂网络中的节点,将对象之间的联系看作网络中的边。对复杂网络的理解和分析可帮助我们根据不同主题挖掘不同的知识,发现其中隐藏的信息从而对问题进行处理和预测。挖掘网络中的社区结构是复杂网络中的一项重要研究内容,在推荐系统、信息传播、行为预测和数据挖掘等各方面起到了不可代替的作用。社区结构的重叠节点在实际生活中普遍存在,重叠社区发现算法使得划分的社区结构更有效。复杂网络除了表现出重叠性之外,还具有动力学复杂性,即社区结构中的节点状态不断改变。在实际网络数据中,除了包括网络的拓扑结构信息,还含有丰富的节点属性信息。目前一些社区发现算法未能很好地刻画出社区的重叠区域,且没有考虑到节点的动态性和属性信息等。针对网络具有重叠性、动态性和节点富含属性信息,本文具体工作有以下三个方面:1.提出了一种基于粗糙集和密度峰值的重叠社区发现算法。该算法在传统的节点局部相似性度量基础上,结合灰色关联分析方法得到节点的全局相似性,进而将其转化为节点间距离。将密度峰值算法的思想应用在该方法中,根据网络结构自动选取中心节点。结合粗糙集理论,根据距离比例关系,定义了社区的近似集和边界域,针对边界域进行计算,得到重叠社区结构。实验验证了该算法具有有效性和可行性。2.针对网络社区结构的重叠性和动态性,提出了一种基于粗糙集和距离动态模型的重叠社区发现方法。该算法首先根据网络的拓扑结构,结合节点度中心性和定义的全局距离得到K个中心节点,然后结合粗糙集理论和距离动态模型的思想,根据边界域与下近似集节点间相连的边的距离变化,缩小边界域节点,迭代找到最佳的重叠社区结构。最后根据两条规则处理“伪”重叠节点。实验验证了改进算法的可行性和有效性。3.网络除了含有拓扑结构信息,还富含节点属性信息。针对网络社区结构具有重叠性和属性节点,提出了一种结合网络结构和属性的基于粗糙集的重叠社区发现算法。首先在传统的节点局部属性相似性和节点局部结构相似性的基础上,定义了融合两者信息的全局节点相似性,进而转化为节点全局距离,然后结合节点聚集系数和节点全局距离得到K个中心节点,最后结合粗糙集理论划分重叠社区结构。实验结果表明该算法的有效性和可行性。
基于云计算的图像数据补全系统的设计与实现
这是一篇关于WSDCA,Spark,图像修复,粗糙集,样本块的论文, 主要内容为数字图像修复技术的目的是恢复受损图像的完整性。修复过程是指根据一定的规则填充受损区域中的图像像素,并且需要填充后的破损区域与原始图像的其他区域之间在视觉上过渡自然平滑,最大限度地减少修复的痕迹。随着大数据时代的到来,图像数据呈爆炸式增长,传统的算法存在时间复杂度高的问题,以Spark为代表的云计算框架成为分析处理海量图像数据的一个优秀解决方案。本文研究的是图像数据补全系统的设计与实现,重点是改进了基于匹配的样本块的图像修复算法。针对现有的Criminisi算法及其改进算法存在匹配准则不合理以及难以满足大规模图像处理的问题,本文结合粗糙集的理念,提出一种基于WSDCA(Weighted similarity Data completion algorithm)算法的样本块图像修复算法,并基于Spark框架设计实现了一套图像修复系统。本文所作的主要工作及取得的成果包括:(1)深入研究了基于匹配的样本块图像修复算法的三个关键步骤和存在的问题,找到了改进算法的思路。(2)提出了一种基于WSDCA算法的样本块图像修复算法。该算法使用WSDCA算法作为匹配准则的改进基础,结合粗糙集理论在填补缺失数据的良好效果,较好地解决了匹配准则的不合理问题。实验结果表明,改进后的算法在PSNR上提高了 0.2-3dB。(3)设计并实现了一个基于Spark框架的图像数据修复系统。系统主要包括图像上传模块、数据预处理模块、图像修复模块和数据可视化模块,并使用Java编程语言、SpringMVC和Mybatis软件体系架构编码实现了系统。(4)搭建测试环境,对设计、实现的系统进行了测试。测试结果表明,本系统能够有效地完成图像修复。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码码头网 ,原文地址:https://m.bishedaima.com/lunwen/46418.html