基于用户评分与类别聚类的个性化推荐方法
这是一篇关于协同过滤,个性化推荐,模糊C均值聚类,花朵授粉算法,时间因子的论文, 主要内容为互联网的快速发展让人们进入了信息过载时代,用户在网络上寻找信息犹如大海捞针一般,而推荐系统则可以主动为用户推荐其感兴趣的信息,作为推荐系统的核心组成部分,推荐算法备受重视。协同过滤算法作为目前应用最广泛的一种推荐算法,受到国内外众多学者研究,提出了很多优化和改进方法,并获得了不错的效果,但是数据稀疏、片面关注用户评分信息、用户兴趣漂移等问题仍然存在并且长期存在。本文提出了一种基于用户评分与类别聚类的个性化推荐方法(URCC-CF),对传统的基于用户的协同过滤算法进行优化。主要研究工作包括:(1)用户的兴趣偏好会随时间推移而发生变化,即存在用户兴趣漂移问题。本文基于艾宾浩斯遗忘曲线来构建时间因子对用户评分进行加权修正,早期的评分赋予较低权,近期评分赋予较高权重。采用SVD算法对用户-项目评分矩阵进行降维填充,一定程度上缓解了稀疏性,提高相似性计算的准确性。(2)传统的用户相似性计算仅考虑用户的评分,然而用户评分不是衡量用户偏好的唯一因素,用户对项目类别的偏好在很大程度上也体现了用户的相似性。本文综合项目类别偏好、项目类别比例和主观评分偏好三个指标构建用户-类别评分矩阵,并根据其结果为用户进行偏好聚类,提高了用户分类的准确性。综合用户-项目评分相似性与用户-类别评分相似性生成综合相似性,提高了预测评分的准确性。(3)协同过滤推荐中常用的聚类算法普遍存在因为聚类中心的随机性而产生的目标函数陷入局部最优解问题。本文采用花朵授粉算法确定聚类中心,优化模糊C均值聚类算法,对用户进行基于项目类别偏好的聚类,有效解决的局部最优解的问题,同时仅在类簇内进行最近邻查找,缩小了查找范围,有效提高了推荐方法的计算效率和可扩展性。通过在公开的MovieLens数据集上进行检验,证明本文推荐方法有较好的推荐性能。首先通过对比研究确定算法涉及到的最优参数,之后将本文算法与其他三种推荐算法进行对比,证明本文算法在准确度和覆盖率上均优于其他算法。后对比分析了本文提出的基于花朵授粉算法优化的模糊C均值聚类与K-means聚类,实验结果表明本文所用聚类算法能够有效提高用户聚类的准确性。
特定场景非侵入式负荷识别及故障电弧检测技术研究
这是一篇关于非侵入式负荷识别,故障电弧检测,卡方拟合优度检验,事件检测,模糊C均值聚类,支持向量机的论文, 主要内容为近年来,安全用电与智慧用电在我国越来越受重视,非侵入式负荷识别与故障电弧检测技术研究得到了广泛关注。目前,非侵入式负荷识别技术研究大多集中于普通居民用户,很少关注特定场景负荷的特异性,导致特定场景的实际应用效果无法保证,针对此问题本文提出了一种基于特定场景的非侵入式负荷识别与故障电弧检测方法。不同于普通家庭场景的非侵入式负荷识别,宿舍、商场等特定场景由于管理需要,更具有指向性,实用价值和可行性更高。本文以高校宿舍特定场景为例进行研究,首先对宿舍常用用电负荷进行分类,根据该场景的用电规则进行负荷与特征分析,并提出四个新特征量应用于后续工作。针对因功率波动与负荷复杂运行状态导致的负荷投切误检问题,本文提出了一种基于功率波动与滑动窗卡方拟合优度检验负荷投切事件检测方法。利用实测数据与Plaid数据集数据模拟宿舍场景并进行了检测方法验证。与此同时,本文考虑到串联故障电弧具有隐蔽性和高危害性,提出一种基于无量纲特征指标的串联故障电弧检测方法,并设计了故障电弧实验平台,用于采集实际电弧数据与方法验证。离线数据与硬件实时电弧检测准确率达98.0%和95.0%。另一方面,在负荷识别环节按负荷功率大小采用Fisher线性判断进行特征重要性分析并建立特征库。同时利用非监督模糊C均值聚类和监督支持向量机两种算法进行基于宿舍场景的负荷识别验证,验证结果表明两种方法对单负荷与多负荷的识别准确率达到91.0%和89.0%以上,因此本文提出的方法在宿舍场景的负荷识别及故障电弧检测中具有良好的应用价值。
改进的融合用户兴趣的协同过滤推荐系统研究
这是一篇关于协同过滤,模糊C均值聚类,用户评分,用户兴趣倾向,标准差,离散系数的论文, 主要内容为传统的协同过滤算法面对稀疏数据时计算相似度精确度偏低,导致评分预测结果计算不准确,推荐效果也随之下降。针对传统协同过滤算法的不足之处,利用聚类算法对数据及进行聚类,降低用户邻居的搜索时间,同时引入用户兴趣相似度优化对用户兴趣偏好的计算,引入标准差作为惩罚因子优化Pearson相关系数的计算。在此研究基础上,提出了一种将用户兴趣和改进的Pearson相似性相结合的协同过滤算。本文主要创新如下:(1)采用改进的模糊C均值聚类算法对用户数据集进行聚类,利用加权的欧式距离计算公式对传统FCM算法忽略不同用户兴趣爱好程度的不同问题进行修正,提高聚类的结果精确度。在用户兴趣相似性计算的过程中,将用户评分分值差异度和用户评分倾向相似性加入到传统的协同过滤推荐算法中,用于优化对用户兴趣偏好的计算,形成用户兴趣相似度计算方法。(2)针对Pearson相关系数在计算时忽略项目自身质量属性的问题,用标准差来反映用户评分的离散性,并将离散系数作为判断用户评分对计算相似性的贡献度,消除项目自身质量属性对计算相似度带来的误差。(3)最后将用户兴趣和改进的Pearson相关系数相结合,从而计算出更加准确的用户相似度。在真实的数据集上进行了实验验证,该算法提高了评分的预测效果,提高了推荐的精确度。
基于时间遗忘和聚类的个性化推荐算法研究
这是一篇关于协同过滤,遗忘函数,模糊C均值聚类,用户偏好,推荐算法的论文, 主要内容为随着5G的逐渐普及,互联网加速发展,网络信息呈指数性爆炸增长。面对海量的数据,用户如何从中找寻到自己所需要的信息,以及信息提供商如何让自己提供的信息被目标用户关注并收取都成为迫切需要解决的问题。为有效应对该问题,人们发明了推荐系统并取得了良好的效果。推荐系统的核心部分是推荐算法,本文通过查阅大量资料文献对推荐算法进行研究与分析,针对算法中存在的用户兴趣迁移、数据稀疏等问题,提出了一种新的基于时间遗忘和聚类的个性化推荐算法。本文具体研究内容如下:(1)对User-based CF算法进行研究,深入分析用户兴趣变化问题产生原因,提出基于时间遗忘的协同过滤推荐算法。首先通过模拟遗忘曲线建立时间函数,然后考虑不同年龄的用户群体遗忘规律不同,加入遗忘因子构成时间遗忘模型用于对用户评分进行加权。最后对相似度计算方式和评分预测计算方式进行改进。(2)针对数据稀疏性问题,在基于时间遗忘的协同过滤推荐算法基础上继续进行改进。通过用户评分信息和项目特征信息提取出用户对项目特征的偏好,构建用户项目类别偏好矩阵。针对模糊C均值聚类算法(FCM)易陷入局部最优解的问题,基于粒子群算法对FCM算法进行改进,然后把改进后的PSO-FCM聚类算法结合用户偏好矩阵对用户进行聚类,在聚类中进行用户相似度的计算。最终得到基于时间遗忘和聚类的协同过滤推荐算法。本文在Movielens数据集上对本文提出的算法和现有其他算法进行对比实验。实验结果表明,本文算法有效缓解了用户兴趣变化和数据稀疏性问题,提高了推荐结果的质量。
基于数据分析的生鲜超市业务系统的设计与实现
这是一篇关于数据分析,生鲜超市业务系统,SSH,模糊C均值聚类,Apriori,移动App的论文, 主要内容为随着社会的发展和人们生活水平的不断提高,生鲜农产品作为餐桌上不可或缺的食物和营养来源,人们对它的需求也与日俱增。生鲜连锁超市作为一种新的生鲜农产品经营方式,由于其统一经营管理,生鲜农产品的安全和质量更有保障,因而越来越受到消费者的欢迎与认可。然而随着生鲜超市业务的不断发展和扩张,生鲜超市的业务信息系统却发展缓慢。企业现有的超市业务系统往往没有考虑到生鲜农产品的独特性和经营中的特殊需求,缺少对整个生鲜业务的全过程覆盖,同时并没对生鲜超市连锁企业在经营过程中产生的大量数据进行数据分析和挖掘。本文针对长春市某生鲜连锁超市企业的实际情况,设计和开发了更加贴合企业需求的生鲜超市业务系统,并将数据挖掘中的聚类分析和关联规则运用于企业的销售数据分析中。将数据挖掘中的相关技术与业务系统相结合,从而帮助企业制定更加合理的经营管理和营销策略。主要工作分为两部分:第一部分为生鲜超市业务系统基础功能的实现工作,系统采用当前较为流行的Java语言,开源的SSH框架来完成系统中各个模块的开发。系统的基础业务模块主要包括用户管理、接受销售流水、验收入库、大库分货、门店调拨、商品报损、采购计划、门店订货、商品管理、在途商品信息管理、退货处理等,让生鲜超市经营中的每一环节都可控可追踪,完成数据共享和整个业务的信息化,提高生鲜流转过程中信息化水平。在途商品信息管理中使用开源的Open Layers构建了基于JavaScript的轻量级Web GIS模块,能够更加直观的获取运输地理位置信息。此外在考虑到采购人员对移动办公的迫切需求后,完成了采购管理移动App的设计与开发,帮助采购员更好的开展采购工作;第二部分工作为设计和实现对生鲜连锁超市的销售数据分析,由于生鲜超市在经营过程中会积累大量数据以及每个门店的销售数据不同,因此可以使用各个门店的销售数据来对门店进行聚类分析。但是在对聚类分析中的模糊C均值聚类算法进行研究后,发现该算法在聚类前需要指定聚类数目的缺点后引入了统计学中的混合F分布,提出了一种能获取最佳聚类数目的改进方案,能够解决模糊C均值聚类算法需要事先指定聚类数目的缺点,并将改进后的算法应用到生鲜超市销售特征的分析中。然后针对生鲜超市顾客购买商品之间的潜在关联,设计和实现了顾客购物篮分析。生鲜连锁超市顾客每次购买商品时的交易数据可以称为购物篮数据,由于数据挖掘技术中的关联规则较为适用于生鲜超市顾客购物篮交易数据的分析中,因此采用Apriori关联规则挖掘算法来对顾客的购物篮数据进行商品间关联规则的挖掘。通过两个模块中的实验结果进行分析,能够发现企业积累的大量数据中潜在的信息,为企业的实际经营管理提供帮助。
高考志愿个性化推荐相关算法研究及系统设计
这是一篇关于高考志愿推荐,指数平滑预测,个性化推荐,模糊C均值聚类,微信小程序的论文, 主要内容为高考志愿填报是高考中的一个重要的环节,但是由于院校专业信息较多且存在一定的波动,考生和家长们很难掌握报考所需的大量信息,导致考生盲目报考热门院校专业和他人包办的现象非常普遍,使得考生兴趣与专业不符,造成厌学情绪严重、退学和学业不达标现象激增。针对这些现象,本文对高考志愿推荐相关算法进行研究并基于微信小程序平台设计和开发了具有个性化推荐功能的高考志愿推荐系统,为考生和家长提供信息与技术支持。主要研究内容如下:(1)针对高考分数受影响因素多且数据量有限导致预测误差较大的问题,提出基于遗传算法(Genetic Algorithm,GA)的二次指数平滑预测算法进行分数预测。首先对比和分析了几种不同的分数预测方法,选用指数平滑预测方法对位次进行预测,由于平滑系数的选取对预测结果影响较大,因此利用GA对平滑因子的选取进行优化。分别与灰色预测算法和二次指数平滑预测算法进行对比,结果表明本文提出的算法绝对误差小于其他两种算法,但是由于高考分数存在不确定因素影响,部分院校预测结果与实际存在较大误差,为了提高系统的鲁棒性,对概率模型进行了改进,充分利用了往年的录取信息,减小对预测结果的依赖性。(2)针对高考志愿推荐系统个性化推荐能力不足的问题,提出了一种基于用户行为特征的混合推荐算法。针对用户评分获取难且存在主观性的问题,对用户行为进行挖掘作为用户的评分。由于院校数据众多,造成评分矩阵维数高的问题,采用评分集合来替代传统的评分矩阵并对杰卡德相似系数进行改进作为相似度计算公式。针对基于用户的协同过滤推荐算法和基于内容的推荐算法各自存在的优缺点,采用并行的方式进行混合,利用阿里天池数据集对算法进行验证,结果证明了算法的有效性,表明了用集合表示兴趣和对杰卡德相似系数的改进具有合理性。最后将算法应用到志愿推荐系统,为分数相同兴趣不同的用户推荐适合个人兴趣的院校专业,提高了志愿推荐的准确性。(3)针对用户多元化的需求无法满足的问题,提出了基于网格聚类算法(Clustering In QUEst,CLIQUE)的自适应模糊聚类算法。采用聚类算法对院校专业数据进行聚类,根据用户对不同指标的侧重来计算不同类的优先级进行推荐。针对模糊C均值聚类算法(Fuzzy C-means Algorithm,FCM)不能自动识别聚类数目且初始点选取敏感容易陷入局部最优的问题,利用CLIQUE算法对聚类数目和初值进行获取。利用测试数据对算法进行验证,算法可以准确识别聚类的数目,提高了聚类的准确率,证明了算法的有效性。本文的算法计算的聚类中心相比于随机法确定的聚类中心需要更少的迭代次数,提高了算法的计算效率。(4)针对目前大多数的推荐平台无法满足用户填报志愿的及时性和便捷性,开发了基于微信小程序的高考志愿推荐系统。对相关院校专业信息进行整理,设计数据库对数据进行存储。同时对考生和家长的需求进行分析,对系统的功能进行设计和开发,并且将推荐算法在推荐系统中进行实现。分别对于系统的功能和性能进行测试,并且成功将小程序上线并进行推广,约700人次用户使用,实践表明系统满足设计要求。
基于时间遗忘和聚类的个性化推荐算法研究
这是一篇关于协同过滤,遗忘函数,模糊C均值聚类,用户偏好,推荐算法的论文, 主要内容为随着5G的逐渐普及,互联网加速发展,网络信息呈指数性爆炸增长。面对海量的数据,用户如何从中找寻到自己所需要的信息,以及信息提供商如何让自己提供的信息被目标用户关注并收取都成为迫切需要解决的问题。为有效应对该问题,人们发明了推荐系统并取得了良好的效果。推荐系统的核心部分是推荐算法,本文通过查阅大量资料文献对推荐算法进行研究与分析,针对算法中存在的用户兴趣迁移、数据稀疏等问题,提出了一种新的基于时间遗忘和聚类的个性化推荐算法。本文具体研究内容如下:(1)对User-based CF算法进行研究,深入分析用户兴趣变化问题产生原因,提出基于时间遗忘的协同过滤推荐算法。首先通过模拟遗忘曲线建立时间函数,然后考虑不同年龄的用户群体遗忘规律不同,加入遗忘因子构成时间遗忘模型用于对用户评分进行加权。最后对相似度计算方式和评分预测计算方式进行改进。(2)针对数据稀疏性问题,在基于时间遗忘的协同过滤推荐算法基础上继续进行改进。通过用户评分信息和项目特征信息提取出用户对项目特征的偏好,构建用户项目类别偏好矩阵。针对模糊C均值聚类算法(FCM)易陷入局部最优解的问题,基于粒子群算法对FCM算法进行改进,然后把改进后的PSO-FCM聚类算法结合用户偏好矩阵对用户进行聚类,在聚类中进行用户相似度的计算。最终得到基于时间遗忘和聚类的协同过滤推荐算法。本文在Movielens数据集上对本文提出的算法和现有其他算法进行对比实验。实验结果表明,本文算法有效缓解了用户兴趣变化和数据稀疏性问题,提高了推荐结果的质量。
改进的融合用户兴趣的协同过滤推荐系统研究
这是一篇关于协同过滤,模糊C均值聚类,用户评分,用户兴趣倾向,标准差,离散系数的论文, 主要内容为传统的协同过滤算法面对稀疏数据时计算相似度精确度偏低,导致评分预测结果计算不准确,推荐效果也随之下降。针对传统协同过滤算法的不足之处,利用聚类算法对数据及进行聚类,降低用户邻居的搜索时间,同时引入用户兴趣相似度优化对用户兴趣偏好的计算,引入标准差作为惩罚因子优化Pearson相关系数的计算。在此研究基础上,提出了一种将用户兴趣和改进的Pearson相似性相结合的协同过滤算。本文主要创新如下:(1)采用改进的模糊C均值聚类算法对用户数据集进行聚类,利用加权的欧式距离计算公式对传统FCM算法忽略不同用户兴趣爱好程度的不同问题进行修正,提高聚类的结果精确度。在用户兴趣相似性计算的过程中,将用户评分分值差异度和用户评分倾向相似性加入到传统的协同过滤推荐算法中,用于优化对用户兴趣偏好的计算,形成用户兴趣相似度计算方法。(2)针对Pearson相关系数在计算时忽略项目自身质量属性的问题,用标准差来反映用户评分的离散性,并将离散系数作为判断用户评分对计算相似性的贡献度,消除项目自身质量属性对计算相似度带来的误差。(3)最后将用户兴趣和改进的Pearson相关系数相结合,从而计算出更加准确的用户相似度。在真实的数据集上进行了实验验证,该算法提高了评分的预测效果,提高了推荐的精确度。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码导航 ,原文地址:https://m.bishedaima.com/lunwen/53016.html