基于Web日志挖掘的个性化学习平台的设计与实现
这是一篇关于个性化网上学习,Web日志挖掘,SSM框架,Apriori算法,K-Means算法的论文, 主要内容为近年来,随着互联网和远程教育的快速发展,传统教育方式已经不能够满足现代人们对于个性化资源的需要,因此出现了个性化的学习平台。这种新型学习平台正逐渐改变着传统的教育模式,同时也促进了新型教育模式的发展。本文针对传统网上学习系统在内容和形式上的单一性缺点,提出了个性化的网上学习平台,其“个性化”主要体现在两个方面:第一,系统对收集的日志文件进行Web日志挖掘,通过访问课程的时间长短向学习者推荐小组,通过日志记录中用户访问各课程间的联系,将相关课程进行关联,其意义在于让学习者了解各课程之间的拓扑关系,比如某学习者在学习Java开发,系统会为其推送C语言,告诉学习者C语言和Java是相关联的;第二,系统基于学习者的兴趣为其推荐小组,对于小组内某一学习者喜欢的课程,系统会将与此课程相关的课程同时推送给小组内的所有人,为学习者预测其感兴趣的课程。本文的系统可以分别在PC端与移动端运行,其中PC端的开发是基于JavaWeb来设计的,移动端是基于Android操作系统来实现的。在线下,系统利用Web日志挖掘技术来处理日志文件。整个系统的设计是基于软件工程的,这样方便系统开发者研究出灵活、易于操作、性能良好、功能全面的系统。本文主要研究内容如下:(1)系统各部分功能设计:开发过程中将用户角色分为学生者、教师和管理者三类。系统有六个主要的功能模块,分别为用户管理模块、学习资源功能模块、公告管理模块、网上留言管理模块、在线学习模块和个性化推荐模块。(2)在J2EE平台中整合SSM框架:系统的PC端基于JavaWeb设计,用SSM(Spring+SpringMVC+MyBatis)进行项目开发,并用Maven对项目进行管理。表现层用SpringMVC来实现,业务层用Service接口来实现,持久层用MyBatis来操作数据库,最后用Spring对各个层次进行整合。移动端是通过在Android操作系统中加载系统服务器来实现的。(3)线下Web日志挖掘:本论文根据个性化网上学习的特点,对系统中的访问日志进行了Web日志挖掘。系统用Flume来收集日志文件,用Apriori关联算法对各课程之间进行关联规则分析,用K-Means聚类算法对学习者进行分组。
基于Storm的数据分析系统设计与实现
这是一篇关于流处理,Storm,Kafka,Spring,K-Means算法的论文, 主要内容为如今,大数据、移动互联网已经成为这个时代的共识,只有依靠大数据技术深入挖掘数据中潜在的价值才能为企业在时代浪潮中提供更可靠的决策依据。因此,大数据处理技术成为人们研究的热点。Hadoop目前已经成为批处理的标准,而目前人们对实时处理、个性化查询要求越来越高,所以Storm出现了,而目前对Storm实时流处理技术的研究仍然处于初始阶段。 论文对Storm实时流处理技术与其他相似技术进行了比较,总结了相关技术的优势所在以及适合的应用场景。对Storm进行数据处理时存在的相关问题也进行了研究并进行了相关的改进。实现了Storm与Spring框架的结合,实现基于xml配置文件定义Topology,减少组件间的耦合性。通过K-means算法并行化进行用户聚集度分析,实现了整个分析系统的并行化,最后总结了Storm系统性能优化的基本思路。 总结起来,论文主要进行了如下方面的工作:分析和比较了流行的大数据处理技术,尤其是流处理技术;并对Storm性能进行了分析,总结出了Storm性能优化基本思路;采用分布式数据收集系统Kafka,解决Storm框架处理文件数据时Spout不能并行化的问题;提出基于Spring的可插拔编程模型topology的实现方法,为Storm应用开发提供了一个一致性的编程模型,使开发人员能够借助Spring编程模型实现Storm应用;实现了K-Means算法并行化并移植到Storm运行,用于进行用户聚集度分析;最终设计了一套较完整的基于Storm的数据分析系统,用GPS数据进行分析并验证。
基于智能推荐模型的人职匹配系统研究与实现
这是一篇关于智能推荐,层次分析法,SimRank算法,K-Means算法的论文, 主要内容为近年来,在国内外经济形势趋于严峻的大背景下,随着北京地区高校毕业生数量持续增加,应届毕业生求职困难的问题凸显。然而在求职的过程中,毕业生不仅要面对客观形势,还要面对巨量的就业信息。这些问题大大消耗了求职精力,提高了求职成本,降低了求职成功率。结合北京地区高校毕业生求职的实际情况,以及用人单位的招聘特点,本文设计一个基于智能推荐模型的人职匹配系统。本系统的智能推荐模型采用“层次分析法模型”和"SimRank算法模型”相结合的方式。通过“层次分析法模型”对应届毕业生与用人单位发布的招聘职位进行指标匹配,找到二者的硬性联系;通过"SimRank算法模型”计算应届毕业生与往届毕业生类的匹配度,结合往届毕业生的签约单位,找到应届毕业生与用人单位的潜在联系;综合以上两种联系,计算并获得推荐结果。系统以某高校的实际数据进行验证,相比于其他推荐系统,具有较高的推荐准确率。本系统主要包括:登录管理、简历管理、职业测评、招聘管理、就业单位管理和单位推荐等六大功能模块,其中核心功能模块为单位推荐功能。系统基于J2EE与Andriod技术进行开发,可以同时部署到web平台以及移动终端。本系统的实现能够在很大程度上避免应届毕业生求职的盲目性,对于毕业生及用人单位具有较好的应用价值和现实意义。
基于协同过滤的个性化推荐系统的研究
这是一篇关于协同过滤,隐语义模型,K-Means算法,支持向量回归的论文, 主要内容为随着计算机网络的快速发展,大数据时代已经到来,电子商务等领域充斥着海量数据,用户从大量物品中选择自已喜欢的物品变得越发困难。个性化推荐系统能够快速的给人们推荐其喜欢的物品。协同过滤推荐算法是个性化推荐算法的热点领域,得到国内外学者的深入研究与探讨。基于用户的协同过滤推荐算法通过计算用户相似度以选取近邻,进行近邻推荐。针对传统的基于用户的协同过滤推荐算法中忽略用户的兴趣划分而导致的推荐召回率低的问题与传统打分方式评分预测误差大的问题。本文提出一种基于兴趣划分和支持向量回归的协同过滤推荐算法IPSVRUCF。首先用K-Means算法对项目进行聚类,不同项目集合表示特定的用户兴趣点,进而实现对用户兴趣划分;一方面,依据划分的兴趣点构建项目的特征向量,运用对项目的评分计算用户对项目的偏好程度,然后按照项目特征与用户对项目的偏好程度计算用户的兴趣向量;另一方面,结合项目特征向量与用户评分,训练支持向量回归模型进行评分预测;最后提出用户成熟度的概念,将基于兴趣相似度的协同过滤与支持向量回归预测相结合进行推荐。针对传统的协同过滤推荐算法忽略了用户间的信任而导致的推荐精度低的问题。本文提出一种基于用户信任改进的协同过滤推荐算法TrustUCF。首先,用隐语义模型LFM模型挖掘用户兴趣特征,进而计算用户兴趣相似度;然后提出近邻熟悉程度的计算方法,将用户对近邻用户的熟悉程度与兴趣相似度结合建立用户信任;最后,用户之间的信任度加权用户之间评分相似度作为最终相似度,进行基于用户的协同过滤推荐。最后在MovieLens数据集上与传统的基于用户的协同过滤算法对比实验。能得出结论:IPSVRUCF能有效提高召回率与降低评分预测误差,TrustUCF能有效提高推荐的精度。图[26]表[11]参[51]
基于智能推荐模型的人职匹配系统研究与实现
这是一篇关于智能推荐,层次分析法,SimRank算法,K-Means算法的论文, 主要内容为近年来,在国内外经济形势趋于严峻的大背景下,随着北京地区高校毕业生数量持续增加,应届毕业生求职困难的问题凸显。然而在求职的过程中,毕业生不仅要面对客观形势,还要面对巨量的就业信息。这些问题大大消耗了求职精力,提高了求职成本,降低了求职成功率。结合北京地区高校毕业生求职的实际情况,以及用人单位的招聘特点,本文设计一个基于智能推荐模型的人职匹配系统。本系统的智能推荐模型采用“层次分析法模型”和"SimRank算法模型”相结合的方式。通过“层次分析法模型”对应届毕业生与用人单位发布的招聘职位进行指标匹配,找到二者的硬性联系;通过"SimRank算法模型”计算应届毕业生与往届毕业生类的匹配度,结合往届毕业生的签约单位,找到应届毕业生与用人单位的潜在联系;综合以上两种联系,计算并获得推荐结果。系统以某高校的实际数据进行验证,相比于其他推荐系统,具有较高的推荐准确率。本系统主要包括:登录管理、简历管理、职业测评、招聘管理、就业单位管理和单位推荐等六大功能模块,其中核心功能模块为单位推荐功能。系统基于J2EE与Andriod技术进行开发,可以同时部署到web平台以及移动终端。本系统的实现能够在很大程度上避免应届毕业生求职的盲目性,对于毕业生及用人单位具有较好的应用价值和现实意义。
基于知识图谱的聚类算法研究及其在文本聚类中的应用
这是一篇关于文本聚类,K-Means算法,知识图谱的论文, 主要内容为通信工程和计算机技术的迅速发展将人类社会带入到了信息时代,数据库中存储的数据量也急剧增大,如何在海量数据中分析和获取有价值的知识成为人们日益关注的问题。文本聚类分析是信息数据挖掘的一个重要研究方向,可以直观地反映数据间的分布特点,更好地发现数据集中内在的类别特性。K-Means算法作为聚类分析算法中最为普遍应用的算法之一,尽管时间复杂度较低且易于实现,但在处理具有高维性和稀疏性的数据时,容易出现局部最优的情况。本文介绍了文本聚类算法的基本理论与相关技术,对于K-Means算法本身具有的部分局限性,提出了改进的聚类算法。在介绍聚类的几种常用的算法思想和文本聚类的相关技术的基础上,重点阐释了K-Means聚类算法,并分析了该算法具有的优缺点。针对传统K-Means算法对噪声数据敏感且随机选择初始聚类中心导致可能无法得到有效的聚类结果等缺点,提出了基于知识图谱的改进K-Means聚类算法。知识图谱是构建在当前Web基础之上的一层覆盖网络,借助其图的表示结构,考虑文档词条间的语义关系,可以在Web网页上建立起基于概念的一种链接关系。通过改进类与类之间的相似度度量标准,构建知识图谱中的“语义网络”,从而优化初始聚类中心的选择方式与词条向量间的距离计算方法,降低孤立点对聚类结果的影响。改进的K-Means算法中初始簇类中心的选择策略可以减少该算法陷入局部最优解的可能性并充分考虑到文本内容对文本聚类的贡献度,提高算法性能与效果。论文采用了常用的评价指标来对不同方法的实验结果进行比较,其中,评价标准包括兰德指数、轮廓系数、互信息与V-measure标准等。通过对比实验表明改进后的算法能够得出聚类质量较高且波动幅度较小的聚类结果。同时,针对本文的研究做出分析与总结,提出了在实验过程中未能深入研究到的相关问题,并展望了文本聚类挖掘未来的研究方向。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设货栈 ,原文地址:https://m.bishedaima.com/lunwen/45722.html