基于用户行为日志的个性化新闻推荐算法的研究与实现
这是一篇关于新闻推荐,协同过滤算法,隐马尔科夫模型,三维模型的论文, 主要内容为随着无线互联网和移动端设备的普及,便捷的信息获取方式使得人们更依赖于信息。新闻的获取方式已经从主动获取变成了新闻推荐。最初的新闻推荐是帮助用户找到其感兴趣的内容并推荐给他们,而现在是主动发掘用户的潜在兴趣,并为之推荐。随着信息量的激增,推荐中存在问题也越来越突出,如用户模型更新速度慢、重复内容过度推荐、获取的新闻范围过窄、冷启动等问题。生活方式的改变使得用户获取新闻的方式从目的性获取转变为随机获取,这和传统的新闻推荐方式相悖。传统新闻推荐模型的建立并没有很好的满足用户浏览新闻这一非目的性的动机,因此本文在传统的协同过滤推荐算法的基础上引入了隐马尔科夫模型,通过马尔科夫过程的随机性模拟用户的非目的性浏览行为,研究马尔科夫模型在新闻推荐算法中的应用,主要研究内容分为三个部分。1)研究目前主流推荐算法的优缺点和马尔科夫模型,将马尔科夫模型应用于新闻推荐中并实现了一种基于隐马尔科夫模型的协同过滤算法。通过实验对比,证明该算法比传统的推荐算法效果更好。为了进一步提高算法效率,对算法进行了优化改进,改进后的算法在准确率和召回率上有所提高,其效率明显高于之前算法。2)在基于隐马尔科夫模型的基础上进一步研究,提出并设计了三维模型,以隐马尔科夫模型为主要维数,以用户特征和环境特征组成三维模型,研究三维模型在推荐算法中的应用。通过混合基于内容的推荐算法和Top N算法,实现基于隐马尔科夫模型的三维混合推荐算法。实验证明,三维模型的混合推荐比单一的推荐算法准确率更高,同时在解决冷启动上有较好的效果,通过聚类算法对推荐算法做进一步优化改进,其效果比改进前更好。3)搭建小型的集群平台,建立小型的Spark生态环境,并以基于隐马尔科夫模型的三维混合推荐算法作为推荐系统的主要算法进行设计。通过推荐系统的设计,实现基于用户行为日志的个性化推荐,并通过Web页面展示出推荐效果。
基于电商数据和用户行为的信息抽取
这是一篇关于命名实体识别,关系抽取,隐马尔科夫模型,用户行为,近义词关系的论文, 主要内容为随着互联网和电子商务在中国的爆炸式发展,以阿里巴巴为首的电子商务公司,正在产生海量的数据并吸引数以亿计的用户。换言之,大数据时代正在步步逼近,面对海量的数据,怎样提高数据利用率,怎样提取用户最想要的,最有价值的信息是核心价值的问题。在电子商务这块战斗在互联网产业最前沿的阵地上,尤其需要快速完成从数据到信息的转化。这就是本文要研究的信息抽取(information extraction)问题,尤其专注于电子商务领域。现有的信息抽取技术主要包括命名实体识别(Named Entity Recognition)和关系抽取(Relation Extraction)。命名实体识别现在主要有以下技术方法:基于规则和词典的方法、基于统计的方法、二者混合的方法等。其中基于规则和词典的方法,在有针对性的优化规则的基础上,准确率很高,但是人力成本较大,可复用和可扩展性不强,往往只能解决某些特定的应用场景。基于统计的方法准确率和召回率往往不尽如人意,算法复杂度也较高,但是可扩展性强,进步空间很大,大量学者致力于改进数学统计模型,以达到更高的准确率和召回率,从而真正实现机器智能识别。经典的命名实体识别模型有HMM(隐马尔科夫模型),ME-HMM(最大熵隐马尔科夫模型),CRF(条件随机场)等。关系抽取是从海量语料中分析抽取命名实体之间的关系,比如地名与机构名之间的从属关系,物品名之间的相似关系,各种简称与全称之间的同义关系等。同时,信息抽取是一个应用性很强的领域,理论算法必须要形成系统实现,才能准确评定算法模型的效果。但是,现在流行的信息抽取系统有华盛顿大学领导开发的OPENIE系列软件包,只能应用于英文信息抽取。现在迫切需要一种高效使用的中心信息抽取系统。本文的主要贡献为:1)介绍了经典的信息抽取模型,分别是命名实体识别领域的HMM,ME-HMM,CRF等,近义词关系抽取领域的词向量模型。同时还介绍了信息抽取任务常用的评价指标准确率,召回率和F值。2)基于经典的命名实体识别模型——隐马尔科夫模型做了针对于电子商务数据的优化,提出了一种基于词汇的隐马尔科夫模型(Lexical-HMM),提升了模型对于电商应用场景下,对于命名实体识别的准确率。对于近义词关系抽取,则提出了一种基于用户搜索和浏览行为的二部图模型,可以高效准确的抽取实体近义关系,并做了对比实验,证明了算法效果。3)设计并验证了本文提出的信息抽取系统。基于Spark平台和人工训练集,采用DAG的设计方式,可以高效准确地从输入数据从抽取命名实体库和近义词库,并验证了系统的效率和稳定性。
液压泵劣化程度的评估方法研究
这是一篇关于液压泵,状态评估,隐马尔科夫模型,局部均值分解,集对分析,支持向量聚类的论文, 主要内容为液压系统在现代工业生产中起着越来越重要的作用,而液压泵作为液压系统的关键部件,对它的监控和评估对于保持整个液压系统的健康运行具有重要意义。本文以液压泵为研究对象,研究了液压泵劣化程度的评估方法。由于提取的液压泵振动信号不可避免地受到噪声的干扰。因此,对信号进行有效处理可以减轻噪声的干扰,增加诊断的可靠性。局部均值分解(LMD,Local Mean Decomposition)是一种新的信号处理方法,非常适合于液压泵的非平稳信号的处理。本文在详细地分析其分解原理的基础上,针对目前算法分解效率较低的问题,提出了一种改进的方法。其次,本文在针对隐马尔科夫模型用于评估问题时只是将待评估样本与正常阶段样本进行比对以及退化阶段的划分带有主观性的缺点,提出了基于隐马尔科夫模型的综合评估方法,并通过美国辛辛那提大学公布的轴承的全寿命数据验证了所提出方法的有效性。最后,在实验室人工模拟不同程度的轴向柱塞泵松靴故障和中心弹簧失效故障,通过使用局部均值分解方法对信号进行前期的处理,进而使用本文所提出的基于隐马尔科夫模型的综合评估方法对液压泵进行了劣化程度的评估,并与传统的隐马尔科夫模型进行对比,验证了本文所提出方法的有效性。
基于用户行为日志的个性化新闻推荐算法的研究与实现
这是一篇关于新闻推荐,协同过滤算法,隐马尔科夫模型,三维模型的论文, 主要内容为随着无线互联网和移动端设备的普及,便捷的信息获取方式使得人们更依赖于信息。新闻的获取方式已经从主动获取变成了新闻推荐。最初的新闻推荐是帮助用户找到其感兴趣的内容并推荐给他们,而现在是主动发掘用户的潜在兴趣,并为之推荐。随着信息量的激增,推荐中存在问题也越来越突出,如用户模型更新速度慢、重复内容过度推荐、获取的新闻范围过窄、冷启动等问题。生活方式的改变使得用户获取新闻的方式从目的性获取转变为随机获取,这和传统的新闻推荐方式相悖。传统新闻推荐模型的建立并没有很好的满足用户浏览新闻这一非目的性的动机,因此本文在传统的协同过滤推荐算法的基础上引入了隐马尔科夫模型,通过马尔科夫过程的随机性模拟用户的非目的性浏览行为,研究马尔科夫模型在新闻推荐算法中的应用,主要研究内容分为三个部分。1)研究目前主流推荐算法的优缺点和马尔科夫模型,将马尔科夫模型应用于新闻推荐中并实现了一种基于隐马尔科夫模型的协同过滤算法。通过实验对比,证明该算法比传统的推荐算法效果更好。为了进一步提高算法效率,对算法进行了优化改进,改进后的算法在准确率和召回率上有所提高,其效率明显高于之前算法。2)在基于隐马尔科夫模型的基础上进一步研究,提出并设计了三维模型,以隐马尔科夫模型为主要维数,以用户特征和环境特征组成三维模型,研究三维模型在推荐算法中的应用。通过混合基于内容的推荐算法和Top N算法,实现基于隐马尔科夫模型的三维混合推荐算法。实验证明,三维模型的混合推荐比单一的推荐算法准确率更高,同时在解决冷启动上有较好的效果,通过聚类算法对推荐算法做进一步优化改进,其效果比改进前更好。3)搭建小型的集群平台,建立小型的Spark生态环境,并以基于隐马尔科夫模型的三维混合推荐算法作为推荐系统的主要算法进行设计。通过推荐系统的设计,实现基于用户行为日志的个性化推荐,并通过Web页面展示出推荐效果。
基于隐马尔科夫模型的游戏化学习行为建模研究
这是一篇关于在线学习,游戏化学习,学习行为建模,隐马尔科夫模型的论文, 主要内容为随着现代信息技术的发展我国教育信息化的程度也在不断提升,不仅MOOCs这类面向大众的在线学习平台得到迅猛发展而且越来越多的高校也推出了主要面向本校师生的在线课程或学习管理系统,在线学习既为学习者提供了更加丰富的学习资源又使学习者在学习上变得更加灵活,但在线学习存在着学习体验枯燥的问题,这便会对学习者学习的参与感和动机产生负面影响。不过近年来游戏化学习由于其在促进学习者学习的动机、参与度、协作和成效等方面的积极作用得到了许多研究者的关注,通过在学习中加入游戏化机制,我们可以创造一种类似游戏的沉浸感进而改善学习者的学习体验,对学习者的学习行为产生积极影响。学习行为建模作为一种新兴方法有利于拓宽我们对游戏化学习环境下学习者学习行为模式的理解,对此本研究以自行开发的学术读写系统为研究工具,同时以隐马尔科夫模型作为学习行为建模的技术支撑,主要进行的研究工作如下:首先,对游戏化学习和学习行为建模技术做了深入的介绍和分析,说明选择隐马尔科夫模型作为本研究技术支撑的原因,随后对隐马尔科夫模型中的三个基本问题和相对应的解决算法进行了详细说明后,针对本研究中面临的实际问题添加了比例因子也修正了重估公式,采用贝叶斯信息准则选取最优的模型隐状态数量,在模型参数估计中结合K-means算法进行模型优化,一定程度上改善了建模过程中Baum-Welch算法存在的收敛速度慢和易达成局部最优解的问题。其次,开发了一款辅助研究生文献阅读与写作课程教学的学术读写系统,结合游戏化学习理论设计出徽章、积分、排行榜三项游戏化机制并将其与学术读写系统相融合,该学术读写系统选择前后端分离的方式进行开发,其中前端采用React框架完成开发而后端则采用ThinkPHP框架完成开发,系统由文献搜索、文献阅读、论文撰写、课堂参与、同侪评论五大功能模块组成,在辅助学习者完成论文写作的同时通过系统中的游戏化机制提升学习者的学习动机和参与感。最后,以94名研究生一年级学生为实验对象通过学术读写系统采集了共21663条在线学习行为数据,基于隐马尔科夫模型分别构建了学习者在非游戏化学习环境下的学习行为模型和游戏化学习环境下的学习行为模型,通过对比分析结果表明游戏化学习阶段学生的学习积极性更高,同时在学习策略上与同伴进行了更多的社交互动,能借助同伴的意见帮助自己进行论文修改和自我反思。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码驿站 ,原文地址:https://m.bishedaima.com/lunwen/55552.html