基于时序演进的机器学习方法研究
这是一篇关于机器学习,数据挖掘,推荐系统,用户建模的论文, 主要内容为在传统的机器学习中,往往假设数据的分布是固定不变的。但是在许多现实应用场景中,比如推荐系统中,数据的分布往往会随着时间的变化而变化,即存在着“时序演进”的现象。使用传统方法无法考虑“时序演进”性质,往往会使得刻画的数据分布不精确,难以对未来的数据进行很好的预测。随着生产生活中可获取数据量的不断增大、数据环境越来越复杂,传统方法在处理时序演进问题上的局限性也越来越凸显。如何快速而有效地利用数据“时序演进”的性质来提高模型的性能,近年来得到了越来越多研究者的关注。本文试图针对在线购物这一复杂的数据场景,考虑数据中“时序演进”的性质,尝试通过特征处理、空间嵌入等不同角度将数据的动态性转换为静态状态来处理,从而一方面能够较好刻画“时序演进”的性质,另一方面能够降低构建模型的难度。主要取得了以下创新成果:第一,提出了一种基于时间窗口特征的时序演进推荐算法。该方法通过不同宽度的窗口来从不同粒度上捕捉用户与商品随时间演进的特征,然后利用集成学习方法来学习这些静态的特征,从而得到一个具有“时序演进”特性的推荐系统。在腾讯公司提供的真实线上推荐系统中的应用效果,表明了该方法相对传统的推荐方法在推荐精度上有较大的提高。第二,提出了一种基于用户阶段演进的用户建模方法。该方法基于用户的交互数据,构建了一个静态低维的用户流形空间,将不同用户在不同时期所处的阶段进行对齐。在这个空间中,较为稳定的阶段的演进模式更容易被刻画出来。基于阶段演进的规律,我们就可以更深刻地理解用户的行为,从而对用户未来的行为也能有更好的预测。在使用腾讯公司提供的真实在线购物网站的数据的实验中,引入用户流形的推荐系统的推荐精度得到了明显提高,并且大幅超越了许多基准方法。同时用户流形空间的可视化结果也展示了用户流形空间可以很好地刻画用户动态偏好变化的模式。
基于用户实时兴趣偏好建模的个性化推荐算法研究及应用
这是一篇关于推荐系统,协同过滤,用户建模,聚类算法的论文, 主要内容为随着互联网中的数据量呈爆炸式增长态势,使得人们很难在海量信息中快速找到对自己有用的信息,导致信息过载问题的出现。推荐系统的提出被认为是目前最有希望解决信息过载的有效手段,它可以通过挖掘用户的历史偏好信息,来对用户下一步的行为进行预测。其中,为了精准地刻画用户兴趣,需要对用户行为进行建模,以便更好地理解用户。但已有的用户兴趣建模方法过分依赖用户评分数据进行建模分析,由于用户评分数据的稀疏性导致该种建模方式并不能很好地解决推荐系统中的冷启动问题,并且用户的兴趣往往会随着时间发生显著的漂移。针对此,本文利用深度学习、密度峰值聚类、协同过滤等技术,研究基于用户兴趣模型的推荐算法,解决推荐算法中存在的冷启动、用户兴趣漂移等问题。其中研究内容主要包括如下三个方面:(1)针对传统的用户建模方式只是利用到了用户的交互记录信息,不能有效处理推荐系统中的冷启动问题。本文利用用户在新系统注册时提供的属性信息,使用One-hot编码方式将用户属性信息进行特征表示,得到用户属性向量,之后利用Auto Encoder网络对用户属性向量进行降维和结合,得到融合丰富属性信息的用户画像模型,实验结果表明本文提出的方法可以得到更丰富的用户模型以解决冷启动的问题。(2)针对传统的推荐算法统一学习用户和物品之间的交互信息时,大部分忽略时间因素对用户的兴趣和物品的热度的影响。本文在用户模型设计时加入用户交互记录的时间序列信息,利用长短期记忆网络对时间序列信息进行深度学习,获得用户当前的兴趣偏好向量。之后与结合丰富属性信息的用户模型进行融合,得到最终的用户模型。最后利用基于密度峰值的聚类算法将得到的用户模型向量进行聚类,在同一类簇中进行用户相似度的计算,可以在很大程度上减少计算用户相似度的时间消耗。将数据集按照物品交互时间顺序划分,赋给近期交互的物品更高的权重值,这样得到最适合目标用户近期兴趣的物品列表,在Movie Lens-100K、Movie Lens-1M和Book-Crossing数据集上的实验结果表明本文提出的推荐算法的推荐质量要优于对比算法。(3)基于本文提出的推荐算法实现基于教育资源的推荐系统应用,并有效验证提出的算法的合理性和更优异的推荐效果。
推荐系统用户相似度计算方法研究
这是一篇关于推荐系统,用户相似度,协同过滤,推荐算法,用户建模的论文, 主要内容为随着互联网的数据规模急剧扩大,用户无法准确迅速地找到自己需要的信息,为解决日益严重的信息过载问题,多种技术方案应运而生,推荐系统就是其中的佼佼者。推荐系统是一种个性化的信息服务,能够很好地充当用户和信息资源之间的桥梁。推荐系统通过建立模型,对用户的需求进行描述,再通过某种推荐策略将特定的信息资源主动推荐给目标用户。 由于推荐系统具有个性化和智能化等特点,其在电子商务、社交网站和影音站点取得了巨大的成功,已经成为这些应用平台的核心子系统。基于协同过滤的推荐系统是应用最为广泛、研究最为深入的一类推荐系统,这类推荐系统算法的关键是寻找用户或者项目的邻居,邻居寻找的准确性决定了最后推荐结果的质量,而邻居的寻找依赖于用户或者项目相似度的计算,因此设计一个适合的相似度计算方法是推荐算法成功的关键问题。 本文首先介绍了推荐系统的概念和推荐系统的模型,同时详细探讨了用户研究和用户模型,并对常用的推荐系统架构进行了分析和介绍;然后介绍了常用的几种推荐算法并介绍了各自适用的场景和优缺点以及主要的相似度计算方法和这些相似度计算方法的局限,接着介绍了常用的实验数据集和评价指标。 传统的用户相似度计算方法中每个项目的权重是一样的,通过分析可以知道用户间共同高评分项目的权重应该高于用户间共同低评分项目的权重,再考虑上类群关系,就得到了本文提出的一种加权的用户相似度计算方法,这种方法解决了一些会导致寻找邻居准确性下降的问题。通过在MovieLens数据集上进行实验,与基于传统用户相似度计算方法的协同过滤算法相比较,实验结果表明,考虑了项目相似度权重的协同过滤推荐算法能显著提高评分预测的准确性和推荐结果的质量。
基于事理图谱分析的教学设计平台研究
这是一篇关于教学行为事理图谱,用户建模,个性化推荐,教学设计,协同备课的论文, 主要内容为传统的备课方式有赖于单个教师手动撰写教案,且需要人工查找大量的教学资源来辅助备课过程,在此期间会过于消耗教师的精力,备课效果也难以得到保障。此外,现有备课平台大多只注重单纯的信息资源利用,难以满足教师用户的个性化教学设计和课程备课需求。因此,如何让教师更加有效且个性化地在网络平台上进行教学设计制作和课程备课是本文研究的重点。为此,本文主要研究了基于事理图谱分析的教学设计平台(后文简称ELG平台)的设计与实现,包括以下几个方面:(1)基于ELG分析的推荐算法研究。在充分考虑教学行为信息对刻画教师教学属性方面影响的基础上,通过对教学行为事理图谱的特征提取(即对教学行为事件及其顺承关系进行抽取),确立了教学行为事理图谱的结构特征,并以此完成了用户模型的构建及其更新策略;在用户建模的基础上,实现了基于用户动态特征信息的资源推荐算法(TRRA-UD)与融合用户聚类和交互关系的备课同伴推荐算法(CRA-UCIR)。(2)ELG平台原型的设计与研发。通过对建设ELG平台及其技术方案进行调研和文献研究,总结归纳了平台的实际使用需求,完成了平台原型的总体设计;采用SpringBoot+MybatisPlus+Vue框架完成了 ELG平台原型的研发,实现了在线协同备课、教学资源智能检索和推荐、教案模板生成、教学行为事理图谱可视化等主要功能。算法仿真实验结果表明,本文提出的基于ELG分析的推荐算法具备可行性与有效性;功能测试表明,ELG平台能够达到预想设计需求,将有效提升教师教学设计效率与课程备课效果。
舆情监控系统中语义网络的构建及其应用的研究
这是一篇关于舆情监控,语义网络,信息建模,用户建模的论文, 主要内容为现代商业竞争激烈,企业需要及时地把握行业动态。信息数量大、种类多且质量参差不齐,对企业有效使用信息造成了巨大的困难。舆情监控系统可以监控、分类、推荐和分析舆情。目前多数舆情监控系统因为缺乏对领域知识概念的相关考虑,所以对舆情信息中相关概念的识别较为困难。因此,在舆情信息分类的过程中,难以有效利用信息中的概念进行分类。同时,在舆情信息推荐方面,由于较难识别用户关注的信息中的概念,影响了对用户的关注点的发现与判断,不利于个性化推荐。针对上述问题,本文研究面向舆情监控的语义网络的构建与应用。主要的工作内容包括:(1)针对舆情监控系统较少考虑到领域知识的问题,提出并构建面向舆情监控的语义网络。通过对公开知识图谱进行扩展,增加概念的数量以及概念间的量化关系,改善领域知识考虑不足的问题。(2)基于面向舆情监控的语义网络,提出一种针对舆情信息和用户的建模方法,强化了识别概念、发现隐含概念和突出主题的能力。(3)利用基于语义网络构造的舆情信息模型,提升了舆情信息在主流分类器下的分类效果;提出一种基于语义网络中概念间距离的相似度计算方法,有效衡量“信息-信息”和“信息-用户”的相似度,从而更好地向用户推荐舆情。(4)将上述研究应用于DETC舆情监控系统,构建了面向舆情监控的语义网络,设计并实现了舆情分类、舆情推荐、舆情分析和预警模块。
面向微博用户的文本自适应图片推荐
这是一篇关于推荐系统,表示学习,用户建模,深度学习,多模态学习的论文, 主要内容为在社会化媒体时代的社交网络平台上,图文并茂的表达方式已经成为主流。相比于原创一段文字并发布于社交媒体,用户创作图片的过程明显更加复杂。因此,使用已经存在的图片表达自己内容的方式受到了社交网络用户的欢迎。作为人们获取信息、交流、沟通的重要平台,社交网络平台给用户提供了丰富的数据来源、个性化的互动方式,但其数据的爆炸式增长又导致了严重的信息过载现象。如何从海量的源于社交网络的图片中找到符合用户文字表达内容,又与用户使用图片的风格相一致的图片成为了很有挑战性的问题。论文以新浪微博为研究平台,研究基于用户输入文本的图片推荐问题,并尝试提出一套完整的图片推荐体系,主要工作如下:1.借助python爬虫工具,从新浪微博、花瓣网上获取了大量数据。针对原始数据噪音较大的问题,本文基于新浪微博和花瓣网用户数据分布的特点,提出了一套数据清洗方法,对冗余信息进行了清洗,提高了训练数据纯度。进一步,提炼了用户基本信息、社交关系、微博图片、文本内容等信息,建立了用户人口统计学特征、微博内容特征、图片风格特征、影响力特征等特征组,强化了数据的表达能力。2.针对数据集中文本模态数据非常稀疏的问题,本文将图片以及其对应的文本描述转化成了BIW网络图,在对BIW网络图的连接关系与拓扑结构进行分析后,通过一种改进的随机游走算法解决了图片文本描述信息过短和文本描述缺失的问题。进一步,本文设计了一种基于BIW网络图嵌入向量的深度学习框架,获取了微博图片与文本的多模态联合表示。3.提出了三种基于多模态表示的用户风格建模方法。其中注意力模型考虑了在发布不同主题内容时用户风格的多样性,动态的对用户风格进行建模。随后,基于建立的用户风格模型,提出了一种综合利用用户当前输入文本、历史使用图片风格等多种要素的图片推荐框架,通过分析用户特征与候选图片之间的潜在联系,产生最终的图片推荐。实验结果表明,本文提出的特征提取、多模态表示学习、用户建模对于结果提升皆有效果,结合各模块后的推荐算法效果远优于常见算法。
The Research on User Profiling and Time Awareness-based Hybrid Approaches for Recommendation Systems
这是一篇关于混合推荐,用户建模,用户信息,知识图,推荐系统原型的论文, 主要内容为当前,大多数互联网用户都面临着信息过载的问题。因此,学术界和工业界出现了各种推荐系统和方法来解决这一问题。推荐系统一般根据用户的个人信息库来预测用户对未知项目的评价或者为用户提供相关信息。混合推荐系统集成了不同的推荐方法和技术,利用它们各自的优点,克服它们各自的局限性,来获得更好的结果并提高预测和推荐的质量。然而,尽管推荐系统在工业界和学术界得到了广泛关注和快速发展,但它仍然面临着冷启动、数据稀疏、用户建模以及用户兴趣偏好转移等诸多挑战和限制。许多学术研究只关注用户与用户或者项目与用户之间的相似度算法,而忽略了用户个人信息库的重要性。此外,这些学术研究也没有给予用户兴趣的动态变化以足够的关注。因此,除了提高推荐结果的准确性外,还可以通过解决推荐系统的这些挑战和局限性,进一步提高推荐的效率和有效性。本文主要聚焦于用户建模和混合推荐方法,研究了不同的用户建模方法以解决在推荐系统中遇到的诸多挑战和缓解推荐系统的局限性。此外,用户生成的内容(如用户评论)也被用于用户建模,以改善用户个人信息库和提高推荐的性能。在用户建模研究的支持下,本文提出了一种新的用户混合推荐方法,该方法主要用来解决用户兴趣偏好变化问题和提高推荐的性能。本文所提出的混合推荐方法采用基于内容和神经协同过滤的方法,利用扩展的用户和项目信息执行用户建模、评分预测和Top N推荐任务。此外,该混合推荐系统还将扩展的用户和项目信息应用于知识图谱中,以利用用户、项目、属性和特征之间的关系来提高评分预测的性能。本文采用准确率、召回率、新颖性、多样性、MAE(Mean Absolute Error)和RMSE(Root Mean Square Error)等多种评价指标,把该混合推荐方法与几种基准推荐算法进行了全面地,详细地评估和比较。实验结果表明,本文提出的混合推荐方法解决了用户兴趣偏好变化的问题,而且在评分预测以及Top N推荐上优于目前这些基准方法。此外,本文还设计并实现了一个基于该推荐方法的推荐系统原型。该推荐系统原型提供了其管理的图形用户界面以及允许用户查看、执行和控制本文提出功能,此外,原型还包括查看和搜索系统中所有的用户和项目,构建和查看不同的知识图谱,为每个用户创建其个人信息库,生成评分预测以及Top N推荐。本研究有助于学术界在用户建模,混合推荐方法和推荐系统评估等方面的研究。而且,基于本文提出的混合推荐方法,本研究设计和开发了一个推荐系统原型,促进了推荐系统行业的发展。
资源自适应个性化新闻推荐系统的研究与实现
这是一篇关于个性化推荐,资源自适应,用户建模,长期兴趣,短期兴趣的论文, 主要内容为随着互联网的迅猛发展,网络数据量不断增长,在给网络用户获取信息带来便利的同时也造成了信息过载问题。我国上网用户数量达到3.84亿,占人口总数的29%以上,其中超过80%网络用户使用网络新闻资讯服务。个性化新闻推荐系统可以为用户推荐个性化新闻资讯,帮助用户发现感兴趣的内容,具有广阔的应用前景。 目前市场上的新闻推荐系统通过让用户回答问题或者主动定制新闻的方式实现个性化,其个性化特性不够完善。本文提出了一种基于隐式反馈的用户建模方法,该方法通过用户终端收集用户使用记录并进行分析,建立基于加权关键词表示的多模型用户模型。该模型可以同时反映出用户的长期兴趣和短期兴趣,并可以实时自动更新。 学术界对推荐系统的研究主要集中在推荐效果上,但是对于实际应用,推荐系统的性能也十分重要。本文提出一种资源自适应的推荐算法,使系统在推荐效果和系统性能之间取得了动态平衡。该方法监测系统资源使用情况,通过调整新闻时间窗口、文档向量维度和用户模型关键词维度的方式来动态调整相似度计算的运算量。当访问压力增大时,系统降低运算量来提高系统性能。 本文实现了上述算法并设计了个性化新闻推荐系统EagleNews。该系统从国内知名新闻网站采集新闻,使用基于内容的推荐方法,以网络服务的方式运行于互联网上,可以使用通用的HTTP通信协议和标准的数据交换格式XML进行访问。实验表明系统取得了良好的效果。
基于事理图谱分析的教学设计平台研究
这是一篇关于教学行为事理图谱,用户建模,个性化推荐,教学设计,协同备课的论文, 主要内容为传统的备课方式有赖于单个教师手动撰写教案,且需要人工查找大量的教学资源来辅助备课过程,在此期间会过于消耗教师的精力,备课效果也难以得到保障。此外,现有备课平台大多只注重单纯的信息资源利用,难以满足教师用户的个性化教学设计和课程备课需求。因此,如何让教师更加有效且个性化地在网络平台上进行教学设计制作和课程备课是本文研究的重点。为此,本文主要研究了基于事理图谱分析的教学设计平台(后文简称ELG平台)的设计与实现,包括以下几个方面:(1)基于ELG分析的推荐算法研究。在充分考虑教学行为信息对刻画教师教学属性方面影响的基础上,通过对教学行为事理图谱的特征提取(即对教学行为事件及其顺承关系进行抽取),确立了教学行为事理图谱的结构特征,并以此完成了用户模型的构建及其更新策略;在用户建模的基础上,实现了基于用户动态特征信息的资源推荐算法(TRRA-UD)与融合用户聚类和交互关系的备课同伴推荐算法(CRA-UCIR)。(2)ELG平台原型的设计与研发。通过对建设ELG平台及其技术方案进行调研和文献研究,总结归纳了平台的实际使用需求,完成了平台原型的总体设计;采用SpringBoot+MybatisPlus+Vue框架完成了 ELG平台原型的研发,实现了在线协同备课、教学资源智能检索和推荐、教案模板生成、教学行为事理图谱可视化等主要功能。算法仿真实验结果表明,本文提出的基于ELG分析的推荐算法具备可行性与有效性;功能测试表明,ELG平台能够达到预想设计需求,将有效提升教师教学设计效率与课程备课效果。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码向导 ,原文地址:https://m.bishedaima.com/lunwen/46318.html