基于机器学习的社区文章推荐系统研究
这是一篇关于协同过滤,隐语义模型,TFIDF,Word2Vec,LDA主题模型,神经网络的论文, 主要内容为随着互联网技术的飞速发展,我们逐步迈入大数据时代。近年来,不少社区、论坛等互联网社交、问答的平台迅速崛起。由于互联网上数据量飞速增长,使得用户无从快速地选择所需要的信息。因此,帮助用户快速地搜索到符合用户喜好的信息变得尤为重要。信息推荐技术是实现这一需求的重要手段。通过挖掘、分析用户的历史行为数据、以及社区里的评论文本数据,推荐系统可以快速定位到用户所需要的信息,为用户提供可信的推荐结果。这样一来,用户检索信息的时间就可以大大减少了,而且用户的产品体验也改善了。因此,推荐功能也就起到了改善用户产品体验满意程度的作用,也为用户带来了更方便、更快捷的生活。协同过滤推荐方法是最早的推荐算法之一。其算法原理是:通过参考用户的历史行为和文章的不同属性来预测用户可能偏好的文章,选取预测得分较高的文章推荐给用户。但是,传统的推荐算法往往存在一些问题。其主要方面归纳如下:(1)数据稀疏性问题;(2)冷启动(Cold Start)问题;(3)同质化问题。为了解决传统的推荐算法所存在的问题,本文的研究工作提出了一种基于传统协同过滤的改进方法。首先,使用了皮尔森相似度对用户打分进行了归一化,剔除了零得分的文章和由于用户使用习惯差异引入的噪声。。另外,基于隐语义模型的推荐算法解决了在推荐上的稀疏性问题。除此之外,用户历史行为数据只能捕捉到一部分用户的行为习惯,对于没有游览、点击行为的用户便遗漏了信息。因此,本文还提出了使用组合推荐策略的方法。结合协同过滤算法和LDA主题模型相融合的推荐算法,一方面从用户评论数据中挖掘出用户的兴趣偏好,根据LDA主题模型中用户在不同主题上的概率用来计算用户的相似度。另一方面,改进的协同过滤算法用来计算文章的相似度。结合这两方面的信息,从不同维度上搜集更全面的用户信息用于推荐服务。这样的组合策略大大减轻了推荐中冷启动问题和同质化问题的影响。通过对实验结果分析得知,基于组合模型的推荐算法在准确率、召回率和多样性方面的优于传统推荐算法。为了实验验证组合模型的推荐效果,我们采集某企业的真实数据作为数据集,通过对比多种算法,并在多种评估指标上进行了实验。实验结果表明:基于融合模型的推荐算法在上述数据集上取得了良好的成绩。其准确性、查全率和广泛性都获得了提高。因此,该算法明显优于其他传统的推荐算法,从而证明了融合组合模型的推荐算法具有可行性、合理性和有效性。
基于LDA主题模型的电影推荐算法研究
这是一篇关于电影推荐,LDA主题模型,概率图模型,负样本,用户主题的论文, 主要内容为互联网的普及使得人们可以很方便的获取电影资源,但是随着电影资源越来越丰富,人们很难方便快捷的找到自己喜欢的电影。所以,对于视频网站而言,需要一个好的推荐系统来向用户推荐其可能感兴趣的电影。为了让用户可以准确及时的找到自己喜欢的电影,本文引入了 LDA主题模型对电影推荐进行研究。LDA的出现最开始是为了解决文本挖掘的问题,本文类比文本挖掘的过程,将用户看作是文档,电影看作是词,将用户给电影的评分看作是词频,从而将LDA给文档-词的建模过程迁移到电影推荐系统当中给用户-电影的建模过程,用户-电影的建模过程可以看成用户以一定的概率选择一个主题,再基于这个主题以一定的概率选择选择一部电影。在模型建好之后,本文又提出了两种改进策略:第一,为了进一步提高LDA主题模型推荐算法的推荐质量,本文提出了一种基于负样本进行学习的方法negLDA。LDA通过正样本的学习可以提取出用户喜欢的潜在主题元素,然后对电影进行正面预测评分,negLDA通过创造出负样本,进而从负样本的学习中来提取用户不喜欢的主题元素,对电影进行负面预测评分,该算法不单单只考虑用户喜欢的元素,也考虑用户不喜欢的元素,从而可以更加立体的评价用户对电影的喜欢程度,通过实验也证明了改进算法的有效性。第二,很多研究者都提出了基于LDA拓展和改进的概率图模型,本文重点研究了其中的两种模型并从中受到启发,也提出了自己改进的概率图模型—双重主题LDA模型(dual topic LDA,dtLDA),并将其应用在电影推荐系统当中,双重主题LDA模型在原有的LDA模型的基础上加入了用户主题的概念,用户-电影的建模过程就可以看成用户以一定的概率选择一个用户主题(或者说一个用户小组、用户社区),再以一定的概率选择一个电影主题,最后以一定的概率选择一部电影,这样的建模过程考虑到了单个用户的兴趣会被小集体所影响,实验结果证明改进后的算法可以提高推荐的精度。
基于个性化推荐的校园互动管理平台研究与设计
这是一篇关于校园互动管理平台,个性化推荐,协同过滤,LDA主题模型,SSH架构的论文, 主要内容为随着智能化信息时代的到来,校园学生对于获取信息的高效性也越来越重视。目前高校学生获取各类信息需要在不同的App和平台上进行,这对高校学生获取信息造成一定的局限性。在信息爆炸的时代,快速找到自己有用的信息对提高生活品质也显得必不可少。为此,需要搭建基于个性化推荐的、集失物招领、交友、经验交流、买卖交易为一体的校园学生互动管理平台。本平台采用个性化的推荐算法,为每一位学生提供个性化的服务,从而让用户快速的找到感兴趣的信息,进而提高高校学生获取信息的效率。基于本平台,用户可以实现购买产品、收藏产品、加入购物车、发货等功能。可以发布校园资讯帮助学生了解学校热点,促进高校学生的交流。同时设置了二手市场模块,帮助学生处理闲置物品。搭建毕业热点板块,帮助毕业生更快更好的了解社会最新动态。在线交流板块帮助学生们更好的沟通交流,做到即时通讯,了解不同学生的喜好从而促进学生们的综合发展,加强合作交流。同时为实现学生信息的精准对接,将个性化推荐技术运用到平台中,根据用户的喜好和特定需求,推荐其可能感兴趣的信息,从而实现提升用户体验和促进校园数字化管理。本文的主要工作如下:(1)提出一种混合推荐算法,该算法将LDA主题模型和协同过滤推荐算法相结合通过研究对比各类推荐算法的基本原理,分析推荐算法在校园互动管理平台推荐中存在的问题,然后提出一种全新的混合推荐算法。该算法会运用LDA主题模型建模同时根据协同过滤算法对用户评分矩阵进行聚类填充,有效缓解了矩阵评分稀疏性问题,提高推荐的准确性。(2)设计实现了校园互动管理平台按照软件开发流程,使用面向对象方法,分别从功能、行为以及数据入手,对校园互动管理平台进行设计、实现和测试。首先,经过一些走访和问卷调查等方式,准确理解用户和项目的功能、性能、可靠性等具体要求,将用户非形式的需求表述转化为完整的需求定义;对系统的技术、管理以及法律等可行性进行详细的分析,从而验证系统的可行性。采用模块化、层次化的设计思想,设计了平台体系结构构建方案。其次,使用SSH开框架实现校园学生互动管理平台。SSH框架是典型的三层架构体现MVC设计思想,同时可以让开发人员减轻重新建立解决复杂问题方案的负担和精力。便于敏捷开发出新的需求,降低开发时间成本。最后,对学生互动管理平台的功能、性能以及页面进行测试,主要包括功能完成情况、容错能力测试,对结果进行分析。
基于网购商品评价的情感分析系统设计与实现
这是一篇关于文本情感分析,BERT模型,长短期记忆网络,深度学习,LDA主题模型的论文, 主要内容为文本情感分析是自然语言处理(Natural Language Processing,NLP)最重要的研究内容之一,吸引了众多学者的关注。早期研究多采用构造文本词典以及贝叶斯等传统学习算法,工作量大、准确率低,近来有文献采用卷积神经网络CNN(Convolutional Neural Networks)等深度学习算法来解决文本情感分析的准确性和速度问题。本文研究基于网购商品评价的情感分析问题,采用BERT(Bidirectional Encoder Representation from Transformers)与LSTM(Long Short-Term Memory)建立文本情感分类模型,结合LDA(Latent Dirichlet Allocation)技术对评价内容提取主题,从而进一步挖掘文本中隐含的信息。本论文分析国内外文本分类的研究现状,依托著名平台京东电商中的手机文本评价数据进行算法模型研究,结合项目实际进行系统需求分析与设计,实现了基于网购商品评价的情感分析系统,本文的主要研究内容及工作创新如下:(1)理论技术研究。本文结合文本分类、LDA主题模型等技术的国内外研究现状,对近年来文献中出现的长短期记忆网络LSTM、BERT预训练语言模型等深度学习理论和用于主题提取的LDA模型进行研究,最后讨论目前主流的前端框架。(2)数据获取与预处理。课题研究的数据是通过数据采集器对京东电商平台中的手机文本评价进行抓取,并对获取到的数据进行预处理,删除多余列和重复数据。(3)文本情感分类模型构建。文本情感分类模型采用两种方式构建,一种是基于BERT的文本情感分类模型,另外一种是基于BERT与LSTM结合的文本情感分类模型。论文分别对两种情感分类模型进行实验,结果表明,两种方式在情感分类的准确率方面基本持平,但是基于BERT与LSTM结合的文本情感分类模型具有更快的运行速度,因此,选择BERT与LSTM结合的模型来实现本系统文本情感分类功能。(4)主题模型构建。通过jieba组件对分类后的评价内容进行中文分词,结合哈工大停用词表过滤停用词,最后运用LDA主题提取技术挖掘出评价文本中的关键主题。(5)系统设计与实现。结合项目需求分析,设计功能模块和My SQL数据库以及相关数据库表,采用主流前端框架Vue.js和Python语言实现基于网购商品评价的情感分析系统,并进行系统功能测试以满足用户需求,具有良好的交互性和实用性。
基于情境感知的兴趣点推荐算法研究与应用
这是一篇关于用户偏好,情境感知技术,混合推荐,兴趣点推荐,LDA主题模型的论文, 主要内容为近年来,移动设备的发展带动了兴趣点数据的积累,且感知技术的发展,使情境感知推荐系统成为推荐系统研究领域的热点之一。为帮助用户从海量数据中找到符合当前情境下用户偏好的兴趣点,融入情境信息的兴趣点推荐应运而生,但其仍面临着情境因素较多、用户-兴趣点-情境的签到矩阵稀疏等问题。因此,本文首先对影响兴趣点推荐的主要情境因素进行整理分类,再采用有效的方法缓解签到矩阵的稀疏性,提高推荐结果的准确性。本文主要工作如下。(1)在理论研究上,针对影响用户兴趣点偏好情境因素较多的问题,本文改进了传统情境因素分类方式,根据调查问卷的结果,分析并确定了影响用户兴趣点偏好的十个主要情境因素。针对用户-兴趣点-情境签到矩阵稀疏的问题,本文基于协同过滤,利用LDA主题模型和用户上下文信息计算用户近邻集合,然后,在用户近邻集合中,利用改进的情境效用计算方法实现基于内容的情境相似性度量,最后混合用户相似性与情境相似性实现目标用户的未知资源推荐。在Yelp数据集和Foursquare数据集上进行对比实验,实验结果显示,本文所提基于情境感知的兴趣点推荐算法的推荐结果准确性更高。(2)在应用实例上,本文基于以上研究,设计并实现了一款融合情境信息的个性化旅游推荐系统,该系统充分挖掘用户所处情境信息,为用户推荐适合于当前情境下的景点,很好地满足了用户对个性化旅游推荐系统的需求。系统同时也验证了本文理论研究在现实应用中的重要意义。本文共有图42幅,表17个,参考文献64篇。
基于情境感知的兴趣点推荐算法研究与应用
这是一篇关于用户偏好,情境感知技术,混合推荐,兴趣点推荐,LDA主题模型的论文, 主要内容为近年来,移动设备的发展带动了兴趣点数据的积累,且感知技术的发展,使情境感知推荐系统成为推荐系统研究领域的热点之一。为帮助用户从海量数据中找到符合当前情境下用户偏好的兴趣点,融入情境信息的兴趣点推荐应运而生,但其仍面临着情境因素较多、用户-兴趣点-情境的签到矩阵稀疏等问题。因此,本文首先对影响兴趣点推荐的主要情境因素进行整理分类,再采用有效的方法缓解签到矩阵的稀疏性,提高推荐结果的准确性。本文主要工作如下。(1)在理论研究上,针对影响用户兴趣点偏好情境因素较多的问题,本文改进了传统情境因素分类方式,根据调查问卷的结果,分析并确定了影响用户兴趣点偏好的十个主要情境因素。针对用户-兴趣点-情境签到矩阵稀疏的问题,本文基于协同过滤,利用LDA主题模型和用户上下文信息计算用户近邻集合,然后,在用户近邻集合中,利用改进的情境效用计算方法实现基于内容的情境相似性度量,最后混合用户相似性与情境相似性实现目标用户的未知资源推荐。在Yelp数据集和Foursquare数据集上进行对比实验,实验结果显示,本文所提基于情境感知的兴趣点推荐算法的推荐结果准确性更高。(2)在应用实例上,本文基于以上研究,设计并实现了一款融合情境信息的个性化旅游推荐系统,该系统充分挖掘用户所处情境信息,为用户推荐适合于当前情境下的景点,很好地满足了用户对个性化旅游推荐系统的需求。系统同时也验证了本文理论研究在现实应用中的重要意义。本文共有图42幅,表17个,参考文献64篇。
基于主题挖掘的电商用户负向体验问题研究
这是一篇关于电商用户体验,负向体验,LDA主题模型,PCN服务模型的论文, 主要内容为随着电商市场竞争加剧和消费端流量增长陷入瓶颈,电商行业的“蓝海”时代已经过去,各电商平台已经从前期“流量至上、低价竞争”的粗放化发展阶段向重视服务质量和用户体验的精细化发展阶段过渡。在此背景下,电商平台想要提高核心竞争力的关键在于重视用户全流程体验,提供优质商品和极致服务,形成良好口碑和用户粘性。然而,电商购物流程复杂、时间跨度长、参与方较多,如何发现并解决用户存在的障碍场景和负向问题,给予其更好的服务体验,是各电商平台亟需解决的一大难点。本文基于主题挖掘技术,爬取“黑猫投诉”网站中的电商用户投诉文本,对国内四大头部电商平台淘宝、京东、拼多多、抖音的用户负向体验数据进行挖掘分析并给出优化改进建议。主要工作如下:首先,对电商用户体验的国内外研究现状进行总结归纳,界定了电商用户负向体验概念,并对用户负向体验反馈渠道进行简要分析,从而明确研究目标及数据源。其次,使用爬虫技术从“黑猫投诉”网站爬取电商用户投诉数据并进行数据预处理。随后,利用统计学方法对投诉文本中的结构化数据进行初步描述分析,利用LDA主题模型对非结构化数据进行隐含语义主题挖掘,得到各电商平台的主题结果并进行对比分析。最后,依据主题挖掘结果,从两个维度提出改进建议:一是基于各电商平台用户负向体验的共性问题,立足用户售前、售中、售后电商购物全流程,应用服务质量PCN模型,从“内容宣传”“商家服务”“商品质量”“发货物流”“用户账号”五个方面,提出通用的电商用户负向体验优化方案;二是基于各电商平台用户负向体验的特性问题和其本身商业模式、发展阶段的不同,为淘宝、京东、拼多多、抖音提出更具针对性的用户负向体验改进建议。本研究在理论层面上以主题挖掘为主,结合了服务质量PCN模型等专家理论,拓展了电商用户体验的理论模型,丰富了情报学与其它学科的交叉研究;在实践层面上建立了一套通用的电商用户体验流程框架,为电商平台的后续研究提供了指导工具,并通过对淘宝、京东、拼多多、抖音用户负向体验进行主题挖掘分析,帮助各电商平台了解了网购过程中影响用户体验的关键因素,有助于其在用户体验方面做出更好的战略规划,提升竞争力,适应不断变化的市场环境。
基于用户兴趣的微博广告推荐系统设计与实现
这是一篇关于信息过载,用户兴趣,LDA主题模型,协同过滤,个性化推荐的论文, 主要内容为当下,互联网技术的快速发展将人类引入大数据时代,在数据的海洋里,信息消费者很难有效的找到自己感兴趣且有价值的信息,信息生产者也无法针对性的将信息传达给特定用户,这就是大数据时代中的“信息过载”问题。微博(原名新浪微博)是web2.0时代以来发展最好的社交产品之一,目前拥有约4.89亿月活跃用户,对微博来说,其移动端和web端每日产生巨大的数据量使平台上的“信息过载”问题变得非常严重。为解决这个问题,本文利用推荐技术来搭建推荐系统。值得一提的是,“社会化媒体营销”这个由互联网技术和电商企业孕育出的当下最流行的互联网营销观念被一些企业广泛的应用于宣传产品上,他们利用微博账号发布有关产品的博文或者购买微博平台广告功能将发布的博文推广给平台用户,但微博平台“信息过载”问题使用户在微博主页很容易错过感兴趣的企业账号发布的微博,此外,企业购买的微博广告功能常常出现推广博文与用户兴趣不匹配的现象。所以本文以微博为研究对象,开发一款基于用户兴趣的微博广告推荐系统,这样既可以解决“信息过载”问题,又可以根据用户的兴趣为其推荐微博广告。本文的主要任务是设计与实现基于用户兴趣的微博广告推荐系统,为此本文从以下几个方面展开工作:(1)对微博数据进行采集。微博数据获取有多种方式,本文采用网络爬虫技术模拟用户登录,设计爬取策略,提取微博数据并将数据存储在数据库中;(2)在获取微博数据的基础上对用户兴趣模型和微博广告特征提取进行研究。本文从用户的原创博文、用户的社交关系和用户的交互行为等三方面利用LDA主题模型挖掘用户兴趣,并利用基于HowNet词汇语义倾向计算方法合并同义词得到最终的用户兴趣模型。(3)利用TF-IDF算法提取微博广告特征。(4)在构建用户兴趣模型获得用户兴趣特征的基础上,对微博广告的个性化推荐技术进行研究。本文提出基于LDA主题模型和基于改进的协同过滤等个性化推荐算法为用户推荐微博广告。(5)最后,本文使用Python语言和Django网站开发框架以及MySQL数据库,开发了基于用户兴趣的微博广告推荐系统。本文通过上述工作,开发了基于用户兴趣的微博广告推荐系统,普通用户和管理员用户通过账号登录系统,普通用户可以查看系统为其推荐的微博广告列表,也可以查看用户资料和博文信息,管理员可以启动数据采集程序,构建用户兴趣模型,提取广告特征以及个性化微博广告推荐。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码小屋 ,原文地址:https://m.bishedaima.com/lunwen/46637.html