融合用户微博兴趣挖掘与协同过滤的新闻推荐研究
这是一篇关于冷启动,新闻推荐,兴趣挖掘,协同过滤,微博的论文, 主要内容为互联网作为信息的高速公路经历了快速的发展,而在发展过程中带来的“信息爆炸”严重影响着用户使用互联网的体验,高效的信息检索要求下推荐系统应运而生。推荐系统利用已有的数据信息通过各种算法推测并推荐给用户可能感兴趣的项目,再通过用户对推荐项目的反馈调整推荐方向,不断优化推荐系统。在实际应用中,推荐系统中新用户基于内容推荐的“冷启动”和潜在兴趣缺失问题随之出现。在推荐系统中引入用户外部已有信息数据是解决新用户冷启动和潜在兴趣缺失问题的方案之一,由于个人社交媒体(微博)信息的公开性、精确性和信息多样性被广泛研究应用于个性化推荐系统。与此同时,协同过滤算法利用用户群体集与项目集之间进行交互行为来进行推荐,其作为解决推荐多样性不足且富有新颖性的推荐方法被广泛研究。近年来关于对社交媒体的研究越来越多,研究者通过分析社交媒体进行热点新闻预测、舆论分析、个性化推荐和社区发现等研究。通过挖掘社交媒体信息,给社会化各群体以用户画像,经过个体的个人信息、微博发文、转发和评论等信息分析的个人用户画像作为个性化推荐的基础。在本文中,通过研究微博媒体结构来实现对个体用户的兴趣挖掘,并使用挖掘的用户兴趣集作为基于内容新闻推荐的元数据之一。根据上述研究思路用以解决在实际新闻推荐应用过程中存在的冷启动和推荐多样性不足问题,本文的主要研究工作如下:首先,针对传统基于内容的推荐算法存在的新用户的“冷启动”问题,提出了一种融合用户微博兴趣挖掘和协同过滤的新闻推荐算法,该算法通过关联用户的微博数据并从中挖掘用户兴趣,经过相似度计算得到基于用户微博兴趣挖掘的候选推荐新闻集,再利用用户历史新闻评价信息,运用基于用户的协同过滤算法得到最终的候选新闻集,从而解决冷启动和推荐多样性缺失问题,并提高推荐效果。其次,在挖掘用户微博兴趣过程中,通过分析群体用户微博发现存在很多的微博用户微博发文少,针对这一问题,运用了微博兴趣挖掘框架,通过将挖掘微博用户关注者的背景信息和标签信息用来表示为微博发文少用户的兴趣,提出了一种微博用户兴趣挖掘算法,该算法在融合用户微博发文兴趣、用户潜在关注兴趣等兴趣挖掘,对用户微博兴趣集进行更好的构建。最后,进行新闻推荐过程中出现的维度灾难问题,通过textCNN进行了文本分类,太大降低推荐过程中的计算消耗时间,同时与传统的新闻推荐算法进行比较实验,并得到结论。通过分析实验结果表明,该算法在提高了推荐效果的同时具有多样性和新颖性,并且能够有效的缓解新用户的冷启动问题。
基于注意力模型的图像高级语义标注算法的研究与实现
这是一篇关于兴趣挖掘,主题模型,图像标注,跨模态相似性计算的论文, 主要内容为如何管理和检索互联网庞大的图像资源是多媒体技术研究的重点,兴趣挖掘和图像标注是解决这一问题的关键途径。早期的图像标注技术受限于数据集的规模,标注性能不高。现有的图像标注技术摆脱了数据集规模的约束,直接在互联网环境中查找具有相似图像特征的已标注图像,然后根据这些图像的语义关键词完成对未知图像的语义标注。然而互联网下的数据集标注质量良莠不齐,并且这些标注面向全体互联网用户,不具有个性化的特点,所以标注结果与人类心理预期有诸多差异。个性化的图像标注需要解决几个关键问题:首先是如何描述用户兴趣演化的问题;然后是如何个性化识别图像标注区域的问题;最后是如何基于图像与标签的关系,跨越语义鸿沟,实现图像高级语义标注的问题。针对上述关键科学问题,论文的主要研究内容和创新点如下:(1)针对描述用户兴趣演化的问题,提出了一种基于可变兴趣模型(Deformable Interests Model,DIM)的用户兴趣挖掘方法。该方法通过兴趣追踪模型(Interests Tracking Model,ITM)将标注词映射到频繁模式空间,考虑时间因素,挖掘用户长期兴趣;通过可变兴趣模型(Deformable Interests Model,DIM)融合用户长期兴趣和情景兴趣,全面和精确地挖掘用户兴趣。在此基础上,该方法使用影响力实时更新机制,自适应更新长期兴趣、短期兴趣和热点话题对用户兴趣的影响力。实验结果表明,该方法能实时、全面、准确地挖掘用户兴趣。(2)针对个性化识别标注区域并生成对应高级语义的问题,提出了一种基于跨模态局部近邻分析模型的高级语义生成算法(Local-HSNN)。该算法首先确定生成高级语义的对象,随后计算跨模态特征相似度,最后利用强排名模型生成符合观察任务的图像区域及语义关键词。实验结果表明,该方法能准确地实现个性化识别标注区域并生成对应语义关键词。(3)设计与实现基于注意力模型的图像高级语义标注系统,跨越“语义鸿沟”,实现图像高级语义标注。图像高级语义标注系统采用B/S架构实现,具备完整的个性化地自动标注图像高级语义功能、丰富的可视化功能和完善的用户管理功能,具有较高的安全性和较快的响应速度。
融合用户微博兴趣挖掘与协同过滤的新闻推荐研究
这是一篇关于冷启动,新闻推荐,兴趣挖掘,协同过滤,微博的论文, 主要内容为互联网作为信息的高速公路经历了快速的发展,而在发展过程中带来的“信息爆炸”严重影响着用户使用互联网的体验,高效的信息检索要求下推荐系统应运而生。推荐系统利用已有的数据信息通过各种算法推测并推荐给用户可能感兴趣的项目,再通过用户对推荐项目的反馈调整推荐方向,不断优化推荐系统。在实际应用中,推荐系统中新用户基于内容推荐的“冷启动”和潜在兴趣缺失问题随之出现。在推荐系统中引入用户外部已有信息数据是解决新用户冷启动和潜在兴趣缺失问题的方案之一,由于个人社交媒体(微博)信息的公开性、精确性和信息多样性被广泛研究应用于个性化推荐系统。与此同时,协同过滤算法利用用户群体集与项目集之间进行交互行为来进行推荐,其作为解决推荐多样性不足且富有新颖性的推荐方法被广泛研究。近年来关于对社交媒体的研究越来越多,研究者通过分析社交媒体进行热点新闻预测、舆论分析、个性化推荐和社区发现等研究。通过挖掘社交媒体信息,给社会化各群体以用户画像,经过个体的个人信息、微博发文、转发和评论等信息分析的个人用户画像作为个性化推荐的基础。在本文中,通过研究微博媒体结构来实现对个体用户的兴趣挖掘,并使用挖掘的用户兴趣集作为基于内容新闻推荐的元数据之一。根据上述研究思路用以解决在实际新闻推荐应用过程中存在的冷启动和推荐多样性不足问题,本文的主要研究工作如下:首先,针对传统基于内容的推荐算法存在的新用户的“冷启动”问题,提出了一种融合用户微博兴趣挖掘和协同过滤的新闻推荐算法,该算法通过关联用户的微博数据并从中挖掘用户兴趣,经过相似度计算得到基于用户微博兴趣挖掘的候选推荐新闻集,再利用用户历史新闻评价信息,运用基于用户的协同过滤算法得到最终的候选新闻集,从而解决冷启动和推荐多样性缺失问题,并提高推荐效果。其次,在挖掘用户微博兴趣过程中,通过分析群体用户微博发现存在很多的微博用户微博发文少,针对这一问题,运用了微博兴趣挖掘框架,通过将挖掘微博用户关注者的背景信息和标签信息用来表示为微博发文少用户的兴趣,提出了一种微博用户兴趣挖掘算法,该算法在融合用户微博发文兴趣、用户潜在关注兴趣等兴趣挖掘,对用户微博兴趣集进行更好的构建。最后,进行新闻推荐过程中出现的维度灾难问题,通过textCNN进行了文本分类,太大降低推荐过程中的计算消耗时间,同时与传统的新闻推荐算法进行比较实验,并得到结论。通过分析实验结果表明,该算法在提高了推荐效果的同时具有多样性和新颖性,并且能够有效的缓解新用户的冷启动问题。
融合用户微博兴趣挖掘与协同过滤的新闻推荐研究
这是一篇关于冷启动,新闻推荐,兴趣挖掘,协同过滤,微博的论文, 主要内容为互联网作为信息的高速公路经历了快速的发展,而在发展过程中带来的“信息爆炸”严重影响着用户使用互联网的体验,高效的信息检索要求下推荐系统应运而生。推荐系统利用已有的数据信息通过各种算法推测并推荐给用户可能感兴趣的项目,再通过用户对推荐项目的反馈调整推荐方向,不断优化推荐系统。在实际应用中,推荐系统中新用户基于内容推荐的“冷启动”和潜在兴趣缺失问题随之出现。在推荐系统中引入用户外部已有信息数据是解决新用户冷启动和潜在兴趣缺失问题的方案之一,由于个人社交媒体(微博)信息的公开性、精确性和信息多样性被广泛研究应用于个性化推荐系统。与此同时,协同过滤算法利用用户群体集与项目集之间进行交互行为来进行推荐,其作为解决推荐多样性不足且富有新颖性的推荐方法被广泛研究。近年来关于对社交媒体的研究越来越多,研究者通过分析社交媒体进行热点新闻预测、舆论分析、个性化推荐和社区发现等研究。通过挖掘社交媒体信息,给社会化各群体以用户画像,经过个体的个人信息、微博发文、转发和评论等信息分析的个人用户画像作为个性化推荐的基础。在本文中,通过研究微博媒体结构来实现对个体用户的兴趣挖掘,并使用挖掘的用户兴趣集作为基于内容新闻推荐的元数据之一。根据上述研究思路用以解决在实际新闻推荐应用过程中存在的冷启动和推荐多样性不足问题,本文的主要研究工作如下:首先,针对传统基于内容的推荐算法存在的新用户的“冷启动”问题,提出了一种融合用户微博兴趣挖掘和协同过滤的新闻推荐算法,该算法通过关联用户的微博数据并从中挖掘用户兴趣,经过相似度计算得到基于用户微博兴趣挖掘的候选推荐新闻集,再利用用户历史新闻评价信息,运用基于用户的协同过滤算法得到最终的候选新闻集,从而解决冷启动和推荐多样性缺失问题,并提高推荐效果。其次,在挖掘用户微博兴趣过程中,通过分析群体用户微博发现存在很多的微博用户微博发文少,针对这一问题,运用了微博兴趣挖掘框架,通过将挖掘微博用户关注者的背景信息和标签信息用来表示为微博发文少用户的兴趣,提出了一种微博用户兴趣挖掘算法,该算法在融合用户微博发文兴趣、用户潜在关注兴趣等兴趣挖掘,对用户微博兴趣集进行更好的构建。最后,进行新闻推荐过程中出现的维度灾难问题,通过textCNN进行了文本分类,太大降低推荐过程中的计算消耗时间,同时与传统的新闻推荐算法进行比较实验,并得到结论。通过分析实验结果表明,该算法在提高了推荐效果的同时具有多样性和新颖性,并且能够有效的缓解新用户的冷启动问题。
社交媒体用户画像构建方法研究与系统实现
这是一篇关于用户画像,社交媒体,兴趣挖掘,属性分析,文本分类的论文, 主要内容为随着5G时代的到来与数字化社会的快速发展,人们的生活越来越依赖网络。与此同时,方便人们表达自我与网络社交的社交媒体平台也飞速发展。越来越多的用户进入社交媒体平台,留下了丰富的个人动态、个人信息等数据,这些数据都是用户自主产生,具有极大的真实性与可靠性。通过分析用户在社交媒体平台产生的数据,可以做到尽可能全面、准确地描绘用户画像。用户基本属性和用户兴趣是社交媒体用户画像重要的组成部分,对于社交平台运营管理、个性化推荐、个性化营销等方面具有重要的意义。因此,结合社交媒体用户画像的研究现状,本文基于新浪微博,从用户基本属性和用户兴趣画像两方面构建社交媒体用户画像。主要贡献有以下三点:(1)在社交媒体用户基本属性研究方面,以用户性别与年龄研究为例,构建用户性别与年龄分类方法。从特征构建和算法模型两个方面对性别与年龄的分类进行了研究。在特征集的构建中,主要构建了三类特征:基于Word2vec的词向量特征、基于LDA的主题特征,以及统计特征,通过将多种特征融合进行实验,实验表明所采用的多种特征对于分类效果有明显的提升。在算法方面,提出了Stacking模型融合的框架,并与传统的算法进行对比,实验表明相较于传统的算法,本文所提出的Stacking模型融合的框架对于分类效果有明显的提升。(2)在社交媒体用户兴趣挖掘研究方面,结合之前学者的研究,并根据社交媒体平台的实际情况,以兴趣类别能够覆盖绝大多数的微博,并且不同类别之间有较大的区分度为原则,划分了10个不同的兴趣类别。并且由于微博文本短小,表达随意,使用传统的短文本分类算法不能取得良好的效果,因此本文选择将微博短文本合并成用户文档合集,采用主题模型算法进行研究。同时本文使用LDA的改进模型Labeled-LDA对主题特征进行提取,并结合用户文本内容之外的其他统计特征,构建多特征模型,与常用的兴趣挖掘算法进行对比,发现相较于传统的兴趣挖掘模型,本文所提出的多特征模型的实验效果更好。(3)本文完成了社交媒体用户画像分析系统的设计与实现,通过对社交媒体用户画像分析系统进行详细的分析与细节的设计,结合Python和Django框架及MySQL数据库完成了系统的核心功能,包括数据获取、用户基本属性分析、用户兴趣分析,同时也实现了一些附加的功能,实验表明社交媒体用户画像分析系统表现良好,可以有效地提取用户画像并进行可视化展示。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码导航 ,原文地址:https://m.bishedaima.com/lunwen/56129.html