基于社会媒体的旅游推荐系统研究与实现
这是一篇关于旅游推荐,社会媒体,Word2vec,LDA的论文, 主要内容为随着信息技术的不断发展,旅游业也在不断地进行创新突破,“旅游+信息化”成为一个备受关注的热点,人们可以通过互联网获取到海量的旅游信息,通过这些信息来帮助用户进行计划的制定以及决策。社会媒体既是一个用户可以自由分享自己的意见和观点的平台,却也会出现信息过载的问题。为了使用户可以在海量信息中快速准确地找到自己想要的内容,个性化推荐系统是一种非常有效的解决方案。目前旅游景点推荐系统仍存在数据稀疏问题,为了更好地进行旅游景点的推荐,本文针对现有推荐算法进行优化与改进,提出一种基于Word2vec和LDA模型的旅游景点推荐模型,并通过设计实现的旅游景点推荐原型系统,将本文提出的推荐模型应用于该原型系统中。本文的主要内容如下:(1)介绍了当前个性化旅游推荐算法的国内外研究现状以及存在的问题,由此引入了基于社会媒体的旅游景点推荐算法,然后详细介绍了基于协同过滤的推荐算法、基于内容的推荐算法以及混合推荐算法的原理以及优缺点,对本文用到的LDA主题模型与Word2vec词向量模型进行了研究与分析。(2)由于LDA是以全局的形式来预测文档中的词汇、Word2vec以局部的形式来预测文档中的词汇的特殊性,本文提出一种基于Word2vec和LDA模型的旅游景点推荐模型。该推荐模型的核心思想是通过LDA主题模型将景点评论文本转换为景点-主题-词矩阵,再通过结合Word2vec词向量模型转换为景点-主题-词向量矩阵,通过上述矩阵生成用户/景点向量模型,基于用户/景点向量模型预测用户对未知景点的评分来产生推荐结果。另外,还对基于Word2vec和LDA的推荐模型进行了拓展研究。通过在爬取的去哪儿网的旅游景点评论数据集上与其他的推荐算法做实验对比,实验结果表明,本文提出的推荐模型在评分预测准确率上有所提升。(3)对旅游景点推荐原型系统进行需求分析,采用B/S架构,将本文提出的基于Word2vec和LDA的推荐模型应用到系统中,设计并实现了一个由用户管理模块、评论管理模块、景点推荐模块等组成的个性化旅游景点推荐系统,最后对系统主要功能模块进行了测试以及界面展示。
基于“城市画像”与“用户画像”的个性化旅游推荐系统实践
这是一篇关于城市画像,用户画像,文本挖掘,旅游推荐,城市形象的论文, 主要内容为随着经济社会的发展,旅游成为人们日常生活中重要的组成部分。无论是周末的出行还是节假日的旅游,人们往往在下一次旅游出行目的地以及相应路线安排上投入了大量时间精力,期望收获性价比高、体验感好的旅行体验。而网上五花八门的旅游攻略和琳琅满目的旅游商品消耗了用户大量的时间,大大提升了用户的决策成本,降低了用户的旅游前体验。于是如何更好地利用网上用户过往的游览路线、评论、图片等多维度信息,经过加工处理、提炼整合,为现有用户服务呢?本文提出了一种解决方案。本文基于“带着微博去旅行”这一平台的用户数据,选取了北京、上海、成都、杭州、西安、重庆、大连、香港共8个目标城市,从无到有实现了一个基于“用户画像”与“城市画像”的个性化旅游推荐系统。首先,本文对爬取到的原始数据进行了加工处理,使之成为有价值的能够被系统所利用的信息,这一阶段实现的是“用户画像”以及“城市画像”。构建用户画像,第一步是通过将用户的基本属性数据标签化,得到“年龄、性别、星座、身份属性”等人口标签,另外基于语义匹配规则提炼出“摄影爱好者/美食爱好者/时尚达人”等族群标签,第二步是根据用户在某一景点发表的评论文本以及景点定位数据,得到用户的旅游类型标签,进一步丰富用户画像。城市画像的构建主要围绕两个维度展开:第一个维度是根据用户微博的配图得到8个城市的图片集,通过在百度EasyDL平台上训练图片分类模型,预测8个城市的图片在现代化元素、传统元素、自然风景、美食等9个标签上的分布,实现图像维度的城市画像。第二个维度是从用户文本出发,按城市聚合根据TextRank关键词提取技术得到每个城市在名词、形容词、动词上的TOP30关键词,实现文本维度的城市画像。按景点聚合得到每个景点下的评论文本,分别获取景点关键词,基于语义匹配规则可得到景点与不同旅游类型的映射关系,通过遍历文本得到各景点在各旅游类型上的热度分布,实现景点画像,再汇总统计每个城市在各旅游类型上的分布,得到旅游类型维度的城市画像。在这个过程中,本文提出了几种计算城市、景点、用户内部相似度的参考维度,并结合欧式距离、Jaccard距离以及余弦相似度等相似度计算方法进行了实现,具体有:1.根据图片标签分布、文本关键词以及该城市景点的旅游类型分布来计算城市之间的相似度;2.根据用户的人口标签、族群标签与旅游类型分布计算用户之间的相似度;3.根据景点关键词或在各旅游类型上热度分布计算景点间的相似度;其次,本文基于以上工作搭建了一个简单的个性化旅游推荐系统,即利用信息推荐算法实现用户与旅游系统的交互,通过获取用户的旅游需求以及个人的外显和内隐的行为数据,然后根据旅游的约束条件,为用户直接推荐最合适的旅游景点,帮助用户快速决策。具体方法有基于内存的协同过滤推荐,基于内容的推荐,基于人口统计学的推荐,基于标签的推荐以及基于知识的推荐,此外还有基于兴趣关键词搜索的推荐。本文详细地说明了各种推荐方法的推荐设计、应用效果、局限性以及改进方向。但由于本文清洗后有效用户数据量有限,导致用户-景点矩阵非常稀疏,很难通过交叉验证等方法实现推荐指标的度量,但本文展示了一种如何充分利用用户各维度的历史旅行数据,搭建个性化旅游推荐系统的思路以及相应的技术实现,并围绕实现目标、优势与应用价值以及应用局限性进行了比较分析。在应用与展望部分,本文提出基于个性化旅游推荐系统,搭建一个小型的智能交互式旅游推荐公众平台,为解决实际旅游推荐场景提供可行性。最后,本文利用城市画像、用户画像对城市形象进行分析,从旅游推荐延伸到旅游目的地的城市形象建设,基于用户在有影响力的社交媒体平台上发表的内容,挖掘用户对城市形象的感知,并针对旅游城市形象建设以及旅游开发提出了相关建议。
基于Spark云计算平台的旅游景点推荐算法优化研究
这是一篇关于Spark,旅游推荐,LDA,规范化,RSA的论文, 主要内容为在新时代的旅游中,传统的旅游方式正在发生着深刻的蜕变,在线旅游逐渐兴起并日益成为了旅游市场的新热点。如今,在大数据的背景下,在线旅游数据日渐超载,数据的存储、计算分析和管理俨然已经成为了旅游行业亟待解决的难题之一。此外,过载的旅游数据也给用户带来了极大的信息困扰,降低了用户的旅游服务体验感。为了解决上述问题,亟需新的平台以及合适的推荐算法来为用户提供了较好的旅游信息筛选和推荐服务。针对目前旅游景点推荐研究的不足之处,本文提出了基于Spark云计算平台的旅游景点推荐算法优化研究方案,主要研究工作如下:1.结合Spark云计算平台技术。Spark是目前解决各行各业大数据存储、计算分析以及管理的优秀云计算平台。Spark可以利用Hadoop的分布式存储平台来存放超载的旅游大数据信息,此外,Spark的分布式计算架构可以有效地提升分析计算旅游数据的效率。本文利用Spark云计算平台实现旅游数据的分布式存储和旅游景点推荐算法的并行化计算,以提高算法推荐的时效性。2.爬取真实旅游数据集。利用编写的Python爬虫代码对旅游网站的数据进行爬取,以获得用户对景点的真实评分和评论文本等信息。将爬取的真实数据集用于推荐算法比对实验,以证明改进算法的实用性。3.提出一种基于评分与评论文本信息的LDA主题加权的算法模型。该算法利用评分以及评论信息为用户提供个性化景点推荐。首先,对于评论文本信息合集,先是通过LDA主题模型来求得该合集的主题分布,然后再利用重新定义的相对熵方法进行相似度计算;其次,考虑到评分对每条评论的影响,利用规范化后的用户平均分计算得到的加权值对单条评论产生的主题分布进行加权,并计算相似度。接着,将这两个计算得到的相似度以一定的比例结合起来,得到联合相似度。最后利用这种联合相似度计算目标对象对未评分过景点的预测分值,并根据预测分值的大小对景点进行顺序排序和目标推荐。实验结果表明,本文所提的算法模型在景点评分预测方面有着较高的准确性。
基于自注意力机制和神经协同过滤的旅游群组推荐
这是一篇关于旅游推荐,群组推荐,自注意力机制,神经协同过滤的论文, 主要内容为移动互联网的高速发展在4G、5G时代体现出了极强的适应性,为人们日常生活水平的提高提供了强有力的技术加持。在旅游业中,各大旅游网站通过采集吃住行相关的兴趣点信息供用户预订选择,用户在此信息网络中可以充分利用各种数据为出行提供决策依据,但不可避免的也有由于数据量过于庞大而导致用户无法高效选择的问题。推荐系统在众多商业领域展现出其显著的高效优势,但在旅游业的应用还有待研究和拓展。近年来,越来越多的用户以旅游团的方式出行,推荐对象由用户升级为群组,如何去合理高效地聚焦、匹配旅游群组,是进行精准推荐的核心数据预处理工作。此外,相较于传统个性化推荐系统,面向用户的推荐只需考虑个人历史交互信息,而面向群组的推荐不仅面临历史交互数量的增加,还需考虑如何融合群组成员的偏好来预测群组决策,尽可能提高整体满意度。现有的群组推荐系统在融合成员偏好时,多采用静态的、预定义的策略来进行浅层次的评分融合,这极大地增加了群内成员差异性过大导致最终结果满意度过低的风险。除了要认识到不同成员之间的差异性,还应充分考虑到用户的历史交互项对其偏好精准表达的影响,以及不同成员在加入特定群组时对当前候选景点选择的话语权,这个过程是动态、具有交互影响性的,从而才能有效应对稀疏数据集和用户冷启动的问题。本文针对以上问题,以旅游群组推荐系统为目标,开展深入的研究,主要的内容与创新点如下:(1)针对旅游群组用户具有众多不同风格的特点,本文提出一种用户自适应的旅游群组发现算法。应用局部异常点检测方法(Local Outier Factor,LOF)分割离群用户与非离群用户,然后在非离群用户集依次确定初始群组中心、k-means聚类,最后依据一定的标准,确定异常点的群组,完成群组发现。(2)针对旅游群组推荐系统具有动态学习成员偏好和海量数据计算的需求,本文提出一种基于自注意力机制的旅游群组推荐模型(Self-Attention-Based Tour Group Recommendation,SATGR)。该模型首先设计一个两层的神经注意力网络来学习群组中不同成员的个性偏好,当组与不同的项目交互时,既能够根据单个用户历史交互信息学习到其定制偏好向量,还能在模拟群组决策时,根据不同用户历史经验对决策的影响性,为不同用户分配特定的权重,动态调整群体的聚集策略。此外,还应有效利用用户-项交互数据来提高群组推荐的性能。为了在海量数据中捕捉群体决策的复杂过程,本文将原始用户项交互和学习到的组项交互同时输入至神经协同过滤(Neural Collaborative Filtering,NCF)框架,通过这种方式,不仅可以提高两个任务的性能,解决信息过载和动态建模问题,而且还可以通过利用群组数据为没有历史个人行为的冷启动用户提供建议。实验结果表明,自适应群组发现算法相较于随机群组划分方法能有更佳的推荐效果,同时,本文提出的SATGR模型相较于传统的基准推荐模型,在两个数据集(Mafengwo、Foursquare)的 HR 指标上分别提升了 3.83%和 3.02%,NDCG 指标上分别提升了 4.54%和5.64%,从而有效地证明了该旅游群组推荐模型能同时从项目级别和用户级别考虑对群组决策的影响力差异,动态性地聚合不同旅游群组在面对不同候选景点时的偏好,从而更精准地表达旅游群组偏好特征,借助神经协同过滤框架实现旅游群组的动态推荐。
基于知识图谱和用户动态偏好的旅游推荐算法研究
这是一篇关于知识图谱,旅游推荐,LSTM,知识表示,知识学习的论文, 主要内容为旅游推荐中存在着对用户偏好和旅游产品复杂信息更细粒度的描述的难题,以及在线旅游信息推荐中用户数据稀疏和兴趣多变的问题。并且在中文知识图谱领域中,还没有公开的旅游景点知识图谱。然而,不同于以往的推荐,旅游推荐数据存在一定的稀缺性,无论是用户交互数据还是景点属性信息,都影响着推荐的效果。基于知识图的旅游推荐,可以利用本身的结构优势和丰富的信息作为推荐系统的辅助提供数据。为了解决以上问题,本文主要研究内容如下:(1)旅游领域知识图谱的构建,设计并实现了旅游知识图谱的构建方法。将知识图谱概念引入到旅游推荐领域,对旅游领域知识特征进行分析,实现了领域内实体和关系的划分,完成了旅游领域本体库的构建。然后抽取了旅游领域的实体和关系,并且完成了基于关系数据库的知识图谱存储。最后分析了关系数据库进行知识存储的利弊,利用Neo4j改进了知识的存储方式。(2)针对在线旅游信息推荐中存在的数据稀疏和用户兴趣多变的问题,本研究提出一种在线旅游信息推荐模型(Knowledge Graph Embedding Travel Recommendation,KGETR)。该模型包括了信息嵌入和兴趣传播两个核心模块。信息嵌入模块利用知识图嵌入,对旅游信息和用户属性进行统一的向量表示;兴趣传播模块通过基于嵌入和路径结合的兴趣传播,来丰富用户和旅游产品的属性特征。此外,本文还引入时间属性构造知识图谱四元组,准确把握用户兴趣。结果表明,该模型在准确率、召回率和F1分别提升了6.72%、13.8%、29.03%。(3)针对用户复杂的长期偏好和旅游产品复杂信息的更细粒度的描述的问题,结合用户的长期和短期偏好构建了一种将知识图表示引入推荐系统的神经注意力旅游推荐模型(Long-Short Attention Travel Recommendation,LSATR)。具体来说,LSATR主要分为两个核心模块,即旅游产品编码器和用户编码器。旅游产品编码器是一个多通道、词实体对齐的知识感知卷积神经网络,它融合了旅游产品的语义级和知识级表示,并且将单词和实体视为多个通道,在卷积过程中显式地保持它们的对齐关系。用户编码器采用双向长短期记忆神经网络(Bi-directional Long-Short Term Memory,Bi-LSTM)研究用户的长、短期偏好。为了满足用户不同的兴趣,我们设计了一个注意力模块来动态聚合用户关于当前候选旅游产品的历史。在真实的旅游电子商务数据集上进行了大量的实验,证明了LSATR比现有的深度推荐模型取得了实质性的改进。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码导航 ,原文地址:https://m.bishedaima.com/lunwen/49214.html