基于半结构化信息的产品推荐系统
这是一篇关于产品推荐系统,命名实体识别,属性抽取,相似度度量,主动学习,条件随机场的论文, 主要内容为产品推荐是指从海量网络产品信息中依据用户兴趣进行选择并向用户进行推荐。好的产品推荐系统一方面能极大节约用户搜索及挑选产品的时间,另一方面能有效增加商家的用户粘性。因此,产品推荐系统在电商中得到了越来越广泛的应用,与此同时,也暴露出了诸多问题,引起了越来越多研究者的关注。 本文在已有研究的基础上,着重研究基于半结构化信息的产品推荐系统中的两个关键技术,其一是从半结构化信息中抽取结构化的产品属性信息,其二是基于抽取的结构化属性信息进行产品相似度的度量。为此,本文开展了如下的研究和开发工作: (1)在产品结构化属性信息抽取方面,本文基于半结构化产品描述信息的特点,采用了基于主动学习的线性条件随机场模型进行产品属性及属性值的抽取。实验表明,该算法在获取较好抽取效果的同时,能减少对语料的标注,因此,具有较好的可移植性。 (2)在产品相似度度量方面,本文提出了基于所抽取的属性进行产品相似度度量的方法。该方法首先基于产品属性进行分类,之后在同类产品间采用最小编辑距离来综合其他属性度量产品相似度。实验表明了该方法的有效性。 (3)综合以上两个技术,本文实现了一个基于半结构化信息的产品推荐系统。在系统原型设计实现中,采用JSP+Servlet+Spring+Hibernate框架。实验表明,本文提出的方法在产品推荐系统中具有较好的可解释性、可扩展性和较好的推荐性能。
面向农产品的协同过滤推荐算法研究
这是一篇关于协同过滤推荐算法,农产品电子商务,相似度度量,谱聚类算法的论文, 主要内容为近年来,电子商务以方便信息沟通、收付方式灵活便捷等优点,促进社会信息化发展。但是,随着互联网的发展,很多用户深受“信息过载”的困扰,影响购物体验。于是,能够帮助消费者从海量数据中挖掘出其感兴趣的商品的推荐系统应运而生。推荐系统通过分析消费者的个人特征和行为特征,确定用户兴趣,进而向用户进行推荐。对经营者而言,能够提高交易量,达到精准营销的目的;对消费者而言,能够节约时间,快速找到其有意愿购买的商品。农产品电商是整个电商平台中尤为重要的一部分,农产品推荐系统具有增加农民收入、提高第一产业竞争力、促进农业信息化发展等重大意义,然而,现阶段关于农产品电子商务个性化推荐系统的研究较少。本文的研究目标是设计一种面向农产品的推荐算法,该算法以协同过滤推荐算法为基础,以快速推荐,效果良好为目标。本文的研究旨在抛砖引玉,以激发更多面向农产品的推荐算法的进一步、更深入的研究,本文主要工作及创新点如下:(1)选取面向农产品的推荐算法的基础算法。对农产品电子交易区别于其他商品交易的特点进行梳理,同时对协同过滤推荐算法进行总结和分类,并指出算法面临的问题。综合农产品线上交易的特点和各种协同过滤算法的特点,选取基于项目的协同过滤算法作为本文研究的面向农产品的推荐算法的基础算法。(2)针对冷启动问题,对算法做出改进。传统的协同过滤算法在冷启动情况下,推荐效果不佳,针对这一问题,本文提出IPSS项目相似性度量方法。此方法有两个主要部分:评分相似度和结构相似度,其中,评分相似度主要考虑两个项目评分之间的评分差、项目评分与评分中值之差,以及项目评分与其他评分平均值之差;结构相似度部分定义了共同评分项目占所有项目比重并惩罚活跃用户的逆项目频率(Inverse Item Frequence,IIF)系数。(3)针对可扩展性问题,对算法做出改进。传统的协同过滤推荐算法在海量数据情况下,会受到可扩展性问题的影响,针对这一问题,本文提出融合项目谱聚类的协同过滤算法。算法分为离线和在线两个步骤:离线时对项目聚类;在线时,首先确定目标项目从属的类别,然后在类中搜索近邻,最后求未评分项目的预测评分并据此为目标用户产生推荐。(4)对算法在真实数据上进行实验。简要介绍推荐引擎整体框架,并根据现有数据和算法使用MATLAB2009b在Movie Lens 100k和Grecs两个数据集对优化算法进行实验。首先需要按提示输入需要为其进行推荐的目标用户的编号,在手动输入编号后,程序会自动计算未评分项目的预测评分并根据计算结果产生推荐项目列表,展示给用户。本文提出的面向农产品的协同过滤推荐算法(记作SC-ICF)能够有效实现农产品推荐功能,此外,在冷启动、大规模数据集情况下,推荐效果优于传统算法。
基于半结构化信息的产品推荐系统
这是一篇关于产品推荐系统,命名实体识别,属性抽取,相似度度量,主动学习,条件随机场的论文, 主要内容为产品推荐是指从海量网络产品信息中依据用户兴趣进行选择并向用户进行推荐。好的产品推荐系统一方面能极大节约用户搜索及挑选产品的时间,另一方面能有效增加商家的用户粘性。因此,产品推荐系统在电商中得到了越来越广泛的应用,与此同时,也暴露出了诸多问题,引起了越来越多研究者的关注。 本文在已有研究的基础上,着重研究基于半结构化信息的产品推荐系统中的两个关键技术,其一是从半结构化信息中抽取结构化的产品属性信息,其二是基于抽取的结构化属性信息进行产品相似度的度量。为此,本文开展了如下的研究和开发工作: (1)在产品结构化属性信息抽取方面,本文基于半结构化产品描述信息的特点,采用了基于主动学习的线性条件随机场模型进行产品属性及属性值的抽取。实验表明,该算法在获取较好抽取效果的同时,能减少对语料的标注,因此,具有较好的可移植性。 (2)在产品相似度度量方面,本文提出了基于所抽取的属性进行产品相似度度量的方法。该方法首先基于产品属性进行分类,之后在同类产品间采用最小编辑距离来综合其他属性度量产品相似度。实验表明了该方法的有效性。 (3)综合以上两个技术,本文实现了一个基于半结构化信息的产品推荐系统。在系统原型设计实现中,采用JSP+Servlet+Spring+Hibernate框架。实验表明,本文提出的方法在产品推荐系统中具有较好的可解释性、可扩展性和较好的推荐性能。
基于半结构化信息的产品推荐系统
这是一篇关于产品推荐系统,命名实体识别,属性抽取,相似度度量,主动学习,条件随机场的论文, 主要内容为产品推荐是指从海量网络产品信息中依据用户兴趣进行选择并向用户进行推荐。好的产品推荐系统一方面能极大节约用户搜索及挑选产品的时间,另一方面能有效增加商家的用户粘性。因此,产品推荐系统在电商中得到了越来越广泛的应用,与此同时,也暴露出了诸多问题,引起了越来越多研究者的关注。 本文在已有研究的基础上,着重研究基于半结构化信息的产品推荐系统中的两个关键技术,其一是从半结构化信息中抽取结构化的产品属性信息,其二是基于抽取的结构化属性信息进行产品相似度的度量。为此,本文开展了如下的研究和开发工作: (1)在产品结构化属性信息抽取方面,本文基于半结构化产品描述信息的特点,采用了基于主动学习的线性条件随机场模型进行产品属性及属性值的抽取。实验表明,该算法在获取较好抽取效果的同时,能减少对语料的标注,因此,具有较好的可移植性。 (2)在产品相似度度量方面,本文提出了基于所抽取的属性进行产品相似度度量的方法。该方法首先基于产品属性进行分类,之后在同类产品间采用最小编辑距离来综合其他属性度量产品相似度。实验表明了该方法的有效性。 (3)综合以上两个技术,本文实现了一个基于半结构化信息的产品推荐系统。在系统原型设计实现中,采用JSP+Servlet+Spring+Hibernate框架。实验表明,本文提出的方法在产品推荐系统中具有较好的可解释性、可扩展性和较好的推荐性能。
基于内容和协同过滤的混合推荐算法研究及应用
这是一篇关于混合推荐算法,内容特征,协同过滤,用户评分,相似度度量的论文, 主要内容为在大数据时代,人们一方面享受着大数据所带来的红利,各个平台都给用户们提供了多种多样的选择,以此来丰富人们生活。但是另一方面,用户也不得不面临信息爆炸的挑战,如何从广泛的数据中准确挑选出符合自身需求的个性化的信息已经成为迫切需要解决的问题,个性化推荐系统由此而生。在个性化推荐系统的发展历程中,最为关键的便是其核心内容——推荐算法的研究与应用。目前的主流推荐算法有基于内容的推荐算法、协同过滤算法等。基于内容的推荐算法能够充分利用推荐对象的属性特征进行推荐,但其推荐结果局限性较强,不能挖掘出用户潜在的兴趣爱好。协同过滤推荐算法有着比较稳定的性能,但也存在着数据稀疏性、新物品没有用户评分难以推荐导致“冷启动”等问题。此外,传统协同过滤算法的核心内容在于相似度的计算,但一些常用的相似度计算方法通常不考虑两个用户评分向量间的交叠程度和用户兴趣的衰减变化。论文在综合了上述主流推荐算法的优缺点的基础上,提出一种基于内容和协同过滤的混合推荐算法(CB-TUB),以此来提升算法性能。论文的具体工作包括:第一,针对项目“冷启动”问题,用特征“标签”对项目内容进行描述,进行基于内容的推荐。第二,在利用基于用户的协同过滤推荐算法进行推荐时,通过用户对项目的隐式评分来构建用户-评分矩阵,以此缓解数据稀疏性问题。在相似度计算时,一方面引入用户的评分时间权重,体现用户兴趣变化;另一方面,引入杰卡德统一算子距离,衡量用户间共同评分项目所占的比重。最终,论文创造性地提出了“用户感兴趣指数”这一指标以便两种算法能在同一维度上进行混合,并给出了计算方法。在算法混合时,将推荐项目的加权后用户感兴趣指数从高到低排序,为用户产生Top-N推荐。论文将混合算法应用在了电视节目个性化推荐中。利用2018年泰迪杯B题中的电视节目数据集对混合算法的性能进行实验仿真。研究发现在进行权重混合之后,混合算法在精确率、召回率、1F score方面相较传统的单一算法均有所提升,具有推荐优势。
基于半结构化信息的产品推荐系统
这是一篇关于产品推荐系统,命名实体识别,属性抽取,相似度度量,主动学习,条件随机场的论文, 主要内容为产品推荐是指从海量网络产品信息中依据用户兴趣进行选择并向用户进行推荐。好的产品推荐系统一方面能极大节约用户搜索及挑选产品的时间,另一方面能有效增加商家的用户粘性。因此,产品推荐系统在电商中得到了越来越广泛的应用,与此同时,也暴露出了诸多问题,引起了越来越多研究者的关注。 本文在已有研究的基础上,着重研究基于半结构化信息的产品推荐系统中的两个关键技术,其一是从半结构化信息中抽取结构化的产品属性信息,其二是基于抽取的结构化属性信息进行产品相似度的度量。为此,本文开展了如下的研究和开发工作: (1)在产品结构化属性信息抽取方面,本文基于半结构化产品描述信息的特点,采用了基于主动学习的线性条件随机场模型进行产品属性及属性值的抽取。实验表明,该算法在获取较好抽取效果的同时,能减少对语料的标注,因此,具有较好的可移植性。 (2)在产品相似度度量方面,本文提出了基于所抽取的属性进行产品相似度度量的方法。该方法首先基于产品属性进行分类,之后在同类产品间采用最小编辑距离来综合其他属性度量产品相似度。实验表明了该方法的有效性。 (3)综合以上两个技术,本文实现了一个基于半结构化信息的产品推荐系统。在系统原型设计实现中,采用JSP+Servlet+Spring+Hibernate框架。实验表明,本文提出的方法在产品推荐系统中具有较好的可解释性、可扩展性和较好的推荐性能。
基于Petri网的电商平台用户访问行为相似度分析及应用
这是一篇关于Petri网,相似度度量,H-K聚类,访问行为分析的论文, 主要内容为随着互联网的普及以及电子商务的快速发展,网购逐渐变成人们生活中不可或缺的一部分。用户在电子商务平台进行购物的过程中留下的操作痕迹存储于系统的数据库中,而且在系统的运行时间不断增加的基础上,大量的用户访问行为的痕迹信息被存储在后台数据库中,企业掌握着如此海量的宝贵的数据资源,如何从这些资源中发掘出有价值的内容并加以应用变得十分重要。本文以电子商务用户的访问行为的相似度分析为基础,研究了电商平台用户行为分析的Petri网方法,主要内容如下:(1)首先通过系统后台日志数据对单用户访问行为Petri网建模完成后,基于单用户的访问行为Petri网,提出两个用户行为的相似度度量算法。该算法分别计算用户模型的相似度和用户标签数据的相似度,如年龄、性别、访问时间等,将这两种相似度进行综合,共同评价两个用户的相似程度。(2)在得到两个用户的相似度度量标准后,利用H-K聚类算法,对用户访问行为的Petri网模型进行聚类,然后通过本文提出的群体用户访问行为Petri网模型的构造算法,对属于同一类群体的用户进行模型合并,生成群体用户访问行为Petri网模型。(3)针对电子商务用户访问行为的分析,在得到单用户访问行为Petri网模型,群体用户访问行为Petri网模型的基础上,通过Petri网理论中的可达性、公平性、同步距离等性质,分别研究了上述不同类别Petri网模型间的一致性分析方法,用户访问行为状态合法性的分析方法,用户访问行为间关联关系分析方法及用访问户行为与数据间的关联关系分析方法。主要基于群体用户访问行为Petri网解决用户异常行为检测,用户访问行为预测等问题。本文工作将Petri网的理论与方法引入到基于系统后台日志的用户访问行为描述与分析领域,为将Petri网应用于数据分析领域相关问题进行了有益的尝试和探索。
基于Petri网的电商平台用户访问行为相似度分析及应用
这是一篇关于Petri网,相似度度量,H-K聚类,访问行为分析的论文, 主要内容为随着互联网的普及以及电子商务的快速发展,网购逐渐变成人们生活中不可或缺的一部分。用户在电子商务平台进行购物的过程中留下的操作痕迹存储于系统的数据库中,而且在系统的运行时间不断增加的基础上,大量的用户访问行为的痕迹信息被存储在后台数据库中,企业掌握着如此海量的宝贵的数据资源,如何从这些资源中发掘出有价值的内容并加以应用变得十分重要。本文以电子商务用户的访问行为的相似度分析为基础,研究了电商平台用户行为分析的Petri网方法,主要内容如下:(1)首先通过系统后台日志数据对单用户访问行为Petri网建模完成后,基于单用户的访问行为Petri网,提出两个用户行为的相似度度量算法。该算法分别计算用户模型的相似度和用户标签数据的相似度,如年龄、性别、访问时间等,将这两种相似度进行综合,共同评价两个用户的相似程度。(2)在得到两个用户的相似度度量标准后,利用H-K聚类算法,对用户访问行为的Petri网模型进行聚类,然后通过本文提出的群体用户访问行为Petri网模型的构造算法,对属于同一类群体的用户进行模型合并,生成群体用户访问行为Petri网模型。(3)针对电子商务用户访问行为的分析,在得到单用户访问行为Petri网模型,群体用户访问行为Petri网模型的基础上,通过Petri网理论中的可达性、公平性、同步距离等性质,分别研究了上述不同类别Petri网模型间的一致性分析方法,用户访问行为状态合法性的分析方法,用户访问行为间关联关系分析方法及用访问户行为与数据间的关联关系分析方法。主要基于群体用户访问行为Petri网解决用户异常行为检测,用户访问行为预测等问题。本文工作将Petri网的理论与方法引入到基于系统后台日志的用户访问行为描述与分析领域,为将Petri网应用于数据分析领域相关问题进行了有益的尝试和探索。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码客栈 ,原文地址:https://m.bishedaima.com/lunwen/51975.html