基于FP关联规则的购物推荐系统的开发
这是一篇关于关联规则,相关推荐,频繁项集,规则提取的论文, 主要内容为利用个性化推荐推动企业电子商务在改善顾客关系、培养顾客忠诚度以及增加网上销售方面具有明显的效果。现有的一些电子商务网站通常利用普通的数据库查询技术形成产品推荐,其最大的优点就是查询速度快,但索引会对insert、update、delete等操作产生影响,降低系统性能,影响客户体验。推荐系统需要有大量的数据才能为新顾客做出准确有效的推荐,因此近年来基于数据挖掘的技术在产品推荐中得到了越来越多的关注。为了解决电子商务网站查询存在的问题,设计准确有效且高性能的个性化推荐系统,需要基于数据挖掘领域的技术设计新的个性化推荐系统。 针对现有普通的数据库查询技术在相关产品推荐上存在的缺陷,采用基于关联规则挖掘的方法,实现设计准确有效且高性能的推荐系统。首先讨论购物网站相关商品的个性化推荐和目前常用的基于数据库查询的弊端。然后,引入数据挖掘中的关联规则技术作为规则挖掘的基本的实现手段,来实现大型数据库下高效准确的相关产品推荐。为了克服FP关联规则方法在内存上的瓶颈,在此基础上采用了改进FP关联规则挖掘频繁项集,结合支持度-置信度-兴趣度的方法实现电子购物中的相关产品推荐系统。通过实例证明了所设计的推荐系统具有较高的效率和较准确的推荐能力。
半结构化数据蕴涵规则提取方法的研究
这是一篇关于半结构化数据,蕴涵规则,规则提取,并行计算,数据分析的论文, 主要内容为半结构化数据是相对结构化数据而言的,是伴随着互联网应用产生的一种新的数据形式,它广泛存在于各大社交网络平台和电商平台中。在大数据环境下,半结构化数据的数据规模、生长速度和广度都远远超过结构化数据,呈现出快速增长和发展的势头。蕴涵关系是探求对象之间蕴涵特性的一种描述形式,蕴涵规则是描述蕴涵关系的一种知识表示形式,也是经典逻辑和近似推理中的主要推理形式。对半结构化数据中的互联网商务、消费数据提取蕴涵规则,能够为企业、商家和消费者的分析和决策提供参考。因而,对半结构化数据蕴涵规则提取方法的研究具有理论意义和实际应用前景。针对半结构化静态数据的蕴涵规则提取问题,给出两种规则提取方法。第一种方法是将半结构化数据转化为结构化数据,应用数据转换方法和遗传算法,给出半结构化静态数据蕴涵规则的提取过程,提出了半结构化静态数据蕴涵规则提取算法SDIR,应用网络爬虫工具爬取大众点评网数据,并完成将半结构化静态数据向结构化数据的转换及数据预处理,提取数据的蕴涵规则,实验验证了算法有效性。第二种方法是基于XQuery查询语言直接对网页中的半结构化数据进行蕴涵规则提取,根据SDST概念提出了基于XQuery查询语言的改进Apriori算法,实现了对复杂不规则多个网页半结构化数据的蕴涵规则提取,通过在模拟交易数据集上的测试,仿真实验验证了算法的有效性。针对半结构化动态数据的蕴涵规则提取问题,引入蕴涵强度向量度量,与支持度向量、置信度向量共同反应蕴涵规则随时间变化的动态性,提出了基于划分的并行动态半结构化数据蕴涵规则提取算法,通过三台计算机搭建Hadoop并行计算环境,设计并行计算的MapReduce函数,将该算法在Hadoop平台应用MapReduce进行并行计算,提高算法的运行效率,通过实验验证了算法的有效性。将半结构化数据蕴涵规则提取方法应用于淘宝客户交易数据的分析,数据来自厦门大学数据库实验室开发团队爬取的淘宝2015年6月至11月的客户交易数据。首先对数据进行预处理操作,然后提取数据的关联规则和蕴涵规则,提取关联规则是为了获得频繁项集,使得提取的蕴涵规则有更大的应用范围,最后分析提取数据的关联规则和蕴涵规则,为商家提供参考决策。
网络形式背景下的规则提取与推荐算法研究
这是一篇关于形式背景,概念认知,规则提取,网络形式背景,组推荐的论文, 主要内容为复杂网络下的概念认知学习是数据挖掘和人工智能等领域的重要研究方向。将形式概念分析理论与复杂网络分析方法相结合,发挥它们各自的优势,对深化网络中概念认知理论和应用的研究非常有意义。本文在网络形式背景的基础上,结合复杂网络的拓扑结构特征,对网络规则的提取方法和推荐系统算法进行了以下两方面的研究。首先,提出了网络决策形式背景的概念,将决策形式背景与网络分析统一到一个数据框架下,从而可以用形式背景的方法研究网络规则的提取。具体思路如下:(1)研究了网络决策形式背景的弱概念及其相应子网络。这样,不仅可以找到网络的弱概念,而且可以知道与弱概念对应的子网络的特征值。(2)提出了网络弱概念逻辑的概念,以及其相应的性质,为后面研究网络规则的提取方法奠定了基础。(3)提出了基于邻接结构的规则提取算法。(4)利用UCI数据集对所提出的算法进行了测试,同时还分析了各规则的覆盖度及其对应子网络的特征值,实验表明本文提出的规则提取算法是有效的。其次,在前面基于邻接结构的规则提取算法的启发下,结合推荐系统的相关理论提出了基于弱概念相似度的组推荐算法。具体思路如下:(1)确定专家节点。通过定义属性度、属性密度来描述属性的重要性,进而用改进的节点影响力来确定专家节点。(2)通过专家节点划分社区。将专家的一阶邻接集合视为与专家联系最密切的社区,从而在各个专家社区中进行推荐。在划分的社区中利用属性弱概念下限相似度进行组推荐研究,进而获取推荐规则并对相应社区进行组推荐。(3)利用Movie Lens数据集和Filmtrust数据集分析了各参数对所提算法的影响,并确定了最优参数。进一步,将提出的算法与其他推荐算法进行了比较测试,实验表明文中算法是有效的。
空腹和餐后血糖状态判定差异性研究
这是一篇关于对比分析,规则提取,空腹血糖状态,餐后血糖状态的论文, 主要内容为伴随经济的飞速发展和城市化进程的全面推进,人们的生活方式发生了巨大改变,II型糖尿病已成为严重威胁人类健康的慢性非传染性疾病之一。通过对空腹血糖和餐后血糖状态判定进行糖尿病筛查,可及早发现高危和患病人群。用于空腹血糖和餐后血糖状态判定的关键风险因素基本相同,但关键风险因素对空腹和餐后血糖的影响程度不同,如果可以发现其对不同条件下血糖作用效果的联系及差异,有助于提升糖尿病筛查效果,促进居民健康水平和提高卫生经济学效益。针对空腹和餐后血糖状态判定效果对比相关研究缺失的问题,提出了一种综合多种分类算法的不同条件下血糖状态判定效果及属性重要度对比方法。方法首先采用四种分类算法分别构建空腹和餐后血糖状态判定模型;然后使用属性重要度计算方法,分别计算空腹和餐后血糖状态判定中各个属性的重要度;最后对不同条件下血糖状态判定效果和属性重要度进行对比分析。在国民健康调查公开数据集上对该方法进行实验,结果表明,在相同属性集下空腹血糖状态判定准确率高于餐后血糖状态判定准确率;非侵入性体检指标更适用于空腹血糖状态判定;属性重要度量化结果对指导糖尿病筛查模型构建、提升筛查效果具有重要价值。针对空腹和餐后血糖状态判定模型解释性差,现有规则提取方法无法有效对比两者判定过程的问题,提出了一种基于集成树规则约简的判定模型规则提取方法。方法分别对空腹血糖状态判定模型和餐后血糖状态判定模型进行人工数据集构建、集成树生成和规则约简,并对提取的判定规则集进行了对比分析。实验结果表明,该方法在保证较高判定准确率条件下,可以获得规模较小的判定规则集,增强了模型解释性,实现了空腹和餐后血糖状态异常人群判定过程的对比,并为空腹和餐后血糖状态判定对比研究提供了新思路,对糖尿病筛查工作开展具有积极作用。设计并实现了一套血糖状态判定原型系统,并给出了系统架构及功能结构。该系统基于B/S架构实现,包含数据采集、异常检测、结果展示、数据预处理、血糖状态判定、判定规则提取和日志采集功能。系统可以利用体检指标,实现对个体空腹和餐后血糖状态的判定,并将判定结果及相应判定过程进行可视化。
基于FP关联规则的购物推荐系统的开发
这是一篇关于关联规则,相关推荐,频繁项集,规则提取的论文, 主要内容为利用个性化推荐推动企业电子商务在改善顾客关系、培养顾客忠诚度以及增加网上销售方面具有明显的效果。现有的一些电子商务网站通常利用普通的数据库查询技术形成产品推荐,其最大的优点就是查询速度快,但索引会对insert、update、delete等操作产生影响,降低系统性能,影响客户体验。推荐系统需要有大量的数据才能为新顾客做出准确有效的推荐,因此近年来基于数据挖掘的技术在产品推荐中得到了越来越多的关注。为了解决电子商务网站查询存在的问题,设计准确有效且高性能的个性化推荐系统,需要基于数据挖掘领域的技术设计新的个性化推荐系统。 针对现有普通的数据库查询技术在相关产品推荐上存在的缺陷,采用基于关联规则挖掘的方法,实现设计准确有效且高性能的推荐系统。首先讨论购物网站相关商品的个性化推荐和目前常用的基于数据库查询的弊端。然后,引入数据挖掘中的关联规则技术作为规则挖掘的基本的实现手段,来实现大型数据库下高效准确的相关产品推荐。为了克服FP关联规则方法在内存上的瓶颈,在此基础上采用了改进FP关联规则挖掘频繁项集,结合支持度-置信度-兴趣度的方法实现电子购物中的相关产品推荐系统。通过实例证明了所设计的推荐系统具有较高的效率和较准确的推荐能力。
半结构化数据蕴涵规则提取方法的研究
这是一篇关于半结构化数据,蕴涵规则,规则提取,并行计算,数据分析的论文, 主要内容为半结构化数据是相对结构化数据而言的,是伴随着互联网应用产生的一种新的数据形式,它广泛存在于各大社交网络平台和电商平台中。在大数据环境下,半结构化数据的数据规模、生长速度和广度都远远超过结构化数据,呈现出快速增长和发展的势头。蕴涵关系是探求对象之间蕴涵特性的一种描述形式,蕴涵规则是描述蕴涵关系的一种知识表示形式,也是经典逻辑和近似推理中的主要推理形式。对半结构化数据中的互联网商务、消费数据提取蕴涵规则,能够为企业、商家和消费者的分析和决策提供参考。因而,对半结构化数据蕴涵规则提取方法的研究具有理论意义和实际应用前景。针对半结构化静态数据的蕴涵规则提取问题,给出两种规则提取方法。第一种方法是将半结构化数据转化为结构化数据,应用数据转换方法和遗传算法,给出半结构化静态数据蕴涵规则的提取过程,提出了半结构化静态数据蕴涵规则提取算法SDIR,应用网络爬虫工具爬取大众点评网数据,并完成将半结构化静态数据向结构化数据的转换及数据预处理,提取数据的蕴涵规则,实验验证了算法有效性。第二种方法是基于XQuery查询语言直接对网页中的半结构化数据进行蕴涵规则提取,根据SDST概念提出了基于XQuery查询语言的改进Apriori算法,实现了对复杂不规则多个网页半结构化数据的蕴涵规则提取,通过在模拟交易数据集上的测试,仿真实验验证了算法的有效性。针对半结构化动态数据的蕴涵规则提取问题,引入蕴涵强度向量度量,与支持度向量、置信度向量共同反应蕴涵规则随时间变化的动态性,提出了基于划分的并行动态半结构化数据蕴涵规则提取算法,通过三台计算机搭建Hadoop并行计算环境,设计并行计算的MapReduce函数,将该算法在Hadoop平台应用MapReduce进行并行计算,提高算法的运行效率,通过实验验证了算法的有效性。将半结构化数据蕴涵规则提取方法应用于淘宝客户交易数据的分析,数据来自厦门大学数据库实验室开发团队爬取的淘宝2015年6月至11月的客户交易数据。首先对数据进行预处理操作,然后提取数据的关联规则和蕴涵规则,提取关联规则是为了获得频繁项集,使得提取的蕴涵规则有更大的应用范围,最后分析提取数据的关联规则和蕴涵规则,为商家提供参考决策。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设驿站 ,原文地址:https://m.bishedaima.com/lunwen/56099.html