8篇关于K-Means的计算机毕业论文

今天分享的是关于K-Means的8篇计算机毕业论文范文, 如果你的论文涉及到K-Means等主题,本文能够帮助到你

连锁超市管理信息可视化平台开发与实现

这是一篇关于商业智能,连锁超市,高价值用户,RFM,K-Means,可视化的论文, 主要内容为连锁超市已经成为现代生活不可分割的组成部分,超市为我们带来的便利的购物体验。于此带来方便的同时,超市每天的人流量大,客户购入数据组成复杂,库存、进货、销售每一环节层层紧扣。连锁超市的管理是一个复杂且庞大的体系。我们需要将超市的数据进行整理、管理、并用简单易懂的可视化手段将数据呈现出来。利用商业智能(BI)化的系统通过对进行抽取、转换、处理、呈现,将数据进行分析处理,呈现为可视化的图形界面。本文构建了一个超市管理信息的可视化平台,实现了对连锁超市重点数据的可视化实现。系统采用B/S架构,使用JAVA+MYSQL+WEB技术手段对系统进行开发。第一个部分是:连锁超市仪表板的可视化界面,将所有重点数据都在同一个界面上呈现出来,还可以通过点击对数据进行下钻。并且做了动态页表可以在页面上动态的显示出数据变化,是一个可交互式的管理信息仪表板。还使用了RFM模型与K-means算法对系统中会员部分数据进行分析处理,为用户打上标签以后用聚类分析,分析用户群像特征,分析用户购买行为。第二个部分是:连锁超市经营数据表的查看以及可视化数据展示,将重点放在单个表的数据的选择查看。通过对表单的筛选以及数据时间段的选择,表单将呈现在页面上,同时呈现可视化图形并且可以选择想要生成的可视化图形样式。在此还提供页面的保存为图片和下载成PDF以及excel的功能。

基于异构网络节点嵌入的虚假评论群组检测算法

这是一篇关于虚假评论群组,异构信息网络,随机游走,K-Means,卷积神经网络的论文, 主要内容为近年来,随着电子商务网站及社交网络的快速发展,评论信息成为决定人们是否消费的重要因素。然而,虚假评论群组的存在影响了电商平台的真实性和公平性。为了检测虚假评论群组,人们进行了各种研究。这些方法存在的共同问题是不能很好的识别出虚假评论群组,导致检测精度不高。本课题围绕当前研究的局限性,从以下两方面进行了研究,具体内容如下。首先,针对现有算法无法充分挖掘用户之间的潜在关系且没有对检测指标进行重要程度的划分问题,提出基于元图的虚假评论群组检测算法。该算法通过提取用户、产品的评论时间和评分等信息,构建基于元图的异构网络,挖掘用户之间的潜在关系。之后采用改进的Deepwalk算法进行游走得到用户节点的低维向量表示,通过Canopy算法与K-Means算法相结合进行聚类得到虚假评论候选群组。并根据熵值法计算各检测指标的动态权重,将划分权重后的各检测指标融合得到群组怀疑度并对其进行排序,从而识别虚假评论群组。其次,针对现有算法对产品评论信息中相关属性挖掘不充分的问题,提出基于特征融合的虚假评论群组检测算法。算法融合了产品与评论时间、产品与评分产生两个新属性,构建用户与新属性融合后得到的基于特征融合的异构网络,采用节点嵌入的思想得到用户的向量表示。将用户向量输入到卷积神经网络中进行训练,根据用户预测值进行分阶段聚类,计算候选群组中的用户紧密度划分出虚假评论群组,得到最终检测结果。最后,对于本文中所提的算法,在Amazon和Miami数据集上进行实验,并将实验和已有算法进行对比,实验结果表明,本文提出的算法在给定数据集上的精确率与召回率方面具有一定优势。

基于Hadoop的高校学业预警系统设计与实现

这是一篇关于Hadoop平台,FP-Growth,K-Means,数据挖掘的论文, 主要内容为近年来,国家对高校教育的重视程度不断增大,高校扩张也在持续增加,大学生的人数也越来越多,从而产生了许多问题和挑战。其中大学生的学业问题尤为重要,如生源质量降低、学生挂科人数日益增多、学生退学率增加等。学业质量下降对高校、个人和家庭都带来了负面影响,因此建立高校的学业预警系统迫在眉睫,对学生有计划、有针对性的帮扶,让学生顺利完成学业,成为对社会有用的一份子。但由于高校学科繁多,系统与系统之间相互独立,学生的学业数据也错综复杂,想要在这些大量的数据中挖掘出有价值的信息,传统的单机计算模式显然不能满足日益增长的需求。本文在此背景下,设计并实现了高校学业预警系统,结合Hadoop分布式Map Reduce计算框架,实现学生成绩的预测和预警,帮助学生完善学业,对高校人才培养具有理论和现实意义。本文的设计思路如下:首先,采用Hadoop平台技术,构建分布式的数据处理平台,为算法的并行化计算提供技术支持。其次,运用FP-Growth关联规则分析和K-Means算法,结合Hadoop平台的优势,将其应用于学业分析中,为校领导和老师提供针对性的建议和解决方案。通过并行化K-Means算法挖掘出课程成绩之间的分布,根据聚类的结果对不同类型的学生提出针对性的合理建议;并行化FP-Growth算法通过对学生挂科的学业课程进行数据挖掘,得到学科与学科之间的内在关联关系,有利于做出合理的培养计划。最后,基于SSH框架,通过对表示层、业务逻辑层和数据持久层的整合,搭建学业预警系统。该系统由预警数据管理、预警信息管理、预警数据挖掘和系统基础信息管理四部分组成。一方面实现了不同阶段学生的学业信息和预警信息,有助于老师和学生随时了解学业概览;另一方面,系统可以对学生成绩进行预警分析,例如通过对某一挂课率较高学科,挖掘出学科之间的关联关系,便于高校及时制定行之有效的培养方案,为高校的教学提供理论支撑,推进高校的智慧校园建设。

面向数据中台的业务数据挖掘研究及应用

这是一篇关于数据中台,数据模型,数据挖掘,RFM,K-Means的论文, 主要内容为自2015年阿里提出中台战略以来,“中台”概念便成为互联网讨论的热点;现在中台战略常被简单地概括为“大中台、小前台”,其主要含义将企业的核心业务能沉淀和聚集到业务中心组成的中台层,前台应用以中台为支撑,向轻量化、敏捷化转变。今天企业的IT生态可以自然地分为应用和数据两大部分,前者指的是各类业务应用系统,后者指的是数据仓库、数据湖等中心化的数据平台。由于这两类系统的设计思想和实现技术有着很大的差别,所以中台架构顺势分成了业务中台和数据中台两部分。数据中台的定位是中心化的企业数据处理平台,企业所有的数据需要输送至数据中台,由数据中台统一进行收集、清洗和转换并集中存储,然后经过数据仓库体系的层层治理将数据按业务主体重新组织,为前台业务提供数据集,主要模块包括采集、数仓存储、数据管理与数据服务。伴随着市场的快速发展,需要企业能够根据市场的变化快速做出响应。特别是当前的电商行业,业务需求的数据变得多样,业务需求迭代更新速度加快等问题,促使企业越来越重视实时数据分析,同时对数据分析也提出了更高的需求,在数据挖掘及机器学习等诸多领域都有迫切的需求。通过实时数据处理可以将业务情况实时地反馈给业务用户,极大的缩短了业务用户的等待时间,数据挖掘不仅能挖掘数据中的商业价值同时对业务决策的支撑作用也至关重要,传统的数据仓库系统都是基于关系型数据的离线处理,主要服务于结构化数据的处理和计算。所以现在迫切需要一种能够在当前数据中台架构上满足实时计算和数据挖掘的需求。针对上述问题,本文根据当前数据中台主要架构,设计了一种多模式数据处理模块,丰富了数据中台架构,使得对数据计算、数据挖掘提供更好的支撑;结合所建数据中台通过使用多模式数据处理模块数据计算和数据挖掘功能对客户价值细分进行了研究。主要工作分为三部分:第一、分析了数据中台总体数据流程,针对数据流程并结合当前前台业务的特点提出了多模式数据处理模块,首先确定了多模式数据处理模块的基本需求并根据需求进行了功能设计。该模块是基于数据中台数据存储区域设计,通过使用数据存储区域的数据进行快速的数据开发和挖掘工作,以便向前台提供类型更丰富的数据。第二、结合某电商业务构建了一种具有多模式数据处理的数据中台架构,并基于该架构进行了数据中台各模块建设。主要包括多格式自动化数据采集、数据模型与计算、多模式数据处理模块、数据管理以及数据服务等。第三、针对当前电商系统中客户细分的需求,基于所建数据中台进行了客户价值挖掘研究。在细分方法中首先针对CRM中常用的RFM模型的单向性和静态性问题提出一种具有多向且动态的VRFMS模型,以识别和区分线上消费者的不同消费习惯和偏好,在方法上使用了层次分析法和K-Means算法进行数据挖掘研究,以提高挖掘结果的准确性,在实现上主要使用多模式数据处理模块进行相关数据计算和数据挖掘工作。通过客户细分的挖掘研究进一步证实了多模式数据处理中台架构的可行性。

基于用户行为的网络游戏细粒度用户画像构建研究

这是一篇关于用户画像,数据工程,基于规则,K-Means,管理服务系统的论文, 主要内容为在游戏产业发展愈发迅速的今天,越来越多的网络用户选择网络游戏作为互联网娱乐生活的重要组成部分。不仅如此,人们原有的娱乐活动场所也逐渐地从现实空间向网络虚拟空间转移。相较于现实空间具有的开放性与不确定性,当人们使用特定的软件或应用进行网络游戏活动时,其自身需求、行为目标和行为模式都是收束和被界定的,这给本文对基于用户行为的用户画像构建研究提供了基础环境。用户画像这一概念在电商、统计、搜索、社交等领域已被广泛应用,但在游戏行业中国内外相关的研究内容并不多见。虽然近年来游戏产业中的数据分析工作对于用户画像的研究和应用已经取得了一定的进展,但随着网络中游戏内容的进一步丰富,所产生的信息资源规模也在随之增长。只有少数大公司才可以配备专门的数据分析人员,实现大量数据的整理与分析。为了适应游戏产业的发展趋势,满足大多数中小型互联网游戏公司数据分析需求,本文以实现基于用户行为模式分析,从多角度建立可动态调整的细粒度用户画像为目标,对以下几个方面的问题进行研究,总结如下:(1)针对大批量的游戏内原始行为日志,建立完整的数据工程,实现对数据的初步清洗和分析,为后续构建用户画像做好准备。(2)提出了一套针对游戏内用户画像设计方法,尤其在业界对于用户类别划分、标签选取和评估机制建立的研究上做出了自己的贡献。(3)分别使用基于原始日志信息、基于规则和基于K-Means聚类算法三种方法生成标签并构建用户画像。(4)搭建基于Spring Boot和Vue.js的用户画像管理服务系统,以实现相关人员对用户画像及相关组成数据的数据可视化分析工作。

面向数据中台的业务数据挖掘研究及应用

基于Hadoop架构的用户协同过滤影视推荐系统的研究与应用

这是一篇关于协同过滤,K-Means,推荐系统,Hadoop的论文, 主要内容为近年来,随着移动互联网、云计算、多媒体等技术和应用的快速发展,互动电视正在进入数字化时代,提供个性化的节目服务日益渗透进人们的生活。互动化、个性化、信息化已成为互动电视的主要特征,影视推荐系统也成为互动电视重要的研究应用方向。推荐系统以特定用户群体为目标,以挖掘用户兴趣喜好为基础,为用户提供精确的信息服务和产品推荐。在当今大数据的环境下,原有采用信息检索和信息过滤技术的推荐系统,已经不能满足海量数据下快速、实时处理需求,从而制约了推荐系统的发展。本论文以互动电视影视推荐为研究对象,结合Hadoop技术、协同过滤算法,分析并构建了一个分布式架构的推荐系统,优化和改进了现有推荐算法,应用结果表明达到预期研究目标。论文具体研究内容如下:(1)基于Hadoop技术,搭建了自动化、智能化的互动电视影视剧推荐系统。本论文将Hadoop的分布式架构应用于互动电视领域,通过分析推荐系统中存在的用户兴趣变化、冷启动、数据稀疏度等问题,设计了针对互动电视行业的大数据推荐系统。(2)针对目前电视节目推荐个性化、准确性、高效的需求,构建了基于电视用户行为的协同过滤推荐模型,并应用于互动电视节目推荐中。在互动电视用户的点播行为数据、影视剧信息、用户基础信息等基础上,采用K-Means聚类算法对用户进行聚类,结合互动电视的行业特点,建立了基于用户行为的协同过滤推荐模型。(3)采用Hadoop分布式文件系统、HBase列式数据库和Mahout等大数据技术对系统进行设计实现。最后对建立的推荐模型通过搭建测试环境进行了验证,并将成果应用于实际系统中,取得了良好的实际效果,为互动电视用户提供更加贴切的服务和体验。