基于降维和聚类的推荐算法研究与应用
这是一篇关于个性化推荐系统,协同过滤,主成分分析,K-means聚类的论文, 主要内容为随着互联网的发展,网络用户数量和承载着各种信息的数据量都在快速增长。面对史无前例的数据量,用户如何获取到自己感兴趣的信息,互联网服务提供商如何让自己提供的服务被目标用户关注并使用都成为亟需解决的问题。智能的个性化推荐系统应时而生,推荐系统利用推荐算法分析用户的历史浏览、购买和评价等信息,预测用户喜好然后进行推荐。推荐算法是推荐系统的核心,本文对传统的协同过滤推荐算法进行了研究与优化,设计了一种新的基于PCA降维与改进的K-means聚类的协同过滤推荐算法PK-CF。该算法为解决用户-项目评分矩阵极度稀疏造成的相似度计算误差的问题,采用主成分分析法对用户-项目评分矩阵进行降维,去除包含信息量少的维度,只保留最能代表用户特征的维度;为解决协同过滤算法在系统规模庞大情况下的相似度计算耗时长的问题,对降维后的数据进行K-means聚类来降低搜索目标用户最近邻的用时,并基于k维树设计了新的初始质心选择算法对K-means算法进行了改进,在保证最终聚类效果的同时加快了聚类的速度。为了进一步提高推荐系统的实时性和可扩展性,设计了PK-CF算法在主流大数据平台Spark平台上的并行化方案,实现了对改进后的K-means算法的并行化和预测评分过程的并行化。本文在Movie Lens数据集上对传统协同过滤算法、基于K-means聚类的协同过滤算法及本文的PK-CF算法进行了性能测试,结果表明:PK-CF算法和其在Spark平台上的并行化方案不仅能有效地提高推荐结果的准确率与召回率,而且在时效性方面也有较好的表现。最后,本文将PK-CF算法应用到音乐推荐业务场景中,开发了一个音乐推荐原型系统,检验了PK-CF算法的实用性。
基于SaaS的产品订阅平台的设计与实现
这是一篇关于订阅服务,软件即服务,主成分分析的论文, 主要内容为近年来,“订阅经济”的时代已经来到。如今的消费者有了一系列新的需求。他们想要定制化,而不是大众化;他们想要可以预见的收获,而不是仅仅拥有所有权。正因如此,如今的企业急需改变商业模式,从原来的以商品为中心的模式变为订阅业务为中心的商业模式。从全球范围内看,一系列以订阅模式为主导的业务模型正在急速发展,涌现出一批新的商业巨头:Netflix,Amazon Prime,Spotify,Salesforce等。“订阅经济”一词就是描述了这个企业与商业模型的新时代。随着越来越多的客户成为订阅者,企业需要一个一体化的产品订阅的平台系统,来管理他们的订阅业务。基于此,本文设计并实现了一个基于SaaS(Software as a Service)的产品订阅的Web平台系统,帮助企业客户创建专为订阅业务模型设计的从动态订单到现金流入的一体化流程。软件开发过程经过了需求分析、概要设计、详细设计和开发、测试等一系列必要步骤。系统由持久层、业务层、API层和表现层构成。根据实际需求,系统由订单模块、订阅模块、产品模块、订阅用户模块、收款模块和洞察分析模块组成。技术上,使用Angular框架进行前端的开发,使用Java和微服务等进行后端的开发,并将每个模块的微服务以分布式和集群的方式配置在云端。持久层框架使用Hibernate,数据库使用My Sql。作为一个SaaS系统,集成了亚马逊云科技(Amazon Web Services,AWS)进行云上数据的存储和计算。使用可扩展的Amazon S3进行云的存储,Amazon Aurora作为云端的数据库。本文研究了SaaS系统的多租户架构和数据隔离安全等特点的设计与实现。洞察分析模块使用机器学习算法对用户进行预测,根据用户特征进行特征分组,分类识别和行为预测,以发现加售和交叉销售的机会。收款模块可以对用户的支付行为进行分析,以实现智能支付的支付重试等功能。平台系统已上线投入使用,并拥有了多个知名SaaS企业用户。系统于2021年3月推出了智能支付功能,已经成功为企业客户增加了营收。同时,公司致力于打造订阅生态系统,为全球的订阅企业提供一个更加合适的平台。本人在项目中参与了需求分析,应用开发,单元测试,功能测试等过程,完成了订单管理模块、产品管理模块、洞察分析模块等功能模块的开发和测试。
基于物联网的蓝莓生产监测系统的研究与实现
这是一篇关于农业物联网,主成分分析,传感器技术,4G通信,蓝莓种植技术的论文, 主要内容为物联网技术的快速发展以及大规模应用,已经给许多传统产业的升级带来了巨大便利,农业物联网就是物联网技术与第一产业结合的典型案例。借助农业物联网技术,大幅提高了生产收益,尤其是经济作物。在诸多经济作物中,蓝莓逐步被市场接受、广泛种植。但由于大规模蓝莓种植起步较晚,且蓝莓种植过程中对种植环境以及生产技术都有较高的要求,造成现有的蓝莓种植过程中存在如下问题:人工种植经验中对土壤矿质以及水肥的非精确改良和控制,容易导致蓝莓对各类营养的转换利用率较低,造成资源浪费;同时非实时反馈的监测系统,无法处理突发状况,导致生产种植过程中对突发状况处理不及时,造成经济损失。基于上述问题,本文利用物联网技术,综合考虑实验基地土壤特点,研究设计了基于物联网的蓝莓生产监测系统,主要包括蓝莓矿物质营养吸收模型、基于多传感器的蓝莓生产信息采集设备、远程服务器监测软件三部分内容。文章具体工作如下:1.建立了不同蓝莓品种对土壤矿物质营养吸收模型。本文利用主成分分析模型,基于实验地块采集的土壤矿质数据以及不同蓝莓品种叶片矿质数据进行建模分析,得到蓝莓对土壤中矿物质营养吸收情况的综合评价模型,参考实际种植数据,该评价方法得出的评价结果与实际相符合,为蓝莓种植生产前期的土壤改良提供了有益指导,同时为后期的物联网在线监测系统提供了基础数据,基于蓝莓矿质营养模型,依托远程服务器资源,设计实现了蓝莓矿质营养监测系统。2.设计实现了基于物联网技术的蓝莓种植生产监测系统。本文根据蓝莓生长过程中的需求,选择相应的环境传感器模组,搭配STM32F103ZET6单片机,实现对蓝莓种植生产环节的环境监测,持续供电以及数据传输。在底层硬件基础上,本文完成了远程服务器监测软件的设计,远程服务监测模块实现了数据收发、存储,并利用信息发送实现了实时预警,实现了蓝莓种植生产环境的在线实时监测。3.在软硬件系统设计的基础上,进行了硬件系统的组装测试以及服务端软件的测试。硬件系统经过与标准监测器具的对比测试实验,土壤温湿度、土壤酸碱度、空气温湿度、光照传感器均符合实验要求。同时,将本文监测系统与现有的其他两种监测系统,在用户需求的基础上进行模糊综合评价,评价结果本文监测系统推荐度为0.86408,为三者中最推荐系统,设计满足用户需求。通过上述主成分分析模型构建求解,物联网系统搭建以及实际测试,本文实现了蓝莓种植生产过程中矿质营养吸收的最大化,以及生产环境的实时监测,为蓝莓的高效生产种植提供了有益的尝试。
基于大规模分布式网络的网络坐标系统研究
这是一篇关于网络坐标系统,主成分分析,物理质点弹簧系统,多组邻居收敛,云计算服务器选择的论文, 主要内容为近年来,随着网络技术的飞速发展,因特网基础架构的巨大潜力被进一步挖掘,全球的分布式网络和应用已经形成,对于大规模分布式网络的研究成为当前互联网领域的研究热点之一。许多分布式的应用如CDN(Content Distributed Networks)、比特流等在提供服务的过程中,需要知道网络中的节点到节点之间的网络距离,以提高服务的质量。同时,当前的互联网已经进入到云计算时代,云环境下经常面临服务器的选择问题,如何高效的为终端节点选择合适的服务器节点即利用网络距离进行服务器的选择,是云服务提供商亟待解决的问题。网络坐标系统是一种全新的互联网距离预测方案,具有高可拓展性和低开销的特点。相对于传统的直接测量方法,可以将系统总体的测量时间复杂度由O(N2)降低到O(N)。基于此点以及现存网络坐标系统算法在准确性和可拓展性方面的不足,本文旨在设计一种全新的网络坐标系统,并将网络坐标系统的技术应用到云环境下服务器的选择问题中。本文首先提出一种全新的基于NRPCA(Nonnegative Robust Principal Component Analys is)的分布式网络坐标系统算法DISCS。DISC S通过对节点的局部距离信息矩阵进行主成分的提取,进而消除测量误差和异常点的影响,然后通过多次迭代准确获得节点的坐标。在获得节点的坐标后,利用节点的坐标可以计算节点到节点之间的网络距离。本文紧接着提出另一种全新的分布式网络坐标系统算法WDCS。WDCS结合了主成分分析的方法和模拟弹簧力场的思想。首先对节点的原始局部距离矩阵进行主成分提取,然后利用模拟弹簧力场的思想更新坐标。通过设置边权值,为每一个参考节点赋予不同的信任度,以进一步消除坐标的误差。在准确性方面,WDCS稍逊于DISCS,但WDCS较DISCS节省了大量的计算时间。本文在WDCS的基础上,也首次提出多组邻居收敛的思想,即在节点坐标更新的过程中,每隔固定的时间片为节点变换参考节点。本文把这种结合了主成分分析、模拟弹簧力场思想、多组邻居收敛思想的网络坐标系统算法称为WDCS-MNC。文章最后阐述网络坐标系统在云环境下服务器选择问题上的应用,提出一种全新的云服务器选择方案DEAL。DEAL是一种分布式的服务器节点选择策略,具有很好的可拓展性,并且通过设置域间传输惩罚因子,很好的将因特网服务提供商的利益考虑到模型当中,使得因特网服务提供商可以灵活的选择终端节点到服务器节点的映射策略。文章通过仿真实验对所提出的方法与现存的方法进行对比验证。本文所提出的几种方法在不同的网络环境下,性能有所不同。在评估的各个方面,各有优势。与现存的方法和模型相比,DISCS、WDCS和WDCS-MNC更能够准确的计算节点的坐标,精确的估计节点之间的距离。此外,模型DEAL可以快速、高效地完成终端用户节点到服务器节点的映射。
树莓种质资源数据库的研制
这是一篇关于树莓,分级标准,主成分分析,因子分析,种质资源数据库的论文, 主要内容为树莓为适合寒地栽培的一种特色小浆果果树,其果实具有极高营养价值,种植技术也相对简单。国内树莓生产中主要采用国外引入的品种,收集国内外树莓品种资源以及当地的野生资源,并采用杂交育种、实生选种、生物技术等多种手段开展树莓育种工作是刻不容缓的事情。对资源的评价和研究是育种工作的重要基础,而数据库的建立将为资源的数据管理和对外交流提供良好的平台。因此,本研究通过对黑龙江省主要科研单位所收集的32份树莓品种资源的农艺学、果实性状进行调查,建立主要性状的分级标准,并通过主成分和因子分析,对调查资源进行综合评价;采用MySQL数据库管理系统,搭配Navicat客户端,建立一个基于Java语言的WEB网页形式的树莓种质资源数据库,并将所调查内容录入该数据库,从而实现树莓种质资源的信息化和规范化管理,为育种工作提供数据。结论如下:(1)调查的树莓14个主要性状的变异系数和频次分布存在差异。根据各性状的变异范围,将各数量性状的分级标准按等距分组为3级和4级,各级标准均提出参照品种。(2)主成分分析总结出4类指标来评价各树莓品种:一是果实营养成分,包括Vc、糖酸比、可溶性糖;二是植株外观因子,为植株高度;三是果实感官因子,为平均单果重;四是果实结实因子,主要包括自然结实率、结果枝数量。(3)对14个性状进行因子分析,提取出7个公因子,并利用其对调查的32个品种进行综合排序,排在前3位的分别为黑树莓、无刺、托拉蜜。(4)本树莓种质资源数据库系统采用Web流行的Server模式,在C语言下基于Windows+MySQL+Navicat+JavaEE+Eclipse的技术架构,进行局域网功能性模块的设计和后台管理系统的构建。本系统实现了树莓种质资源的浏览、查询、删减数据、注册用户等多项管理功能,并通过对用户的权限分级管理来保证系统的安全性和保障性。
基于web的人脸识别登陆和管理系统设计与实现
这是一篇关于人脸识别,主成分分析,B/S模式,J2EE的论文, 主要内容为如今,数字信息飞速发展,各种信息和交易也趋于数字化和电子化。在信息纷杂众多的同时,信息安全的重要性也在慢慢的凸现出来。基于生物特征的识别技术是信息安全技术中的一个重要分支,因其具有唯一性,可靠性、安全性等众多优点而逐渐成为人们关注的焦点。这其中,基于人体面部特征的识别技术在实际中以其方便、友好和便捷的特点而逐渐被人们所接受。故而,本文构建了一套基于web的人脸识别登陆和后台管理系统。论文的主要工作如下:首先,对国内外人脸识别算法进行研究,给出了基于主成分分析法的人脸识别算法。算法总体分为四步:人脸检测定位、人脸图片归一化处理、人脸特征提取和识别决策。其次,通过对系统业务逻辑进行分析,得出需具备的一些功能性需求和系统指标。其中,基本功能模块有:人脸注册、人脸识别登陆与后台管理。在用户注册模块中,用户注册时能够实时采集人脸图像或上传本地图像进行特征脸的空间的构建;在识别登录模块中,基于主成分分析的人脸识别算法比对待识别拍照图片和人脸库的图片从而判定是否获得登陆权限;在后台管理模块中,管理员需具有对其他管理员信息进行创建及管理的权限、可对人脸注册用户信息完成用户名和人脸查找、修改、更新和删除等常用操作。除此之外,为保证系统能够有效运行及可扩展,还需满足有效性、可移植性、便捷性、安全性及时间特性等系统指标。然后结合业务需求,对系统进行设计,选取B/S模式,采用J2EE的三层架构:表现层、中间层与数据交互层。表现层,主要利用JSP、HTML5、CSS、JavaScript、Ajax等技术完成网页的设计与用户的交互,基于Http协议完成与客户端用户直接交互。中间层采用当下流行的具有MVC模式的Struts2框架对用户请求进行拦截响应和能够实现Java类与数据库表之间进行数据库关系映射的Hibernate框架,数据交互层选用对数据进行管理的关系型数据库MySQL。最后,结合人脸识别算法和系统设计对系统进行实现。通过对算法进行Matlab实验验证,得出人脸识别率为80%,误判率为20%。对系统平台进行搭建,能够实现三大功能性指标和系统运行指标。基于J2EE平台开发的web应用:人脸识别登录及后台管理系统,能够有效保护人们的登录信息、有效识别人脸信息,且登录方便、快捷,还可和其他基于J2EE平台开发的应用相结合,构建整套系统应用。
山东省产业结构演进研究
这是一篇关于山东省,产业结构演进,SSM法,主成分分析的论文, 主要内容为山东省目前的经济发展面临许多关键性的问题:经济增长方式粗约化、资源浪费严重、经济结构失衡、产业结构不合理等等问题。“十二五”规划明确提出要转变经济增长方式,落实贯彻科学发展观,实现经济又好又快发展。 本文运用产业结构熵、产业结构相似度指数、就业产业结构偏离度和偏差系数、偏离—份额分析法(SSM法)全面分析评价改革开放以来山东省产业结构的演进特征;利用主成分分析法找出了山东省产业结构演进的影响因素,最后提出相应的政策建议。 主要内容的结构安排如下:第一章引言介绍研究背景、意义和目的、研究方法以及本文创新与不足。第二章论述了有关产业结构演进的经典理论和国内外研究现状,并对相关研究做了简要评述。第三章首先分析了改革开放以来,山东省的产业结构发展与演进的大体趋势,包括三次产业产值结构与就业结构以及三次产业内部。其次利用多个统计指标实证分析改革开放以来山东省产业结构演进过程和特征。第四章选取了17个相关指标,建立了山东省产业结构影响因素的指标体系,利用主成分方法找出了影响山东省产业结构演进的主要因素。第五章提出相关的政策建议。第一产业的调整要注意两个方面:一是要以科技带动生产方式转型,努力实现由传统部门向现在部门的转变,二是要加快林业和农业服务业的发展。第二产业的调整重点在改变粗放的增长方式,走新型工业化道路;合理选择主导产业,升级传统产业,淘汰落后产业。应该大力发展第三产业,特别是加快现代服务业的发展,重点在发展生产性服务业;培育战略新兴产业,改造整合传统服务业。 本文的主要结论:改革开放至今,山东省的经济发展迅速,三次产业结构、就业结构、三次产业内部结构被不断优化,基本符合工业化的规律。消费需求、城市化和对外贸易等的变化是产业结构演进的主要动力。仍然面临许多关键性问题,第一产业现代化水平不够,劳动力冗余,劳动生产率低,林业、现代农业服务业发展不足;第二产业高级化程度不够,增长方式粗放,环境污染严重;第三产业以传统服务业为主,缺乏现代性服务业,而且产值、就业比重低。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码港湾 ,原文地址:https://m.bishedaima.com/lunwen/46634.html