道路网轨迹相似度计算方法
这是一篇关于轨迹数据,道路网,轨迹相似度,移动对象,向量表示的论文, 主要内容为轨迹相似度计算是轨迹数据分析的主要内容之一,其广泛地应用于轨迹聚类、轨迹模式挖掘等应用。现有的轨迹相似度计算方法在计算道路网轨迹相似度时,算法复杂度高且没有考虑轨迹之间的路网距离。为了解决这个问题,本文提出了一种基于Seq2Seq技术的道路网轨迹相似度计算方法,将道路网轨迹映射成高维空间向量,通过比较高维空间向量之间的距离得到原轨迹之间的相似度。主要研究内容如下:(1)由于道路网轨迹相似度计算首先需要确定轨迹采样点在路网中的位置,为了能够快速地将轨迹采样点匹配到路网上,本文提出了一种基于GRU模型的粗粒度实时路网匹配方法。该方法将轨迹采样点的经纬度信息归一化之后输入GRU模型中,模型结合上一时间的隐含状态能够快速地定位该采样点所在路网中的路段,加速路网匹配过程。(2)为了将路段序列输入到Seq2Seq模型中进行训练,对道路网中的路段进行向量化编码。本文采用skip-gram模型并优化目标函数的设置,对道路网上的所有路段进行向量化编码,使得道路网中距离相近的路段具有相似的向量化编码。(3)将轨迹的路段序列输入Seq2Seq模型进行训练,得到轨迹向量化的编码器。利用该编码器将轨迹编码成高维空间向量,通过比较向量距离得到轨迹的相似度。采用南京市出租车轨迹数据进行测试,实验表明这种相似度计算方法能够大大加快轨迹相似度的计算。(4)为了能够更好地对轨迹等时空数据进行可视化,本文设计并实现了一种基于B-S架构的时空数据可视化工具,此工具能够根据用户提供的数据生成热力图、路线图、动态热力图以及各种辅助表格,为用户提供数据的分析结果并展示。
基于Spark的出租车大数据时空检索方法与可视化研究
这是一篇关于轨迹数据,时空编码,分布式列式存储,Hilbert分区,交互可视化的论文, 主要内容为近年来,随着居民出行的频繁、交通工具的多样化以及出行数据被密集的采集,轨迹数据呈爆炸式增长。在收集、管理、应用这些数据的过程中,由于轨迹大数据更新速度快、数据量巨大,适用大数据技术处理和分布式数据库存储。但轨迹大数据分布不均匀,存在时空特征,这就导致在组织管理过程中出现了数据写入热、存储倾斜、I/O开销大和检索速度慢等问题。为了解决上述问题,本文对轨迹大数据的存储、时空索引以及可视化现状进行了深入研究,深挖大数据技术和分布式数据库存储的技术原理,研究构建了一种融合数据分区和时空多角度分层组织的轨迹大数据模型,并进一步研究实现了轨迹大数据时空检索方法和交互可视化方法。本文以厦门市出租车轨迹大数据作为数据基础,部署分布式集群,基于Spark计算框架,从时间和空间角度组织管理海量的轨迹数据,探索时空检索方法,并结合多种可视化技术挖掘轨迹蕴含的信息。本文的研究内容主要概括为以下三个方面:(1)构建融合数据分区和时空多维度分层组织的数据存储模型搭建一个主节点两个从节点的Hadoop分布式计算集群,基于Spark计算框架,完成轨迹大数据的预处理和入库。在空间层面,探究基于Hilbert曲线对轨迹数据分区的算法流程,结合预分区机制解决分布式数据库HBase写入热和存储倾斜的问题。在时间层面,本文以天为组织管理单元,按分钟制精细化编码存储,形成全局时空细分方案,提出了基于时空多角度分层组织的数据存储模型。该模型大幅度提升轨迹大数据的存储和计算效率,可为轨迹大数据挖掘与分析提供高效的数据管理模型支持。(2)设计行键结构,构建时空混合编码,探究时空检索模式基于HBase的索引规则,设计行键结构,然后融合数据分区构建时空混合编码,将多维时空数据降维存储到分布式数据库HBase中,对比写入速度。探究精确点查询和时空范围查询模式,通过检索效率对比,表现出良好的查询性能。对轨迹大数据进行分层组织管理,解决轨迹大数据的高效存储和检索问题。实验结果表明,该索引在精确点查询和时空范围查询等方面均表现出良好的查询性能。该模型在不同数量级下均能够有效提升轨迹大数据检索速度,同时保证写入和查询速度相对稳定,可为轨迹大数据挖掘与分析提供高效的检索。(3)搭建前后端完全分离的出租车轨迹大数据可视化平台根据用户对出租车轨迹大数据的使用需求进行需求分析,设计交互可视化方法。后端基于Spring Boots+My Batis组合框架,前端结合Vue2.0架构,搭建一个前后端完全分离的出租车轨迹大数据可视化平台。后端基于融合数据分区和时空多维度分层组织的数据存储模型,通过时空混合索引检索精确点数据和时空范围数据,传输到前端,结合Echarts、逆向热力图等方法完成交互可视化。整个过程便于分析结果可视化、探究出租车的时空分布特征,为多源异构海量时空大数据的可视化分析起到的平台支撑和应用示范的作用。
海量车辆传感数据分布式管理平台的研究与设计
这是一篇关于车辆传感数据,数据管理,轨迹数据,数据预处理的论文, 主要内容为在城市计算系统中.需要对多种异构大数据进行分析、挖掘和融合以解决城市中面临的各种问题,提供相关的智能应用和服务。车辆传感数据是城市计算系统中重要的数据组成部分,其具有海量、高速、多样等特征,对其的管理工作面临着诸多的挑战。本文提出了面向海量车辆传感数据的管理平台,提供高效数据预处理和海量分布式数据管理功能。针对车辆传感数据的数据特征和城市计算应用和服务的需求提出一系列有针对性的算法设计以及工程设计优化方案。本文首先分析海量车辆传感数据分布式管理平台的研究背景和主要挑战,明确平台在城市计算系统的定位和应用场景。随后结合车辆传感数据特征、业界数据规范和平台应用需求等多方面因素,提出了完整的车辆传感数据规范。进一步根据数据规范和应用需求,提出了一系列在不同层面的数据预处理规则和算法。其中根据信息论思想提出了具有可扩展性的轨迹压缩算法HESAVE和轨迹地图匹配算法InfoMatch,相较于对照算法均有一定的提升。之后对平台进行了需求分析、设计和可行性验证,提出了一套合理的软件框架及部署模型设计,以及完整的数据预处理、主数据管理和统一查询接口等功能模块的软件设计方案,针对车辆传感数据管理中面对的诸多可靠性、安全性、实时性、可扩展性等提出了针对性优化方案。最后对平台进行了可行性验证,结果表明平台能够满足在城市计算系统中对车辆传感数据管理的需求。
基于Spark的出租车大数据时空检索方法与可视化研究
这是一篇关于轨迹数据,时空编码,分布式列式存储,Hilbert分区,交互可视化的论文, 主要内容为近年来,随着居民出行的频繁、交通工具的多样化以及出行数据被密集的采集,轨迹数据呈爆炸式增长。在收集、管理、应用这些数据的过程中,由于轨迹大数据更新速度快、数据量巨大,适用大数据技术处理和分布式数据库存储。但轨迹大数据分布不均匀,存在时空特征,这就导致在组织管理过程中出现了数据写入热、存储倾斜、I/O开销大和检索速度慢等问题。为了解决上述问题,本文对轨迹大数据的存储、时空索引以及可视化现状进行了深入研究,深挖大数据技术和分布式数据库存储的技术原理,研究构建了一种融合数据分区和时空多角度分层组织的轨迹大数据模型,并进一步研究实现了轨迹大数据时空检索方法和交互可视化方法。本文以厦门市出租车轨迹大数据作为数据基础,部署分布式集群,基于Spark计算框架,从时间和空间角度组织管理海量的轨迹数据,探索时空检索方法,并结合多种可视化技术挖掘轨迹蕴含的信息。本文的研究内容主要概括为以下三个方面:(1)构建融合数据分区和时空多维度分层组织的数据存储模型搭建一个主节点两个从节点的Hadoop分布式计算集群,基于Spark计算框架,完成轨迹大数据的预处理和入库。在空间层面,探究基于Hilbert曲线对轨迹数据分区的算法流程,结合预分区机制解决分布式数据库HBase写入热和存储倾斜的问题。在时间层面,本文以天为组织管理单元,按分钟制精细化编码存储,形成全局时空细分方案,提出了基于时空多角度分层组织的数据存储模型。该模型大幅度提升轨迹大数据的存储和计算效率,可为轨迹大数据挖掘与分析提供高效的数据管理模型支持。(2)设计行键结构,构建时空混合编码,探究时空检索模式基于HBase的索引规则,设计行键结构,然后融合数据分区构建时空混合编码,将多维时空数据降维存储到分布式数据库HBase中,对比写入速度。探究精确点查询和时空范围查询模式,通过检索效率对比,表现出良好的查询性能。对轨迹大数据进行分层组织管理,解决轨迹大数据的高效存储和检索问题。实验结果表明,该索引在精确点查询和时空范围查询等方面均表现出良好的查询性能。该模型在不同数量级下均能够有效提升轨迹大数据检索速度,同时保证写入和查询速度相对稳定,可为轨迹大数据挖掘与分析提供高效的检索。(3)搭建前后端完全分离的出租车轨迹大数据可视化平台根据用户对出租车轨迹大数据的使用需求进行需求分析,设计交互可视化方法。后端基于Spring Boots+My Batis组合框架,前端结合Vue2.0架构,搭建一个前后端完全分离的出租车轨迹大数据可视化平台。后端基于融合数据分区和时空多维度分层组织的数据存储模型,通过时空混合索引检索精确点数据和时空范围数据,传输到前端,结合Echarts、逆向热力图等方法完成交互可视化。整个过程便于分析结果可视化、探究出租车的时空分布特征,为多源异构海量时空大数据的可视化分析起到的平台支撑和应用示范的作用。
基于Spark的出租车大数据时空检索方法与可视化研究
这是一篇关于轨迹数据,时空编码,分布式列式存储,Hilbert分区,交互可视化的论文, 主要内容为近年来,随着居民出行的频繁、交通工具的多样化以及出行数据被密集的采集,轨迹数据呈爆炸式增长。在收集、管理、应用这些数据的过程中,由于轨迹大数据更新速度快、数据量巨大,适用大数据技术处理和分布式数据库存储。但轨迹大数据分布不均匀,存在时空特征,这就导致在组织管理过程中出现了数据写入热、存储倾斜、I/O开销大和检索速度慢等问题。为了解决上述问题,本文对轨迹大数据的存储、时空索引以及可视化现状进行了深入研究,深挖大数据技术和分布式数据库存储的技术原理,研究构建了一种融合数据分区和时空多角度分层组织的轨迹大数据模型,并进一步研究实现了轨迹大数据时空检索方法和交互可视化方法。本文以厦门市出租车轨迹大数据作为数据基础,部署分布式集群,基于Spark计算框架,从时间和空间角度组织管理海量的轨迹数据,探索时空检索方法,并结合多种可视化技术挖掘轨迹蕴含的信息。本文的研究内容主要概括为以下三个方面:(1)构建融合数据分区和时空多维度分层组织的数据存储模型搭建一个主节点两个从节点的Hadoop分布式计算集群,基于Spark计算框架,完成轨迹大数据的预处理和入库。在空间层面,探究基于Hilbert曲线对轨迹数据分区的算法流程,结合预分区机制解决分布式数据库HBase写入热和存储倾斜的问题。在时间层面,本文以天为组织管理单元,按分钟制精细化编码存储,形成全局时空细分方案,提出了基于时空多角度分层组织的数据存储模型。该模型大幅度提升轨迹大数据的存储和计算效率,可为轨迹大数据挖掘与分析提供高效的数据管理模型支持。(2)设计行键结构,构建时空混合编码,探究时空检索模式基于HBase的索引规则,设计行键结构,然后融合数据分区构建时空混合编码,将多维时空数据降维存储到分布式数据库HBase中,对比写入速度。探究精确点查询和时空范围查询模式,通过检索效率对比,表现出良好的查询性能。对轨迹大数据进行分层组织管理,解决轨迹大数据的高效存储和检索问题。实验结果表明,该索引在精确点查询和时空范围查询等方面均表现出良好的查询性能。该模型在不同数量级下均能够有效提升轨迹大数据检索速度,同时保证写入和查询速度相对稳定,可为轨迹大数据挖掘与分析提供高效的检索。(3)搭建前后端完全分离的出租车轨迹大数据可视化平台根据用户对出租车轨迹大数据的使用需求进行需求分析,设计交互可视化方法。后端基于Spring Boots+My Batis组合框架,前端结合Vue2.0架构,搭建一个前后端完全分离的出租车轨迹大数据可视化平台。后端基于融合数据分区和时空多维度分层组织的数据存储模型,通过时空混合索引检索精确点数据和时空范围数据,传输到前端,结合Echarts、逆向热力图等方法完成交互可视化。整个过程便于分析结果可视化、探究出租车的时空分布特征,为多源异构海量时空大数据的可视化分析起到的平台支撑和应用示范的作用。
轨迹知识图谱构建及目的地预测
这是一篇关于轨迹数据,知识图谱,R-GCN,GRU,目的地预测的论文, 主要内容为当前,轨迹大数据的积累为挖掘城市中车辆的移动模式提供了机会。轨迹数据中包含多种不同的空间对象,例如移动对象的起点、目的地,经过的交叉口等等;并且轨迹作为时间序列数据,蕴含着轨迹点的时间以及空间信息。此外,路网结构与天气状况作为辅助因素也会对轨迹数据的分析产生影响。如何组织融合这些多源异构数据以实现对轨迹数据的分析与挖掘,并应用于如交通疏导、位置预测与推荐、群体移动感知及行为分析等现实场景,具有重要意义。知识图谱作为一种用图模型描述知识和世界万物之间的关联关系的建模方法,包含丰富的本体、属性以及本体之间的关系,可以很好地组织融合多源异构数据,更方便服务于各种数据分析与挖掘任务。因此本文基于轨迹数据以及路网和天气辅助信息构建轨迹知识图谱,并基于构建的知识图谱进行目的地预测。准确、高效的目的地预测对个性化广告服务、公共治安管理和和城市交通智能规划起到重要作用。本文的主要工作如下:(1)分别采用自下而上和自上而下的方法构建轨迹知识图谱。首先,将轨迹数据三个部分(轨迹、车道小段、交叉口)分别存储于关系型数据库的三个表中;然后,通过映射规则抽取数据,将二维表中的数据转化为知识图谱的三元组,并与路网与天气数据形成的三元组融合,形成本体层结构。观察发现自下而上构建的知识图谱显示出以轨迹为中心的星型结构,而轨迹内车道小段与交叉口之间的关联关系未能体现。因此,接下来通过自上而下的方法构建轨迹知识图谱。依据领域知识先确定轨迹知识图谱的本体层结构,提出四个空间本体(即起点、车道、交叉口和目的地)、本体属性及本体间关系。再通过本体层结构组织融合轨迹数据、路网以及天气数据,构建轨迹知识图谱。最后将两种方法构建的轨迹知识图谱存储于图数据库Neo4j中,方便后续对数据的提取与应用。(2)基于轨迹知识图谱的目的地预测模型TOP。自上而下构建的轨迹知识图谱中的四种空间实体表达了轨迹从起点到目的地的轨迹语义特征;图谱中空间实体间的关系隐含了路网的拓扑结构。因此基于自上而下构建的知识图谱,提出了一种新的目的地预测方法TOP(trajectory knowledge graph-based destination prediction)。具体而言,在轨迹知识图谱上使用关系图卷积网络(R-GCN),得到空间实体的嵌入表示;然后,通过利用空间实体的嵌入表示,将轨迹替换为嵌入轨迹,并使用门控循环单元(GRU)学习嵌入轨迹的时间特征;最后,与时间元数据(即工作日、假期和出发时间)融合以预测最终目的地。并在上述真实数据集上进行了一系列实验,以验证所提出方法的有效性。
基于Spark的出租车大数据时空检索方法与可视化研究
这是一篇关于轨迹数据,时空编码,分布式列式存储,Hilbert分区,交互可视化的论文, 主要内容为近年来,随着居民出行的频繁、交通工具的多样化以及出行数据被密集的采集,轨迹数据呈爆炸式增长。在收集、管理、应用这些数据的过程中,由于轨迹大数据更新速度快、数据量巨大,适用大数据技术处理和分布式数据库存储。但轨迹大数据分布不均匀,存在时空特征,这就导致在组织管理过程中出现了数据写入热、存储倾斜、I/O开销大和检索速度慢等问题。为了解决上述问题,本文对轨迹大数据的存储、时空索引以及可视化现状进行了深入研究,深挖大数据技术和分布式数据库存储的技术原理,研究构建了一种融合数据分区和时空多角度分层组织的轨迹大数据模型,并进一步研究实现了轨迹大数据时空检索方法和交互可视化方法。本文以厦门市出租车轨迹大数据作为数据基础,部署分布式集群,基于Spark计算框架,从时间和空间角度组织管理海量的轨迹数据,探索时空检索方法,并结合多种可视化技术挖掘轨迹蕴含的信息。本文的研究内容主要概括为以下三个方面:(1)构建融合数据分区和时空多维度分层组织的数据存储模型搭建一个主节点两个从节点的Hadoop分布式计算集群,基于Spark计算框架,完成轨迹大数据的预处理和入库。在空间层面,探究基于Hilbert曲线对轨迹数据分区的算法流程,结合预分区机制解决分布式数据库HBase写入热和存储倾斜的问题。在时间层面,本文以天为组织管理单元,按分钟制精细化编码存储,形成全局时空细分方案,提出了基于时空多角度分层组织的数据存储模型。该模型大幅度提升轨迹大数据的存储和计算效率,可为轨迹大数据挖掘与分析提供高效的数据管理模型支持。(2)设计行键结构,构建时空混合编码,探究时空检索模式基于HBase的索引规则,设计行键结构,然后融合数据分区构建时空混合编码,将多维时空数据降维存储到分布式数据库HBase中,对比写入速度。探究精确点查询和时空范围查询模式,通过检索效率对比,表现出良好的查询性能。对轨迹大数据进行分层组织管理,解决轨迹大数据的高效存储和检索问题。实验结果表明,该索引在精确点查询和时空范围查询等方面均表现出良好的查询性能。该模型在不同数量级下均能够有效提升轨迹大数据检索速度,同时保证写入和查询速度相对稳定,可为轨迹大数据挖掘与分析提供高效的检索。(3)搭建前后端完全分离的出租车轨迹大数据可视化平台根据用户对出租车轨迹大数据的使用需求进行需求分析,设计交互可视化方法。后端基于Spring Boots+My Batis组合框架,前端结合Vue2.0架构,搭建一个前后端完全分离的出租车轨迹大数据可视化平台。后端基于融合数据分区和时空多维度分层组织的数据存储模型,通过时空混合索引检索精确点数据和时空范围数据,传输到前端,结合Echarts、逆向热力图等方法完成交互可视化。整个过程便于分析结果可视化、探究出租车的时空分布特征,为多源异构海量时空大数据的可视化分析起到的平台支撑和应用示范的作用。
基于轨迹数据分析的兴趣点推荐系统的设计与实现
这是一篇关于兴趣点推荐,轨迹数据,停留点,SSM框架的论文, 主要内容为随着智能终端的普及和移动定位技术的不断成熟,产生了大量的融合了地理位置信息的数据,轨迹数据就是其中的一种。轨迹数据能够代表具有移动能力的物体(如人类、动物和交通工具)的移动性,在基于地理位置的服务领域具有很高的挖掘价值。目前,轨迹数据挖掘领域已经出现了很多应用,比如对于兴趣点的推荐,即向用户推荐符合他意愿的一个地点,同时,兴趣点推荐也是随着基于位置的社交网络不断发展而出现的一种常见应用。兴趣点推荐不仅能让用户在这个数据爆炸的时代找到符合自身意愿的地点,而且可以为商家提供可观的经济效益。传统的兴趣点推荐方法大多基于位置社交网络中产生的签到数据做出推荐,即根据用户的历史签到信息来推断用户对于其他尚未签到的地点的偏好。然而,签到数据的产生依赖于用户对于地点的签到意愿,具有稀疏性。用户日常出行的轨迹数据则能客观的显示用户的行为规律,暴露用户对于过去已访问地点的偏好。因此,本文将设计并实现一种基于轨迹数据做出的推荐系统,根据用户轨迹数据分析出历史兴趣点再进行推荐。首先,介绍轨迹数据的预处理、停留点提取、停留点聚类等对于轨迹数据的处理算法以及目前现有的推荐算法。然后,使用轨迹数据集对算法加以验证。最后,阐述基于轨迹数据分析的兴趣点推荐系统的系统需求,并按照系统需求进行详细的功能模块划分,完成系统的架构设计、数据库设计和接口设计,且使用SSM框架实现系统。本论文在算法研究阶段使用准确率与召回率评估推荐算法,实验证明推荐效果符合系统的使用要求。最后对基于轨迹数据分析的兴趣点推荐系统进行功能测试,验证了系统的功能并且表明系统可以正常使用。
基于图网络的露天矿路网生成方法研究
这是一篇关于路网生成,露天矿,轨迹数据,图网络,量化不确定性的论文, 主要内容为随着露天矿智能化建设的快速发展,露天矿卡车调度系统和无人驾驶设备的研究备受关注。然而,这些智能化研究的进步都依赖于路网模型的构建。路网模型反映了露天矿道路的地理位置信息和拓扑关系,是推进露天矿卡车调度系统和无人驾驶设备快速发展的基础。因此,生成实时、准确的露天矿路网对于露天矿智能化建设至关重要。本文旨在研究适用于露天矿地理环境的路网生成方法。为此,本文以露天矿卡车产生的海量GPS(Global Positioning System)轨迹数据为基础,探讨如何生成符合实际情况的露天矿路网。主要研究内容如下:(1)基于双图卷积网络的露天矿路网生成方法现有的路网生成方法往往只使用单一的轨迹特征。此外,构建的深度网络只能利用局部上下文信息,缺乏全局上下文信息的捕获能力。为了解决上述问题,本文提出基于双图卷积网络的露天矿路网生成方法(Road network Generation method of open-pit mine based on Dual Graph convolution network,RGDG)。首先,该方法构建多组轨迹特征并进行特征融合,得到轨迹融合特征。然后,设计了露天矿道路中心线预测网络(Road Centerline Prediction Network,RCP-Net),RCPNet通过残差编码器提取轨迹融合特征的深度特征,并采用双图卷积网络建模深度特征的空间全局上下文信息和通道全局上下文信息,输出深度上下文特征。接着,将深度上下文特征输入到露天矿道路中心线解码器中生成道路中心线概率图。最后,使用道路中心线概率图构建矢量化露天矿路网并细化其拓扑结构。实验结果表明,RGDG方法相较于表现最好的基线方法,在路网几何性方面提升了3.2%,在路网拓扑性方面提升了4.4%。(2)基于集成RCP-Net量化不确定性的露天矿路网生成方法单个RCP-Net进行露天矿道路中心线预测容易产生过拟合。并且,由于RCPNet深度模型的复杂性,其预测结果往往存在不确定性,导致对露天矿狭窄道路和稀疏轨迹道路的错误预测。本文为了解决上述问题,提出基于集成RCP-Net量化不确定性的露天矿路网生成方法(Road network Generation method of open-pit mine based on Ensemble RCP-Net quantifying Uncertainty,RGERU)。首先,使用随机层采样方法增强集成RCP-Net的模型多样性,降低过拟合风险。其次,利用近似贝叶斯方法估计集成RCP-Net模型权重参数的后验分布。然后,采样后验分布样本,用于统计预测方差得到不确定性概率图,以此量化集成RCP-Net的不确定性,并反映露天矿道路中心线预测的不确定程度。最后,利用不确定性概率图去构建不确定性联合损失函数,使集成RCP-Net克服对不确定道路的预测限制,提高露天矿道路中心线预测精确率。实验结果表明,使用RGERU方法生成的露天矿路网较RGDG方法在路网几何性方面提升了3.6%,在路网拓扑性方面提升了2.9%。(3)露天矿路网生成系统设计与应用本文基于对露天矿路网生成方法的研究,设计了露天矿路网生成系统。该系统包括以下功能:GPS轨迹数据预处理、卡车轨迹特征提取、模型样本制作、露天矿路网生成模型训练以及露天矿路网生成测试等。最终,将该系统整合进露天矿智能调度平台中,为露天矿路网自动构建提供支持,从而推动露天矿智能化建设的发展。该论文有图43幅,表4个,参考文献101篇。
基于轨迹数据分析的兴趣点推荐系统的设计与实现
这是一篇关于兴趣点推荐,轨迹数据,停留点,SSM框架的论文, 主要内容为随着智能终端的普及和移动定位技术的不断成熟,产生了大量的融合了地理位置信息的数据,轨迹数据就是其中的一种。轨迹数据能够代表具有移动能力的物体(如人类、动物和交通工具)的移动性,在基于地理位置的服务领域具有很高的挖掘价值。目前,轨迹数据挖掘领域已经出现了很多应用,比如对于兴趣点的推荐,即向用户推荐符合他意愿的一个地点,同时,兴趣点推荐也是随着基于位置的社交网络不断发展而出现的一种常见应用。兴趣点推荐不仅能让用户在这个数据爆炸的时代找到符合自身意愿的地点,而且可以为商家提供可观的经济效益。传统的兴趣点推荐方法大多基于位置社交网络中产生的签到数据做出推荐,即根据用户的历史签到信息来推断用户对于其他尚未签到的地点的偏好。然而,签到数据的产生依赖于用户对于地点的签到意愿,具有稀疏性。用户日常出行的轨迹数据则能客观的显示用户的行为规律,暴露用户对于过去已访问地点的偏好。因此,本文将设计并实现一种基于轨迹数据做出的推荐系统,根据用户轨迹数据分析出历史兴趣点再进行推荐。首先,介绍轨迹数据的预处理、停留点提取、停留点聚类等对于轨迹数据的处理算法以及目前现有的推荐算法。然后,使用轨迹数据集对算法加以验证。最后,阐述基于轨迹数据分析的兴趣点推荐系统的系统需求,并按照系统需求进行详细的功能模块划分,完成系统的架构设计、数据库设计和接口设计,且使用SSM框架实现系统。本论文在算法研究阶段使用准确率与召回率评估推荐算法,实验证明推荐效果符合系统的使用要求。最后对基于轨迹数据分析的兴趣点推荐系统进行功能测试,验证了系统的功能并且表明系统可以正常使用。
海量车辆传感数据分布式管理平台的研究与设计
这是一篇关于车辆传感数据,数据管理,轨迹数据,数据预处理的论文, 主要内容为在城市计算系统中.需要对多种异构大数据进行分析、挖掘和融合以解决城市中面临的各种问题,提供相关的智能应用和服务。车辆传感数据是城市计算系统中重要的数据组成部分,其具有海量、高速、多样等特征,对其的管理工作面临着诸多的挑战。本文提出了面向海量车辆传感数据的管理平台,提供高效数据预处理和海量分布式数据管理功能。针对车辆传感数据的数据特征和城市计算应用和服务的需求提出一系列有针对性的算法设计以及工程设计优化方案。本文首先分析海量车辆传感数据分布式管理平台的研究背景和主要挑战,明确平台在城市计算系统的定位和应用场景。随后结合车辆传感数据特征、业界数据规范和平台应用需求等多方面因素,提出了完整的车辆传感数据规范。进一步根据数据规范和应用需求,提出了一系列在不同层面的数据预处理规则和算法。其中根据信息论思想提出了具有可扩展性的轨迹压缩算法HESAVE和轨迹地图匹配算法InfoMatch,相较于对照算法均有一定的提升。之后对平台进行了需求分析、设计和可行性验证,提出了一套合理的软件框架及部署模型设计,以及完整的数据预处理、主数据管理和统一查询接口等功能模块的软件设计方案,针对车辆传感数据管理中面对的诸多可靠性、安全性、实时性、可扩展性等提出了针对性优化方案。最后对平台进行了可行性验证,结果表明平台能够满足在城市计算系统中对车辆传感数据管理的需求。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设工厂 ,原文地址:https://m.bishedaima.com/lunwen/52363.html