跨媒体科技大数据的知识服务与交互可视化构件研究
这是一篇关于跨媒体科技大数据,知识服务构件,对抗生成学习,交互可视化的论文, 主要内容为大数据时代科技资源呈现数据规模大、多模态、更新快速、时效性高和价值密度较低等趋势,对有效利用科技资源带来严峻的挑战。本文基于注意力机制、对抗生成学习、循环神经网络、微服务等知识和技术,利用深度学习方法对科技大数据进行实体识别和关系抽取,引入多注意力机制提高算法准确率;利用对抗生成学习和语义相似度实现跨媒体科技大数据的检索;利用循环神经网络方法,将知识图谱中的实体和关系作为输入,推演出新的关系,进一步扩大知识图谱的规模。同时,通过微服务技术完成对实体关系抽取、跨媒体检索、交互可视化等知识服务构件的开发,实现知识服务构件的开放协同。本文完成的主要工作如下:(1)提出了跨媒体科技大数据的实体识别与关联关系发现的方法。针对科技大数据的实体识别,提出了结合分词词性的注意力机制的命名实体识别算法,通过结合分词词性、双向长短时循环网络和注意力机制,利用有监督方法对数据进行学习与训练,实现了科技大数据的实体识别;针对科技大数据的实体关系发现,通过结合科技文本数据的句子级别注意力机制和自注意力机制,提出了基于多注意力机制的实体关系抽取算法,实现了科技大数据的实体关系发现。(2)提出了跨媒体科技大数据的知识服务构件的开放协同。为了使知识服务构件具有良好的扩展性、开放性,提出了基于微服务的知识服务构件的开放协同机制,同时定义了本文开发的具体知识服务构件。利用微服务架构完成知识服务构件开发,实现知识服务构件的可扩展性、开放性、分布式运行,具有业务响应快、代码复用率高、可靠性高、开发成本低等优势。针对跨媒体科技大数据检索知识服务构件,提出一种基于对抗生成学习和语义相似度的跨媒体科技大数据检索方法,对跨媒体科技资源进行检索,并根据语义相似度进行排序,解决了跨媒体数据特征异构性问题,提高了跨媒体检索准确率。(3)提出了跨媒体科技大数据的动态推演展示与交互可视化的方法。针对科技大数据中实体关系缺失的问题,提出了基于循环神经网络的动态推演算法,利用循环神经网络结构,将知识图谱中的实体和关系向量作为输入,结合上一时刻的状态进行计算,得到当前时刻的隐藏值,经过迭代运算,输出一个融合了知识图谱中的实体和关系的结果向量,解决了科技大数据中实体关系缺失的问题,扩大了科技大数据知识图谱规模。针对跨媒体科技大数据内部关联关系复杂性问题,利用可视化技术帮助用户获取数据背后隐藏的价值,提出了基于ECharts的跨媒体科技大数据的交互可视化方案,实现了跨媒体科技大数据的知识图谱、热点词云等的可视化,为用户分析科技大数据提供便利。(4)实现了跨媒体科技大数据知识服务与交互可视化构件的系统。系统由实体关系抽取、跨媒体检索、交互可视化等知识服务构件组成。系统各项功能完备,用户界面操作友好。
科技论文的领域信息挖掘与主题演进规律研究
这是一篇关于科技大数据,图神经网络,多标签分类,主题演进规律,交互可视化的论文, 主要内容为近年来,随着社会对科研投入的增大,各种领域的研究成果数量显著增加。各研究领域迅速发展,不同领域之间交叉融合,许多研究成果之间存在一定的依赖关系。如何有效挖掘科技论文的研究领域和主题演进规律具有重要的研究意义。本文基于注意力机制、图卷积网络、图注意力网络、层级标签分类网络、时间卷积网络等多种深度学习技术,对科技论文数据进行特征表示,利用层级多标签分类模型科技论文领域信息,并对研究领域内的各个主题进行演进规律的研究。通过微服务技术建立科技论文的领域信息挖掘与演进规律预测系统。本文完成的主要工作如下:(1)提出了科技论文数据获取与特征提取方法。针对科技论文的特征表示,提出了结合图卷积网络与BERT深度语义模型的科技文本语义特征表示模型,通过结合科技论文的关键词共现关系,描述论文与关键词之间的关联,构建了一个论文与关键词的异质网络,通过BERT获得所有结点的初始向量表示,并结合GCN网络将相邻结点的语义特征结合,提取空间信息,最终的输出作为科技论文的语义表示,实现了对论文的语义特征表示学习。(2)提出了基于图卷积网络的科技论文领域信息挖掘模型。一篇论文往往具有多个类别,例如在中图分类法中,类别之间具有层级关系,论文的类别呈现出层次结构,这就是一个典型的多标签层次分类任务。它对现有的模型提出了两个挑战:首先,现有模型不能很好地捕获论文之间的语义关系。其次,它们忽略了对标签的层次结构进行建模。本文提出了一种基于图注意力网络的分层标签注意力模型,该模型利用词的共现性来对论文的语义关系进行建模。使用多个线性层来建模类别层次结构,并通过注意力机制组合标签的每个层次结构,实现了对论文领域的层级多标签分类。(3)提出了基于空间增强与动态图卷积网络的科技论文研究主题演进规律预测模型。由于各个研究主题之间具有一定的关联关系,孤立地看待单个研究主题无法有效地挖掘这些研究主题之间的依赖。为了同时捕获研究主题之间的空间依赖以及时间变化,提出了一种基于空间增强与动态图卷积网络的研究主题趋势预测模型,本模型结合了图卷积神经网络(GCN)和时间卷积网络(TCN),GCN用于学习研究主题的空间表示,并利用空间依赖加强空间特征,TCN用于学习研究主题趋势的动态变化,并根据时间距离计算加权损失进行优化,实现对研究主题演进规律的挖掘。(4)实现了科技论文的领域信息挖掘与主题演进规律分析系统。系统集成了数据处理模块、学科查询模块、研究主题变化趋势模块。基于Springboot框架开发了可视化系统,并集成了 ElasticSearch检索引擎以及Redis缓存数据库,有效提升了系统各模块的性能,采用Echarts可视化插件进行可视化展示,提供了中英文论文成果的检索、论文学科的分布分析、研究主题关联图谱、研究主题演进规律预测等功能。系统各项功能完备,用户界面操作友好。
跨媒体科技大数据的知识服务与交互可视化构件研究
这是一篇关于跨媒体科技大数据,知识服务构件,对抗生成学习,交互可视化的论文, 主要内容为大数据时代科技资源呈现数据规模大、多模态、更新快速、时效性高和价值密度较低等趋势,对有效利用科技资源带来严峻的挑战。本文基于注意力机制、对抗生成学习、循环神经网络、微服务等知识和技术,利用深度学习方法对科技大数据进行实体识别和关系抽取,引入多注意力机制提高算法准确率;利用对抗生成学习和语义相似度实现跨媒体科技大数据的检索;利用循环神经网络方法,将知识图谱中的实体和关系作为输入,推演出新的关系,进一步扩大知识图谱的规模。同时,通过微服务技术完成对实体关系抽取、跨媒体检索、交互可视化等知识服务构件的开发,实现知识服务构件的开放协同。本文完成的主要工作如下:(1)提出了跨媒体科技大数据的实体识别与关联关系发现的方法。针对科技大数据的实体识别,提出了结合分词词性的注意力机制的命名实体识别算法,通过结合分词词性、双向长短时循环网络和注意力机制,利用有监督方法对数据进行学习与训练,实现了科技大数据的实体识别;针对科技大数据的实体关系发现,通过结合科技文本数据的句子级别注意力机制和自注意力机制,提出了基于多注意力机制的实体关系抽取算法,实现了科技大数据的实体关系发现。(2)提出了跨媒体科技大数据的知识服务构件的开放协同。为了使知识服务构件具有良好的扩展性、开放性,提出了基于微服务的知识服务构件的开放协同机制,同时定义了本文开发的具体知识服务构件。利用微服务架构完成知识服务构件开发,实现知识服务构件的可扩展性、开放性、分布式运行,具有业务响应快、代码复用率高、可靠性高、开发成本低等优势。针对跨媒体科技大数据检索知识服务构件,提出一种基于对抗生成学习和语义相似度的跨媒体科技大数据检索方法,对跨媒体科技资源进行检索,并根据语义相似度进行排序,解决了跨媒体数据特征异构性问题,提高了跨媒体检索准确率。(3)提出了跨媒体科技大数据的动态推演展示与交互可视化的方法。针对科技大数据中实体关系缺失的问题,提出了基于循环神经网络的动态推演算法,利用循环神经网络结构,将知识图谱中的实体和关系向量作为输入,结合上一时刻的状态进行计算,得到当前时刻的隐藏值,经过迭代运算,输出一个融合了知识图谱中的实体和关系的结果向量,解决了科技大数据中实体关系缺失的问题,扩大了科技大数据知识图谱规模。针对跨媒体科技大数据内部关联关系复杂性问题,利用可视化技术帮助用户获取数据背后隐藏的价值,提出了基于ECharts的跨媒体科技大数据的交互可视化方案,实现了跨媒体科技大数据的知识图谱、热点词云等的可视化,为用户分析科技大数据提供便利。(4)实现了跨媒体科技大数据知识服务与交互可视化构件的系统。系统由实体关系抽取、跨媒体检索、交互可视化等知识服务构件组成。系统各项功能完备,用户界面操作友好。
基于Spark的出租车大数据时空检索方法与可视化研究
这是一篇关于轨迹数据,时空编码,分布式列式存储,Hilbert分区,交互可视化的论文, 主要内容为近年来,随着居民出行的频繁、交通工具的多样化以及出行数据被密集的采集,轨迹数据呈爆炸式增长。在收集、管理、应用这些数据的过程中,由于轨迹大数据更新速度快、数据量巨大,适用大数据技术处理和分布式数据库存储。但轨迹大数据分布不均匀,存在时空特征,这就导致在组织管理过程中出现了数据写入热、存储倾斜、I/O开销大和检索速度慢等问题。为了解决上述问题,本文对轨迹大数据的存储、时空索引以及可视化现状进行了深入研究,深挖大数据技术和分布式数据库存储的技术原理,研究构建了一种融合数据分区和时空多角度分层组织的轨迹大数据模型,并进一步研究实现了轨迹大数据时空检索方法和交互可视化方法。本文以厦门市出租车轨迹大数据作为数据基础,部署分布式集群,基于Spark计算框架,从时间和空间角度组织管理海量的轨迹数据,探索时空检索方法,并结合多种可视化技术挖掘轨迹蕴含的信息。本文的研究内容主要概括为以下三个方面:(1)构建融合数据分区和时空多维度分层组织的数据存储模型搭建一个主节点两个从节点的Hadoop分布式计算集群,基于Spark计算框架,完成轨迹大数据的预处理和入库。在空间层面,探究基于Hilbert曲线对轨迹数据分区的算法流程,结合预分区机制解决分布式数据库HBase写入热和存储倾斜的问题。在时间层面,本文以天为组织管理单元,按分钟制精细化编码存储,形成全局时空细分方案,提出了基于时空多角度分层组织的数据存储模型。该模型大幅度提升轨迹大数据的存储和计算效率,可为轨迹大数据挖掘与分析提供高效的数据管理模型支持。(2)设计行键结构,构建时空混合编码,探究时空检索模式基于HBase的索引规则,设计行键结构,然后融合数据分区构建时空混合编码,将多维时空数据降维存储到分布式数据库HBase中,对比写入速度。探究精确点查询和时空范围查询模式,通过检索效率对比,表现出良好的查询性能。对轨迹大数据进行分层组织管理,解决轨迹大数据的高效存储和检索问题。实验结果表明,该索引在精确点查询和时空范围查询等方面均表现出良好的查询性能。该模型在不同数量级下均能够有效提升轨迹大数据检索速度,同时保证写入和查询速度相对稳定,可为轨迹大数据挖掘与分析提供高效的检索。(3)搭建前后端完全分离的出租车轨迹大数据可视化平台根据用户对出租车轨迹大数据的使用需求进行需求分析,设计交互可视化方法。后端基于Spring Boots+My Batis组合框架,前端结合Vue2.0架构,搭建一个前后端完全分离的出租车轨迹大数据可视化平台。后端基于融合数据分区和时空多维度分层组织的数据存储模型,通过时空混合索引检索精确点数据和时空范围数据,传输到前端,结合Echarts、逆向热力图等方法完成交互可视化。整个过程便于分析结果可视化、探究出租车的时空分布特征,为多源异构海量时空大数据的可视化分析起到的平台支撑和应用示范的作用。
跨媒体科技大数据的知识服务与交互可视化构件研究
这是一篇关于跨媒体科技大数据,知识服务构件,对抗生成学习,交互可视化的论文, 主要内容为大数据时代科技资源呈现数据规模大、多模态、更新快速、时效性高和价值密度较低等趋势,对有效利用科技资源带来严峻的挑战。本文基于注意力机制、对抗生成学习、循环神经网络、微服务等知识和技术,利用深度学习方法对科技大数据进行实体识别和关系抽取,引入多注意力机制提高算法准确率;利用对抗生成学习和语义相似度实现跨媒体科技大数据的检索;利用循环神经网络方法,将知识图谱中的实体和关系作为输入,推演出新的关系,进一步扩大知识图谱的规模。同时,通过微服务技术完成对实体关系抽取、跨媒体检索、交互可视化等知识服务构件的开发,实现知识服务构件的开放协同。本文完成的主要工作如下:(1)提出了跨媒体科技大数据的实体识别与关联关系发现的方法。针对科技大数据的实体识别,提出了结合分词词性的注意力机制的命名实体识别算法,通过结合分词词性、双向长短时循环网络和注意力机制,利用有监督方法对数据进行学习与训练,实现了科技大数据的实体识别;针对科技大数据的实体关系发现,通过结合科技文本数据的句子级别注意力机制和自注意力机制,提出了基于多注意力机制的实体关系抽取算法,实现了科技大数据的实体关系发现。(2)提出了跨媒体科技大数据的知识服务构件的开放协同。为了使知识服务构件具有良好的扩展性、开放性,提出了基于微服务的知识服务构件的开放协同机制,同时定义了本文开发的具体知识服务构件。利用微服务架构完成知识服务构件开发,实现知识服务构件的可扩展性、开放性、分布式运行,具有业务响应快、代码复用率高、可靠性高、开发成本低等优势。针对跨媒体科技大数据检索知识服务构件,提出一种基于对抗生成学习和语义相似度的跨媒体科技大数据检索方法,对跨媒体科技资源进行检索,并根据语义相似度进行排序,解决了跨媒体数据特征异构性问题,提高了跨媒体检索准确率。(3)提出了跨媒体科技大数据的动态推演展示与交互可视化的方法。针对科技大数据中实体关系缺失的问题,提出了基于循环神经网络的动态推演算法,利用循环神经网络结构,将知识图谱中的实体和关系向量作为输入,结合上一时刻的状态进行计算,得到当前时刻的隐藏值,经过迭代运算,输出一个融合了知识图谱中的实体和关系的结果向量,解决了科技大数据中实体关系缺失的问题,扩大了科技大数据知识图谱规模。针对跨媒体科技大数据内部关联关系复杂性问题,利用可视化技术帮助用户获取数据背后隐藏的价值,提出了基于ECharts的跨媒体科技大数据的交互可视化方案,实现了跨媒体科技大数据的知识图谱、热点词云等的可视化,为用户分析科技大数据提供便利。(4)实现了跨媒体科技大数据知识服务与交互可视化构件的系统。系统由实体关系抽取、跨媒体检索、交互可视化等知识服务构件组成。系统各项功能完备,用户界面操作友好。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设海岸 ,原文地址:https://m.bishedaima.com/lunwen/50121.html