基于关联数据的科技智库数据共享机制研究
这是一篇关于数据共享机制,科技智库,数据伦理,关联数据,通知描述的论文, 主要内容为大数据时代下,科技和诸多学科产生交叉,“科技+经济”、“科技+政治”、“科技+健康”等主题层出不穷,多学科交叉导致科技智库数据搜集的难度大大提升。科技智库数据共享就是将科技智库在科研活动中获取到各方面、各领域的高质量原始数据,以“机器可读”的形式,在科技智库、科研院所等以科学研究为目的的组织体系中进行共享利用,促进项目数据的重复利用。科技智库数据共享说易行难,从宏观的角度看,科技智库共享的数据资源涉及多方利益,如政府、企业、公众等,缺乏合理的机制、政策和制度的支撑,无法为数据伦理中涉及到的商业机密、个人隐私等问题匹配解决方案。从微观的角度看,共享数据应以什么样的格式组织,由谁负责管理,如何实现共享数据的统一运营管理,以保证数据的质量和用途,都是目前科技智库数据共享中的难题所在。本文以科技智库共享数据为研究对象,针对其面临的问题与挑战,从宏观和微观两个角度进行相应分析,并提出框架、机制、制度等方面的建议和解决方案。首先,基于科技智库数据共享的实际需求,提出科技图谱的概念。通过利益相关者理论和协同理论,明确共享过程中的利益主体,提出了与科技创新需求相匹配的科技图谱构建服务框架。其次,针对科技智库数据共享中的政策制度问题进行研究。通过界定共享数据的产权归属,明确其主要利益享有者,参照现有的数据流通许可协议,结合科技智库数据共享的实际需求,提出与之相匹配的数据共享许可协议体系,将利益协调和许可协议保障相统一,提出基于利益协调的科技智库支撑服务框架,并从政策、制度方面提出相应建议。最后,对科技智库数据共享中的技术实现方面进行研究。以知识图谱作为共享数据的主要组织形式,探讨在以科学数据中心为统一管理机构的情况下,如何实现对共享数据的构建与维护。结合HTTP、LDN、LDP等技术标准,提出基于通知的服务器交互式的数据管理架构,对数据共享过程中的描述、发布、维护等问题进行重点探讨,并结合案例实验进行分析,突出研究的可行之处。
宋代镇江诗词资源知识组织与知识发现研究
这是一篇关于宋代镇江诗词,诗词资源,本体,关联数据,知识图谱的论文, 主要内容为在大数据时代,由于文化和科技融合日趋紧密,现代信息科学技术为传统人文学科研究带来了全新的技术与方法,为传统研究范式的转型提供了可能。诗词作为我国优秀传统文化,蕴含了丰富的历史文化信息,也饱含了历代士子的个人思想和家国情怀。诗词作为一种宝贵的文化资源,历来就被重视与研究,尤其在当前结合新的技术手段,使得诗词资源的组织模式向语义化方向演进,既可优化诗词资源组织整理的研究,又能够促进地方文化的深度开发与建设工作,也是对传统诗词研究的推进与革新。在此背景下,本文主要以宋代镇江诗词资源为例,探究诗词领域的知识组织与知识发现模式。本文通过文献调研与文献计量方法对相关研究文献进行搜集与分析,了解国内外相关研究现状。在对宋代镇江历史文化及其诗词资源进行调研、梳理与考证后,引入本体、关联数据及知识图谱等语义网相关理论和技术方法,通过对调研采集的宋代镇江诗词进行知识概念提取、本体建模、关联数据发布、知识图谱构建等,实现了对诗词资源的语义化组织。本文通过对诗词资源进行细粒度的语义描述,通过查询与推理可深入揭示其知识内涵,从而促进其共享利用。针对传统诗词资源组织模式落后的问题,提出了语义化组织诗词资源的方法和路径,核心内容主要从以下三个方面展开。(1)构建本体模型实现对诗词资源的细粒度语义描述。在对宋代镇江历史文化充分调研的基础上对相关诗词资源进行收集和整理,分析宋代镇江诗词特点,深度挖掘诗词资源的内容特征与属性信息。在全面分析诗词资源概念属性的基础上,根据已有元数据规范结合自定义词表的方式构建诗词资源本体模型。通过构建本体模型解决了诗词资源领域内缺乏语义化描述的问题,对诗词及其它历史文化资源领域的语义描述和标注等具有一定借鉴意义,为诗词资源的描述提供了规范化的说明,也为后续关联数据研究提供了标准化的参考。(2)基于关联数据实现宋代镇江诗词资源的知识聚合与发布。利用Drupal平台实现了宋代镇江诗词资源关联数据的实例化发布,在资源标识、内容类型与属性构建、RDF映射的基础上,完成诗词资源聚合平台的设计与可视化展示。通过搭建宋代镇江诗词资源知识服务平台,明确了统一的技术实践流程,在具体的平台上进行了多元资源的聚合发布。基于实证研究方法实例化地进行了应用研究,为诗词资源的组织研究提供了可借鉴的应用场景。(3)依托知识图谱实现诗词资源的知识发现。利用知识图谱中丰富的图运算弥补关联数据在知识挖掘与计算上的不足,通过图数据库Neo4j在关联数据基础上对诗词资源内容主题以知识图谱的形式呈现,对诗词进行“诗”、“人”、“地”、“时”、“事”的全方位关联探讨和多维度分析。通过查询及推理的方式完成对宋代镇江诗词资源的知识发现,实现了对关联数据从狭义到广义上的扩展延伸,克服了现有研究中对诗词内容属性揭示不足的局限,验证了将图数据库应用于诗词知识图谱构建的优势,通过对诗词知识的深度挖掘为未来诗词领域内实现智慧化精准服务带来可能。
关联数据在数字图书馆中应用过程的知识图谱分析
这是一篇关于知识图谱,关联数据,数字图书馆,突变检测,Cite Space的论文, 主要内容为随着信息时代的发展,我国图书馆发生日新月异的变化,作为图书馆进行数据发布和提供信息服务的重要技术之一的关联数据越来越受到大家的关注。这些年,国内外学者针对关联数据在数字图书馆的应用方面做了大量的理论和实践研究并取得了丰富的成果。当前很多研究者对研究热点的分析都采用综述这种定性方法,这种方法很大程度上取决于作者主观的判断和作者的知识结构,会影响研究结果的客观性和准确性。而科学知识图谱通过对数据的定量分析,然后以图谱的形式直观的揭示研究领域的历史、前沿和整体情况,能够展示其核心结构和当前动态,为研究人员提供实用和宝贵的参考。本文以2002-2017年间中国知网、万方和维普三大数据库收录的关联数据在数字图书馆中的研究相关论文为样本,运用词频分析、共现分析、聚类共词分析、突变检测等先进的科学计量方法,对我国关联数据研究进行全面的文献计量和知识图谱分析,充分解释了数字图书馆中关联数据应用领域的作者合作网络、机构合作网络、关键词共现网络、聚类共词网络、突变词主题时区视图和突变共词聚类知识图谱,直观展示了21世纪以来我国关联数据研究的作者合作网络、核心机构、研究热点、研究前沿和新兴趋势。研究发现:(1)现代不断开放与互联的环境给数字图书馆和关联数据的发展带来了新的机遇和挑战,传统图书馆在新的环境下将有更大的发展空间;(2)同领域、跨领域的科研合作呈现加强态势,但合作网络相对稀疏,不同机构、不同区域间的合作仍然不够明显,应用研究大都限制于“亲缘”关系,而与其他不同单位作者之间的合作比较弱;(3)研究核心力量集中在高校管理院系和一流研究院所。高校管理院系以管理学院、信息管理院系为主,南京大学、上海图书馆、华中师范大学、武汉大学、吉林大学的关联数据研究优势突出;(4)关联数据研究涌现出欧石燕、刘炜、夏翠娟、王忠义、夏立新、邱均平、王萍、游毅、高劲松等杰出代表学者;(5)通过对共现知识图谱的深入分析研究,得出了当前我国关联数据应用于数字图书馆研究主要的四种不同应用形式和国外研究的五种不同方向。另通过对关键词聚类发现了国内该领域的两个主要热点话题;(6)运用突变检测并结合共词分析方法发现国内关联数据研究文献的突变词类型共有4种,并得出关联数据研究的两大新兴主题,以及关联数据从诞生到发布、互联和应用的一个生命周期的四大研究热点主题。为数字图书馆中关联数据的进一步深入研究指明了方向。
基于web数据的碳交易领域知识图谱构建研究
这是一篇关于知识图谱,三元组抽取,实体识别,关系抽取,关联数据的论文, 主要内容为知识图谱作为具有强大语义处理能力和开放组织能力的新兴技术手段,是当前的研究热点之一。根据知识覆盖面不同可以将知识图谱分为通用领域知识图谱和垂直领域知识图谱。目前知识图谱的研究主要集中在通用领域,面向垂直领域的研究工作较少。近年来我国碳交易市场发展迅速,大量异构多源的数据迫切需要一个有效的整合方法,传统的信息集成方法无法从知识的角度对数据进行管理,为此,本文提出构建碳交易领域的知识图谱,以便从web数据中整合碳交易领域的知识。本文的研究重点主要集中在知识图谱的知识获取方面,提出一种构建碳交易领域知识图谱的技术框架,主要研究内容及成果如下:首先,针对碳交易领域数据多源异构、分散自治的特点,通过构建数据获取器,从网络资源中自动收集碳交易领域的相关数据。其次,针对不同结构的数据,提出不同的知识抽取方法。对于百科站点中的半结构化数据,通过构建web数据包装器从中获取知识。对于碳交易领域垂直站点中的非结构化文本数据,将其知识抽取分为实体识别和关系抽取两部分。在实体识别阶段,研究了Bi LSTM-CRF网络训练模型识别句子中的实体,其平均准确率达到90%以上;在关系抽取阶段,研究了依存句法分析模式匹配的方法获取实体之间的关系,提出一种基于标注数据的模式生成方法,实验结果显示该方法能够有效地抽取实体之间的关系。对于国家技术标准网站的行业标准和技术规范文件,通过构建规则提取其中的行业知识。最后,将获取到的三元组知识整合并转化为关联数据的形式,在此基础上构建知识查询模块。同时,通过图数据库Neo4j实现知识可视化展现。实验结果表明,本文提出的知识图谱构建方法,能够有效地从不同结构的数据中获取三元组知识,且在很大程度上减少人工参与;基于知识图谱的知识查询和可视化展现,能够为碳交易领域的知识服务提供帮助。
基于关联数据的科技智库数据共享机制研究
这是一篇关于数据共享机制,科技智库,数据伦理,关联数据,通知描述的论文, 主要内容为大数据时代下,科技和诸多学科产生交叉,“科技+经济”、“科技+政治”、“科技+健康”等主题层出不穷,多学科交叉导致科技智库数据搜集的难度大大提升。科技智库数据共享就是将科技智库在科研活动中获取到各方面、各领域的高质量原始数据,以“机器可读”的形式,在科技智库、科研院所等以科学研究为目的的组织体系中进行共享利用,促进项目数据的重复利用。科技智库数据共享说易行难,从宏观的角度看,科技智库共享的数据资源涉及多方利益,如政府、企业、公众等,缺乏合理的机制、政策和制度的支撑,无法为数据伦理中涉及到的商业机密、个人隐私等问题匹配解决方案。从微观的角度看,共享数据应以什么样的格式组织,由谁负责管理,如何实现共享数据的统一运营管理,以保证数据的质量和用途,都是目前科技智库数据共享中的难题所在。本文以科技智库共享数据为研究对象,针对其面临的问题与挑战,从宏观和微观两个角度进行相应分析,并提出框架、机制、制度等方面的建议和解决方案。首先,基于科技智库数据共享的实际需求,提出科技图谱的概念。通过利益相关者理论和协同理论,明确共享过程中的利益主体,提出了与科技创新需求相匹配的科技图谱构建服务框架。其次,针对科技智库数据共享中的政策制度问题进行研究。通过界定共享数据的产权归属,明确其主要利益享有者,参照现有的数据流通许可协议,结合科技智库数据共享的实际需求,提出与之相匹配的数据共享许可协议体系,将利益协调和许可协议保障相统一,提出基于利益协调的科技智库支撑服务框架,并从政策、制度方面提出相应建议。最后,对科技智库数据共享中的技术实现方面进行研究。以知识图谱作为共享数据的主要组织形式,探讨在以科学数据中心为统一管理机构的情况下,如何实现对共享数据的构建与维护。结合HTTP、LDN、LDP等技术标准,提出基于通知的服务器交互式的数据管理架构,对数据共享过程中的描述、发布、维护等问题进行重点探讨,并结合案例实验进行分析,突出研究的可行之处。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码项目助手 ,原文地址:https://m.bishedaima.com/lunwen/56269.html