数字人文视域下历史档案资源知识库构建研究
这是一篇关于数字人文,历史档案,知识库,本体,CIDOC-CRM的论文, 主要内容为随着数字人文研究迅速发展,不仅推动了历史、艺术、考古等领域的发展,而且极大程度上推动了档案领域的革新。历史档案资源作为数字人文重要的研究对象之一,其实用价值愈来愈受到广大人文学者的关注。目前,该类资源呈现出分散、多元、异构特点,从而使其无法发挥应有的作用。近年来,本体、知识图谱、数据库、知识库等技术手段在档案资源整合、知识组织等相关研究中大显身手,甚至逐步成为了档案研究领域的热点问题,为有效拓展档案价值、实现档案的智能化管理与应用提供了重要参考。利用历史档案资源构建相应知识库,是实现历史档案资源结构化、检索便捷化、检索结果准确化、服务智能化的一条重要路径。本文立足数字人文视角,充分结合用户需求,设计了历史档案资源知识库框架,并从理论和实证双重角度利用基于本体方法构建历史档案资源知识库。在该过程中,充分发挥了CIDOC-CRM在历史档案资源语义组织上的优越性,构建了历史档案资源本体,并基于该本体对My SQL数据库的表结构以及Neo4j图数据的节点与关系进行了设计,为知识库以可视化呈现历史档案资源数据做准备,同时也从知识关联、知识发现的角度对知识库进行了设计和构建。另外,笔者利用Ping Code Wiki知识库构建工具实现知识库最终构建与实现。从而使历史档案资源知识库可以切实满足新环境下用户的需求,推动历史档案资源的价值实现与价值增值。
数字人文视域下近代商会档案资源整合研究
这是一篇关于数字人文,商会档案,档案资源整合的论文, 主要内容为近代商会档案是清末至民国商会活动的历史记录,是我国历史文化遗产的重要组成部分,更是研究中国近现代经济史和商会专史的重要史料。针对近代商会档案资源开展整合工作,有利于聚焦文本结构,促进商会档案文本数据整合转型;有利于突破商会档案的属地化管理、促进商会区域史研究;有利于突破商会档案文本的局限,构筑全景式整体史的视野。近代商会档案资源整合既是商会档案价值和档案整理走向文本结构化转型的内在驱动力,也是史学研究纵深发展对商会档案文本阐释和跨数据库利用的外在需求以及数字赋能人文内涵的逻辑使然。随着信息技术、网络技术、数字技术的高速发展,数字人文作为一种新兴的研究手段和方法逐步参与到档案学的研究之中,并对商会档案资源整合提供了新思维、新方法、新平台。在数字人文视域下,商会档案资源的整合具有过去无可比拟的优势。而针对当前商会档案资源整合存在像难以实现全方面的覆盖、数字化整理不平衡以及局限性的问题,采取多元主体参与;制定统一标准,将数字人文为我所用;加强统筹推进,重点突出发展等优化策略推进近代商会档案资源进行整合。在此基础上,提出数字人文视域下近代商会档案资源整合的具体实施路径。主要从数据、技术、平台三个维度切入实现整合。首先从数据出发,细化商会档案数据的颗粒度,综合运用“七步法”构建本体;其次从技术出发,利用数据库、数据关联、知识图谱等技术构建商会档案图状数据结构,进而发现档案的多重脉络;最后从平台出发,利用各类专题数据库汇集商会档案资源,积极推动资源共享,使近代商会档案资源最大程度地发挥价值,促进其在数字人文视域下的整合,如此一来不仅有利于商会研究的现实需要,更为“数字”与“人文”研究开辟了新思路。
面向领域知识服务的唐诗本体构建与智能应用研究
这是一篇关于领域本体,唐诗,领域知识服务,智能应用,数字人文的论文, 主要内容为以知识图谱为代表的新一代人工智能技术的发展为唐诗数字人文领域的研究带来了新思路和新方法的变革,利用知识图谱提供智能化的知识服务成为唐诗数字人文领域研究的新方向。同时,随着唐诗大数据的增长,唐诗领域的知识服务需求也从传统的信息查询转变为希望满足精准化、专业化和智能化的知识服务需求,这一转变对细粒度、语义化的唐诗知识组织和表示方式提出了新的要求。然而当前互联网上的唐诗知识组织松散稀疏,复杂异构,大大增加了知识获取、组织和利用的难度。领域本体作为领域共享概念的明确化形式化的语义描述模型,可以有效地组织和表示唐诗知识中的概念、术语、属性、关系等,是唐诗领域知识图谱构建和领域知识服务的表示基础。因此本文以唐诗领域知识服务需求为导向,构建面向领域知识服务的唐诗本体,并实现知识图谱环境下的本体智能应用。首先,本文采用专家咨询法、问卷调查法和知识小组三种定性与定量方法调研唐诗领域知识服务需求,调研对象包括科研人员、普通用户和开发人员在内的三类用户;并对收集到的需求进行分析,构建面向唐诗本体构建的需求分析框架,使得领域本体可以覆盖复杂变化的知识服务需求,形成唐诗本体的先验原型。其次,本文提出了面向领域知识服务的唐诗本体(Tang Poetry Ontology for Domain Knowledge Service,以下简称TPO4DKS)模型构建框架,包括分布式异构数据源层、本体模式层和本体智能应用层;基于此构建框架,本文进一步提出了一种面向领域知识服务的唐诗本体构建方法论,包括规范化、概念化、形式化和集成化四个步骤,按照元本体-子域本体-全局本体的本体层次逐步构建;利用OWL语言和Protégé工具编辑管理TPO4DKS模型,并使用Virtuoso数据库将本体以RDF三元组形式存储于本体知识库。最后,本文开展了基于唐诗本体的智能应用研究,包括TPO4DKS在支持知识管理、知识推理及知识查询3个方面的智能化应用。其中,基于TPO4DKS的知识管理通过语义标注、语义集成和知识存储三个方面支持唐诗领域知识的识别、抽取和存储应用;知识推理通过构造基于OWL语言的推理规则、产生式规则和自定义SWRL(Semantic Web Rule Language)规则实现唐诗知识推理的应用;知识查询则通过基于本体知识库的SPARQL查询功能不断完善本体模式层弥补知识库与查询需求之间的语义间隙,从而增强知识查询的服务能力。
数字人文驱动下历史人物年谱知识图谱构建研究
这是一篇关于数字人文,历史人物年谱,知识图谱的论文, 主要内容为在数字人文的推动下,传统的人文资源研究已逐步转向数字化、信息化,历史人物年谱资源亟需一个全新的、有效的知识组织方式,将年谱中的知识内涵挖掘出来,让历史人物年谱资源能够焕发出新的活力。因此,对历史人物年谱开展数字研究与知识重构,是深化历史人物年谱创新研究的关键,而知识图谱作为知识重构研究的重要切入点,具有高度的信息组织和语义兼容性,能够满足历史人物年谱文本内容相关知识重构。本文将采取知识图谱技术对历史人物年谱进行知识重构,以案例研究为切入点,在分析历史人物年谱资源特征、用户需求的基础上,探讨历史人物年谱知识图谱构建问题;涵盖了历史人物年谱资源的知识获取、本体模型构建以及知识图谱的存储等方面,最终实现历史人物年谱知识图谱的实践应用;为历史人物年谱的数字化研究和用户个性化信息检索服务提供新思路。本文的重点研究工作如下:(1)重点分析研究来源数据的特征,采取内容分析、社会网络分析等多种文本分析方法深度剖析数据资源,揭示研究案例资源的特征和内在关联,在此基础上提取年谱资源的知识实体单元,以规范格式进行存储,并形成一个标准的数据集,为后续知识图谱建模提供数据单元。(2)构建历史人物年谱知识本体模型,完成历史人物年谱知识图谱模型的初步构建工作。根据数据特征和内容分析结果,定义实体知识单元之间的关系,采用OWL语言对模型的层级、概念内涵等进行语义描述,定义历史人物年谱概念与概念之间的关系属性与数据属性,完成历史人物年谱资源的知识描述体系,实现历史人物年谱知识本体模型的表示与实例化展示。(3)分析用户对于人物传记资源的知识检索和服务需求,完成历史人物年谱知识图谱的存储与可视化,并结合图数据库中的Cypher查询功能,构建了相关的知识检索模块,实现了基于历史人物年谱知识图谱的知识检索与可视化平台,为广大用户提供历史人物年谱资源的检索服务;进一步拓宽历史人物年谱体例资源的数字化、图像化的研究渠道,提高历史人物年谱资源的利用率,推广历史人物年谱资源的深度挖掘与利用。
基于文献的陕西传统民居与聚落研究历程探析(1934-2019)
这是一篇关于陕西民居,研究历程,建筑史学史,民居建筑学,数字人文的论文, 主要内容为“辨章学术,考镜源流”中国传统学术研究的根基之一是采用文献来考证其学术发展脉络,即文献本是“记录一切有知识的一切载体”的代称。当前处于信息化时代,知识爆炸成为一种常态化。知识更新速度远大于人们接受和理解知识的速度。随着文献数量激增,现今已经难以通过窥见全貌。亟待需要进行对其进行归纳总结。基于数字人文的“远读”理念和文献计量学方法对陕西地区传统民居和聚落已有研究成果进行定量化总结,梳理其研究历程。首先,在文献收集1236篇学术论文和50余部著作的基础上,采用“远读”方法对其从四个方面进行定量化分析和研究图景描摹:(1)论文关键词视角下的陕西民居和聚落研究的宏观演进特征。(2)科学知识图谱下的陕西民居和聚落(3)比较了陕西和全国相关研究的关系(4)陕西民居研究和陕西地区建筑工作者进行的其他地区民居研究的关系。此外,本研究论述了自20世纪30年代以来的陕西地区传统民居和聚落研究发展历程,将其划分为3个发展阶段:早期探索(20世纪30年代——改革开放),稳步发展(改革开放——21世纪初),多元繁盛(21世纪初——至今)。在此基础上对每个阶段的大事件进行了解读。最后,从现有的陕西地方通史和全国民居相关著作、陕西民居和聚落研究著作和98篇代表性学术论文进行研究内容的归纳,梳理出具体的8大研究主题和具体的21个研究方向。本研究陕西传统民居和聚落研究提供了较为详尽的基础资料,为未来陕西地区传统民居和聚落的保护、发展和传承提供了理论参考。同时为数字人文研究提供了研究参考样本。最后在一定程度上推进了我国民居建筑学学科的发展。
基于文献计量的国内外数字人文研究的比较分析
这是一篇关于数字人文,文献计量,国内外对比,主体分析,内容分析的论文, 主要内容为随着信息技术的发展,人类文化正在向数字化转型,进入一种新的形态,在这场数字新形态的变革中,数字人文的开放性特征凸显出现,并发挥了关键的作用。数字人文的开放性,体现在多个方面,不仅打破了学科边界,将科技融合互通,还将人文学科与人类生活日常相联系。数字人文是在人类文化进行数字化转型过程中的必经之路,建设了一种新的学术与文化机制。数字人文的研究不仅在国内受到重视,在国际学术界也受到越来越多学者的关注,因此对国内外数字人文的研究进展、核心作者和核心机构的分布合作情况、研究热点与前沿发展趋势等一系列问题的探究就显得十分重要,通过国内外在数字人文领域内的研究对比分析,发现其研究异同,对我国数字人文今后进一步的发展也具有重要意义。本文以中国知网(CNKI)和Web of Science数据库获取的近十年数字人文主题的核心期刊数据为数据源,综合运用文献调研法、文献计量法、科学知识图谱、比较分析法等研究方法,利用Citespace、Gephi、COOC计量工具,从国内外数字人文研究的主体分析和内容分析两部分对近十年国内外数字人文的研究进行了比较系统的梳理和对比,并针对我国数字人文的发展现状提出了相应的思考与建议。本研究的具体内容分为以下几方面:首先,通过对国内外近十年数字人文文献发文量进行统计分析,发现国外对数字人文的研究早于国内,产出成果相对更多;接着从载文量和被引量两方面综合衡量国内外的重点期刊分布情况,以及对期刊的学科分布进行分析,发现我国数字人文研究主要分布在图书馆、情报与文献学学科,而国外较为均匀的分布在图书馆、情报与文献学,文学,计算机科学技术等学科。其次,运用综合指数法界定出国内夏翠娟、刘炜、欧阳剑,国外Poole,Alex H.、Chen,Chih-Ming等多位核心作者,同时界定出国内南京大学、南京农业大学、上海图书馆,国外University of London、King’s College London等多个核心机构,并从核心作者、核心机构的分布情况及合作情况来比较国内外研究主体的异同,发现国内在该领域的研究力量更集中且合作程度相对紧密。再次,通过奠基性文献和高被引文献挖掘国内外数字人文研究的知识基础,发现在研究初期,国内更重视技术研究,国外更重视理论研究,国内外同时关注古籍数字化、可视化等方面的研究;接着从关键词共现、高频关键词、关键词聚类探究出国内图书馆、知识图谱,国外远读、文化遗产等主题热点。最后,从知识演进的时间线图谱中反映国内外数字人文研究的发展脉络,发现国内在知识组织和档案学,国外在文本挖掘、学术图书馆和社交媒体方面的研究是近年来领域内的趋热研究,接着通过突现词来识别领域内的研究前沿,从三个阶段分析国内外数字人文的发展演变过程,并预测档案学、人文教育等研究可能成为未来数字人文的研究热点。通过国内外数字人文研究的对比分析,结合我国数字人文发展的特点,认为可以从促进数字人文领域合作研究、推进图书馆数字人文实践、构建数字人文教育体系三方面来促进我国数字人文研究与实践的进一步发展。
基于文献的陕西传统民居与聚落研究历程探析(1934-2019)
这是一篇关于陕西民居,研究历程,建筑史学史,民居建筑学,数字人文的论文, 主要内容为“辨章学术,考镜源流”中国传统学术研究的根基之一是采用文献来考证其学术发展脉络,即文献本是“记录一切有知识的一切载体”的代称。当前处于信息化时代,知识爆炸成为一种常态化。知识更新速度远大于人们接受和理解知识的速度。随着文献数量激增,现今已经难以通过窥见全貌。亟待需要进行对其进行归纳总结。基于数字人文的“远读”理念和文献计量学方法对陕西地区传统民居和聚落已有研究成果进行定量化总结,梳理其研究历程。首先,在文献收集1236篇学术论文和50余部著作的基础上,采用“远读”方法对其从四个方面进行定量化分析和研究图景描摹:(1)论文关键词视角下的陕西民居和聚落研究的宏观演进特征。(2)科学知识图谱下的陕西民居和聚落(3)比较了陕西和全国相关研究的关系(4)陕西民居研究和陕西地区建筑工作者进行的其他地区民居研究的关系。此外,本研究论述了自20世纪30年代以来的陕西地区传统民居和聚落研究发展历程,将其划分为3个发展阶段:早期探索(20世纪30年代——改革开放),稳步发展(改革开放——21世纪初),多元繁盛(21世纪初——至今)。在此基础上对每个阶段的大事件进行了解读。最后,从现有的陕西地方通史和全国民居相关著作、陕西民居和聚落研究著作和98篇代表性学术论文进行研究内容的归纳,梳理出具体的8大研究主题和具体的21个研究方向。本研究陕西传统民居和聚落研究提供了较为详尽的基础资料,为未来陕西地区传统民居和聚落的保护、发展和传承提供了理论参考。同时为数字人文研究提供了研究参考样本。最后在一定程度上推进了我国民居建筑学学科的发展。
贵州近代历史人物知识图谱构建研究
这是一篇关于数字人文,知识图谱,领域本体,信息组织,问答系统的论文, 主要内容为人文历史文献是信息服务机构收藏的重要对象,也是当前社会主义核心价值观等精神文明建设的宝贵财富。然而,不同类型的文献资源包含的信息较为多元,在进行知识组织时,仅采用一种方式难以展现其中丰富多元的细节。传统的知识组织方式难以展现人文历史文献资源内容的细节,不利于用户宏观把握和快速检索所需的人物历史信息。而且,大部分人文历史文献的内容通常以非结构化文本形式记录,缺乏系统性和语义性,阻碍了其深层次的利用和开发。历史人物知识图谱是一种有效的组织方法,可以将历史人物的多方面信息通过结构化数据进行反映,从而提高历史学习和研究的便利性、智能化管理、查询、推理和可视化,并揭示历史人物之间的复杂联系,挖掘出隐藏在数据中的规律和价值,促进对历史发展规律和趋势的认识。贵州近代历史人物知识图谱构建研究对于文献资源内容数智化开发利用具有重要意义,但目前还缺乏统一且通用的构建方法和标准。基于以上内容,本文以数字人文理念为切入点,深入揭示历史人物相关文献资源的内容特征,对其细粒度知识元进行关联重组,以人物为中心,辅以事件、地点、机构、时间等核心特征,构建历史人物资源聚合本体模型,在此基础上完成贵州近代历史人物知识图谱的搭建,并开展实证研究,实现人物知识内容的可视化展示、语义检索和知识问答等应用层服务。以期解决贵州近代历史人物相关文献资源知识内容“闲置”、思维“困囿”、技术“迟滞”等问题。鉴于此,本文的主要研究内容分为三个部分。首先,通过回顾国内外文献,梳理了与本研究相关的概念和理论意义,并确定了知识图谱构建方法和工具。其次,通过文献调研法,归纳总结了相关文献资源的内外部特征,并进行了文本分析,筛选出相关概念和概念之间的关系。然后,基于已有的本体描述语言和本体库,设计了贵州近代历史人物的本体模型,在此基础上通过知识抽取等技术完成了知识图谱实例化过程。最后,对贵州近代历史人物知识图谱展开实证研究。其中,知识图谱模式层采用本体模型设计,描述了人物相关概念和关系。实例层运用自然语言处理和深度学习技术,对非结构化数据进行知识抽取、整合和存储,实现了人物实体的可视化展示,在此基础上搭建了前端应用平台,实现了人物知识查询、实体识别和知识问答等功能。本文基于贵州近代历史人物相关文献资源,从多维视角构建本体模型并且实现了知识图谱实例构建。前端可视化界面采用B/S架构设计,实现了前后端分离的应用层服务平台,包括人物信息可视化浏览界面、实体关系识别界面以及知识问答系统,满足用户对贵州近代历史人物知识的可视化查询、知识发现、知识问答等需求,不仅有利于学者和用户对历史人物相关资源的使用和开发,也有助于推动历史文献资源从数字化向数智化转型升级。本研究为历史人物知识图谱的构建和应用提供了一个可行且有效的方法和实例,对于推动人文历史资源的数字化和智能化发展,以及促进人文精神的传承和弘扬,具有一定的理论和实践意义。
数字人文视阈下民国报纸知识图谱构建研究
这是一篇关于数字人文,民国报纸,知识图谱,本体,梅兰芳的论文, 主要内容为知识图谱作为大数据时代高效管理知识,呈现概念及其相互关系的技术,一经推出便引起了图情界的重视,无论是国际还是国内,都已经有数字人文项目应用了此项技术,并且取得了一定的研究成果。民国报纸作为中华民国历史的信息载体,具有高度的人文研究价值,其中隐藏的民国历史文化也是学术界探讨的热点之一。然而经过对目前已经上线运行的相关民国报纸资源库和藏有民国报纸的收藏机构进行网络调研时发现,大部分收藏机构对民国报纸仅仅停留在数字化阶段,甚至有一小部分收藏机构依然保持着以藏为主的收藏状态,设置阅览室实行线下阅览的方式,缺少了对民国报纸的挖掘应用阶段,使其难以发挥应有的人文研究价值。因此,本研究选取民国报纸这一尚未完全被唤醒的特藏资源,依托知识图谱相关技术手段,重点解析民国报纸的内容特征与外部特征,以京剧艺术表演大师—梅兰芳为实证研究的主体,实现基于知识图谱技术的民国报纸挖掘与应用。本文的第三章以数字人文为视角,对民国报纸资源库进行综合评价与分析,从资源、人文及知识组织三个维度分析民国报纸知识图谱构建的充分必要性。本文的第四章及第五章通过“中国历史文献总库—近代报纸数据库”收集民国报纸,进而对民国报纸内容特点进行综合分析。其中第四章分别对民国报纸中的概念、关系及内容分类进行阐述,并基于书目模型(BIBFRAME Model)设计了民国报纸本体模型,同时结合民国报纸中所包含的新闻事件,依据动词触发词进行新闻事件分类,构建了民国报纸事件模型。第五章是实例研究部分,以京剧艺术表演大师—梅兰芳为研究对象,根据其独有的艺术表征与事件特点,从新闻、广告、文学三个维度设计建设面向梅兰芳的民国报纸知识图谱,从而实现面向梅兰芳的民国报纸知识挖掘与应用。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码客栈网 ,原文地址:https://m.bishedaima.com/lunwen/48981.html