科技论文关键词语义表示方法对比研究
这是一篇关于科技论文,关键词分析,语义表示,共词分析,共词网络,表示学习的论文, 主要内容为关键词语义表示方法决定了科技文献关键词分析结果的可靠性,尽管目前在自然语言处理领域有很多对于词汇语义表示方法的研究,但在科技文献关键词分析场景下,目前尚缺乏研究系统性地评估关键词语义表示方法的优劣,以致于在科技文献分析研究实验中,相关工作人员并不清楚采用何种关键词语义表示方法更为合适,在面临诸多新兴方法时,也无法有效甄别选择合适的方法。在具体实践中,该如何选择关键词语义表示方法呢?为了标准、量化地对文献关键词语义表示方法的好坏进行对比,本研究将科技领域文献中最能表征文献主题的关键词作为基本分析对象;并将文献关键词聚类作为本研究中的任务场景,经过文献调研选择“数字图书馆”领域知识图谱作为标准评估数据集(“黄金标准”);对该领域中的文献关键词语义表示方法选择共词矩阵、共词网络、词表示学习、网络表示学习和图神经网络五大类基础方法下的23种变种方法(包括词表示学习下的“预训练-微调”模式、“语义+结构”拼接模式);利用加权后的Jaccard系数评估K-means聚类和层次聚类结果对于“黄金标准”的拟合指标。基于上述实验方案,本研究为了在多个领域上开展实验来体现本研究结果的普遍性,选择依次开展两种场景上“数字图书馆”领域下的科技文献关键词语义表示方法对比实验。经过两种任务场景下“数字图书馆”领域的两个实验,本研究得出的结论是:(1)从整体上看,仅仅利用计算机技术对文献关键词进行学科研究热点、主题结构分析等研究,得到的结论的可靠性根本与领域专家的预期结果还存在明显差距;(2)在特定情况下,词表示学习上的“预训练-微调”模式和“语义+结构”的拼接模式可取得更好的效果。具体而言:(1)在面向领域知识组织体系构建任务上,假如要想追求理想的聚类效果,宜优选K-means聚类方法而非层次聚类方法;并且从本文选择的五大类关键词语义表示方法及变种上看,共词矩阵、网络表示学习和图神经网络在文献关键词语义表示上的效果较差,而传统的共词网络和词表示学习效果相对较好。(2)在面向领域高频词分析的任务上,除“预训练-微调”的词表示学习方法与特定的“语义+结构”拼接模式可取得较好的效果外,使用其他方法得到的效果之间没有明显差距。最后,基于本研究中所得的量化评估结论,本文后续针对文献关键词分析任务给不同技术水平情报工作人员提出了几点建议。
基于共词分析的组织变革知识图谱研究
这是一篇关于组织变革,共词分析,知识图谱的论文, 主要内容为组织变革问题是近年来国内外理论界和实业界共同关注的一个热点问题。随着环境的快速变化和科技的不断进步,变革已经成为时代发展的必然要求和现代企业面临的战略抉择。作为组织发展的重要手段,组织变革对维持组织长期生存,促进组织健全发展,实现组织战略目标及保障组织的可持续发展具有重要意义。目前对组织变革的研究主要集中在组织变革的内容、组织变革的过程、组织变革的情境、组织变革的阻力和组织变革的目标等方面,研究范围更加广泛,研究领域更加细化。不同的组织变革范式,其研究方法、研究对象、指导思想等大相径庭,但是在组织变革研究过程中,如何使该领域走向规范化和系统化的问题很少有人涉及。因此,本文运用新的技术和方法,将组织变革领域的动态发展规律以可视化的图像直观地显示出来,形成全新的组织变革知识图谱,整合其逻辑与梳理其脉络,有助于推动该研究领域的发展和成熟。 科学知识图谱可以形象地展示科学知识的结构关系与发展进程,其理论基础是基于科学计量学引文分析,其技术方法是基于信息可视化技术;CiteSpace分析软件是绘制知识图谱和分析文献数据的最实用和最方便的一种工具,可以分析和识别相关研究领域的动态发展过程;高频关键词承载着相关知识领域的知识结构和热点主题。通过绘制分析组织变革领域高频关键词共词知识图谱,我们可以直观地看到当前组织变革领域的研究热点、研究前沿、主题结构和发展趋势。本文依据美国科学情报研究所建立的SSCI数据库,以选取的35种管理期刊为数据来源,利用词频分析、共词分析和聚类分析等方法和技术,借助CiteSpace信息可视化软件绘制出2000-2011年间高频关键词共词知识图谱,定性和定量地对组织变革知识领域进行了分析和研究。 首先,运用词频分析方法,探测组织变革领域的研究热点。从分析结果看,组织变革热点研究领域稳中有变,“组织绩效”、“组织变革”、“变革管理”、“变革模型”等研究领域一直处于核心地位,随着信息技术的发展和时代的进步“组织创新”、“战略变革”、“组织学习”、“人力资源管理”等成为研究者关注的重点,目前已经相当成熟并拓展了新的研究范围,如“变革路径”、“员工态度”、“工作表现”和“社会认同”等方面。其次,运用突发词探测法,辨识组织变革领域的研究前沿。从分析结果看,“组织转型”和“环境”的变动趋势最大,是组织变革的一个研究前沿,另外,随着对知识型员工的重视,“员工行为”、“员工心理”、“组织承诺”和“人力资源管理”的研究逐渐引起研究者的关注,成为新的研究前沿。第三,解读时区视图图谱,确定组织变革领域的主题结构。从分析结果看,关于组织绩效的研究是早期研究者关注的主题,之后随着时间的发展,“变革管理”、“变革模型”、“战略变革”、“组织学习”、“人力资源管理”等成为研究者关注的重点。而最近几年的研究主题则集中在“变革路径”、“员工态度”、“工作表现”、“社会认同”和“跨国组织”等方面。最后,运用聚类分析方法,预测组织变革领域的研究趋势。从分析结果看,关于组织绩效的研究一直是研究者关注的重点而且已经相当成熟,这方面的关键词有“组织变革”、“变革模型”、“组织愿景”、“组织创新”和“竞争优势”等;关于组织文化的研究需要加强研究力度;关于中层管理者的研究是较为新颖的研究领域,可以作为新的研究方向。 共词分析知识图谱,在一定程度上可以显示组织变革知识领域的研究热点和研究前沿,确定该领域的主题结构,预测该领域的研究趋势,明确该领域的研究现状,进而推进该领域的发展。但是,共词分析方法也存在不少值得思考之处。首先,共词分析中选词很重要,但是选词过程中存在着很大的主观因素;其次,某些类型的文献没有标引在数据库中以及数据处理过程中删除数据的主观性,导致分析得出的结果不能准确地反映出相关研究领域的真实全貌;最后,不同的检索策略,检索的结果有差异,统计分析得到的结果有所差异等。由于各种共词图谱分析可视化方法的特征和原理不同,在分析不同的数据样本时,其结果显示形式有所差异。因此,实际应用中要根据每种可视化的特征和原理并结合实际需要来选择可视化方法,客观真实地显示研究领域的动态发展变化和规律,促进研究领域的发展和成熟。
基于共词分析和社会网络分析的关联数据知识图谱构建
这是一篇关于知识结构,关联数据,共词分析,聚类分析,社会网络分析,中心度分析,K-核分析的论文, 主要内容为本文研究主要目的在于借助共词分析和社会网络分析方法探索关联数据领域的知识图谱。在该研究中,数据来源于Web of Science(WOS)核心数据集合,一共检索出946篇文献,关键词共计2332个,从中最终确定30个高频关键词,并以这30个高频关键词构建关键词共现矩阵。接着,基于该矩阵,本文采用共词分析法中的主成分分析,聚类分析法,相关系数相似性分析以及多维尺度分析方法,和社会网络分析法中的中心性以及K核分析对关联数据领域的研究状况进行了分析。首先,通过共词分析本文确定了关联数据中的主体聚类,并将它们概括分为物联网”,“实体链接”,“教育”,“语义网”“,”关联数据“,”数据网“,”Dbpedia“,”数据集成“和”本体”。而后,本文借助社交网络分析描述每个关键字如何连接网络,哪些人受到影响,以及他们与每个关键词的亲近程度。根据结果,这两种分析都可以更好地理解关联数据领域的主题相互关联。它还可以用于解析不同学科思想在在关联数据领域或相关学科中的分布状况。此外,本文还考察了每个关键词关系的流向,并将关系网络的结构可视化。简而言之,这项研究通过对不同年份发表的关联数据的相关论文的分析揭示了关联数据的发展状况,旨在了解关键词所揭示的关联数据的相关研究领域。
基于知识图谱的文献分析系统的设计与实现
这是一篇关于知识图谱,文献分析,社区发现,共词分析,PageRank算法的论文, 主要内容为在科学研究活动中,科研工作者应当对当前领域知识结构和发展情况有着全面且准确的把握,因此广泛阅读文献并对文献内容进行把握就成为了科研工作者的关键任务之一。同时,随着当今社会文化、教育、科学技术的飞速发展,记载其内容的文献数量呈现爆炸式增长,这为科研工作者对文献信息的获取增加了难度。随着文献信息发布的信息化,文献的大量获取变得相关便捷,但有关文献内容的分析依然大多依靠于人工分析。随着知识图谱概念的提出,其基于实体与关系的特性与文献网络相当契合。因此,设计出一种能够对文献进行自动获取,并基于知识图谱对文献内容进行自动分析的系统符合了当前科研工作中的迫切需求。本文以文献分析为研究对象,并以知识图谱作为基础研究理论,致力于实现了基于知识图谱的文献分析系统。从文献分析的角度出发,将传统文献分析理论与现代计算机技术进行结合,实现了对文献的自动获取与分析。本文重点研究了对文献知识图谱的建立与分析,一方面实现了对于引文知识图谱、作者知识图谱的节点抽取与知识图谱建立,另一方面提出了对文献分析的相关算法,如基于现代互联网排名的Page Rank算法设计了文献排名算法,基于社区发现算法设计了学术团体推理算法等。本文首先介绍了研究的背景、意义,并对目前国内外研究现状做了介绍与分析。然后对系统设计中所用到的相关技术进行了简要的介绍。之后基于系统典型业务场景,分析了系统的功能性需求和非功能需求;之后对系统设计与实现中所面临的关键技术问题进行了论述,从问题描述、问题解决方案、问题算法实现的步骤几个方面给出了关键问题的解决过程;然后,根据需求分析,对文献分析系统进行了总体设计,给出了系统的总体架构、系统模块划分及模块间的接口设计、系统重要功能流程的分析说明;之后在系统的详细设计与实现中,对各个模块中的类图及接口实现、系统流程实现进行了阐述,从而详细介绍系统的实现;最后,将设计完成的系统进行部署,依照需求分析对其进行测试并对测试结果进行分析,从而对系统进行验证,证明了文献分析系统的总体设计与实现是可行的、合理的。
干细胞移植治疗新生儿支气管肺发育不良研究现状的可视化分析
这是一篇关于支气管肺发育不良,干细胞,新生儿,知识图谱,共词分析的论文, 主要内容为目的:检索近10年来关于干细胞移植治疗新生儿支气管肺发育不良领域的文献并进行可视化分析,总结近10年来这一领域的研究热点及趋势,为未来的研究提示可能的方向。方法:以“stem cells”和“bronchopulmonary dysplasia”为主题词在PubMed、Embase、ScienceDirect及Web of Science数据库检索2009年1月1日至2019年1月1日期间发表的英文文献。运用Excel 2016进行关键词相关统计,并运用VOSviewer软件绘制知识图谱。结果:共纳入文献136篇,获得高频关键词38个,BPD、MSCs、Lung injury、Stem cells、Cell transplantation为主要研究热点,目前关于干细胞治疗新生儿支气管肺发育不良领域的研究主要集中于以下4个方面:细胞治疗、肺损伤及修复、间充质干细胞、动物实验。结论:通过干细胞移植治疗新生儿支气管肺发育不良进行可视化分析可以为这一领域的研究热点及未来的研究方向提供了参考。
科技论文关键词语义表示方法对比研究
这是一篇关于科技论文,关键词分析,语义表示,共词分析,共词网络,表示学习的论文, 主要内容为关键词语义表示方法决定了科技文献关键词分析结果的可靠性,尽管目前在自然语言处理领域有很多对于词汇语义表示方法的研究,但在科技文献关键词分析场景下,目前尚缺乏研究系统性地评估关键词语义表示方法的优劣,以致于在科技文献分析研究实验中,相关工作人员并不清楚采用何种关键词语义表示方法更为合适,在面临诸多新兴方法时,也无法有效甄别选择合适的方法。在具体实践中,该如何选择关键词语义表示方法呢?为了标准、量化地对文献关键词语义表示方法的好坏进行对比,本研究将科技领域文献中最能表征文献主题的关键词作为基本分析对象;并将文献关键词聚类作为本研究中的任务场景,经过文献调研选择“数字图书馆”领域知识图谱作为标准评估数据集(“黄金标准”);对该领域中的文献关键词语义表示方法选择共词矩阵、共词网络、词表示学习、网络表示学习和图神经网络五大类基础方法下的23种变种方法(包括词表示学习下的“预训练-微调”模式、“语义+结构”拼接模式);利用加权后的Jaccard系数评估K-means聚类和层次聚类结果对于“黄金标准”的拟合指标。基于上述实验方案,本研究为了在多个领域上开展实验来体现本研究结果的普遍性,选择依次开展两种场景上“数字图书馆”领域下的科技文献关键词语义表示方法对比实验。经过两种任务场景下“数字图书馆”领域的两个实验,本研究得出的结论是:(1)从整体上看,仅仅利用计算机技术对文献关键词进行学科研究热点、主题结构分析等研究,得到的结论的可靠性根本与领域专家的预期结果还存在明显差距;(2)在特定情况下,词表示学习上的“预训练-微调”模式和“语义+结构”的拼接模式可取得更好的效果。具体而言:(1)在面向领域知识组织体系构建任务上,假如要想追求理想的聚类效果,宜优选K-means聚类方法而非层次聚类方法;并且从本文选择的五大类关键词语义表示方法及变种上看,共词矩阵、网络表示学习和图神经网络在文献关键词语义表示上的效果较差,而传统的共词网络和词表示学习效果相对较好。(2)在面向领域高频词分析的任务上,除“预训练-微调”的词表示学习方法与特定的“语义+结构”拼接模式可取得较好的效果外,使用其他方法得到的效果之间没有明显差距。最后,基于本研究中所得的量化评估结论,本文后续针对文献关键词分析任务给不同技术水平情报工作人员提出了几点建议。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码港湾 ,原文地址:https://m.bishedaima.com/lunwen/48827.html