粒计算及其在本体学习中应用的研究
这是一篇关于粒计算,本体,本体学习的论文, 主要内容为粒计算是信息处理的一种新的概念和计算范式,覆盖了所有有关粒度的理论、方法、技术和工具的研究。粒计算的内容包括两个主要的方面,一个是如何构建信息粒,另一个是如何利用粒运算求解问题 本体的提出减少或消除了领域概念及术语间的混乱,成为系统间通信、共享和互操作的基础,解决了知识共享和重用的问题。然而,本体建造是一个非常复杂的过程,它不但需要领域专家的参与,而且本体的手工构造耗时、费力、易出现倾向性错误和及时动态更新困难,于是人们提出了自动或半自动构建本体的方法——本体学习。 本文在详细分析研究了粒计基本理论与技术,本体概念、本体分类、研究本体的意义和本体学习的基础上,将粒计算方法应用于本体学习领域,提出了基于粒计算的本体学习的数学模型和在信息系统下基于粒计算实现本体学习的算法。其后,我们将这种方法应用于海军舰艇领域,半自动构建了海军舰艇领域本体。对舰艇学习所获本体,即概念及其关系集,我们采用JSP动态网页的形式表示,并借助图匹配技术完成有关海军舰艇领域概念的检索。 论文的最后部分分析了所给方案中的一些不足之处,并展望进一步研究的工作。
基于中文文本的领域本体学习研究
这是一篇关于本体学习,知识图谱,互联网文本,概念抽取,关系抽取的论文, 主要内容为本体作为语义网络的重要分支,在信息检索、问答系统等领域扮演着重要的角色。而本体构建作为本体应用的必要前提,目前本体构建方法主要分为两类,一类为依靠本体专家手工构建本体,另一类为根据统计学和语言学等理论自动或者半自动构建本体,即本体学习。由于手工构建本体缺乏足够的灵活性和客观性,因此本体学习逐渐成为当前本体构建研究的主流方法。但是传统的本体学习方法存在领域可移植性较差等问题,并且基于网络文本的本体学习研究相对较少。因此本文基于互联网中文文本进行本体学习研究,其中主要包括语料库的构建和本体概念、分类关系、非分类关系的抽取,提升了本体学习方法的可移植性和性能。本文的主要内容及成果如下:(1)提出一种自动构建本体学习语料库的方法。传统的本体学习方法通常是基于已有的标注语料库实现的,难以利用复杂的网络文本进行本体学习。本文首先基于知识图谱获取领域词典,进而构建得到对应领域的领域向量空间模型。然后基于TF*IWF*IWF算法将网络文本映射为领域空间向量,并计算得到该文本与对应领域的相关度。最后根据相关度对网络文本进行过滤与预处理,从而完成本体学习语料库的构建。(2)提出一种改进的D-TF-IDF算法,以优化本体概念的抽取过程。由于传统TF-IDF算法无法区分文本对相关领域的重要程度,因此改进后的D-TF-IDF算法将基于领域向量空间模型计算得到的领域文本相关度作为文本权重,以提升对领域相关文本的敏感度。同时通过设置TF阈值过滤掉文本特有但与对应领域无关的杂质词汇,以优化本体术语的抽取效果。最后通过K-Means聚类算法对本体术语进行相似聚类,并进行消歧处理,从而完成本体概念的抽取。(3)提出一种基于知识图谱的本体分类关系抽取方法。在基于语义词典的传统抽取方法中,传统语义词典通常存在领域可移植性和更新及时性较差的问题,因此首先基于知识图谱获取对应领域的分类关系模板。然后针对分类关系抽取方法效率较低的问题,结合Floyd算法提出一种剪枝算法,实现对分类关系模板的剪枝优化。最后结合本体概念完成对本体分类关系的抽取。(4)对关系标签的抽取方法进行改进,以优化本体非分类关系的抽取过程。针对传统关系标签抽取方法有效性较差的问题,首先使用通用构词规则模板对复杂关系标签进行分解。然后根据关系标签与对应领域的相关度,将关系标签分类为领域动词与通用动词,进而分别使用相应的统计方法进行抽取。最后结合基于关联规则抽取得到的概念对从而完成本体非分类关系的抽取。综合上述研究内容,本文设计了一种本体学习实验框架,并从本体自身和应用两个方面与相近方法进行了对比实验。实验结果表明,相较于对比方法,本文所提出的本体学习方法不仅能够基于互联网中文文本构建得到有效的领域本体,还能在一定程度上提升本体概念抽取的准确性与本体关系抽取的效率和有效性。
茶学领域本体自适应学习方法研究
这是一篇关于领域本体,茶学本体,本体学习,自适应学习的论文, 主要内容为本体学习(Ontology Learning)是自动或半自动构建本体的一系列方法和技术,它对本体建模具有积极的推动作用,主要体现在能够减少手工构建本体繁杂的人力消耗和提高本体构建质量等方面。然而,我们在开展农业领域本体建模与本体学习研究过程中,发现农业知识语料库里的信息是在持续增长并不断变化的,为使所建本体能够主动适应这种变化,开展农业领域本体自适应学习理论与方法的研究就显得尤为必要和重要。 本研究在已有成果的基础上,针对茶学领域本体学习的自适应问题,重点开展茶学领域本体自适应学习方法的研究,主要包括茶学领域概念的自适应提取方法、茶学领域概念间关系的自适应提取方法以及茶学领域本体自适应学习原型系统设计三个方面。论文研究的主要内容如下: 1、提出了茶学领域概念的自适应提取方法。构建贝叶斯网络,结合上下文依赖分析、互信息技术和领域度判断等算法,通过贝叶斯网络的逆向推理,实现茶学领域概念的自适应提取。 2、提出了茶学领域概念间关系的自适应提取方法。通过概念聚类和簇聚类的方法提取茶学领域概念间分类关系,使用贝叶斯网络逆向推理,实现茶学领域概念间分类关系的自适应提取。 3、开发了茶学领域本体自适应学习原型系统。在Eclipse平台上采用Servlet/JSP技术,开发一个茶学领域本体自适应学习原型系统,实验验证了文中所用理论与方法的正确性。 论文研究对于农业领域本体建模理论与方法的深入研究,大规模构建农业领域本体,进一步建立农业语义网络与知识网格,实现农业领域知识的充分共享和协同服务,具有一定的理论价值和实际意义。
面向公安人口领域的自然语言查询接口研究与实现
这是一篇关于自然语言查询接口,本体学习,中间语言,关联路径,公安人口数据的论文, 主要内容为随着各行各业的信息化程度的加深,数据库技术被广泛应用来存储和管理日益增长的业务数据。当前,公安部门的关系型数据库中积累了海量人口和公安数据,数据库中不仅单表存储的数据众多,而且表的数量大,表之间的关系也很复杂。此外,公安人员在处理日常业务中有着多种灵活的查询需求。对于非专业技术人员来说,在不熟悉数据库结构和SQL语句用法的情况下,使用结构化查询语言来从传统数据库系统中查询数据是极其困难的。因此,为公安用户提供一个专用的数据库自然语言查询接口,具有较大的实际应用价值。自然语言查询接口的目的是将用自然语言表达的查询自动转化为SQL语句,方便用户通过接口查询数据库中所需信息。然而,现有自然语言查询接口技术存在缺乏领域知识理解,难以生成涉及多表的复杂查询,以及难以处理自然语言中的语义模糊、同义省略等语法现象的问题。为了解决以上问题,本文提出了基于本体的自然语言查询接口。本文基于本体学习技术将公安人口数据库中的结构化数据半自动地转化为领域本体,然后结合领域本体对自然语言查询语句进行句法分析以生成中间语言,并提出基于BFS的关联路径算法以解决复杂SQL语句生成时的多表连接问题。本文的主要贡献和创新点如下:(1)基于本体学习技术将公安人口数据库中的结构化数据半自动地转化为领域本体,并结合《同义词词林》处理语义相似问题,对领域本体进行扩充。生成的领域本体与知识库较好地融合了领域知识,用于辅助转化。(2)结合领域本体的句法分析生成中间语言。首先通过Jieba分词工具对自然语言查询语句进行中文分词处理,结合领域本体和知识库生成对应的句型数组和句子对象数组。然后通过查询目标提取算法和查询条件提取算法来提取目标短语和条件短语。最后经规则匹配和句法分析提取查询目标和查询条件,生成数组形式的中间语言。(3)提出基于BFS的关联路径算法解决复杂查询中的多表连接问题,并基于斯坦纳树组合优化方案对路径寻找进行效率优化,然后将中间语言转化为完整的SQL语句。(4)设计并实现了面向公安人口领域的自然语言查询系统。该系统采用Vue.js和Flask框架开发,具有用户管理、数据库管理、词典管理、数据预处理、自然语言查询与展示、语音识别、全文检索等功能模块。在上海市公安人口数据集上的实验结果表明,本文提出的基于本体的自然语言查询接口在单表查询、多表查询、复杂查询语句上的准确率分别达到83.3%,、68.8%、51.9%,较好地满足了公安人口部门民警对人口数据库的日常查询需求。
基于中文文本的领域本体学习研究
这是一篇关于本体学习,知识图谱,互联网文本,概念抽取,关系抽取的论文, 主要内容为本体作为语义网络的重要分支,在信息检索、问答系统等领域扮演着重要的角色。而本体构建作为本体应用的必要前提,目前本体构建方法主要分为两类,一类为依靠本体专家手工构建本体,另一类为根据统计学和语言学等理论自动或者半自动构建本体,即本体学习。由于手工构建本体缺乏足够的灵活性和客观性,因此本体学习逐渐成为当前本体构建研究的主流方法。但是传统的本体学习方法存在领域可移植性较差等问题,并且基于网络文本的本体学习研究相对较少。因此本文基于互联网中文文本进行本体学习研究,其中主要包括语料库的构建和本体概念、分类关系、非分类关系的抽取,提升了本体学习方法的可移植性和性能。本文的主要内容及成果如下:(1)提出一种自动构建本体学习语料库的方法。传统的本体学习方法通常是基于已有的标注语料库实现的,难以利用复杂的网络文本进行本体学习。本文首先基于知识图谱获取领域词典,进而构建得到对应领域的领域向量空间模型。然后基于TF*IWF*IWF算法将网络文本映射为领域空间向量,并计算得到该文本与对应领域的相关度。最后根据相关度对网络文本进行过滤与预处理,从而完成本体学习语料库的构建。(2)提出一种改进的D-TF-IDF算法,以优化本体概念的抽取过程。由于传统TF-IDF算法无法区分文本对相关领域的重要程度,因此改进后的D-TF-IDF算法将基于领域向量空间模型计算得到的领域文本相关度作为文本权重,以提升对领域相关文本的敏感度。同时通过设置TF阈值过滤掉文本特有但与对应领域无关的杂质词汇,以优化本体术语的抽取效果。最后通过K-Means聚类算法对本体术语进行相似聚类,并进行消歧处理,从而完成本体概念的抽取。(3)提出一种基于知识图谱的本体分类关系抽取方法。在基于语义词典的传统抽取方法中,传统语义词典通常存在领域可移植性和更新及时性较差的问题,因此首先基于知识图谱获取对应领域的分类关系模板。然后针对分类关系抽取方法效率较低的问题,结合Floyd算法提出一种剪枝算法,实现对分类关系模板的剪枝优化。最后结合本体概念完成对本体分类关系的抽取。(4)对关系标签的抽取方法进行改进,以优化本体非分类关系的抽取过程。针对传统关系标签抽取方法有效性较差的问题,首先使用通用构词规则模板对复杂关系标签进行分解。然后根据关系标签与对应领域的相关度,将关系标签分类为领域动词与通用动词,进而分别使用相应的统计方法进行抽取。最后结合基于关联规则抽取得到的概念对从而完成本体非分类关系的抽取。综合上述研究内容,本文设计了一种本体学习实验框架,并从本体自身和应用两个方面与相近方法进行了对比实验。实验结果表明,相较于对比方法,本文所提出的本体学习方法不仅能够基于互联网中文文本构建得到有效的领域本体,还能在一定程度上提升本体概念抽取的准确性与本体关系抽取的效率和有效性。
基于中文文本的领域本体学习研究
这是一篇关于本体学习,知识图谱,互联网文本,概念抽取,关系抽取的论文, 主要内容为本体作为语义网络的重要分支,在信息检索、问答系统等领域扮演着重要的角色。而本体构建作为本体应用的必要前提,目前本体构建方法主要分为两类,一类为依靠本体专家手工构建本体,另一类为根据统计学和语言学等理论自动或者半自动构建本体,即本体学习。由于手工构建本体缺乏足够的灵活性和客观性,因此本体学习逐渐成为当前本体构建研究的主流方法。但是传统的本体学习方法存在领域可移植性较差等问题,并且基于网络文本的本体学习研究相对较少。因此本文基于互联网中文文本进行本体学习研究,其中主要包括语料库的构建和本体概念、分类关系、非分类关系的抽取,提升了本体学习方法的可移植性和性能。本文的主要内容及成果如下:(1)提出一种自动构建本体学习语料库的方法。传统的本体学习方法通常是基于已有的标注语料库实现的,难以利用复杂的网络文本进行本体学习。本文首先基于知识图谱获取领域词典,进而构建得到对应领域的领域向量空间模型。然后基于TF*IWF*IWF算法将网络文本映射为领域空间向量,并计算得到该文本与对应领域的相关度。最后根据相关度对网络文本进行过滤与预处理,从而完成本体学习语料库的构建。(2)提出一种改进的D-TF-IDF算法,以优化本体概念的抽取过程。由于传统TF-IDF算法无法区分文本对相关领域的重要程度,因此改进后的D-TF-IDF算法将基于领域向量空间模型计算得到的领域文本相关度作为文本权重,以提升对领域相关文本的敏感度。同时通过设置TF阈值过滤掉文本特有但与对应领域无关的杂质词汇,以优化本体术语的抽取效果。最后通过K-Means聚类算法对本体术语进行相似聚类,并进行消歧处理,从而完成本体概念的抽取。(3)提出一种基于知识图谱的本体分类关系抽取方法。在基于语义词典的传统抽取方法中,传统语义词典通常存在领域可移植性和更新及时性较差的问题,因此首先基于知识图谱获取对应领域的分类关系模板。然后针对分类关系抽取方法效率较低的问题,结合Floyd算法提出一种剪枝算法,实现对分类关系模板的剪枝优化。最后结合本体概念完成对本体分类关系的抽取。(4)对关系标签的抽取方法进行改进,以优化本体非分类关系的抽取过程。针对传统关系标签抽取方法有效性较差的问题,首先使用通用构词规则模板对复杂关系标签进行分解。然后根据关系标签与对应领域的相关度,将关系标签分类为领域动词与通用动词,进而分别使用相应的统计方法进行抽取。最后结合基于关联规则抽取得到的概念对从而完成本体非分类关系的抽取。综合上述研究内容,本文设计了一种本体学习实验框架,并从本体自身和应用两个方面与相近方法进行了对比实验。实验结果表明,相较于对比方法,本文所提出的本体学习方法不仅能够基于互联网中文文本构建得到有效的领域本体,还能在一定程度上提升本体概念抽取的准确性与本体关系抽取的效率和有效性。
基于混合方法的上下位关系提取和本体学习方法
这是一篇关于自然语言处理,知识图谱,本体学习,上下位关系,机器学习的论文, 主要内容为随着互联网的高速发展,越来越多的应用产生了大量的用户数据和文本。在这些数据和文本中往往可以获得非常有价值的信息或规律,从而进一步为社会和企业创造价值。通过知识图谱能够将海量的互联网数据进行进一步的组织和整合,一个优秀的知识图谱对于知识推荐、查询理解和个性化搜索非常重要。构建知识图谱的核心任务是知识提取。上下位关系,作为分类体系的基础组成部分,被用于描述两个概念之间的“is-a”的关系,这种关系在许多自然语言处理任务中发挥着关键作用,例如本体学习、知识库的自动构建或扩展,或词义歧义和归纳。事实上,这种关系可以作为建立更复杂的结构(如分类树)的基础,或者作为许多词语理解应用的有效背景知识,因此,一个有效的方法来获得上下位关系是非常重要的。许多学者和专家在这个领域取得了许多杰出的成果,其中比较出名的关系提取方法有模板匹配法和分布式模型法,然而模板匹配法虽然精度较高,但是覆盖率比较低,另一方面,分布式模型法虽然可以拥有较高的覆盖率,但是需要大量人工去构造数据集,在所需数据集数据量较大的情况下往往不切实际。为了解决上述问题,同时将上下位关系的提取及本体学习过程自动化,本篇论文提出了一种基于模板匹配和分布式模型的混合方法SHP-ML,该方法有效地克服了上述两种单一方法的缺点,并可以在给定“种子”概念的基础上进行自动地上下位关系提取并生成相关概念的分类树。为了便于用户使用,本文在提出的混合方法的基础上设计并实现了可视化的自动上下位关系提取系统。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码驿站 ,原文地址:https://m.bishedaima.com/lunwen/52566.html