基于领域本体“七步法”的中医辨证推理知识库构建方法研究
这是一篇关于Brat,领域本体“七步法”,中医辨证,知识表示,知识库的论文, 主要内容为本研究将中医学研究与信息技术进行紧密联系,依托国家重点计划课题“基于名老中医学术经验的辨证论治临床辅助决策系统”,运用本体技术、知识图谱、术语规范等相关技术与系统,以领域本体“七步法”为梳理中医辨证内容的方法,基本实现了中医辨证相关内容的知识抽取与表示。并运用Neo4j图数据管理系统对梳理的知识进行了储存与完善,基本实现了中医辨证知识图谱结构的呈现。辨证论治是中医学独具特色的临床思维模式,是中医临床诊疗疾病时应当遵循的原则。分而言之,辨证是论治的前提和基础,为之后的治疗提供方向,在收集完四诊信息后,辨证的精确程度决定了治疗疗效的好坏,可以说在中医诊疗中发挥着承上启下的作用。发展至今,中医辨证理论体系内容已经相当全面,但仍然面临着一些问题亟待解决,如中医辨证术语的不规范、中医辨证过程的不透明等。在过去几十年间,应用现代技术研究中医辨证取得了一定的突破与进展,构建了一系列中医专家系统、中医辨证模型等,但由于中医辨证术语的不规范、医案样本数据量不足、样本质量不高等问题,使得它们的临床实用性不高,因此高质量的知识数据库的建立是其关键环节。知识库是一种基于知识的高度结构化、具有推理规则的系统,其关键是知识的表示方法,决定了知识库的结构。基于本体的知识表示是近年的研究热点,而领域本体“七步法”是构建本体的方法,适用性广且成熟度高,尤其适用于医学领域,因此本研究以全国中医药行业高等教育“十二五”规划的《中医诊断学》第九版教材知识为数据来源,探索应用领域本体“七步法”指导构建中医辨证领域本体,进而构建中医辨证推理知识库。研究目的一、研究中医辨证推理的方法、过程、思维,以形成比较符合临床的辨证推理逻辑;探索基于领域本体“七步法”构建中医辨证推理知识库的方法。研究方法一、文献研究:通过阅读有关中医辨证思维与方法的相关文献,归纳总结比较合理且适用于临床的中医辨证推理过程。文献研究领域本体“七步法”相关理论与应用,以及知识库构建的相关研究,找出目前比较有优势的构建知识库的技术。二、逻辑研究:基于中医辨证论治理论的知识体系,用逻辑推理式描述中医辨证推理的过程,进行中医辨证推理过程的逻辑研究,运用逻辑推理式表示“症状→病”以及“症状→证”的推理过程。三、知识库构建方法研究:知识库构建过程主要有数据采集、数据处理以及数据储存与管理三个大的方面。以《中医诊断学》教材为数据源,应用领域本体“七步法”梳理中医辨证的理论知识,以本体表示法进行表示。运用Brat(brat rapid annotation tool,以下简称Brat)系统对原始数据进行标注来抽取实体,并在该系统中导入“中医主题词表”对数据进行规范化处理。将抽取的数据在Neo4j图数据库中进行储存、完善,形成小型的中医辨证知识图谱,即中医辨证推理知识库。研究结果本课题应用领域本体“七步法”梳理中医辨证知识后,定义了疾病、证、症状三个术语的概念、属性及其关系。以此为基础,在Brat中标注了 12899个实体数据,7286条关系。在Neo4j系统中创建了 2374个症状节点,139个证节点,139个疾病实体,1101个病机实体以及7286条关系。研究结论及意义中医辨证的逻辑推理式明确表示了从“症”到“病”以及从“病”到“证”的推理过程,在一定程度上改善了辨证不规范、不透明的问题。领域本体“七步法”用于指导构建中医辨证知识库是可行的,应用本体表示法可使辨证知识形成结构化表达,再以知识图谱的形式呈现,从而在加强知识关联程度的同时加快了搜索、问答速度,提高了中医辨证推理知识库的质量,可为中医辨证智能化发展提供数据支撑及方法学参考。
面向医药行业的知识库构建与知识发现
这是一篇关于网络爬虫,知识库,语义分析,知识检索的论文, 主要内容为随着Web 2.0的蓬勃发展,网络数据的容量呈爆炸式增长,人们被迅速淹没在数据的海洋里,这些数据不仅包含大量的结构化数据,还包含大量的半结构化和非结构化数据。数据的剧烈增加不仅带来了更多有用的信息,同时也增加了获取知识的难度。在医药领域,医药相关的信息也日益增多,通过构建医药知识库可以把看这似杂乱的数据统一规整并有效使用。同时,基于医药知识库进行知识检索,可以理解用户输入并精准地获取知识,大大增加用户的购药体验。如何高效的构建医药知识库并基于该知识库进行知识检索是本文研究的内容。本文提出了面向医药领域的知识库构建方法并实现了基于该医药领域知识库的知识检索。本文的主要工作包括以下两部分,一是构建面向医药行业的知识库,从垂直网站、百科类站点以及医药电商站点获取数据,经过数据清洗,采用基于规则与词典的方法进行命名实体识别,采用基于统计机器学习方法进行关系抽取,然后进行知识加工,最终构建一个医药领域知识库;二是基于医药领域知识库进行知识检索,首先基于HMM和CRF的方法完成对输入的语义分析,然后构建知识检索模型完成知识检索并展示应用情况。通过实验表明基于HMM和CRF的分词方法具有很高的准确率和召回率,通过应用情况展示分析表明知识检索有非常良好的效果。本文中构建的面向医药行业的知识库已经正式投入项目中使用,是智能医药系统的核心组成部分。本文提出的面向医药领域的构建和知识发现方法,可以很大程度上支撑智能医药服务,向用户提供更加有效并且人性化的服务,具有很广阔的应用前景。
基于结构数据的多模式智能问答消歧系统
这是一篇关于智能问答,多模,多媒体,知识库的论文, 主要内容为近些年,人们满足自身信息需求的方式发生了深刻变化。例如,移动设备如今无处不在。据报道,人们在移动端的搜索量已经超过了 PC端的搜索量。我们在本文中主要研究多种交互模式(多模)下的问题解答技术;利用这种技术,人们既可以提供自然语言的问句,又可提供图片。本文通过整数线性规划函数及定义多模约束来实现上述目的。实验结果表明,即使面对难度很大的模糊实体搜索,本文方法也可提供准确答案。当前智能问答技术的工作一般都基于文本展开。其中一类方法是将用户的自然语言问句,提取出能够表达主要含义的的一个或多个关键字,然后通过网页或文本的搜索引擎进行查找,如2001年Kwok和Etzioni等的Scaling question answering to the web工作。尽管基于关键字的方法现在被普遍使用,但学术界和工业界一直在寻求更准确、更高效的查询方式。此类工作最先进水平的智能问答系统,是通过模板将自然语言的问句过滤为符合模板的问句。另一类方法是试图通过知识库(Knowledge Bases)或知识图谱(Knowledge Graph)方式来解答问题。早期基于知识库的智能问答系统,如BASEBALL、SHRDLU和LUNAR,只能解决某特定领域内的问题。随着知识库的发展,智能问答技术逐渐从特定领域问答扩展到多领域,如早期的依托手动创建的知识库的Unix Consultant和LILOG系统。近年来,智能问答系统更多的依赖于关联数据网络(web of linked data),如 DBpedia、Freebase 和 Yago 等。IBM 的 Watson 项目将自然语言问句进行文本处理后,通过DBpedia和Yago进行逻辑推理得到答案。2012年,Watson机器人在著名智力竞赛节目"Jeopardy"战胜了人类。本文提出了使用自然语言处理和图像检索两种方式对用户提供的问句进行分析,在基于文本的智能问答技术上进行拓展,建立多模式问答系统。在用户提出自然语言问句的同时,我们还允许用户提供照片、手绘图等方式,表达其所想得到的答案的图像。然后,我们对文本和图像处理进行并行处理,处理的结果在Yago知识库上进行逻辑推理,通过线性优化的方式得到最优解。实验表明,使用文本和图像两种方式,能够使得用户表达的信息更为明确,更好的使机器理解用户的问句含义,对消除用户问句中实体的歧义,非常有效果。随着用户通过移动设备获取图像越来越便捷,我们扩展智能问答技术的输入也成为可能,用户使用移动设备可以很便捷的同时提供文本和图像进行查询,综合考虑自然语言和图像检索时可提升问题回答的准确率。另外,本文研究也有助于推广利用多种交互模式条件下的多媒体知识库。随着在线多媒体内容的爆发式增长和移动设备的高度普及,将来对多种交互模式(音频和视频)下的多媒体搜索领域的研究需求会不断增长。
基于知识图谱的领域知识库管理系统的设计与实现
这是一篇关于知识图谱,实体识别,实体关系提取,知识库,检索的论文, 主要内容为在互联网如此发达的时代,查询搜索已经成为人们获取知识最主要的途径。传统的搜索引擎大多基于关键词匹配,而在2012年,知识图谱的提出改变了传统的搜索引擎模式,搜索引擎可以智能化的“理解”用户输入的自然语言,并返回最相关的知识给用户。然而目前知识图谱技术基本都还是用于开放性领域的开放性知识,每个特定领域的知识库中的知识依然存在着知识间信息孤岛、知识间的联系没有建立,知识的管理维护不规范,知识的更新和组织困难等问题。因此,如何合理组织领域知识建立领域知识库,给相关领域用户提供高质量的服务成为目前急需解决的问题。针对以上问题,本文采用知识图谱的形式组织领域知识,提出了建立领域知识库的解决方案,并完成了相应的领域知识库管理系统的设计与实现。主要研究内容有:(1)知识图谱的构建。主要包括图谱中节点和边提取所对应的命名实体提取和实体关系抽取。(2)知识库管理系统的设计。包括系统的架构设计,功能模块设计,模块间的交互设计,数据存储结构和存储方式的设计等。(3)知识库管理系统的实现。主要包括知识存储,知识更新和查询检索等功能模块的实现。知识的存储模块综合采用了 Neo4j,Mysql和ElasticSearch等多种数据库。知识的更新模块通过收集用户查询日志并做聚类分析实现领域知识库的半自动化更新。知识的查询检索模块结合图检索和ElasticSearch开箱即用的全文检索功能进行实现。本系统提供了基于知识图谱建立领域知识库的一站式解决方案,实现了领域知识库基本的管理和维护功能,同时使知识库具备一定的智能型和灵活性。根据对上述内容的研究,本文选用适用于领域知识特点的相关工具和技术构建了基于知识图谱的领域知识库管理系统。解决了领域知识库中的信息孤岛的问题,建立了知识本体间的多样性关联,用知识图谱的形式组织和管理知识库中的知识。大大减少了领域专家维护管理知识库的重复劳动力,提高了领域用户获取领域知识的方便性和灵活性,验证了知识图谱相关技术对领域知识库的可用性。
大理州地方税务局税务知识网络培训系统的设计与实现
这是一篇关于网络培训,知识库,在线考试的论文, 主要内容为随着我国政府在管理理念的转变,税务部门在落实职能转变工作中一直走在前列。近年来地方税务局针对发展需要通过各种方式举行培训活动,切实提高干群队伍的服务能力与服务质量,积极践行群众路线,通过自身素质的提高与服务知识的丰富,为广大纳税人提供更好的服务。随着角色的不断转变,税务以及服务知识变得更加重要。地税部门每年也积极的采取各式各样的培训活动,以便让广大税务工作者提升综合素质。但是在培训活动中出现了很多问题,比如培训时间会和工作产生冲突、培训活动需要联系固定的地点与安排时间以及培训活动只能分批次进行等。这对服务质量要求较高的地方税务局来说非常不便。近几年我国信息技术发展很快,通过互联网能够提供更好的学习机会,能够实现更加自由随意的网络知识学习。因此在对大理州地方税务局的调研过程中发现,可以通过这种方式实现对工作人员的税务知识网络培训,借助网络软件平台的优势,为税务部门提供更加自由的学习时间和充分利用公务人员的碎片时间进行考试学习培训目标。该想法的提出得到了大理州地方税务局的认可,并作出了支持系统开发的决定。在大理州地方税局税务知识网络培训系统的设计与实现中,主要以当地税务部门的实际需要为出发点,力争为税务部门提供一个更好的知识学习平台,达到良好的培训目的。以此为目标,做了如下主要研究工作:首先,调研分析了大理州地方税务局当前的税务知识培训管理情况,对其中发现的问题听取了相关领导的意见,并结合目前国内外一些先进的知识培训系统的经验,提出了符合地方税务局实际需要的职工网络知识培训软件系统的开发思想,并进行了相关开发技术的调研分析和学习;其次,借助软件开发分析技术,可对系统设计相关的业务流程进行了分析,从而中出了系统研发需要具备的基本知识点网络培训功能,最终经过流程分析和整合,系统可以通过五个主要功能来进行设计和实现,并在介绍中给出了详细的业务流程分析图以及用例图等;再次,对象系统中的数据流进行了分析,这也有效指导了系统中的数据库设计,为数据库中表的设计做好了充分条件;再其次,对大理州地方税务局的税务知识网络培训系统按照既定的需求分析进行功能设计与数据库设计,在本文的第四章中给出了具体的介绍,其中通过图的形式给出了架构设计、功能模块设计以及数据库表设计等,并配示了一些设计图;最后,使用简单易懂的C#语言对功能进行了具体的实现,并对实现后的系统进行功能测试和性能测试,在功能测试的阶段,对测试用例全面的设计,争取将每一个模块都进行有效的测试,借助软件测试工具Load Runner执行测试脚本,并对测试结果进行记录和分析。该系统已经在几个试点税务局中运行使用,该系统的研发一改过去固定培训模式的方法,工作人员在纳税人对税务服务要求更高的服务过程中可以更加方便的学习税务知识,充分利用公务人员的碎片时间开展之时培训学习。总体来说效果较好,提升了服务质量,提高了政府的公信力。
基于知识库的港口企业计件工资系统研究与设计
这是一篇关于港口企业信息化,知识库,计件工资,规则库的论文, 主要内容为随着计算机技术的不断发展,企业信息化成了企业在竞争中处于不败地位的有效手段之一。而作为港口企业来说,自动化的生产业务管理系统不仅能够及时全面地提供信息和数据,简化管理部门人员和工人的工作,对不同的管理层次提出不同的报告,而且能根据过去的数据预测未来的情况。 本文从研究广州港集团计件工资系统的实际需求出发,提出了运用知识库的相关理论在整个港口生产业务系统J2EE体系架构的基础上,设计了以面向对象的知识库为核心,以关系型数据库作为最终的存储介质的计件工资规则库,使用对象/关系映射工具避免了两者之间的“阻抗不匹配”。从而构建了一个智能、高效、松散藕合和高度集成的港口企业计件工资系统来实现计件工资的智能计算。文中对课题中的核心技术(UML建模技术、Hibernate技术和其他J2EE轻量级架构技术)做了一些研究。 本文共分为六个章节,首先介绍了论文研究的背景与意义,计件工资研究现状及存在问题。 接着介绍了知识工程中对知识的若干研究以及知识库技术基础。 紧接着又介绍了广州港集团生产业务系统和计件工资子系统的功能需求,以及适宜此需求的基于J2EE架构的开发框架体系和系统实现的相关技术。 然后介绍了知识库的具体设计思路,从构件知识库的知识表示方法和知识库的持久化这两个基本问题入手阐述了知识库的实现思想,以及系统采用的对象/关系映射工具Hibernate。 最后介绍了计件工资系统的具体设计。先用UML技术对系统进行了详细的分析,并建立了系统用例模型,然后用Hibernate实现了作为系统核心的知识库,并介绍了Hibernate映射文件和配置文件的具体编写应用以及知识库表的设计,最后分析了其他部分技术在系统中的应用,并提出了系统测试的方案。
基于.NET平台的工程计算专家系统的研究
这是一篇关于专家系统,知识库,推理机,.NET框架,工程计算的论文, 主要内容为专家系统是当前人工智能应用中最成功的一个领域,它利用知识和经验,通过推理来解决某领域中只有人类专家才能解决的难题。 本文所研究的工程计算专家系统基于.NET平台构建,它不同于传统意义上的专家系统,主要的区别在于其系统知识库是由大量的计算公式构成,所以知识库的构建和知识表示的方法与其他的专家系统有很大的区别。并且由于国家相关规范和标准的变动造成相关公式经常的变动性,工程计算专家系统专门设计了推理机和解释执行器等部件,降低了系统各层次间的耦合度,实现了业务与规则的分离。 论文首先介绍了专家系统理论和.NET平台;然后介绍了专家系统中的知识库和推理机制的相关知识;最后提出了一个基于.NET的B/S设计模式体系结构,探讨了在.NET平台下工程计算专家系统的研究。该系统很好的实现了业务与规则分离、知识库与推理机分离,使得工程计算专家系统具有较高的可重用性和健壮性。
面向网络百科和知识图谱的实体链接算法研究与实现
这是一篇关于实体链接,知识库,元学习,图神经网络的论文, 主要内容为当今社会步入大数据时代,互联网上出现了海量的自然语言文本数据。自然语言文本数据中蕴含着大量的知识,但文本数据组织形式不固定,传统方法难以准确挖掘这些知识。知识库是以一定的表示方式组织、管理和使用知识的工具,其中存储了大量命名实体及相关知识,典型代表有网络百科和知识图谱等。自然语言文本中往往含有大量的专有名词,对理解语句起着关键作用,这些专有名词被称为实体提及。实体链接就是找到自然语言中的实体提及在知识库中的对应实体的过程。通过实体链接,自然语言中文本中的大量知识就能得到充分挖掘,进而语义搜索、智能问答等下游应用都能得到很好的支持。根据知识库类型的不同,实体链接任务可以分为面向网络百科的实体链接和面向知识图谱的实体链接。面向网络百科的实体链接是将自然语言文本中的实体提及链接到对应的网络百科实体上的过程。面向知识图谱的实体链接是将自然语言文本中的实体提及链接到对应的知识图谱实体上的过程。本文针对现有研究成果的不足,深入研究了两种不同的实体链接任务,并取得了以下研究成果:(1)在面向网络百科的实体链接任务中,现有方法忽略了训练语料中部分实体提及对应的样本过少的问题,导致这些方法准确率低。本文提出将实体链接任务按照实体提及不同分为大量子任务,进而提出一种基于元学习的面向网络百科的实体链接方法Meta-EL,利用元学习算法解决部分实体提及的少样本问题。在该方法中,为了解决部分子任务的类不平衡问题,本文提出了基于集合编码器的自适应系数机制,动态调整不同任务的训练过程。在多个真实数据集进行实验评估的结果表明,与现有工作相比,本文提出的面向网络百科的实体链接算法显著提高了准确性。(2)在面向知识图谱的实体链接任务中,现有工作没有考虑实体提及上下文的语义依存关系,也没有充分利用知识图谱中的结构化信息,导致这些方法准确率低。本文提出了结合语义依存分析和图注意力网络的面向知识图谱的实体链接算法DPGAT。针对实体提及语境中的语义依存关系,DPGAT算法利用语义依存分析算法构建语义依存图,进而使用图卷积网络对语义依存图进行编码。针对知识图谱中的结构化信息,DPGAT在知识图谱实体的表示学习中引入了注意力机制,根据对实体语义的重要性赋予知识图谱中的结构化信息相应的权重。在多个真实数据集上的实验结果表明,与现有工作相比,本文提出的DPGAT算法,显著提高了面向知识图谱的实体链接任务的准确性。
翻译知识库管理平台的设计与实现
这是一篇关于知识库,翻译管理,SSH框架,Activiti工作流,全文检索的论文, 主要内容为翻译工作是大连工程技术有限公司信息技术部的重要组成之一,随着翻译资料的不断积累和公司信息化建设的不断完善,如何高效的管理翻译工作和翻译资料,建立一个基于机械方面翻译资料的知识库,从而提高信息部门翻译的工作效率,提升服务意识,加强翻译资料的管理,形成公司内部员工学习参阅的知识库,加快知识和信息的流动,最终提高工程技术公司的自身管理水平,具有一定的现实意义。翻译知识库管理平台将工程技术公司翻译过程中的各个环节、相关人员、相关资源和相关任务进行科学化、规范化、流程化管理,在平台的协作下进行统一管理、协同调度,系统能对翻译中的各个环节和翻译后的资料进行有效的管理,提高企业管理水平和效率。系统采取Browser/server结构,在当今比较流行的SSH(Struts+Hibernate+Spring)框架的基础上,使用MVC设计模式、Oracle 11g数据库管理系统和Eclipse开发工具,应用了Activiti工作流,全文检索等关键技术,最终开发了翻译知识库管理平台。系统容错方面专业,人机交互强大,模块独立设计,因此本系统具有非常强大的可扩展性。本系统能够满足公司翻译工作过程中的业务需求,将翻译过程中的附件资料存储到知识库中并方便查询,翻译过程中产生的专业性词汇也可以存储到词典中并方便查询,绩效管理和成本管理快速准确的核算出部门绩效和各部成本,以上功能的实现帮助公司管理层更加高效的管理公司翻译工作,提高工作效率并加快翻译资料的流通和重复利用,翻译知识库管理平台投入使用后受到公司员工和管理层的广泛认可。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码项目助手 ,原文地址:https://m.bishedaima.com/lunwen/45383.html