基于在线医疗社区的多源糖尿病知识图谱构建与应用研究
这是一篇关于在线医疗社区,知识图谱,知识抽取,语义识别的论文, 主要内容为糖尿病作为一种终身性疾病目前已经成为威胁我国居民健康的重要因素,由于没有根治性手段,患者需要主动进行健康管理才能对疾病进行有效控制,因此如何有效提升糖尿病患者的健康知识水平是糖尿病防治工作的核心任务。随着互联网飞速发展,网络中积累了海量医学资源,通过知识图谱技术对这些数据加以整合归纳可以为患者提供丰富的医学及健康管理知识,帮助患者进行自我管理。然而目前国内医疗知识图谱的研究多集中于电子病历和医学文献上,并不能满足糖尿病患者对日常健康管理知识的需求。与此同时,在线医疗社区作为一种医疗领域的社交媒体近几年发展迅速,截至2021年12月用户规模已达2.98亿。在线医疗社区方便快捷的特点吸引了众多糖尿病患者线上咨询,使得平台积累了大量糖尿病问答文本。这些文本在蕴含糖尿病科普知识的同时还包含了海量的健康管理知识,对其进行知识抽取可以实现对电子病历和医学文献中医疗知识的补充,更好地满足患者对糖尿病健康知识的检索需求。因此本文提出构建一个以在线医疗社区糖尿病问答文本为基础数据,融合多个异构数据源的糖尿病知识图谱,并基于知识图谱进行语义识别研究帮助患者高效地查询糖尿病健康知识。在图谱构建与应用过程中,如何高效地从糖尿病问答文本中提取医学健康知识以及如何准确识别患者提问意图完成和图谱知识的匹配是难点所在。由于糖尿病问答文本是一种患者提问与医生答复相结合的非结构化数据,不规范性和专业性共存,传统知识抽取模型效果不佳,所以本文提出一种改进的实体关系抽取模型完成糖尿病知识的高效抽取。针对患者提问,为了更准确识别患者意图,本文提出一种多任务语义识别模型解析患者提问中的关键信息和意图倾向,为患者快速精确地检索图谱中的糖尿病知识提供技术支持。本文主要研究内容和贡献如下:(1)在多源糖尿病知识图谱构建过程中,为了解决由于问答文本口语化严重、错别字多以及关系类别不均衡导致实体关系抽取效果不佳的问题,提出一种基于语义增强和不均衡关系优化策略的实体关系联合抽取模型。模型在特征提取阶段采用双词集匹配方法引入词汇特征,与拼音特征和字符特征融合进行语义增强。在关系抽取阶段基于多头选择策略对损失函数进行优化,通过为易分关系添加弱化因子提高模型对难分类关系的关注度。实验结果表明本文提出的模型相比传统实体关系抽取模型效果更好,综合F1值有较大提升,可以有效提取糖尿病问答文本中的实体关系知识。(2)分析多个异构数据源的数据特点建立完备的数据模式层,通过知识抽取、实体对齐、知识存储等知识图谱构建流程成功构建了多源糖尿病知识图谱。图谱整合了多种概念及概念间的关系,可以为患者提供更加丰富的糖尿病医疗知识。(3)为了更准确地识别患者提问意图帮助患者检索图谱中的知识,提出一种改进的语义识别模型。该模型将语义识别任务划分为实体识别和意图识别,采用联合建模方法,在实体识别阶段引入语义增强策略提高实体识别效果,在意图识别阶段添加一种改进的辅助分类器提升两种任务之间的信息共享能力。实验结果表明改进的模型取得了最优的准确率和F1值,和基线模型相比性能有明显的改善,可以有效识别患者提问中的关键实体和意图倾向。最后结合知识图谱和语义识别模型进行语义检索平台原型设计,对图谱实际应用价值进行分析。
融合人格特征的推荐系统研究与实现
这是一篇关于人格识别,语义识别,概率矩阵分解,图神经网络的论文, 主要内容为人格是一种心理构造,可用于描述和解释人类的行为,是一种推荐系统领域内尚未被应用的非结构用户数据。人格作为人类心理特质的直接映射,可对人类偏好产生重要影响。近年来,互联网的海量数据给人们带来严重的信息过载问题,导致用户难以准确获取与其需求相符合的信息。推荐系统能够根据用户历史行为数据,分析其潜在偏好,为用户提供个性化推荐,成为缓解信息过载问题的有效手段。现有推荐系统主要是基于历史信息的推荐,以用户评分矩阵作为主要的用户偏好信息。用户评分矩阵通常较为稀疏,而推荐系统模型期望稠密输入,稀疏输入带来推荐准确性的下降,因此现有推荐算法普遍面临的评分矩阵稀疏,难以分析提取用户偏好的问题,也造成了实际推荐效果不佳。基于用户评论和其他隐式反馈信息的推荐算法在解决冷启动、推荐准确性以及可解释性等方面具有重要潜力。然而当前受到文本信息挖掘技术、用户潜在特征建模技术等方面的限制,基于评论信息分析的推荐算法进展并不明显。目前的研究广泛认为基于模型的推荐结果优于基于历史信息的推荐,特别是在稀疏数据上效果更好。但当前以模型为基础的协同过滤推荐系统存在仅对项目特征深入分析建模,未对用户特征进行分析建模的问题。没有用户特征,推荐结果无法匹配用户个性。用户特征模型的缺失,同时也导致了冷启动问题和数据稀疏问题,需要大量的用户数据和历史行为信息才能为用户推荐满意的项目。针对上述问题,提出两种融合人格特征提取的推荐算法。算法一融合人格特征的概率推荐模型,构建人格特征提取神经网络,从评论信息中获取人格特征进行用户建模,将人格这种非结构数据转换为结构数据。提出的Per-Bert MF概率模型依据用户人格得分和其他上下文信息计算得出最终预测评分矩阵;算法二融合人格特征的图神经网络模型,参照用户-项目关系对构建异质二部图结构,将用户及项目作为图节点。构建人格特征提取神经网络,从评论信息中获取人格特质进行用户建模,将用户及项目的人格得分作为节点信息存入图节点。提出基于图注意力机制的P-GAT图神经网络模型获取用户及项目节点的最终表示,使用向量内积获得推荐系统预测结果。通过人格模型的引入,解决推荐系统“用户-项目”模型面临的用户特征缺失问题,提取人格特征作为用户本质特征,为个性化推荐系统的改进提供了新的思路。
基于在线医疗社区的多源糖尿病知识图谱构建与应用研究
这是一篇关于在线医疗社区,知识图谱,知识抽取,语义识别的论文, 主要内容为糖尿病作为一种终身性疾病目前已经成为威胁我国居民健康的重要因素,由于没有根治性手段,患者需要主动进行健康管理才能对疾病进行有效控制,因此如何有效提升糖尿病患者的健康知识水平是糖尿病防治工作的核心任务。随着互联网飞速发展,网络中积累了海量医学资源,通过知识图谱技术对这些数据加以整合归纳可以为患者提供丰富的医学及健康管理知识,帮助患者进行自我管理。然而目前国内医疗知识图谱的研究多集中于电子病历和医学文献上,并不能满足糖尿病患者对日常健康管理知识的需求。与此同时,在线医疗社区作为一种医疗领域的社交媒体近几年发展迅速,截至2021年12月用户规模已达2.98亿。在线医疗社区方便快捷的特点吸引了众多糖尿病患者线上咨询,使得平台积累了大量糖尿病问答文本。这些文本在蕴含糖尿病科普知识的同时还包含了海量的健康管理知识,对其进行知识抽取可以实现对电子病历和医学文献中医疗知识的补充,更好地满足患者对糖尿病健康知识的检索需求。因此本文提出构建一个以在线医疗社区糖尿病问答文本为基础数据,融合多个异构数据源的糖尿病知识图谱,并基于知识图谱进行语义识别研究帮助患者高效地查询糖尿病健康知识。在图谱构建与应用过程中,如何高效地从糖尿病问答文本中提取医学健康知识以及如何准确识别患者提问意图完成和图谱知识的匹配是难点所在。由于糖尿病问答文本是一种患者提问与医生答复相结合的非结构化数据,不规范性和专业性共存,传统知识抽取模型效果不佳,所以本文提出一种改进的实体关系抽取模型完成糖尿病知识的高效抽取。针对患者提问,为了更准确识别患者意图,本文提出一种多任务语义识别模型解析患者提问中的关键信息和意图倾向,为患者快速精确地检索图谱中的糖尿病知识提供技术支持。本文主要研究内容和贡献如下:(1)在多源糖尿病知识图谱构建过程中,为了解决由于问答文本口语化严重、错别字多以及关系类别不均衡导致实体关系抽取效果不佳的问题,提出一种基于语义增强和不均衡关系优化策略的实体关系联合抽取模型。模型在特征提取阶段采用双词集匹配方法引入词汇特征,与拼音特征和字符特征融合进行语义增强。在关系抽取阶段基于多头选择策略对损失函数进行优化,通过为易分关系添加弱化因子提高模型对难分类关系的关注度。实验结果表明本文提出的模型相比传统实体关系抽取模型效果更好,综合F1值有较大提升,可以有效提取糖尿病问答文本中的实体关系知识。(2)分析多个异构数据源的数据特点建立完备的数据模式层,通过知识抽取、实体对齐、知识存储等知识图谱构建流程成功构建了多源糖尿病知识图谱。图谱整合了多种概念及概念间的关系,可以为患者提供更加丰富的糖尿病医疗知识。(3)为了更准确地识别患者提问意图帮助患者检索图谱中的知识,提出一种改进的语义识别模型。该模型将语义识别任务划分为实体识别和意图识别,采用联合建模方法,在实体识别阶段引入语义增强策略提高实体识别效果,在意图识别阶段添加一种改进的辅助分类器提升两种任务之间的信息共享能力。实验结果表明改进的模型取得了最优的准确率和F1值,和基线模型相比性能有明显的改善,可以有效识别患者提问中的关键实体和意图倾向。最后结合知识图谱和语义识别模型进行语义检索平台原型设计,对图谱实际应用价值进行分析。
基于知识图谱的多媒体网络舆情语义识别案例库构建
这是一篇关于知识图谱,网络舆情,语义识别,案例库的论文, 主要内容为网络媒体渐渐地替代传统媒体的存在,而成为了人民发表自己对社会事件看法和意见的主要场所。基于巨大的用户基数,社会事件在发生后,大量的网民推动话题的衍生以及传播,形成网络舆情,其传播过程之快,传播覆盖面积之广,都给网络舆情的监管带来了更高的要求。目前网络舆情研究面临的主要难题是如何解决舆情信息随着网络普及而越来越密集,越来越复杂的特点同时应对舆情信息更新速度快,载体多样化的现状,对舆情相关知识的表示和组织是当前情况下网络舆情研究和管理的迫切需求。在目前的网络舆情信息管理中,管理的体系构建还不完善,在对网络舆情进行处理时,缺乏有效的知识支撑,为决策提供知识参考。语义识别时网络舆情管理中重要的一环,基于网络舆情的语义识别,相关部门可以迅速的对舆情作出反应。本文提出构建基于知识图谱的多媒体网络舆情语义识别案例库,不仅仅对事件知识做出了知识的整理,而且提供了网络舆情的语义识别过程中所涉及的相关知识,为网络舆情的分析管理提供了知识服务,通过更加直接有效的手段为相关部门提供决策依据。本文提出了一种构建案例库的框架。对国内网络舆情的研究做分析,对国内外知识图谱以及知识库研究现状进行分析,对整体案例库构建流程的进行分析,针对该案例库的使用者进行用户的需求分析,对案例库的数据库模型进行设计,对发布信息的服务端进行构建,最终通过简单的实例验证了该框架的可行性和有效性。首先,笔者分析了现有国内网络舆情语义识别领域的研究和国内外目前对于知识图谱以及知识库的相关研究,根据现有文章的研究基础,找到本文的立足点。笔者发现国内对于网络舆情理论研究基础深厚,对舆情知识库的构建范围主要集中于突发事件领域,中心更多置于突发事件知识的管理,而对网络舆情语义识别相关知识并没有系统有效的组织。对于知识库的研究大多都从专家决策系统入手,而对于以语义网络为基础的知识图谱和知识库的构建研究相对较少。在此基础上,笔者提出了新的想法,融合知识图谱技术和情报学领域对网络舆情语义识别的研究,进行知识库的构建。其次,根据选题的背景,研究目的以及研究意义。笔者通过对整体案例库构建思路的梳理,构建流程的把握,明确了文章的工作。通过文章中对网络舆情组成要素以及语义识别流程分析,结合对案例库用户的需求,确立了案例库中的知识结构,通过对知识结构的分析,基于七步法构建了多媒体网络舆情语义识别案例本体,并且确立了数据映射和发布的服务端。最后,选取舆情信息,采集数据,完成知识图谱的构建以及基于知识图谱的案例库的实现,对框架的有效性进行了实证分析。
基于糖尿病知识图谱的语义识别模型设计与应用
这是一篇关于糖尿病知识图谱,语义识别,实体识别,多级别词特征,关系识别的论文, 主要内容为近几年随着中国经济的快速发展,人们越来越重视自身的健康情况,并且互联网的广泛普及也极大的促进了互联网医疗的发展,同时互联网也在多年的发展过程中,积累了大量的行业数据,包括医疗相关的科技论文、医院的医嘱、病例等数字化的医疗数据。众多相关的数据资源分布在不同的平台上,形成了数据孤岛,当人们搜索相关的资料时,需要自己去从不同的搜索结果中整理总结出相关的信息,这将会耗费人们很大的精力。而谷歌最早提出的服务于智能搜索的知识图谱技术,可以用于整合不同来源的异构数据。本文将利用知识图谱的相关技术,构建一个糖尿病相关的知识图谱,一方面希望能帮助科研工作者或医疗从业人员快捷方便的查询相关的知识,另一方面也希望能为糖尿病相关的各种智能服务提供数据支撑。本文的主要研究内容有以下几点:首先设计了糖尿病知识图谱的整体构建流程,该图谱一共包含15种实体类别和10种关系类别,并使用ArangoDB数据库进行图谱的存储,可以为各种智能服务提供了数据层面的支持。其次,在糖尿病知识图谱的构建过程中,针对实体识别任务,本文在常用的算法模型的基础上,引入了多级别的词向量特征。实验结果表明本文提出的多级别的词向量和字符向量相结合的方法,比之前基础模型的性能表现稍微有所提高。针对实体之间关系的识别,本文首先在两个基础模型上进行实验,并将多级别词向量的思想也融入模型之中,另外本文提出在关系识别过程中引入实体的类别信息。经过一系列的对比实验,最终显示实体的类别信息这一特征能明显的提高模型的准确率,其准确率的提升在6%-9%之间。其中实验得分最高的模型分别利用了文本信息的字符特征、多级别词特征、实体的位置特征以及实体的类别特征。最后,本文依据构建出的糖尿病知识图谱,提出了一个语义识别模型,此模型的任务有两个,识别用户搜索文本的意图和句子中的关键实体。基于这两个目的,分别阐述了级联语义识别模型和联合语义识别模型的思想与构建流程。级联语义识别模型首先需要进行实体的识别,采用的方法与知识图谱构建过程实体识别任务的算法相似,然后再进行意图的识别,该模型用于表明用户最终想搜索的中心话题是什么,最后将实体识别的结果和意图识别的结果进行知识的一致性检测。联合的语义识别模型是将上述两个任务合并在一个模型中进行,需要将实体识别的损失函数和意图识别的损失函数进行加权求和,从而去不断修正模型的参数,并且该联合模型使用N-best的思想,通过对实体识别的结果和意图识别的结果进行笛卡尔乘积运算,并对所有的笛卡尔乘积重新进行排序,将排序的结果作为模型最终的输出,保证了实体识别结果和意图识别结果的一致性。本文同时对于该语义识别模型在语义搜索中的两个应用场景进行了举例说明,并给出了结果展示。
基于在线医疗社区的多源糖尿病知识图谱构建与应用研究
这是一篇关于在线医疗社区,知识图谱,知识抽取,语义识别的论文, 主要内容为糖尿病作为一种终身性疾病目前已经成为威胁我国居民健康的重要因素,由于没有根治性手段,患者需要主动进行健康管理才能对疾病进行有效控制,因此如何有效提升糖尿病患者的健康知识水平是糖尿病防治工作的核心任务。随着互联网飞速发展,网络中积累了海量医学资源,通过知识图谱技术对这些数据加以整合归纳可以为患者提供丰富的医学及健康管理知识,帮助患者进行自我管理。然而目前国内医疗知识图谱的研究多集中于电子病历和医学文献上,并不能满足糖尿病患者对日常健康管理知识的需求。与此同时,在线医疗社区作为一种医疗领域的社交媒体近几年发展迅速,截至2021年12月用户规模已达2.98亿。在线医疗社区方便快捷的特点吸引了众多糖尿病患者线上咨询,使得平台积累了大量糖尿病问答文本。这些文本在蕴含糖尿病科普知识的同时还包含了海量的健康管理知识,对其进行知识抽取可以实现对电子病历和医学文献中医疗知识的补充,更好地满足患者对糖尿病健康知识的检索需求。因此本文提出构建一个以在线医疗社区糖尿病问答文本为基础数据,融合多个异构数据源的糖尿病知识图谱,并基于知识图谱进行语义识别研究帮助患者高效地查询糖尿病健康知识。在图谱构建与应用过程中,如何高效地从糖尿病问答文本中提取医学健康知识以及如何准确识别患者提问意图完成和图谱知识的匹配是难点所在。由于糖尿病问答文本是一种患者提问与医生答复相结合的非结构化数据,不规范性和专业性共存,传统知识抽取模型效果不佳,所以本文提出一种改进的实体关系抽取模型完成糖尿病知识的高效抽取。针对患者提问,为了更准确识别患者意图,本文提出一种多任务语义识别模型解析患者提问中的关键信息和意图倾向,为患者快速精确地检索图谱中的糖尿病知识提供技术支持。本文主要研究内容和贡献如下:(1)在多源糖尿病知识图谱构建过程中,为了解决由于问答文本口语化严重、错别字多以及关系类别不均衡导致实体关系抽取效果不佳的问题,提出一种基于语义增强和不均衡关系优化策略的实体关系联合抽取模型。模型在特征提取阶段采用双词集匹配方法引入词汇特征,与拼音特征和字符特征融合进行语义增强。在关系抽取阶段基于多头选择策略对损失函数进行优化,通过为易分关系添加弱化因子提高模型对难分类关系的关注度。实验结果表明本文提出的模型相比传统实体关系抽取模型效果更好,综合F1值有较大提升,可以有效提取糖尿病问答文本中的实体关系知识。(2)分析多个异构数据源的数据特点建立完备的数据模式层,通过知识抽取、实体对齐、知识存储等知识图谱构建流程成功构建了多源糖尿病知识图谱。图谱整合了多种概念及概念间的关系,可以为患者提供更加丰富的糖尿病医疗知识。(3)为了更准确地识别患者提问意图帮助患者检索图谱中的知识,提出一种改进的语义识别模型。该模型将语义识别任务划分为实体识别和意图识别,采用联合建模方法,在实体识别阶段引入语义增强策略提高实体识别效果,在意图识别阶段添加一种改进的辅助分类器提升两种任务之间的信息共享能力。实验结果表明改进的模型取得了最优的准确率和F1值,和基线模型相比性能有明显的改善,可以有效识别患者提问中的关键实体和意图倾向。最后结合知识图谱和语义识别模型进行语义检索平台原型设计,对图谱实际应用价值进行分析。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码项目助手 ,原文地址:https://m.bishedaima.com/lunwen/56138.html