基于变分自编码器的混合推荐方法研究
这是一篇关于变分自编码器,不确定性,特征噪声,信息瓶颈,因果推理的论文, 主要内容为混合推荐系统旨在根据用户与产品的历史交互记录以及用户/产品特征信息为用户推荐感兴趣的新产品。由于变分自编码器模型(variational auto-encoder,VAE)在建模高维稀疏数据时具有独特的表示学习优势,其被广泛地应用于推荐系统领域处理用户侧或产品侧信息。然而,大部分现有推荐系统仅使用VAE模型作为提取用户/产品隐藏特征的工具,并未充分考虑用户交互与用户/产品特征信息各自具有的独特优势与不足,从而导致了推荐结果中存在一定的不确定性、噪声与偏差。针对上述问题,本文将VAE模型推广到混合推荐系统,使其作为一个整体且系统的变分推理框架优势互补地处理用户交互、用户属性与产品特征等多模态信息,从而在提升产品推荐准确度的同时增强模型的鲁棒性。总体来说,本文提出基于VAE的混合推荐系统旨在解决如下关键问题:从交互信息的角度来说,大量用户或产品的历史交互较为稀疏;在更新迭代较快的电商平台中,甚至经常出现没有任何历史交互信息的冷启动产品。因此,如何提升推荐系统对交互信息不足的用户或产品的推荐性能成为本文研究的首要问题。此外,在收集的用户历史交互数据中,如果存在同时影响产品曝光与用户交互的因素,即混淆因子,则其会在产品曝光与用户交互之间建立虚假的联系,从而造成模型对用户偏好的估计中存在系统性偏差。因此,如何从有偏的观测交互数据中无偏地估计用户偏好成为本文研究的另一大难题;从用户/产品特征的角度来说,由于现有特征工程的限制,提取的用户/产品特征中可能存在大量无法消除的个性化噪声。因此,如何在充分利用辅助特征信息降低推荐结果不确定性的同时,减轻特征噪声对模型的影响也成为本文将VAE推广至混合推荐系统的一大挑战。为了解决这些关键问题,本文从用户、产品与因果推理三个角度出发,通过设计新的隐空间结构、生成过程与推理算法等手段将VAE推广至混合推荐系统,从多角度提升其对交互不确定性、特征噪声与未观测混淆因子的鲁棒性。首先,从用户的角度而言,为了解决VAE模型在学习历史交互稀疏用户的隐藏表示时具有较大不确定性以及用户特征中含有大量噪声的问题,本文提出了一个基于变分带宽自编码器(variational bandwidth auto-encoder,VBAE)的推荐系统。该模型从信息论的角度出发,将用户交互与用户特征信息的融合过程建模为一个依赖用户的随机信道。该信道可以依照每一个用户历史交互信息的充分程度调整其带宽大小,从而能够动态地决定从含噪用户特征中允许融入的信息多少。为了实现该信道动态对交互-特征信息融合的调控能力,本文继而提出了一个量子力学启发策略从用户的历史交互中解缠交互信息的不确定性信息与承载用户偏好的语义信息,并将得到的交互不确定性度量作为计算信道带宽的依据。于是,在基于可变带宽信道的交互-特征信息融合机制下,VBAE既可以在交互信息不确定性较大时引入额外特征信息辅助推荐,又能在交互信息置信度较高的时候降低模型对于含噪用户特征的依赖,避免了模型的过拟合。其次,从产品的角度而言,针对面向用户的自编码推荐系统(user-oriented auto-encoder,UAE)因为舍弃建模产品隐变量而无法利用产品信息辅助推荐以及无法推荐冷启动产品的弊端,本文提出了一个基于变分耦合自编码器(mutuallyregularized dual collaborative VAE,MD-CVAE)的推荐模型。观察到UAE的最后一层权重与产品间存在一一对应关系,该模型首先使用有序堆叠的产品隐变量替代了UAE模型中随机初始化的网络权重,使其作为接口引入产品内容信息。接着,本文通过巧妙设计MD-CVAE的概率生成过程,以最小化UAE网络权重与对应产品内容隐变量均方误差的方式将MD-CVAE的产品内容模块与UAE模块紧密耦合在一起,使其在进行冷启动产品推荐时,UAE解码器中冷启动产品所对应的缺失权重可以由其内容隐变量来替代;最后,本文提出了一种针对用户隐变量的对称推理方法,其将MD-CVAE编码器作为解码器的转置,解决了存在新产品时UAE无法推理用户隐变量的问题,从而赋予了UAE模型推荐冷启动产品的能力。MD-CVAE是一个紧密耦合的推荐系统。其使得产品特征与用户交互互相促进,共同学习到更加以推荐为导向的用户/产品隐藏表示;并且,其对称结构也使其可以在不需要模型重训练的情况下直接推荐冷启动产品。最后,从因果的角度而言,针对未观测的混淆因子可能导致基于UAE的推荐模型根据历史交互建模用户偏好时存在偏差的问题,本文提出了一个基于深度因果自编码器(deep deconfounded recommender,Deep-Deconf)的推荐系统。该模型首先设计了一个具有分解Logistic似然的VAE模型从产品对于用户的共同曝光模式中推理得到可以使得不同产品对于同一用户曝光条件独立的隐混淆因子作为未观测真实混淆因子的替代。接着,本文证明在一定的条件下在推荐模型中控制该隐混淆因子可以消除由于真实混淆因子带来的混淆偏差。最后,本文证明了通过上述方法估计得到的用户偏好隐变量与交互预测值可能具有较大的方差,并证明在模型中引入用户特征作为额外的干预前变量加以控制可以大幅提升模型的采样效率。综上,Deep-Deconf模型以较小的方差实现了针对未观测混淆因子的无偏性,又具有较低的方差与较高的可解释性。因此,该模型可以在一定程度上解决未观测混淆因子对基于UAE的推荐模型造成的负面影响。在实验中,本文在多个真实推荐数据集上进行了详细的算法评价与分析(包括citeulike,movielens和Amazon数据集等),验证了本文提出三个将VAE模型推广到混合推荐系统的策略在降低模型不确定性、提升模型对特征噪声的鲁棒性、推荐冷启动产品与消除混淆因子造成的偏差等方面具有一定的优越性。
基于知识图谱的推理问答算法研究与设计
这是一篇关于多跳推理,因果推理,知识图谱,知识图谱问答的论文, 主要内容为传统面向知识图谱的问答主要集中于“如何从知识图谱中获取简单问题答案”的研究。这些研究虽然保证了问答的准确率,并被应用到各种问答系统中,但是存在着以下问题:1)难以回答具有复杂逻辑的问题,并且答案缺乏可解释性。2)无法回答在知识图谱中不存在的答案。针对以上两个问题,本文研究并设计了基于知识图谱的推理问答方法,主要包括以下两方面的研究内容。(1)基于知识图谱的多跳推理问答方法。该方法以“用户问题中蕴含多层逻辑关系”为研究前提,通过设计推理网络来克服传统知识图谱问答方法回答复杂逻辑问题准确率低且缺乏解释性的问题。该方法以知识图谱嵌入技术、EncoderDecoder框架、Attention机制为基础,构建了一个end-to-end的多跳推理网络模型。其中,end-to-end网络架构可以保证知识图谱中信息与问题的语义一致性;EncoderDecoder框架中,Encoder部分利用预训练语言模型和Attention机制生成可代表该问题中多层逻辑关系的语义向量,Decoder部分利用知识图谱嵌入技术得到的实体向量和多层逻辑语义向量生成问题所对应的关系路径;最后利用实体向量和语义向量对知识图谱中的实体评分,作为答案选择的依据。(2)基于知识图谱的因果推理问答方法。针对现有知识图谱问答方法不能为问题提供知识图谱中不存在的节点作为答案的现状,本文重点研究了“利用知识图谱中问题目标的相关信息来生成答案”的问题,提出一种流水线形式的知识图谱因果推理问答方法。该方法由问句分析模块、因果推理模块、答案预测模块组成。问句分析模块应用图神经网络和条件随机场等方法从问题中提取待求关系及目标实体,以此作为从知识图谱中抽取相关信息的依据;因果推理模块以知识图谱中的相关信息为基础估计每条信息的倾向分数和条件期望;答案预测模块利用每条信息的倾向分数和条件期望计算问题中待求关系的因果效应,并在目标实体的基础上预测问题的答案。通过在“多跳推理数据集”上进行实验,证明了基于知识图谱的多跳推理问答方法与其它相关算法VRN和KVMem相比,在正确率和解释性方面具有更好的效果;通过在“因果推理数据集”上进行实验,证明了基于知识图谱的因果推理问答方法的有效性,为知识图谱中不存在问题答案的情况提供了一种解决方法。
基于知识图谱和因果推理的医疗诊断模型
这是一篇关于知识图谱,实体识别,关系抽取,图神经网络,意图分析,因果推理的论文, 主要内容为随着信息技术的飞速发展,智能化医疗诊断模型在医疗领域发挥着越来越重要的作用,其通过对海量医疗数据进行分析处理来抽取数据中的医疗知识,帮助医疗人员快速了解病人信息以做出更加准确合理地医疗决策。智能化医疗诊断模型增加了医疗资源的利用率,使有限的医疗资源能够服务更多的人群,在一定程度上缓解了医疗不平衡问题,推动了医疗领域的发展。因此,利用人工智能技术对医疗数据进行分析应用,以实现医疗智能化,具有前瞻性的研究意义和高度的应用价值。知识图谱作为一个表示实体关系的语义网络,能够帮助医疗模型更加准确、快速地获取信息,有效地为医疗模型提供医学知识支撑并为其预测结果提供医学解释。因果推理可以根据知识图谱中的因果关系确定从疾病特征到疾病原因的因果路径,预测患者所患疾病种类并挖掘导致该疾病发生的因素,帮助医疗人员更准确地完成治疗方案的制定,提高医疗质量和效率。本文研究的主要目的是对医疗领域的数据进行深度挖掘,构建出一个更加有效、快捷、准确且有一定规模的医疗知识图谱。并基于知识图谱进行因果推理,实现疾病预测和病因溯源。本文主要工作内容包括以下三个方面:1、医疗知识图谱的构建:本文采用爬虫技术对国内流行的医疗知识网站进行数据爬取,对爬取到的文本医疗数据进行预处理,作为医疗知识图谱的数据来源。对于预处理后的非结构化医疗数据,本文使用基于Bi LSTM-CRF的实体识别模型对其进行医疗命名实体识别,并提出了基于依存关系和图神经网络的关系抽取模型来挖掘医疗实体间的关系,获得结构化的医疗关系三元组数据。利用py2neo工具连接Neo4j数据库,将结构化的医疗关系三元组数据导入Neo4j数据库中,生成可视化的医疗知识图谱。针对本文提出的关系抽取模型,我们在公开数据集上与三类关系抽取模型进行了对比实验,结果表明本文提出的关系抽取模型F1得分为86.2%,优于其他对比模型,验证了本文所提模型的有效性。2、用户意图分析:本文提出了基于Bert+Text GAT的用户意图识别模型,将用户问题视作文本数据,利用文本预训练模型Bert捕获文本的上下文信息,获取文本的词嵌入表示,利用词共现矩阵和句法依存分析挖掘文本的结构信息,通过图注意力网络的消息传递机制进行文本信息聚合,识别用户意图,帮助医疗诊断模型更好地理解患者的需求和症状。3、疾病预测和病因溯源:结合上述两项工作构建医疗诊断模型,首先,构建基于知识图谱和RCNN的疾病预测模型,根据用户意图和用户问句中包含的疾病症状信息,诊断出疾病症状对应的疾病,确定知识图谱中从症状实体到疾病实体的路径,然后利用因果关系进一步推理出疾病实体到原因实体的路径,确定“症状-疾病-原因”的因果路径,获取导致患者症状出现的原因,完成疾病预测和病因溯源任务。
视觉语言多模态融合方法研究与实现
这是一篇关于视觉语言对齐,强化学习,因果推理,自监督学习的论文, 主要内容为视觉语言导航是涉及视觉信息和语言信息的复杂多模态任务,导航智能体遵循语言指令引导,在视觉环境中移动,以到达指定目的地。视觉语言导航可以帮助机器人实现许多有价值的应用,如“室内家务”、“自动物流”及“消防救援”等。现有基于Transformer的视觉语言导航方法显著地提升可见环境的性能表现,但仍然存在不可见环境泛化表现不佳的问题。本文聚焦于提升导航智能体在不可见环境的泛化能力,对视觉语言导航方法展开研究,主要从策略网络架构和奖励设计机制两个角度对导航智能体模型进行改进,具体研究内容主要有以下几点:1.基于因果注意力的视觉语言对齐针对数据偏差误导模型学习虚假相关性、削弱泛化能力的问题,提出基于因果注意力的视觉语言对齐方法。该方法包括1)视觉语言对齐子网络。通过因果注意力Transformer单元,挖掘环境全景视觉和自然语言指令与导航动作之间的因果关系,推理符合因果效应的导航动作,提升模型的泛化能力。2)门控更新子网络。通过门控机制筛选关键时刻信息,为导航决策提供历史信息。该方法在公开数据集R2R和仿真平台Mattport3D上测试验证,与现有的基线模型相比,可见环境的准确率SR提升2.15%,不可见环境的准确率提升2.07%。2.基于自监督辅助任务的内在奖励生成针对视觉语言导航任务中环境反馈奖励模糊、无法为视觉语言对齐提供有效的监督信息的问题,提出基于自监督辅助任务的内在奖励生成方法。通过构造三种适用于Transformer为策略网络的自监督辅助任务,促进模型自发地归纳环境语义信息和导航决策机理,生成不依赖外部监督标签的内在奖励,为智能体提供额外训练信号,提升模型的学习速率和泛化能力。相较于现有基线模型,该方法在公开数据集R2R上可见环境和不可见环境的准确率SR分别提升5.58%和1.28%。3.室内视觉语言导航系统针对现实场景对于视觉语言导航的应用需求,设计系统总体架构和相关功能模块,结合Vue、Flask、Pymysql等开发框架,构建室内视觉语言导航系统。并调用本文提出的两种视觉语言导航方法实现导航功能。
基于知识图谱和因果推理的医疗诊断模型
这是一篇关于知识图谱,实体识别,关系抽取,图神经网络,意图分析,因果推理的论文, 主要内容为随着信息技术的飞速发展,智能化医疗诊断模型在医疗领域发挥着越来越重要的作用,其通过对海量医疗数据进行分析处理来抽取数据中的医疗知识,帮助医疗人员快速了解病人信息以做出更加准确合理地医疗决策。智能化医疗诊断模型增加了医疗资源的利用率,使有限的医疗资源能够服务更多的人群,在一定程度上缓解了医疗不平衡问题,推动了医疗领域的发展。因此,利用人工智能技术对医疗数据进行分析应用,以实现医疗智能化,具有前瞻性的研究意义和高度的应用价值。知识图谱作为一个表示实体关系的语义网络,能够帮助医疗模型更加准确、快速地获取信息,有效地为医疗模型提供医学知识支撑并为其预测结果提供医学解释。因果推理可以根据知识图谱中的因果关系确定从疾病特征到疾病原因的因果路径,预测患者所患疾病种类并挖掘导致该疾病发生的因素,帮助医疗人员更准确地完成治疗方案的制定,提高医疗质量和效率。本文研究的主要目的是对医疗领域的数据进行深度挖掘,构建出一个更加有效、快捷、准确且有一定规模的医疗知识图谱。并基于知识图谱进行因果推理,实现疾病预测和病因溯源。本文主要工作内容包括以下三个方面:1、医疗知识图谱的构建:本文采用爬虫技术对国内流行的医疗知识网站进行数据爬取,对爬取到的文本医疗数据进行预处理,作为医疗知识图谱的数据来源。对于预处理后的非结构化医疗数据,本文使用基于Bi LSTM-CRF的实体识别模型对其进行医疗命名实体识别,并提出了基于依存关系和图神经网络的关系抽取模型来挖掘医疗实体间的关系,获得结构化的医疗关系三元组数据。利用py2neo工具连接Neo4j数据库,将结构化的医疗关系三元组数据导入Neo4j数据库中,生成可视化的医疗知识图谱。针对本文提出的关系抽取模型,我们在公开数据集上与三类关系抽取模型进行了对比实验,结果表明本文提出的关系抽取模型F1得分为86.2%,优于其他对比模型,验证了本文所提模型的有效性。2、用户意图分析:本文提出了基于Bert+Text GAT的用户意图识别模型,将用户问题视作文本数据,利用文本预训练模型Bert捕获文本的上下文信息,获取文本的词嵌入表示,利用词共现矩阵和句法依存分析挖掘文本的结构信息,通过图注意力网络的消息传递机制进行文本信息聚合,识别用户意图,帮助医疗诊断模型更好地理解患者的需求和症状。3、疾病预测和病因溯源:结合上述两项工作构建医疗诊断模型,首先,构建基于知识图谱和RCNN的疾病预测模型,根据用户意图和用户问句中包含的疾病症状信息,诊断出疾病症状对应的疾病,确定知识图谱中从症状实体到疾病实体的路径,然后利用因果关系进一步推理出疾病实体到原因实体的路径,确定“症状-疾病-原因”的因果路径,获取导致患者症状出现的原因,完成疾病预测和病因溯源任务。
基于知识图谱和因果推理的医疗诊断模型
这是一篇关于知识图谱,实体识别,关系抽取,图神经网络,意图分析,因果推理的论文, 主要内容为随着信息技术的飞速发展,智能化医疗诊断模型在医疗领域发挥着越来越重要的作用,其通过对海量医疗数据进行分析处理来抽取数据中的医疗知识,帮助医疗人员快速了解病人信息以做出更加准确合理地医疗决策。智能化医疗诊断模型增加了医疗资源的利用率,使有限的医疗资源能够服务更多的人群,在一定程度上缓解了医疗不平衡问题,推动了医疗领域的发展。因此,利用人工智能技术对医疗数据进行分析应用,以实现医疗智能化,具有前瞻性的研究意义和高度的应用价值。知识图谱作为一个表示实体关系的语义网络,能够帮助医疗模型更加准确、快速地获取信息,有效地为医疗模型提供医学知识支撑并为其预测结果提供医学解释。因果推理可以根据知识图谱中的因果关系确定从疾病特征到疾病原因的因果路径,预测患者所患疾病种类并挖掘导致该疾病发生的因素,帮助医疗人员更准确地完成治疗方案的制定,提高医疗质量和效率。本文研究的主要目的是对医疗领域的数据进行深度挖掘,构建出一个更加有效、快捷、准确且有一定规模的医疗知识图谱。并基于知识图谱进行因果推理,实现疾病预测和病因溯源。本文主要工作内容包括以下三个方面:1、医疗知识图谱的构建:本文采用爬虫技术对国内流行的医疗知识网站进行数据爬取,对爬取到的文本医疗数据进行预处理,作为医疗知识图谱的数据来源。对于预处理后的非结构化医疗数据,本文使用基于Bi LSTM-CRF的实体识别模型对其进行医疗命名实体识别,并提出了基于依存关系和图神经网络的关系抽取模型来挖掘医疗实体间的关系,获得结构化的医疗关系三元组数据。利用py2neo工具连接Neo4j数据库,将结构化的医疗关系三元组数据导入Neo4j数据库中,生成可视化的医疗知识图谱。针对本文提出的关系抽取模型,我们在公开数据集上与三类关系抽取模型进行了对比实验,结果表明本文提出的关系抽取模型F1得分为86.2%,优于其他对比模型,验证了本文所提模型的有效性。2、用户意图分析:本文提出了基于Bert+Text GAT的用户意图识别模型,将用户问题视作文本数据,利用文本预训练模型Bert捕获文本的上下文信息,获取文本的词嵌入表示,利用词共现矩阵和句法依存分析挖掘文本的结构信息,通过图注意力网络的消息传递机制进行文本信息聚合,识别用户意图,帮助医疗诊断模型更好地理解患者的需求和症状。3、疾病预测和病因溯源:结合上述两项工作构建医疗诊断模型,首先,构建基于知识图谱和RCNN的疾病预测模型,根据用户意图和用户问句中包含的疾病症状信息,诊断出疾病症状对应的疾病,确定知识图谱中从症状实体到疾病实体的路径,然后利用因果关系进一步推理出疾病实体到原因实体的路径,确定“症状-疾病-原因”的因果路径,获取导致患者症状出现的原因,完成疾病预测和病因溯源任务。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码小屋 ,原文地址:https://m.bishedaima.com/lunwen/52628.html