基于LSTM的可解释视觉问答系统设计与实现
这是一篇关于可解释,视觉问答,自然语言处理,多模态,计算机视觉的论文, 主要内容为近年来,随着深度学习的飞速发展,视觉问答领域已经取得了重大进步。视觉问答作为计算机视觉与自然语言处理的交叉领域,其基本任务是观察图像并在此基础上回答文本问题。现有的方法大多是通过预训练的自上而下的注意力机制对图像特征进行表示,然后使用单层门控循环单元(GRU)对文本问题进行编码,最后联合这两种特征得到预测答案。目前,虽然视觉问答系统在准确率上体现出了强大的性能,但无法提供模型决策的过程以及理由,这使得很难诊断系统的决策是否准确。针对上述问题,本文提出了一种基于长短期记忆网络(Long Short-Term Memory,LSTM)的可解释视觉问答模型。该模型的核心为答案预测模块和文本解释生成模块,答案预测模块将图像特征与文本特征融合之后输入到非线性层中,接着使用线性映射来预测答案。文本解释生成模块使用融合语义的词频统计方法,从答案信息中提取主题词,结合LSTM生成文本解释,旨在为视觉问答任务预测答案的同时生成与人类语言一致的解释,从而更好地阅读和理解图像,提高系统的可信性。与传统视觉问答方法相比,本模型能够同时向用户提供模型的预测结果和解释结果,兼顾视觉问答任务答案预测的准确性和可解释性。本文在VQA-X数据集与VQA-E数据集上进行实验评估,实验结果表明,本文提出的基于LSTM的可解释视觉问答模型与目前主流的视觉问答模型相比,本模型在答案预测的准确率上有一定的提升。能够在视觉问答任务中生成高准确率答案的同时生成高质量的文本解释。同时,在本文所提出的基于LSTM的可解释视觉问答模型基础上,基于Python和Py QT相关技术,设计并实现了一种基于可解释的视觉问答系统。此系统可以为用户提供可解释的视觉问答任务,能够保证在生成高准确率的答案同时生成高质量的文本解释。本文对系统进行功能与性能测试,结果表明此系统各个功能模块均能得以实现,系统执行稳定,符合预期需求分析的结果。
脑脊液显微镜图像细胞分割与分类方法研究
这是一篇关于脑脊液,目标检测,可解释,细胞形态学,应用原型系统的论文, 主要内容为随着人工智能在学术领域的不断发展,人工智能应用于医疗影像处理的研究近年来愈发火热,并衍生出一系列应用于细胞分类、细胞检测、超声影像分割等领域的成果。脑脊液是在大脑的腔室和管腔以及脊髓的中央管中以及在大脑和脊髓的外部发现的透明液体,其内部包含20多种细胞,这些细胞的数量及形态反映了机体的健康状况。因此,对脑脊液进行细胞学检查是诊断脑膜炎、脑炎、梅毒等多类疾病的重要手段。然而,目前传统的脑脊液细胞学检测需要配有经验丰富的病理医师,进行大批量图像的分析,人力成本极高,采用人工智能代替传统的脑脊液细胞学检测不仅可以大大节省医疗资源,对协助临床诊断以及治疗具有重要意义和应用价值。在实际应用中,一方面各类细胞在脑脊液中分布严重不均,存在部分重要细胞数量极少;另一方面同一类别的细胞由于存在不同的子类别,往往表现为多种不同的形态。不仅如此,脑脊液中不同类别的细胞之间又存在视觉特征差异不明显的情况,这些都会严重干扰模型的识别性能。本文针对上述挑战,对脑脊液显微镜图像细胞分割与分类方法进行研究,提出了引入人工特征的脑脊液细胞检测分类模型,并在此基础上设计和实现了脑脊液细胞学AI分析系统。本文主要贡献如下:1)本文设计了脑脊液细胞特征提取模型,根据Faster R-CNN对脑脊液细胞检测过程中存在的问题,在医生的建议下采取了引入人工特征的方法,并实现了细胞特征提取算法和基于细胞分割的特征提取模型来获得所需要的人工特征。依据细胞形态学以及几何学的知识,本文主要提出了细胞核的粗糙度、凹凸度、长宽比、圆度、细胞面积、细胞核面积以及核质比七种人工特征,并对提取算法进行了设计和实现。相比传统人工特征提取的方式具有更好的解释性和更高的效率。2)根据获得的人工特征,本文提出了引入人工特征的Faster R-CNN细胞检测模型,通过使用人工特征和机器学习算法对模型的预测结果进行二次分类,达到了针对脑脊液数据集提升检测准确率的目的,并通过引入S-LIME模型实现对细胞检测模型结果的解释,获得分类结果的判断依据。3)从实际应用场景出发,本文对整个脑脊液细胞学分析平台的应用场景进行了设计,实现了基于Springboot+Mybatis+Vue的脑脊液细胞学AI分析系统。实现了基于模型的预测、分类结果解释、细胞计数、辅助标注、补充训练等功能,提供了从制成细胞涂片开始到获得分析结果的全流程服务,对提高医院的就诊效率,降低医疗成本有重要意义。
基于知识图谱的可解释推荐算法研究与实现
这是一篇关于推荐,知识图谱,可解释,强化学习,路径提取的论文, 主要内容为随着互联网的快速发展,信息呈现爆炸性的增长态势,海量的数据使用户难以从中获取有效的信息并加以利用,这种现象被称为信息过载。而个性化推荐系统是解决信息过载的有效方法之一。目前推荐系统凭借其能够根据用户的信息和物品的信息,为用户推荐其感兴趣内容的优点,已经被应用在各种Web应用中。大多数推荐系统采用协同过滤推荐算法进行推荐,然而这类算法具有可解释性较差的问题。由于知识图谱具有丰富的语义特征和较强的可解释性,因此一些研究者尝试在推荐算法中引入知识图谱来解决上述问题。然而目前基于知识图谱推荐的方法还面临两个问题:第一,基于知识图谱路径推荐的方法由于采用随机抽取路径的方式抽取路径,致使引入噪声过多;第二,基于知识图谱推荐的方法难以提取知识图谱之外的物品与物品之间的隐式关系特征。针对以上问题本文提出了一种基于知识图谱的可解释推荐算法。该算法首先构建适用于推荐领域的知识图谱,并利用强化学习对知识图谱中用户和物品之间的路径进行提取;然后使用提取的路径来捕获用户与物品之间的显式关系特征,并根据用户的历史行为记录来挖掘知识图谱范围之外的物品间的隐式关系特征;最后本文使用UCL(Uniform content label)对知识图谱进行了标引并设计和开发原型系统。具体如下:(1)为了能够提取知识图谱中用户和物品之间更适宜于推荐的路径,本文提出了一种基于强化学习的知识图谱路径提取方法(Path Extraction of knowledge graph based on Reinforcement Learning,PERL)。该方法使用状态和动作集作为Actor-Critic网络的输入,通过正向传输获得当前状态中每个动作的得分;同时为了加快模型的收敛速度,PERL在训练时融入了知识表示翻译任务和推荐任务的先验知识来构建多任务学习模型;最后为了能够从多角度挖掘用户的兴趣爱好,本文设计策略路径选择算法,提取用户和物品之间的多条路径。(2)针对现有基于知识图谱的推荐方法中不能有效捕获知识图谱以外的物品间的隐式关系特征的问题,本文提出了基于知识图谱的可解释性路径推荐方法(Explainable over Knowledge-aware Path Network for recommendation,EKPN)。该方法包含注意力知识路径感知模块(Attention Knowledge-aware Path Module,AKPM)和隐式特征提取模块(Implicit Feature Extraction Module,IFEM),AKPM使用PERL提取的用户与候选物品之间的路径来捕获知识图谱中物品之间的显式关系特征;IFEM是通过利用用户的历史行为记录来深层挖掘知识图谱外物品之间的隐式关系特征;最后,使用融合机制将显式关系特征与隐式关系特征进行融合,以增强推荐性能。(3)实现了基于知识图谱可解释推荐的原型系统,该原型系统能够向用户展示推荐结果和推荐原因,并且为了更好的规范和存储知识图谱,本文采用UCL标引知识图谱。本文在两个常用且真实的数据集上进行了对比实验和消融实验来验证本文所提出算法的有效性。对比实验证明了本文提出的PERL和EKPN方法相较于基线模型拥有较好的性能;消融实验证明了模型中各个模块的合理性,同时反映出PERL模型提取的用户和物品之间的路径能够很好的跟踪用户的兴趣走向;最后根据具体的案例分析,证明本文提出的方法的可解释性。
脑脊液显微镜图像细胞分割与分类方法研究
这是一篇关于脑脊液,目标检测,可解释,细胞形态学,应用原型系统的论文, 主要内容为随着人工智能在学术领域的不断发展,人工智能应用于医疗影像处理的研究近年来愈发火热,并衍生出一系列应用于细胞分类、细胞检测、超声影像分割等领域的成果。脑脊液是在大脑的腔室和管腔以及脊髓的中央管中以及在大脑和脊髓的外部发现的透明液体,其内部包含20多种细胞,这些细胞的数量及形态反映了机体的健康状况。因此,对脑脊液进行细胞学检查是诊断脑膜炎、脑炎、梅毒等多类疾病的重要手段。然而,目前传统的脑脊液细胞学检测需要配有经验丰富的病理医师,进行大批量图像的分析,人力成本极高,采用人工智能代替传统的脑脊液细胞学检测不仅可以大大节省医疗资源,对协助临床诊断以及治疗具有重要意义和应用价值。在实际应用中,一方面各类细胞在脑脊液中分布严重不均,存在部分重要细胞数量极少;另一方面同一类别的细胞由于存在不同的子类别,往往表现为多种不同的形态。不仅如此,脑脊液中不同类别的细胞之间又存在视觉特征差异不明显的情况,这些都会严重干扰模型的识别性能。本文针对上述挑战,对脑脊液显微镜图像细胞分割与分类方法进行研究,提出了引入人工特征的脑脊液细胞检测分类模型,并在此基础上设计和实现了脑脊液细胞学AI分析系统。本文主要贡献如下:1)本文设计了脑脊液细胞特征提取模型,根据Faster R-CNN对脑脊液细胞检测过程中存在的问题,在医生的建议下采取了引入人工特征的方法,并实现了细胞特征提取算法和基于细胞分割的特征提取模型来获得所需要的人工特征。依据细胞形态学以及几何学的知识,本文主要提出了细胞核的粗糙度、凹凸度、长宽比、圆度、细胞面积、细胞核面积以及核质比七种人工特征,并对提取算法进行了设计和实现。相比传统人工特征提取的方式具有更好的解释性和更高的效率。2)根据获得的人工特征,本文提出了引入人工特征的Faster R-CNN细胞检测模型,通过使用人工特征和机器学习算法对模型的预测结果进行二次分类,达到了针对脑脊液数据集提升检测准确率的目的,并通过引入S-LIME模型实现对细胞检测模型结果的解释,获得分类结果的判断依据。3)从实际应用场景出发,本文对整个脑脊液细胞学分析平台的应用场景进行了设计,实现了基于Springboot+Mybatis+Vue的脑脊液细胞学AI分析系统。实现了基于模型的预测、分类结果解释、细胞计数、辅助标注、补充训练等功能,提供了从制成细胞涂片开始到获得分析结果的全流程服务,对提高医院的就诊效率,降低医疗成本有重要意义。
迭代学习表示和规则的知识图谱推理方法
这是一篇关于知识图谱推理,表示学习,FOL规则,可解释,稀疏实体的论文, 主要内容为随着近年来互联网数据的海量增长以及人工智能的发展,知识图谱以强大的语义处理能力和数据互联能力为数据提供了一种新的表达、组织管理和挖掘方式。但是,构建数据嘈杂和信息抽取过程不确定,导致现有知识图谱通常存在缺失现象,因此推理知识图谱以补全具有重要研究意义。知识表示学习,作为知识图谱推理的常用手段,基于潜在特征,在计算效率上具有明显优势,但学习过程仅利用三元组信息,嵌入结果对样本数量和质量有一定依赖,稀疏实体和关系的嵌入质量相对较差。而推理的另一个手段,知识图谱规则学习,则利用图特征进行推理,预测结果准确、可解释,基于图的全局信息得到一般性的语义规律,缺点是挖掘规则的搜索空间较大。本文联合逻辑规则学习表示,提出一个迭代学习表示和规则的知识推理框架Rep&Rul-IL-KGRF,主要内容如下:(1)分析表示学习和规则学习优势互补的可能。一阶逻辑规则含有图结构信息,涵盖的全局一般性规律能够运用到局部的稀疏数据中,且基于规则的推理可解释性强,这些特点有解决表示学习上述问题的可能。知识的分布式向量表示具有计算高效的优势,这可能帮助减小规则的搜索空间。(2)为了增强知识表示的预测精度和可解释性,提出联合逻辑规则的表示学习模型RPEL,旨在利用带有全局归纳语义信息的逻辑规则,来提高稀疏实体和关系的嵌入质量。模型基于封闭路径式的一阶逻辑软规则,通过实例化规则来丰富稀疏数据的三元组样本,基于模糊逻辑t-norm来计算这些新三元组的软标签,除了直接邻居外,通过基于加法和乘法的逻辑规则关系运算来建模稀疏关系的多跳结构信息。(3)为深入研究表示学习和逻辑规则推理之间的交互,提出利用知识表示的规则学习方法EGRL,旨在利用嵌入高效计算的特点帮助挖掘规则。规定与RPEL模型相同的规则形式,将问题转为关系变量实例化问题。生成候选规则时,基于规则的头覆盖率和相似关系获得关系实例,兼容连通性和潜在特征,基于随机采样和遍历实例化关系变量,在搜索空间和高度可能规则覆盖率之间达到相对平衡。计算候选规则置信度时,在传统标准置信度的基础上,融合嵌入中的隐含语义,使评估规则存在率的置信度更有效。综上(2)和(3),得到迭代学习表示和规则的框架Rep&Rul-IL-KGRF,迭代中优势互补、不断更新嵌入和规则,适用于目前多数表示假设。链路预测和生成解释实验表明,随着逻辑规则的加入提高了知识表示的预测精度和可解释性,且提高预测的准确性在越稀疏的数据上帮助越大。规则评估实验证明嵌入对提升挖掘的效率和质量有一定影响。
基于LSTM的可解释视觉问答系统设计与实现
这是一篇关于可解释,视觉问答,自然语言处理,多模态,计算机视觉的论文, 主要内容为近年来,随着深度学习的飞速发展,视觉问答领域已经取得了重大进步。视觉问答作为计算机视觉与自然语言处理的交叉领域,其基本任务是观察图像并在此基础上回答文本问题。现有的方法大多是通过预训练的自上而下的注意力机制对图像特征进行表示,然后使用单层门控循环单元(GRU)对文本问题进行编码,最后联合这两种特征得到预测答案。目前,虽然视觉问答系统在准确率上体现出了强大的性能,但无法提供模型决策的过程以及理由,这使得很难诊断系统的决策是否准确。针对上述问题,本文提出了一种基于长短期记忆网络(Long Short-Term Memory,LSTM)的可解释视觉问答模型。该模型的核心为答案预测模块和文本解释生成模块,答案预测模块将图像特征与文本特征融合之后输入到非线性层中,接着使用线性映射来预测答案。文本解释生成模块使用融合语义的词频统计方法,从答案信息中提取主题词,结合LSTM生成文本解释,旨在为视觉问答任务预测答案的同时生成与人类语言一致的解释,从而更好地阅读和理解图像,提高系统的可信性。与传统视觉问答方法相比,本模型能够同时向用户提供模型的预测结果和解释结果,兼顾视觉问答任务答案预测的准确性和可解释性。本文在VQA-X数据集与VQA-E数据集上进行实验评估,实验结果表明,本文提出的基于LSTM的可解释视觉问答模型与目前主流的视觉问答模型相比,本模型在答案预测的准确率上有一定的提升。能够在视觉问答任务中生成高准确率答案的同时生成高质量的文本解释。同时,在本文所提出的基于LSTM的可解释视觉问答模型基础上,基于Python和Py QT相关技术,设计并实现了一种基于可解释的视觉问答系统。此系统可以为用户提供可解释的视觉问答任务,能够保证在生成高准确率的答案同时生成高质量的文本解释。本文对系统进行功能与性能测试,结果表明此系统各个功能模块均能得以实现,系统执行稳定,符合预期需求分析的结果。
基于反事实的虚假评论群组检测结果的解释方法
这是一篇关于虚假评论群组检测,黑盒模型,卷积神经网络,反事实,可解释的论文, 主要内容为随着互联网的不断发展,电商平台上出现了越来越多的虚假用户合谋攻击商品的现象,该现象在一定程度上影响了消费者的购买决策。近年来由于人工智能领域的不断发展,许多机器学习的模型陆续被提出,但其中大部分都是黑盒模型,人类难以理解其内部决策逻辑。为了检测虚假评论用户,国内外研究学者进行了大量的研究并取得了不错的检测结果。但此类检测方法结果仍缺乏清晰的解释。为了解决虚假评论群组的检测结果难以被理解的问题,本文对虚假评论群组检测结果的解释方法进行了深入研究。首先,针对用于评估群组虚假程度的人工指标均未与黑盒模型联系起来的问题,本文提出一种将人工指标和黑盒检测模型结合起来的可解释方法。该解释方法根据预处理的数据集和黑盒模型的先验结果,从人工指标的角度进行分析,通过控制变量法构造多个人工指标群组;构造四输入卷积神经网络,并使用黑盒模型得到的虚假群组对其进行训练;将真实群组和人工指标群组输入到训练好的四输入卷积神经网络中,得到人工指标对真实群组的影响并以此作为解释;通过三维空间可视化该解释结果。其次,为了减少人工指标对解释结果的主观影响,本文提出基于反事实搜索算法CFSA的解释方法。该解释方法根据黑盒模型检测得到的虚假评论群组,选择其中可疑度最强的群组作为研究对象;提取除研究对象以外的数据集中的产品、时间、评分分别得到产品集、时间集和评分集;提出反事实搜索算法CFSA,根据算法搜索研究对象的解释信息,并从上述三个集合中寻找替补数据,根据特征重要性寻找模型解释依据;从实例级、特征级和全局级三个维度解释黑盒模型的检测结果。最后,在Amazon数据集以及Yelp系列数据集上分别进行实验分析验证,并对本文中提出的黑盒模型解释方法进行评估,证实了该解释方法的有效性和合理性。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码客栈 ,原文地址:https://m.bishedaima.com/lunwen/50114.html