基于多图数据融合的药物-药物相互作用关系预测研究
这是一篇关于药物-药物相互作用,多模态深度自编码器,重启随机游走,知识图谱,注意力机制的论文, 主要内容为药物联合治疗是克服耐药性和提高单药治疗疗效的一种极具前景的策略,并且已经被证实可以降低剂量相关的毒性。但除了药物间的协同反应外,还存在一些拮抗性的药物相互作用(DDIs),这是产生药物不良事件(ADEs)的主要原因。目前的大多数研究方法主要关注于二分类问题,即预测两种药物之间是否存在相互作用,多分类的问题少有涉及。准确预测DDIs的类型对于药物开发和药物组合疗法的有效应用都很重要。本文应用深度学习算法,结合药物特征信息,构建了两种不同的药物-药物相互作用预测模型。其主要工作如下:(1)目前提出的方法大多只基于药物的一种或者几种特征,而且没有考虑特征信息网络的拓扑关系。为了更有效地集成药物的多种特征,基于相似性假定提出了一种基于多模态数据融合的药物-药物相互作用预测方法NMDADNN。首先从Drug Bank数据集中收集药物相互作用事件和五种药物特征,利用Jaccard系数构建相似性网络。其次,采用带重启的随机游走算法捕获各相似性网络的拓扑信息,并计算正点互信息,以得到节点之间的拓扑相似性。然后,采用多模态深度自编码器(MDA)对五个药物相似性矩阵进行融合,以获得药物的统一特征描述。最后,使用DNN模型预测DDIs的类型。在Drug Bank数据集的5-CV测试中与其他两种基于DNN的方法DDIMDL和Deep DDI进行比较。NMDADNN的ACC、AUPR、AUC、F1 score、Precision和Recall指标分别比Deep DDI高6.1%、6.9%、0.3%、12.2%、14.7%和12.0%,比DDIMDL高1.3%、3.8%、0.05%、4.8%、2.8%和6.3%,取得了较好的预测效果。(2)相似性计算可能受到噪声或异常值的干扰,导致不准确的相似度计算。而知识图谱可以将来自不同数据源的信息进行融合,从而可以提高数据的准确性和完整性。在图领域,图注意力网络(GAT)等模型可以自动学习图结构的特征表示。为了更有效的提取药物的特征,提出了一种基于知识图谱和注意力机制的子图学习模型Fuse GAT。首先基于Drug Bank收集到的药物特征数据构建知识图谱,然后使用知识图谱方法Trans E对所有实体嵌入进行初始化操作,获得实体和关系的初始特征。对于给定的药物对,从知识图谱中选取一个与药物对相关的局部子图。然后,利用注意力机制和消息传递机制生成子图的特征。最后将子图和药物对特征集成起来,并使用解码分类器来预测药物对的类型。Fuse GAT在Drug Bank数据集上的F1 score、ACC、Cohen’s Kappa指标比其他对比的最佳模型增加了9.65%、2.4%、2.15%,可以有效的提高预测性能。
基于内容和学术网络的论文推荐算法研究
这是一篇关于论文推荐,论文内容,学术网络,引用强度,重启随机游走的论文, 主要内容为随着论文数量的快速增长,学术研究者面临信息过载的问题,论文推荐系统能够帮助学者从海量文献数据中寻找所需文献,目前将论文内容和网络结构结合起来进行混合推荐的方法成为新的研究趋势。然而现有的混合推荐方法大多只考虑了文本信息和引用关系,缺乏对学术实体信息的融合,并且没有对引用文献的重要性进行区分,这都不利于产生更有效的推荐结果。因此本文结合论文内容和学术网络,首先为学者找到与其历史兴趣内容相似的论文,然后利用五种学术实体构建异构学术网络,衡量论文间的引用强度为引文网络加权,通过网络结构为学者寻找更多可推荐论文。本文的主要研究工作如下:(1)提出了基于内容相似性的论文推荐算法。通过AMiner学术平台获取文献数据并对数据进行分析,选取摘要代表一篇论文的内容信息,对原始文献数据进行预处理,构建实验所用数据集。将处理后的摘要数据通过段落向量模型得到论文特征表示,根据学者历史兴趣得到学者特征表示。计算学者和论文间的余弦相似度并排序生成初步推荐列表,使用内容相似的论文扩充学者兴趣,建立学者-论文兴趣网络,为后续的研究工作提供基础。(2)提出了基于内容和学术网络的论文推荐算法。在学者-论文兴趣网络的基础上,加入论文间的引用关系以及论文作者、论文发表地,论文研究领域等学术实体,构建异构学术网络并对网络进行元路径分析。利用文献耦合及文献共被引相似度、学者兴趣相似度和论文标签相似度三个指标综合定义引用强度,并为引文网络加权。根据网络的关系矩阵计算得到转移概率矩阵,利用链路预测中的有偏重启随机游走算法计算候选论文对于目标学者的推荐分数,排序后生成推荐列表。在AMiner数据集上进行实验,实验结果表明,该算法在准确率、召回率和F1值等指标上都有着较好的表现。(3)基于提出的算法设计开发了一个Web版论文推荐系统,根据学者不同的兴趣需求,为学者主动提供个性化的文献推荐。学者可通过登录该系统获得每日论文推荐列表、搜索所需学术论文、了解领域内热门搜索词条、阅读论文的详细内容、对感兴趣的论文进行收藏、查看近期浏览和所有收藏过的论文,通过测试验证该系统具有一定的实用性。
面向混合文本的实体链接方法研究
这是一篇关于ERNIE,重启随机游走,实体链接,指称实体图,三段式实体消歧的论文, 主要内容为快速而有效地从海量互联网数据中获取有价值的信息,并利用这些信息扩充知识图谱已成为当前知识图谱构建过程中的热点问题。然而互联网数据不仅包含着结构松散、内容简单的短文本、而且包含规模庞大、内容复杂的长文本。针对包含长文本和短文本的混合文本,本文提出了一种面向混合文本的实体链接模型,并基于上述模型,设计实现了一个完整的实体链接系统。该模型由预训练、实体指称识别、候选实体生成、候选实体消歧、不可链对象处理五个模块构成。本文主要针对现有的实体链接方法做了以下几个方面的改进:(1)为了增强实体识别的准确率,本文提出了一种结合双向长短期记忆网络-条件随机场(Bi LSTM-CRF)和ERNIE预训练模型的实体识别算法,不但提升了Bi LSTMCRF模型语义表示能力,而且增强了ERNIE模型的特征学习能力。(2)针对当前实体链接算法无法兼顾混合文本中短文本和长文本的消歧效率,本文利用单实体消歧和多实体消歧的互补性,提出了一种融合单实体消歧与多实体消歧的三段式实体消歧方法。在单实体消歧阶段,引入双向变形编码器(BERT)改进了上下文相似度特征并融合多种消歧特征;在多实体消歧阶段,融合单实体消歧多种局部特征,并利用实体指称间的关联关系构建指称实体图,进而改进重启随机游走(RWR)算法,最后通过联合前两段的消歧结果,得到最终的实体消歧结果。(3)为了对三段式实体消歧方法的消歧结果进行过滤,利用不可链对象处理确定不可链对象和可链接的目标实体,进而完成最终的实体链接。本文通过与CRF、Bi LSTM-CRF、BERT+Bi LSTM-CRF算法的实验对比,证明了本文提出的ERNIE+Bi LSTM-CRF算法有更好的效果。候选实体消歧阶段分为单实体消歧的局部相似度特征选取实验、多实体消歧的基于图的算法对比实验以及联合消歧阶段实验三个实验,并在本文构建混合文本数据集上进行验证,表明本方法相较于传统的实体链接算法,在精确率、召回率以及F1上都有一定的提升。最终通过不可链阈值判定实验选定不可链阈值,进一提升了实体链接的效果。
基于多图数据融合的药物-药物相互作用关系预测研究
这是一篇关于药物-药物相互作用,多模态深度自编码器,重启随机游走,知识图谱,注意力机制的论文, 主要内容为药物联合治疗是克服耐药性和提高单药治疗疗效的一种极具前景的策略,并且已经被证实可以降低剂量相关的毒性。但除了药物间的协同反应外,还存在一些拮抗性的药物相互作用(DDIs),这是产生药物不良事件(ADEs)的主要原因。目前的大多数研究方法主要关注于二分类问题,即预测两种药物之间是否存在相互作用,多分类的问题少有涉及。准确预测DDIs的类型对于药物开发和药物组合疗法的有效应用都很重要。本文应用深度学习算法,结合药物特征信息,构建了两种不同的药物-药物相互作用预测模型。其主要工作如下:(1)目前提出的方法大多只基于药物的一种或者几种特征,而且没有考虑特征信息网络的拓扑关系。为了更有效地集成药物的多种特征,基于相似性假定提出了一种基于多模态数据融合的药物-药物相互作用预测方法NMDADNN。首先从Drug Bank数据集中收集药物相互作用事件和五种药物特征,利用Jaccard系数构建相似性网络。其次,采用带重启的随机游走算法捕获各相似性网络的拓扑信息,并计算正点互信息,以得到节点之间的拓扑相似性。然后,采用多模态深度自编码器(MDA)对五个药物相似性矩阵进行融合,以获得药物的统一特征描述。最后,使用DNN模型预测DDIs的类型。在Drug Bank数据集的5-CV测试中与其他两种基于DNN的方法DDIMDL和Deep DDI进行比较。NMDADNN的ACC、AUPR、AUC、F1 score、Precision和Recall指标分别比Deep DDI高6.1%、6.9%、0.3%、12.2%、14.7%和12.0%,比DDIMDL高1.3%、3.8%、0.05%、4.8%、2.8%和6.3%,取得了较好的预测效果。(2)相似性计算可能受到噪声或异常值的干扰,导致不准确的相似度计算。而知识图谱可以将来自不同数据源的信息进行融合,从而可以提高数据的准确性和完整性。在图领域,图注意力网络(GAT)等模型可以自动学习图结构的特征表示。为了更有效的提取药物的特征,提出了一种基于知识图谱和注意力机制的子图学习模型Fuse GAT。首先基于Drug Bank收集到的药物特征数据构建知识图谱,然后使用知识图谱方法Trans E对所有实体嵌入进行初始化操作,获得实体和关系的初始特征。对于给定的药物对,从知识图谱中选取一个与药物对相关的局部子图。然后,利用注意力机制和消息传递机制生成子图的特征。最后将子图和药物对特征集成起来,并使用解码分类器来预测药物对的类型。Fuse GAT在Drug Bank数据集上的F1 score、ACC、Cohen’s Kappa指标比其他对比的最佳模型增加了9.65%、2.4%、2.15%,可以有效的提高预测性能。
基于知识图谱随机游走和深度内容匹配的API组合推荐
这是一篇关于Mashup开发,API推荐,重启随机游走,深度学习的论文, 主要内容为随着信息社会的快速发展,单一功能的Web API己越来越无法应对复杂的业务需求,Mashup通过集成多种功能的API来满足业务需求,已经成为应对当前挑战的重要手段之一和推动API经济繁荣的重要驱动力。面向Mashup的API推荐研究旨在依据应用开发需求,有针对性地推荐API组合,从而为开发者提供技术支持,提升开发效率。近年来,WebAPI生态系统积累了大量可用于增强API推荐模型的知识,但目前在这方面的研究仍然有限。为了解决这个问题,本文提出了一种技术框架用于API推荐任务,该框架结合基于知识图谱的推荐策略和基于深度内容匹配两种算法模型。在知识图模型方面,本文设计了一个简洁的知识图模式来编码特定于API组合开发的上下文,并使用图形实体对开发需求进行建模,继而利用带重启的随机游走策略根据知识图评估开发需求与Web API之间的潜在相关性,此过程提出了特定于查询的加权策略来增强知识图的构建。在深度内容匹配模型上,通过Word2Vec和CNN对历史数据的文本描述信息进行向量表示和特征提取,加入多层感知机联合训练模型参数,然后进行特征匹配,根据匹配结果拟合真实使用的API记录。最后,本文将两种模型结合起来,实现了一个性能互补的API推荐模型。本文创新之处在于有效地将API的历史调用记录信息和文本描述信息相结合,将图模型与神经网络相结合,为API的推荐提供了一种全面且有效的解决方案。实验结果表明,本文提出的方法远胜一些最新的基线方法,也在减少计算开销和抑制API推荐中的负面马太效应方面取得了显著的效果。
基于多图数据融合的药物-药物相互作用关系预测研究
这是一篇关于药物-药物相互作用,多模态深度自编码器,重启随机游走,知识图谱,注意力机制的论文, 主要内容为药物联合治疗是克服耐药性和提高单药治疗疗效的一种极具前景的策略,并且已经被证实可以降低剂量相关的毒性。但除了药物间的协同反应外,还存在一些拮抗性的药物相互作用(DDIs),这是产生药物不良事件(ADEs)的主要原因。目前的大多数研究方法主要关注于二分类问题,即预测两种药物之间是否存在相互作用,多分类的问题少有涉及。准确预测DDIs的类型对于药物开发和药物组合疗法的有效应用都很重要。本文应用深度学习算法,结合药物特征信息,构建了两种不同的药物-药物相互作用预测模型。其主要工作如下:(1)目前提出的方法大多只基于药物的一种或者几种特征,而且没有考虑特征信息网络的拓扑关系。为了更有效地集成药物的多种特征,基于相似性假定提出了一种基于多模态数据融合的药物-药物相互作用预测方法NMDADNN。首先从Drug Bank数据集中收集药物相互作用事件和五种药物特征,利用Jaccard系数构建相似性网络。其次,采用带重启的随机游走算法捕获各相似性网络的拓扑信息,并计算正点互信息,以得到节点之间的拓扑相似性。然后,采用多模态深度自编码器(MDA)对五个药物相似性矩阵进行融合,以获得药物的统一特征描述。最后,使用DNN模型预测DDIs的类型。在Drug Bank数据集的5-CV测试中与其他两种基于DNN的方法DDIMDL和Deep DDI进行比较。NMDADNN的ACC、AUPR、AUC、F1 score、Precision和Recall指标分别比Deep DDI高6.1%、6.9%、0.3%、12.2%、14.7%和12.0%,比DDIMDL高1.3%、3.8%、0.05%、4.8%、2.8%和6.3%,取得了较好的预测效果。(2)相似性计算可能受到噪声或异常值的干扰,导致不准确的相似度计算。而知识图谱可以将来自不同数据源的信息进行融合,从而可以提高数据的准确性和完整性。在图领域,图注意力网络(GAT)等模型可以自动学习图结构的特征表示。为了更有效的提取药物的特征,提出了一种基于知识图谱和注意力机制的子图学习模型Fuse GAT。首先基于Drug Bank收集到的药物特征数据构建知识图谱,然后使用知识图谱方法Trans E对所有实体嵌入进行初始化操作,获得实体和关系的初始特征。对于给定的药物对,从知识图谱中选取一个与药物对相关的局部子图。然后,利用注意力机制和消息传递机制生成子图的特征。最后将子图和药物对特征集成起来,并使用解码分类器来预测药物对的类型。Fuse GAT在Drug Bank数据集上的F1 score、ACC、Cohen’s Kappa指标比其他对比的最佳模型增加了9.65%、2.4%、2.15%,可以有效的提高预测性能。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设助手 ,原文地址:https://m.bishedaima.com/lunwen/56312.html