基于路径的知识图谱推荐技术研究
这是一篇关于知识图谱,推荐算法,元路径,循环神经网络的论文, 主要内容为推荐算法可以精准定位互联网应用中用户的偏好和商品。知识图谱(Knowledge Graph,KG)是以三元组为组织形式的、图结构的人类知识数据库,因为其结构良好、语义丰富的特性被广泛应用于推荐算法,例如电商网络、音乐播放器等。通过获取知识图谱中用户和商品的路径,推荐算法的可解释性得到了极大的增强。然而,现实世界中,知识图谱规模大、结构复杂,难以对指数级别的路径进行快速抽取和有效表示,降低了推荐算法的可信度。如何在高度复杂且超大规模的知识图谱中实现快速、准确、可解释的推荐,是知识图谱领域研究的热点之一。有鉴于此,提出了基于路径增强的循环网络(Pe RN,Path-enhanced Recurrent Network)用于知识图谱推荐,通过双向路径抽取算法,大幅降低了从知识图谱中获取路径的成本,并有效地提升了推荐模型整体的准确率和可解释性。Pe RN设计了一种高效的路径抽取策略,能够在元路径辅助的条件下从两端实体同时进行深度优先搜索并匹配,使得从大规模知识图谱中快速获取路径成为可能。并且,Pe RN分别采用基于双向长短期记忆网络的循环网络编码器和基于信息增益的熵编码器对路径本身和其元路径进行编码,实现了一个端到端的模型并保证了推荐算法的准确率和可解释性。为了验证提出方法的效率和可行性,采用了两种真实的知识图谱推荐数据集进行测试,分别是KKBox音乐数据集和IM-1M电影数据集。实验结果表明,相比于现有的方法Pe RN推荐速度提升至少两个数量级,准确率提升5%到10%,且推荐结果更具可解释性。
基于联合神经网络的会话型推荐方法研究
这是一篇关于会话型推荐,联合深度神经网络,图神经网络,循环神经网络的论文, 主要内容为随着互联网的信息爆炸式增长,推荐技术成为当前大数据时代下人工智能应用具有广泛前景的一个领域。通过分析用户喜好主动地向用户推荐信息或商品的方式,可以有效地缓解信息过载的问题,为用户提供优质的信息服务,也为商家带来更大的经济效益。会话型推荐,是一种根据用户在某一段时间内的交互点击行为对用户进行推荐的方法,近些年受到了越来越多的研究者的关注。因为会话本身具有序列结构,所以擅长处理序列信息的循环神经网络(Recurrent Neural Network,RNN)成为了会话型推荐系统的最常用的模型。然而,之前的研究往往只关注会话内的交互,对于可以帮助提升推荐效果的多元化信息缺乏合理的应用,比如反映个性化信息的用户历史行为信息、来自邻居的协同过滤信息等。为了合理利用多元化信息,我们提出两种用于会话型推荐系统的联合神经网络:(1)基于联合神经网络的会话型推荐模型。该模型利用擅长处理序列信息的循环神经网络处理会话内部的交互序列,利用擅长处理静态特征的卷积神经网络处理当前会话之前发生的同一用户的历史交互,得到较为准确的会话特征向量和用户长期偏好向量,并且分析了来自邻居会话的协同过滤信息,给出精准丰富的推荐。(2)基于联合图神经网络的会话型推荐模型。利用当前会话、历史会话以及邻居会话构造出用户行为图和邻居图,然后利用图神经网络分别对其进行处理,得到了当前会话的两种向量表示,并将其聚合送入到深度神经网络中,预测出用户对不同物品的喜好程度。在用户行为图的处理过程中我们考虑了交互发生的时间间隔,并设计了依据时间间隔确定交互之间相似度的方法。我们在公开的推荐系统数据集上设计了一系列实验来验证我们模型的有效性。实验结果表明,我们设计的联合神经网络模型和联合图神经网络模型在两个推荐系统常用评价指标上显著优于现有的会话型推荐模型。并且,我们还对模型中不同的模块进行了分析,证明我们对不同信息的考虑和利用都是有效果的。
基于深度学习的音乐音频分类研究
这是一篇关于音乐分类,深度学习,卷积神经网络,循环神经网络,注意力机制的论文, 主要内容为音乐音频分类技术能够基于音乐内容为音乐添加类别标签,在音乐资源的高效组织、检索和推荐等相关方面的研究和应用具有重要意义。传统的音乐分类方法大量使用了人工设计的声学特征,特征的设计需要音乐领域的知识,不同分类任务的特征往往并不通用。深度学习的出现给更好地解决音乐分类问题提供了新的思路,现有的基于深度学习的音乐音频分类方法在音乐数据处理、模型设计等方面还存在着不足,本文对基于深度学习的音乐音频分类方法进行了深入研究,主要工作内容如下:将音乐的音频信号转换成声谱作为统一表示,避免了手工选取特征存在的问题。音乐的标注工作难度较大,有限的标注数据不利于深度学习模型的训练,对此本文结合音乐信号的特点采用了多种音乐数据增强方法对音乐数据进行增强。基于深度学习的音乐音频分类方法通常使用卷积进行声谱特征的提取,大多已有研究并没有很好地针对声谱的特点进行卷积结构的有效设计。对此本文根据声谱的特点,将一维卷积、门控机制、残差连接与注意力机制相结合,提出了一种基于卷积神经网络的音乐分类模型,该模型能够提取到与音乐类别更相关的声谱特征。模型在GTZAN音乐流派数据集上的准确率达到了91.8%,验证了方法的有效性。单纯基于卷积神经网络的音乐分类方法忽略了音频本身的时序特性。对此本文将提出的卷积结构与双向循环神经网络相结合,提出了一种基于卷积循环神经网络的音乐分类模型,并使用注意力机制为不同时刻循环神经网络的输出分配不同的注意力权重,从而得到更好的音乐整体特征表示。模型在GTZAN数据集上的分类准确率提升至92.2%,同时在多标签标注数据集Magna Tag ATune上的AUC达到了0.9122,超过了其他对比方法,并对不同音乐标签的标注情况进行了分析。本方法对音乐流派的大部分标签具有良好的标注能力,在乐器、唱法与情绪类别的部分标签上也有不错的表现。最后,本文根据上述提出的音乐分类方法设计与实现了一个基于音频的音乐标签标注系统,实现了对音乐流派、情感与场景类音乐标签的标注,为构建音乐领域知识图谱提供了数据支持。
基于用户长短期偏好的个性化音乐推荐算法研究
这是一篇关于推荐系统,循环神经网络,注意力模型的论文, 主要内容为音乐是人们生活中的重要娱乐方式,但在海量的音乐中,找到喜欢的歌曲已经成为了一种挑战。因此,音乐推荐已经成为现代音乐流媒体平台服务中的重要部分,能够减少用户的选择时间,提升用户体验,增加商业利益。本文研究推荐系统中的音乐推荐问题,即分析用户的兴趣,向用户推荐个性化的音乐列表。针对这一问题,本文做出了如下的研究工作:(1)本文提出了一个数据驱动的两段式音乐推荐框架,旨在为用户推荐合适的音乐列表。在第一阶段:(1)基于用户喜欢的音乐列表,使用矩阵分解获取用户对音乐的长期偏好;(2)基于歌曲的音乐上下文,使用段落向量等方法获得歌曲的音乐特征。在第二阶段,将用户对音乐的长期偏好、用户的历史播放记录中的歌曲的特征作为循环神经网络的输入,抓取用户对音乐的短期偏好,输出用户喜欢每一首歌的概率,并由此生成一个Top-k的音乐列表推荐。在该阶段,本文提出了两种基于注意力机制的长短期记忆网络模型,能够有效的抓取并结合用户对音乐的长短期偏好,提高推荐准确度,生成合适的音乐列表。(2)本文在数据驱动的两段式音乐推荐框架的基础上,提出一种基于用户长短期偏好的音乐列表推荐框架。其中,优化了用户长期偏好的提取过程,并提出了两种基于注意力机制的双向长短期记忆网络模型,利用用户喜欢的音乐列表抓取用户对音乐的长期偏好。该方法能够有效的规避矩阵中的稀疏性问题,并提高推荐准确度。(3)本文在真实的数据集上进行了实验,通过实验分析了关键参数对实验算法的推荐性能产生的影响,并与已有的经典音乐推荐系统方案进行对比,证明了本文提出的音乐列表推荐算法的有效性。
基于深度学习的禾本科植物孤儿基因识别方法研究
这是一篇关于孤儿基因,深度学习,循环神经网络,Transformer,CNN-Transformer的论文, 主要内容为孤儿基因又被称为谱系特有基因,是指在一个谱系中特有并且与其他谱系所有基因没有序列相似性的基因。孤儿基因在许多植物的环境适应性方面起着重要作用,对孤儿基因的识别是了解其生物学功能的关键一步。传统的生物学方法识别物种中的孤儿基因需要耗费大量的时间、物力和人力,同时容易受到计算方法的影响。因此,开发一种高效、高精度的孤儿基因识别计算方法具有重要意义。针对二分类任务,大多数传统机器学习模型的性能依赖于特征的质量,这往往要求研究人员有丰富的领域知识,同时人工构建的特征向量会丢失蛋白质序列中的原始信息。近些年来,在生物信息学领域,深度学习因为学习能力强、覆盖范围广、可移植性好等优势而被广泛应用。本研究旨在用深度学习模型从禾本科植物蛋白质序列中提取高阶特征,用以解决禾本科植物孤儿基因识别的问题。本文主要研究内容包括以下几个方面:1)基于传统生物学方法识别物种中孤儿基因所存在的问题,提出了基于循环神经网络和Transformer模型的禾本科植物孤儿基因识别方法。循环神经网络通过其独特的模型结构能够计算序列中各个观测值之间的相互信息。Transformer模型利用多头自注意力机制能够更好地处理蛋白质序列以及汇总序列中的依赖关系信息。通过对比不同模型在验证集和独立测试集上的性能发现Transformer模型的性能要优于循环神经网络模型,该结果显示了Transformer模型提取的特征要比循环神经网络模型提取的特征更加能够分辨出孤儿基因。2)由于Transformer中多头自注意力机制计算的复杂性,导致模型在处理长序列时效率低下。基于此问题提出了CNN-Transformer模型用于处理禾本科植物孤儿基因识别问题,该模型由两个多核一维卷积层和一个Transformer层构成。相较于Transformer模型,CNN-Transformer中的一维卷积层能够提取蛋白质序列中的k-mers特征从而减少蛋白质序列的长度,Transformer层能够捕获kmers特征与特征之间的相互关系。由实验结果可知,CNN-Transformer在三个独立测试集上的平衡准确率BA值都是最高的,分别达到了0.901、0.906和0.880。针对同样的测试集,RNN,LSTM、GRU和Transformer模型的BA、GM、BM和MCC值均低于CNN-Transformer模型。以上结果可知CNN-Transformer的模型结构能够有效的解决Transformer模型所存在的缺点。3)设计开发了禾本科植物孤儿基因识别系统,该系统基于Vue和ElementUI编写了前端框架,Spring Boot和IDEA实现后端代码,My SQL做数据持久化存储。系统集成了禾本科植物孤儿基因识别,孤儿基因数据集下载两个功能模块,用户可通过该系统实现禾本科植物孤儿基因识别和对已发布的孤儿基因数据集进行下载,本系统为孤儿基因的后续研究提供了技术支持。
面向互联网广告投放的互联网流量预测
这是一篇关于互联网广告投放,流量预测,循环神经网络的论文, 主要内容为在互联网营销中,对于品牌商来说,互联网广告投放经常遇到的问题是,广告位流量数据是难以获取。本文对互联网流量预测,结合传统营销理论,结果用于广告位选择和成本预算。本文将综合应用文献研究法、数量研究法、模拟法对品牌方在对互联营销中的研究,在实际生产运营当中解决品牌传播中遇到的信息不对称导致营销成本不可控的问题。本文阐述了互联网的发展过程,从而互联网广告应运而生。在互联网广告投放过程中,涉及到广告的传播模式、计费模式等,在综合各种影响因素分析下,发现互联网投放存在着一些问题。互联网广告是可追踪的,但是由于品牌方和广告平台存在着信息不对称的情况,品牌方难以准确得到广告平台流量信息。互联网用户在上网的时候会产生大量的数据,本文根据维基百科产生的浏览日志数据,而这些日志数据是通过时间序列数据形式存放的,通过对这些数据向上汇总,得出每天、每个页面的浏览量,再通过正则化变换,结合LSTM与GRU、seq2seq模型、注意力机制深入研究,通过循环神经网络进行数据挖掘。最终,通过挖掘模型对互联网平台浏览量进行预测,在极高的预测准确率基础上,为品牌方提供一段时间段内的流量预测结果,此举打破互联网广告平台的信息壁垒。通过类似的方法,品牌方可以通过预测某一个可获取数据的互联网广告平台或者自有电商平台的流量,结合企业本身实际需求,在价格最优的情况下选择更大的互联网广告曝光量,在投放品牌曝光广告前提前锁定优质广告资源位置。
基于路径建模的知识图谱嵌入技术研究
这是一篇关于知识图谱嵌入,循环神经网络,残差网络,实体对齐,知识图谱补全的论文, 主要内容为知识图谱结构化地存储着现实世界中的丰富事实。目前,知识图谱已经成为了各种以知识为驱动的应用的重要资源,如语义搜索、问答以及推荐系统等。通常情况下,单个知识图谱往往难以提供足够多的事实,因此需要链接多个知识图谱的资源或者补全现有知识图谱来扩充知识,这就要求解决实体对齐和知识图谱补全两项任务。近年来,基于知识图谱嵌入技术的方法在这两项任务中取得了十分优秀的结果。这些方法认为相似的实体应当具有相似的语义关系。由于这些方法中大部分都是基于知识图谱中的三元组来学习的,这就使得它们只依赖于三元组中所表示的一阶邻居关系,而失去了捕获实体间更长的依赖关系的能力。同时,只使用三元组的学习方式不利于语义信息在实体间的传递,这一点尤其体现在涉及到多个知识图谱的场景。知识图谱路径能够提供更长的实体间的依赖关系,并且潜在地包含了基本的三元组信息。因此,如果能够利用知识图谱路径来学习知识图谱嵌入,将能在显著提升语义信息的传递效率的同时,给实体嵌入提供更丰富和更具区分性的特征。本文的主要内容如下:1.本文提出了一种循环跳跃网络,其有效结合了传统循环神经网络与残差学习,从而使得模型能够捕捉到知识图谱内与知识图谱间的长依赖关系。2.本文提出了一个端到端的基于循环跳跃网络的框架,不同与现有方法只专注于单个知识图谱任务,该框架能够同时应用于知识图谱补全和实体对齐任务。3.在多个基于现实知识图谱的数据集上,本文所提出的方法均能在知识图谱补全和实体对齐两个任务中获得领先的结果。同时,本文通过消融实验验证了跳跃循环网络的有效性及长依赖对知识图谱嵌入学习的帮助。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设货栈 ,原文地址:https://m.bishedaima.com/lunwen/46169.html