结构张量构建与分解方法及其在多元关联分析中的应用
这是一篇关于关联分析,张量分解,词嵌入,知识图谱,推荐系统的论文, 主要内容为随着物联网及社交网络近几年的迅速发展,相关数据迅速爆炸式增长,困扰人们的问题往往不是数据不足,而是信息过载。张量和知识图谱可以有效地组织不规则的异构数据,如何从它们的结构特征出发,挖掘出数据的隐关联特征,在多元关联分析领域具有很重要的价值。然而,实际数据中存在的非直接关系和非对称关系使得部分实体间的关系难以得到准确的预测,如何分析这些关系成为亟待解决的问题。大多数现有的关系分析预测模型主要针对直接关系与对称关系的预测,缺乏对非直接关系与非对称关系预测的优秀解决方案,部分模型依靠深度神经网络具有对局部非直接关系预测的能力,但算法时间复杂度较高且不具备较好的可解释性。针对数据中的非直接关系,本文提出了ARCCS(Association Rule algorithm Combined with Classical Statistics)模型,该模型将张量看作矩阵的高维表达形式,使用改进的FGMDGCD(Fast Greedy Multi-Dimensional Graph Community Detection)算法来进行低维度内单矩阵的关系聚类分析,使用改进的Apriori算法进行高维度的多矩阵关联分析,使用经典统计检验算法来对结果进行假设检验。针对数据中的非对称关系,本文提出了CPE(CP decomposition and Embedding method)模型,该模型使用张量分解和词嵌入表示以完成知识图谱中关系的预测任务,得益于模型为非对称关系的两个实体赋予不同权重,CPE模型尤其适合捕捉知识图谱中非对称关系的特点。最后,本文综合以上两种模型提出了MAAH(Multiple Association Analysis Hybrid recommendation system,MAAH)模型,该模型综合了两种模型的优点,深入挖掘了电影推荐系统中电影和用户之间的非直接关系与非对称关系。本文提出的三种模型对多元关联数据中存在的非直接关系与非对称关系都做出了很好的预测与分析,在相关数据集上的结果表明,ARCCS模型相比早先较优秀的模型有2.98%的提升,与其他的最新线性模型相比,CPE模型具有高达10%的改进,MAAH推荐模型相比早先表现较好的模型具有10%左右的提升。
基于标签聚类和多构面信任关系的推荐方法研究
这是一篇关于个性化推荐,遗忘曲线,非信任关系,张量分解的论文, 主要内容为随着社交网络的蓬勃迅猛发展,产生了庞大的数据信息量,对标签数据进行的相关的推荐算法的研究也就应运而生,并成为研究热点问题之一。社交网络在各个机构领域中产生的影响效果越来越大,它正潜移默化的影响并改变着人们的生活方式、学习方式甚至是成长模式。个性化推荐系统的出现,给用户带来更为人性化的推荐。突破传统推荐单调重复的问题,提升推荐的多样性和新颖性。通过多维度挖掘用户长短兴趣画像,可以精准把脉用户需求并多策略融合优化推荐的多样性、新颖性和时效性。科研工作者同时有机会在拥有大量数据的线上社会网络平台上进行分析和研究,取得了高水准、高质量的研究成果。针对于传统个性化推荐系统只考虑静态兴趣维度,没有考虑兴趣动态变化的问题,本文提出基于标签聚类的多构面信任关系的推荐方法,该方法借鉴艾宾浩斯遗忘曲线的思想,跟踪兴趣变化给用户推荐带来的影响。通过SPSS统计分析工具,曲线估算出了与遗忘曲线有相当高拟合度的幂函数曲线,为了解决时间因素对推荐准确性带来的问题,提出了基于时频窗的时频兴趣变化函数;然后针对标签数据冗余稀疏难题,在此基础上改进了谱聚类算法,提高推荐准确性;并将标签簇作为划分多构面的依据,以此构建非信任张量,其次针对信任强度的计算问题,通过改进簇间和簇内的信任与非信任关系,并将其二者结合以构建非信任张量。最后利用张量分解方法得到Top-N推荐结果。通过实验进行算法对比,结果表明本文提出的推荐算法能够在解决标签数据冗余的同时保留语义关系并考虑用户的兴趣随时间变化的因素,在推荐准确性方面有显著的提高。
基于地理区域性和用户上下文信息的兴趣点推荐算法研究
这是一篇关于兴趣点推荐,张量分解,混合高斯模型,深度游走模型的论文, 主要内容为5G通信技术的进步带动了移动互联网的发展,互联网发展过程中互联网应用平台积累了大量的用户数据。其中,基于位置的社交网络平台在移动互联网和GPS定位技术的发展下为用户提供打卡签到、分享喜欢的地点等服务,这些服务已经融入了人们的生活。用户在使用这些社交平台的过程中产生了大量的签到数据,通过挖掘这些数据可以分析出用户的偏好,从而可以实现为用户预测其可能感兴趣的地点。兴趣点推荐系统是推荐系统研究的子问题,具有很高的研究价值。相比于其他领域的推荐系统,兴趣点推荐系统的数据更加稀疏。同时用户的出行决策受到地理因素、时间因素等多种上下文因素的影响。因此提高兴趣点推荐的准确度面临巨大的挑战。现有的兴趣点推荐算法往往不能有效地结合地理影响因素和社交关系影响因素,为了解决这个问题,本文提出了基于地理区域性的推荐算法。地理区域性体现在两方面:首先,用户的打卡签到数据在经纬度坐标系上呈现区域性,不同的用户有自己特定的活动空间。其次,受到城市建设规划的影响,兴趣点的分布呈现出区域性。为了更好的利用地理区域性,本文基于协同过滤的思想,以签到数据为基础建立相似用户组,提出了一种加权虚拟用户的计算方法。然后使用混合高斯的方法对相似用户进行聚类。最后通过相似用户聚类和张量分解的方法,充分挖掘地理区域性信息,为用户推荐其感兴趣的地点。传统的推荐兴趣点推荐算法往往没有考虑用户的当前位置和时间,导致生成的推荐内容不符合用户当前的使用场景。为了解决这个问题,本文结合用户的特定场景信息提出了一种新颖的下一个兴趣点推荐算法。该算法在挖掘兴趣点之间联系的同时充分利用上下文信息,为用户推荐其更为需要的下一个兴趣点。为了更好的分析用户连续签到地点的行为模式,本文使用图嵌入的方法充分挖掘兴趣点之间的联系。然后使用图嵌入方法计算出具有时空因素的用户兴趣特征,最后基于用户当前所处情境为用户推荐在一定时间范围内用户更加感兴趣的地点。本文在多个签到数据集上进行了实验,实验结果证明本文提出算法具有较好的性能。
基于张量的个性化推荐系统在医疗领域的研究应用
这是一篇关于推荐系统,张量分解,医疗大数据,药物重定位的论文, 主要内容为随着人工智能和机器学习的发展,各领域都逐渐步入智能化。作为一直以来受国家重视的医疗健康服务领域,它的智能化近年来更是受到了广泛的关注。如今的推荐系统在各个领域都有较为成功的应用,然而在医疗范畴的应用却仍需要进一步去挖掘。尽管医疗领域的推荐系统相比其他领域存在着更多的困难,即便如此国内外的学者们也从未停下探索的脚步。目前推荐系统在医疗行业较为成功的业务应用有:辅助诊疗、合理用药、就诊引导、精准医疗等,所用到的核心技术多以传统协同过滤为主。近些年来,张量分解也被应用到了推荐系统中,甚至在一定程度上优于传统的推荐算法。因此,本文选择以药物重定位作为本次推荐系统在医疗领域的研究应用方向,利用张量分解技术旨在构建一个基于张量的药物重定位推荐算法。本文首先对医疗大数据及相关业务应用场景做了较为全面的调研与综述,介绍了当今医疗范畴和推荐系统的关系。由医疗大数据引出了张量,由信息过载引出了推荐系统,而张量分解作为勾连二者的枢纽,将两个领域交汇在一起。接着对张量的理论基础和常见的概念方法进行了比较全面的整合阐述。又从经典的传统推荐算法入手,对推荐系统进行了一定的调研、整理和分析。并以药物重定位作为本次推荐算法在医疗范畴的应用方向,对推荐算法在其上的价值进行了说明。针对与药物重定位有关的医疗数据构建张量模型,借助PARAFAC2方法处理不规则数据矩阵集合进而得到规范化张量。利用张量常用于推荐系统的平行因子分解法实现疾病-药物的关系对预测,挖掘潜在的疾病-药物关系,最终完成药物重定位的TopN推荐。最后在公开的数据集下选取10%并抹去部分药物-疾病关系信息作为测试数据,利用K折交叉验证对本文的算法模型进行反复测试,和传统协同过滤模型相比较,验证了本次研究模型在precision、recall和F1-Measure上具有不错的表现,同时具备一定的新颖性和可行性。接着在原有模型的基础上引入置信矩阵进行了一定的改进,改进后的效果较之前模型在可靠性上有着一定的提高。最终表明,本文的算法为医疗领域的药物重定位研究提供了一定的参考价值,较好的实现了张量在医疗大数据的一次建模与推理。
基于张量分解的跨领域推荐方法及其应用
这是一篇关于推荐系统,单领域,跨领域,矩阵分解,张量分解的论文, 主要内容为近年来,互联网,尤其移动互联网飞速发展,各大互联网公司从中获取了大量与用户生活和行为模式相关的数据。如何利用这些数据,从各类庞杂数据中挖掘出有用信息,并以此对用户进行相关产品与功能的推荐成为一项难题。从目前来看,学术界与工业界对单领域的个性化推荐有了较为深刻的研究,单领域推荐是学术界与工业界解决推荐问题的主流方法,它通过学习某指定领域的历史数据,来预测该领域的用户行为与偏好。然而,单领域推荐对数据稀疏等问题没有很好的解决方案,有较大局限性。为此,将多个领域数据联合考虑,为目标领域推荐提供帮助的跨领域推荐成为推荐系统的热门课题。本文首先阐述了单领域推荐的不足和跨领域推荐的优势,强调了跨领域推荐的研究意义,介绍了跨领域推荐所要解决的问题与面临的挑战,分析了当前主要的基于跨领域的推荐算法。在这些跨领域的背景知识下,本文选择基于张量分解的跨领域推荐作为研究重点。本文详细论述了张量分解的理论基础,根据张量分解的特点寻找其适合的跨领域推荐应用场景。本文主要研究工作体现在如下两方面:1.基于张量分解的跨领域航班推荐系统本文介绍了航班推荐的背景,明确航班推荐问题的需求及其与传统推荐的不同。继而介绍了简单的航班推荐思路及其中的不足。然后,根据航班推荐的特点,提出了一个跨领域张量分解的改进算法,将历史权重策略加入到算法中用来解决跨领域航班推荐问题。此外,本文提出了该算法并行化的实现思路。2.基于张量分解的跨领域新电影推荐系统本文介绍了新电影推荐的背景,明确新电影推荐问题的需求。继而介绍了利用单领域解决新电影推荐的思路及其中的不足。然后,基于隐式跨领域张量分解算法解决新电影推荐问题。此外,本文针对新电影推荐的特点提出了该算法存储与计算的优化方法。
结构张量构建与分解方法及其在多元关联分析中的应用
这是一篇关于关联分析,张量分解,词嵌入,知识图谱,推荐系统的论文, 主要内容为随着物联网及社交网络近几年的迅速发展,相关数据迅速爆炸式增长,困扰人们的问题往往不是数据不足,而是信息过载。张量和知识图谱可以有效地组织不规则的异构数据,如何从它们的结构特征出发,挖掘出数据的隐关联特征,在多元关联分析领域具有很重要的价值。然而,实际数据中存在的非直接关系和非对称关系使得部分实体间的关系难以得到准确的预测,如何分析这些关系成为亟待解决的问题。大多数现有的关系分析预测模型主要针对直接关系与对称关系的预测,缺乏对非直接关系与非对称关系预测的优秀解决方案,部分模型依靠深度神经网络具有对局部非直接关系预测的能力,但算法时间复杂度较高且不具备较好的可解释性。针对数据中的非直接关系,本文提出了ARCCS(Association Rule algorithm Combined with Classical Statistics)模型,该模型将张量看作矩阵的高维表达形式,使用改进的FGMDGCD(Fast Greedy Multi-Dimensional Graph Community Detection)算法来进行低维度内单矩阵的关系聚类分析,使用改进的Apriori算法进行高维度的多矩阵关联分析,使用经典统计检验算法来对结果进行假设检验。针对数据中的非对称关系,本文提出了CPE(CP decomposition and Embedding method)模型,该模型使用张量分解和词嵌入表示以完成知识图谱中关系的预测任务,得益于模型为非对称关系的两个实体赋予不同权重,CPE模型尤其适合捕捉知识图谱中非对称关系的特点。最后,本文综合以上两种模型提出了MAAH(Multiple Association Analysis Hybrid recommendation system,MAAH)模型,该模型综合了两种模型的优点,深入挖掘了电影推荐系统中电影和用户之间的非直接关系与非对称关系。本文提出的三种模型对多元关联数据中存在的非直接关系与非对称关系都做出了很好的预测与分析,在相关数据集上的结果表明,ARCCS模型相比早先较优秀的模型有2.98%的提升,与其他的最新线性模型相比,CPE模型具有高达10%的改进,MAAH推荐模型相比早先表现较好的模型具有10%左右的提升。
基于张量分解和非采样学习的多行为推荐系统研究
这是一篇关于推荐系统,协同过滤,张量分解,非采样学习的论文, 主要内容为随着信息技术服务发展,信息量日益增长,帮助用户过滤信息的推荐系统逐渐得到重视。推荐系统需要使用大量用户数据,最常用的是用户历史行为数据。传统的单行为推荐算法仅使用目标行为的交互数据而面临数据稀疏问题。多行为推荐系统,利用辅助行为的历史交互信息提高目标行为的推荐效果,逐渐受到关注。已有的多行为推荐算法往往不能对不同行为间的关系很好地建模,同时面临引入辅助行为信息后负采样方法采样偏差增大而非采样方法复杂度高的问题。针对不同行为间关系建模的问题,论文提出了基于张量分解与非采样学习的非采样异构块项分解算法(Non-Sampling Heterogeneous Block Term Decomposition,NHBTD)。NHBTD通过块项分解得到表达能力更强的多组用户、物品和行为嵌入向量并设计不同的块项结构学习行为间关系,通过权重向量控制不同块项的输出,使用多任务学习方法调整不同行为数据的权重。此外,模型采用非采样策略从所有数据中学习。在五个数据集上的实验证明引入多行为数据的必要性,以及NHBTD能更好地捕获到行为间关系,取得优异的推荐效果,有助于缓解目标行为数据稀疏问题。针对块项分解与非采样策略的复杂度高的问题,通过共享不同块项间的用户和物品嵌入向量,以及将一种损失函数优化方法推广到张量分解上,论文在NHBTD基础上进一步提出高效非采样异构块项分解推荐算法(Efficient Non-Sampling Heterogeneous Block Term Decomposition,ENHBTD)。此外,论文探索了用注意力机制代替NHBTD中的权重向量。三个数据集上的实验表明ENHBTD降低了参数量与训练时间,同时没有损害模型性能,注意力机制的引入有助于进一步提高推荐效果。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码码头网 ,原文地址:https://m.bishedaima.com/lunwen/48806.html