基于查询重写的医疗数据隐私保护关键技术研究
这是一篇关于查询重写,差分隐私,隐私预算分配,医疗数据的论文, 主要内容为随着“医疗+互联网”的不断发展,医疗数字化已经成为了常态,由此也产生了大量的医疗数据,这些数据蕴含着患者、医院的重要信息,因此医疗数据上的隐私安全应该得到关注。现有的隐私保护机制都有着很好理论价值,但是实际应用起来却困难重重,问题关键在于大多隐私保护机制都需要对数据库进行深度改造,对现有系统的运行造成极大的阻碍。既要保证数据库上的隐私得到保护又要最大程度减少系统开发带来的开销,成为了目前需要解决的问题。本文基于查询重写技术提出了医疗健康数据保护系统,该系统实现了对医疗健康数据的隐私保护,在不对数据库进行改动的前提下对查询返回的数据进行隐私保护。首先提出了基于查询重写的隐私保护框架RW-SQL,通过对结构化查询语言的分析处理,动态选择不同的隐私保护策略,能实现对数据库上不同查询返回的数据进行保护,具有较强的兼容性。其次,针对差分隐私交互式查询中的隐私预算溢出风险,提出了基于关联属性查询的隐私预算分配方法AQPB,该方法通过分析当前查询和历史查询中的关联关系,给出隐私预算分配溢出风险评估方法,最后限定隐私预算分配上界,减少了数据的隐私泄露风险。本文设计的微服务系统架构耦合度低,隐私保护模块和数据库之间相互独立,采用了RPC(Remote Procedure Call)技术,实现了系统高并发的访问。经过实验测试,本系统通过极低的隐私保护开销,合理的隐私预算分配策略,能够实现对医疗数据的隐私保护。
基于差分隐私的健康医疗数据安全保护及发布技术研究
这是一篇关于隐私保护,差分隐私,直方图发布,医疗数据的论文, 主要内容为随着“互联网+医疗健康”的不断推进,数字医疗行业发展迅速,同时产生了大量的健康医疗数据,一方面,这些庞大的健康医疗数据中存在大量的有价值信息;另一方面,医疗数据中包含着患者的各种敏感信息,一旦发生泄露可能会对患者产生安全威胁或者造成财产损失。因此,如何在对健康医疗数据进行有效使用的同时保证数据的安全是我们目前需要解决的问题。差分隐私机制通过严格的数学模型定义可以保证在最坏的情况下,即攻击者拥有全部背景知识的情况下数据库中特定记录的敏感信息依然不被泄露。同态加密技术可以将加密后的密文结果进行代数运算,在保护健康医疗数据隐私性的前提下对数据进行分析。本文提出了一个差分隐私的健康医疗数据隐私保护系统,通过对健康医疗数据中的敏感属性进行同态加密,并且对敏感属性的统计结果使用差分隐私机制,以实现对健康医疗数据整体的保护。首先,提出了一种差分隐私与同态加密的密文数据库保护框架,对结构化查询语言进行解析后分发给不同的隐私保护模块,对数据操纵语言中的敏感字段进行加密操作,并且对不同类型的查询结果返回不同的隐私保护结果。其次,针对现有的等距直方图无法充分考虑到数据分布不均匀的情况,提出了基于桶边界重划分的差分隐私非等距直方图发布方法,该方法通过引入贪心分组算法,在对非等距直方图结构的桶边界进行重新划分后,发布具有更高可用性的直方图。本文设计的健康医疗数据隐私保护系统采用Spring Cloud微服务架构,系统管理模块和隐私保护模块等模块之间松耦合,服务之间采用Rest通信,通过Nginx对请求进行分发,实现系统的高并发访问。最后通过系统测试,验证了系统在万级并发情况下的高效性、稳定性以及对健康医疗数据隐私保护的有效性。
考虑用户隐私保护的协同过滤推荐算法研究
这是一篇关于推荐算法,矩阵分解,差分隐私,Bhattacharyya系数,时间因素的论文, 主要内容为近年来,随着Internet中数据的爆炸式增长,用户有效获取信息的难度日益增加,信息使用效率下降。传统的信息检索系统能够结合关键字信息进行结果查询,但面对相同关键字提供结果同质化,难以满足用户差异化的信息需要。推荐系统以其算法为核心,能够结合用户的偏好,为用户提供个性化信息推荐服务,显著提升用户信息管理的效率。然而,系统对用户的推荐越精确,需要收集的信息越庞大,用户信息泄露的风险也会增加。为此,对推荐系统中的用户信息进行隐私保护是十分必要的。在隐私保护领域,差分隐私技术因其独特的特性而成为该领域的研究热点。该技术能够在不改变数据整体规模特征的情况下,对数据进行有效保护。为了提高推荐系统的安全性,本文以用户的个性化隐私需求为切入点,在保障用户信息安全的前提下,为用户提供精确的个性化推荐服务。对推荐算法的隐私保护研究工作主要包含以下两个方面:第一,现有的差分隐私与推荐系统结合的研究中,对所有时间段的数据均采用同等程度的隐私保护。然而,用户兴趣是随时间变化的,发生在不同时间段的数据对用户的重要程度存在差异。为此,提出一种基于时间权重因子的差分隐私保护推荐算法。算法首先设计了时间权重因子,用于衡量数据重要性。然后根据时间权重因子划分隐私预算,对不同时间段的数据施加不同强度的隐私保护。在此基础上,构建了基于差分隐私的概率矩阵分解模型,用于完成个性化推荐。实验表明,该算法在满足隐私保护的条件下,能够更有效的保留数据效用,提高推荐结果的准确性。第二,基于邻居型隐私保护推荐算法主要存在两个问题:一是传统相似性度量方法在缺乏共同评分项时难以计算相似性;二是未充分考虑用户个人隐私需求存在差异的特征。为此,提出一种新的考虑Bhattacharyya系数和个性化差分隐私的推荐算法。首先,以Bhattacharyya系数作为算法相似性度量标准,对其进行归一化以解决直接引入差分隐私时敏感度过大问题。在此基础上,考虑用户对隐私保护需求的差异性,对推荐系统采用基于个性化的隐私保护。实验表明,与传统的差分隐私保护推荐算法相比,提出的方案的预测准确性有明显提高。
基于差分隐私的推荐系统研究与应用
这是一篇关于推荐系统,差分隐私,随机游走,纵向联邦学习,逻辑回归的论文, 主要内容为推荐系统能够帮助用户在海量的数据中筛选出更符合个人意愿的物品,同时,在用户不断选择与拒绝的过程中,推荐结果会逐渐改善。但此过程中也会随之产生大量的用户私人信息,这些私人信息在推荐系统的使用过程中,难免会面临一些隐私泄露的风险。一旦用户隐私得不到保障,出现一些负面案例,便会动摇用户对系统的信任,轻则导致用户活跃度降低或提供不真实的数据,使得推荐效果会变差,重则导致用户大规模流失,项目难以为继。本文针对推荐系统中隐私保护问题,主要从以下三个方面进行研究。第一,在现有的随机游走过程中,根据不同用户对物品的操作得出二分图,再由二分图得到转移矩阵迭代,但这个过程中无法保证推荐目标用户的隐私安全。因此,利用差分隐私机制,将Laplace噪声加入用户评分中,重新计算游走的权重。迭代计算之后,可以直接排序得到Top N的推荐结果。如果需要唯一的推荐结果,则以计算得到的点击概率为打分函数,用指数机制的方法得到推荐结果。通过实验表明,在基于差分隐私的随机游走算法中,攻击者无法通过多账号查询作差,进而不会得到目标用户或者其他用户对物品的操作行为。因此该算法保证了推荐过程中个人信息的安全性,同时能够较好地提供推荐结果。第二,对于拥有大量数据的不同企业,通常情况下不会直接分享私有用户数据,且缺乏可以互信的信息沟通机制,导致信息交互相对封闭。为了让不同企业之间共享数据的信息,关键在于如何不泄露企业原始数据也能共同训练得到结果。因此,考虑利用同态加密和差分隐私机制,引入第三方负责发放同态加密密钥,使得在联邦学习训练模型中,参与方能够不直接使用对方的数据,也能得到模型结果。通过对比有无融合差分隐私的纵向联邦学习,发现训练模型准确率差别不大,且加入差分隐私后,也没有明显的负面情况,并且避免了第三方泄露密钥的潜在危险,保证了联邦学习过程中的数据安全。第三,基于以上两方面的研究,搭建出一套基于差分隐私的电影推荐系统,在给用户推荐电影的同时,保证用户和企业的隐私。两方企业提供数据和标签,对于不能匹配上的用户,使用基于差分隐私的随机游走算法得到推荐结果;能够相互匹配上的用户,在融合差分隐私的纵向联邦学习下,构造出逻辑回归模型,并通过第三方计算出目标用户电影点击率,结合随机游走得到的点击率,加权得到新的点击率,同时显示推荐电影结果。
数据融合推荐中的隐私保护方法研究
这是一篇关于推荐系统,差分隐私,数据融合,知识图谱,情感分析的论文, 主要内容为随着互联网的迅速发展,网络上存在的信息呈指数级增长,用户从这些海量而复杂的数据中筛选自己感兴趣的内容的难度也随之增加。推荐系统作为一种有效的信息过滤工具,得到了广泛的应用,它的目的是准确地预测用户对物品或信息的偏好程度,从而把对用户更有价值的内容优先呈现给他们,帮助用户做出快速的决策。协同过滤在推荐算法中被广泛应用,它是基于相似用户具有相似偏好的假设进行推荐的,但是当用户的历史评分数据很少或没有评分时,推荐系统会面临着数据稀疏性和冷启动问题。因此,越来越多的研究者提出将多源数据作为辅助信息融合到推荐系统中提高推荐的性能。但是,推荐系统收集的用户评分等历史反馈数据,不可避免的涉及到用户的隐私信息。随着用户的隐私保护意识的提高,人们在享受推荐服务的同时也越来越关注自己的隐私能否得到保护。而基于数据融合的推荐中,由于涉及到多源数据,并且数据之间存在的关联给攻击者带来更强的背景知识,其隐私问题更具挑战性。因此,本文分析了现有的数据融合推荐中的隐私问题及已有方法的不足,提出了对数据融合推荐中的隐私保护方法的改进方案,主要研究成果如下:(1)针对融合知识图谱的新闻推荐系统中的隐私保护方法不能均衡噪声添加和推荐效果的问题,提出融合知识图谱的新闻推荐中的隐私保护方法,基于差分隐私模型设计一种二阶段隐私保护机制。首先,根据特征向量对推荐结果的影响权重动态地分配隐私预算,并将拉普拉斯噪声添加到用户特征向量中,实现隐私保护的同时降低过量噪声添加造成的数据损失,以提高数据的效用性。其次,对加权的用户特征向量添加统一的拉普拉斯噪声,保证用户数据的安全性。最后,在真实的新闻数据集上进行实验验证表明,该方法在保护用户隐私的同时能保证模型的预测性能。(2)针对融合情感分析的推荐系统面临的数据稀疏性问题,提出改进版的基于神经网络的观点挖掘模型Neu O+(Neural-network based Opinion mining+),将用户的ID特征中隐含的固有属性特征融合到推荐系统中,缓解数据稀疏性从而增强推荐性能。另外,针对融合情感分析的推荐场景中存在的隐私问题,提出一种基于差分隐私的观点挖掘模型DPNeu O,通过在梯度下降最下化损失函数获取优化参数的过程中,添加满足差分隐私的噪声来保护隐私。最后,在两个真实的数据集(Amazon、Yelp)上设计对比实验对本文提出的方法进行验证,表明本文方法相比已有工作能在保护隐私安全的同时提高推荐的精准度。
隐私保护兴趣点推荐方法研究
这是一篇关于兴趣点推荐,隐私保护,差分隐私,矩阵分解,奇异谱分析的论文, 主要内容为兴趣点推荐系统在基于位置的服务中起着重要作用,旨在通过分析用户的历史或结合其他信息,在社交平台上向用户推荐其可能感兴趣的地点。但是,签到数据被暴露给不可信的推荐系统是一种隐私威胁,攻击者可能会根据签到数据推测出用户的一些个人信息,例如工作场所、宗教信仰和行为习惯等。因此,研究一种既能保护用户数据隐私,又能保证较高可用性的兴趣点推荐方法具有重要意义。基于扰动思想的差分隐私技术,能够提供防止隐私泄露的数学证明。将其应用于兴趣点推荐方法中,使得攻击者根据推荐结果无法推断出用户的隐私偏好,实现了隐私保护的目的,同时在推荐方法中结合用户和兴趣点的辅助信息(如社交属性和地理属性等),提高推荐的准确度。论文针对隐私保护的兴趣点推荐方法,所做的主要工作如下:(1)在数据聚集器是可信的假设条件下,基于中心化差分隐私技术,结合用户的偏好和实时需求,提出一种基于时间感知的隐私保护兴趣点推荐方法。该方法包含两个算法:隐私保护兴趣点类别预测算法采用矩阵分解和奇异谱分析技术发现时间演化的用户类别偏好,在矩阵分解的过程中对梯度进行加噪,保护用户对类别的偏好数据;基于加权HITS的隐私保护兴趣点推荐算法加权结合社交地理影响,为用户个性化推荐特定的兴趣点,根据位置的签到频率划分灵敏度,对用户位置签到评分加入噪声,保护用户对特定兴趣点的偏好。提出的方法能够在保护用户签到数据和推荐性能之间达到很好的平衡。(2)在数据聚集器是不可信的假设条件下,基于本地化差分隐私技术,结合地理和社交属性,提出一种结合地理社交属性的隐私保护兴趣点推荐方法。该方法包含三个算法:结合社交的隐私保护矩阵分解算法基于本地化差分隐私的矩阵分解技术,私密的学习隐式的用户偏好特征;基于核密度估计的地理相关性计算算法得出兴趣点的地理属性;基于随机响应机制的兴趣点流行度估计算法统计兴趣点的访问计数并生成兴趣点的流行度特征。加权综合三个算法的结果预测用户对兴趣点的评分。在保证用户显式评分数据和隐式偏好数据不被泄露的同时,可以达到较好的推荐效果。(3)对上述提出的两种隐私保护兴趣点推荐方法分别进行了隐私性分析和实验分析。隐私性分析表明所提出的两种方法均满足差分隐私定义。基于真实的位置数据集,进行对比实验并采用精确率、召回率两个评估指标,实验结果表明,所提出的两种方法在保证用户的偏好数据的同时,能够实现较好的推荐效果。
个性化推荐系统中差分隐私保护方法研究与应用
这是一篇关于个性化推荐系统,差分隐私,ProPer,GS,PAM的论文, 主要内容为近年来,随着互联网技术的迅猛发展、大数据时代的到来,人类每天的工作生活会不经意间通过各种方式产生数以兆亿计的数据信息。面对如此海量的数据信息,个性化推荐系统能够从中找到有价值的信息,为人类社会、经济的发展做出了重要贡献。但是在为人类的工作生活作出贡献的同时,也会因为需要大量收集掌握用户的数据信息而存在用户敏感信息泄露的风险。当用户发觉上传的数据信息在做推荐分析时可能会暴露自己的隐私,这就会让用户越来越不愿意共享他的数据或者共享一些虚假的数据以供推荐分析使用。久而久之,这就违背了推荐系统最初诞生的初衷。因此,如何在保证用户隐私信息不被泄露的前提下,让个性化推荐系统给我们提供精准的推荐结果,享受推荐给我们带来的便利成为了时下研究的热点。差分隐私保护框架是实现差分隐私的基础环境。本文研究了满足PDP保护的ProPer框架并对其改进应用到分布式环境中,提出了D-ProPer差分隐私保护框架。在此框架下,针对GS分组划分方法在划分存在离群点的数据集时会造成巨大误差的问题,提出了满足?-差分隐私的S-GS数据发布方法。该方法是在原有GS划分方法的基础上引进差值集这一概念用于对数据集中存在的离群点进行判定并对其进行针对性的划分,并在文中进行了两组S-GS方法与GS方法的对比实验。实验结果表明在拥有大量离群点的数据集中S-GS方法比GS方法有更强的算法鲁棒性以及更好的数据可用性。针对数据分析者在数据挖掘时可能导致的隐私泄露问题,本文研究了基于差分隐私保护的K-means聚类方法。为了解决该方法对离群点敏感而导致聚类可用性差、算法鲁棒性差等问题,在PAM算法的基础上提出了差分隐私A-PAM聚类算法。通过循环迭代的方法确保在达到隐私保护的同时最大化聚类可用性并通过实验结果表明A-PAM聚类算法在实现隐私保护的同时拥有更好的聚类可用性、更强的算法鲁棒性。最后,将文中提出的理论性的算法运用到实际的应用中,设计了一个电影个性化推荐系统。该系统提供一般和私密两种推荐模式,用户可以根据自己对数据隐私的要求程度选择对应的推荐模式。私密模式下,该系统会结合S-GS方法和A-PAM聚类算法对用户数据进行严格的筛选和推荐工作,在一定程度上避免了因为推荐分析过程中导致的用户隐私泄露问题。
面向隐私保护的文件共享系统的研究与实现
这是一篇关于命名数据网络,随机决策树,差分隐私,隐私保护的论文, 主要内容为共享是互联网的重要基本特点之一,文件共享一直都是计算机网络的重要应用。从1984年开发的分布式网络文件系统(NFS),到Novell开发的局域网文件共享系统网络邻居(Net Ware),再到点对点文件共享系统(P2P)。有几个因素促成了点对点文件共享系统的广泛采用和便利化,其中包括不断增加的互联网带宽、物理媒体的广泛数字化以及家用个人电脑功能的不断增强。用户能够通过各种文件传输系统和其他文件共享网络将一个或多个文件从一台计算机传输到另一台计算机,文件共享系统随着时代的发展也在不断的进步。但是近年来,随着人们对于隐私的日益重视,文件共享系统的隐私泄露越来越受到关注。一些学术研究论文分析了文件共享系统的协议并发现了协议中的弱点,指出了文件共享网络的用户的活动容易受到监控。可以通过IP地址、DNS名称、使用的软件版本、共享的文件、发起的查询以及回答的查询来跟踪客户。如何在实现隐私保护的同时高效的共享文件是当前的研究热点。基于此,本文提出NDN网络中文件共享系统的隐私保护。首先引入未来互联网的NDN结构,然后在P2P网络结构(Peer to Peer)下设计并完成了文件共享系统。本文针对NDN路由缓存可能造成隐私泄露的问题,采用在路由器中增加随机延迟的方法尽量避免隐私探测的情况发生,目的为了尽量避免恶意用户探测缓存数据造成隐私泄露,同时在服务器收集用户下载信息,个人信息,用户下载偏好信息等,引入了基于差分隐私噪声添加的随机决策树隐私保护方法。用户信息经过噪声添加处理在传递给服务器,既能在用户传输的过程中进行保护,同时也能确保用户数据存储在服务器中的安全性。最后,通过Adult和Survival数据集进行实验验证。之后本文对系统应用的算法与当前的隐私保护算法进行实验对比,算法在正确率与相对误差方面平均约有3%的提高。本文设计与实现了面向隐私保护的文件共享系统,系统整体架构分为网络层、数据层、逻辑层、用户交互层、设备层几部分组成。其中网络层为系统的核心,利用NDN网络对网络层进行构建,用户之间文件传输采用P2P模式,即每个人既是请求者同时也是提供者,用户进行文件传输下载时不需要经过服务器,由用户节点之间传输交互完成;数据层考虑系统的隐私保护,在路由器与服务器中都采取了相应的措施对用户信息进行保护;在逻辑层使用NDN代理模式将底层网络与用户交互层相连接,最后在用户交互层使用JAVA语言设计出用户可操作系统的页面,同时设计并完成了系统的一些功能模块丰富了整个系统。最后对系统的各个功能模块进行测试,确保该系统可以正常使用,完成了系统的在网络方面传输的性能测试。最后针对系统存在的问题和未来系统的发展做了简要的讨论。
数据融合推荐中的隐私保护方法研究
这是一篇关于推荐系统,差分隐私,数据融合,知识图谱,情感分析的论文, 主要内容为随着互联网的迅速发展,网络上存在的信息呈指数级增长,用户从这些海量而复杂的数据中筛选自己感兴趣的内容的难度也随之增加。推荐系统作为一种有效的信息过滤工具,得到了广泛的应用,它的目的是准确地预测用户对物品或信息的偏好程度,从而把对用户更有价值的内容优先呈现给他们,帮助用户做出快速的决策。协同过滤在推荐算法中被广泛应用,它是基于相似用户具有相似偏好的假设进行推荐的,但是当用户的历史评分数据很少或没有评分时,推荐系统会面临着数据稀疏性和冷启动问题。因此,越来越多的研究者提出将多源数据作为辅助信息融合到推荐系统中提高推荐的性能。但是,推荐系统收集的用户评分等历史反馈数据,不可避免的涉及到用户的隐私信息。随着用户的隐私保护意识的提高,人们在享受推荐服务的同时也越来越关注自己的隐私能否得到保护。而基于数据融合的推荐中,由于涉及到多源数据,并且数据之间存在的关联给攻击者带来更强的背景知识,其隐私问题更具挑战性。因此,本文分析了现有的数据融合推荐中的隐私问题及已有方法的不足,提出了对数据融合推荐中的隐私保护方法的改进方案,主要研究成果如下:(1)针对融合知识图谱的新闻推荐系统中的隐私保护方法不能均衡噪声添加和推荐效果的问题,提出融合知识图谱的新闻推荐中的隐私保护方法,基于差分隐私模型设计一种二阶段隐私保护机制。首先,根据特征向量对推荐结果的影响权重动态地分配隐私预算,并将拉普拉斯噪声添加到用户特征向量中,实现隐私保护的同时降低过量噪声添加造成的数据损失,以提高数据的效用性。其次,对加权的用户特征向量添加统一的拉普拉斯噪声,保证用户数据的安全性。最后,在真实的新闻数据集上进行实验验证表明,该方法在保护用户隐私的同时能保证模型的预测性能。(2)针对融合情感分析的推荐系统面临的数据稀疏性问题,提出改进版的基于神经网络的观点挖掘模型Neu O+(Neural-network based Opinion mining+),将用户的ID特征中隐含的固有属性特征融合到推荐系统中,缓解数据稀疏性从而增强推荐性能。另外,针对融合情感分析的推荐场景中存在的隐私问题,提出一种基于差分隐私的观点挖掘模型DPNeu O,通过在梯度下降最下化损失函数获取优化参数的过程中,添加满足差分隐私的噪声来保护隐私。最后,在两个真实的数据集(Amazon、Yelp)上设计对比实验对本文提出的方法进行验证,表明本文方法相比已有工作能在保护隐私安全的同时提高推荐的精准度。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码向导 ,原文地址:https://m.bishedaima.com/lunwen/46267.html