基于时序性item2vec的隐私推荐算法
这是一篇关于推荐算法,隐私保护,双向长短时记忆网络,同态加密,item2vec的论文, 主要内容为大数据时代,为解决信息超载问题,推荐算法在许多领域被广泛应用,发挥了越来越重要的作用。推荐系统使用用户与应用平台的交互记录、用户属性等数据过滤用户需求,但这些数据的泄露往往会暴露用户的隐私信息,引发恶意推荐等安全事件。将推荐算法与隐私保护机制相结合,可以在为用户提供精确推荐信息的同时,更好地保护用户隐私。本文提出了一种用户隐私保护的推荐算法Priv Item2Vec,将双向长短时记忆网络算法(bi LSTM)与基于item2vec的推荐算法结合,使输出结果具有时序性,提高了算法的推荐准确率;同时在传输过程中使用Paillier加密算法对商品及用户行为序列生成的表征数据进行重新构造,保护用户隐私数据。Priv Item2Vec算法首先将商品序列输入到item2vec模型中,得到静态嵌入结果,然后将静态嵌入结果输入到bi LSTM模型中进行训练,最终得出有时序性的商品表征数据。然后,使用Paillier加密算法对商品id及经由item2vec和bi LSTM训练后输出的表征数据进行重新构造,对用户隐私信息进行保护:1)根据同态加密算法的特性,在用户端生成随机数与商品id进行计算并将计算结果和随机数加密,构造伪商品id,同时发送到给服务器端。2)数据传到服务器端后,同样根据同态加密算法的特性计算得出真实的加密商品id,并从服务器端的映射序列中找到对应的商品项,利用余弦相似度计算方法依次将其他商品与目标商品计算向量相似度,最终利用堆排序算法对得出的相似度序列进行排序,得出要向用户推荐的TOP-K推荐序列并向用户端传递。3)用户端对得到的加密序列解密,得到真实的、要向用户推荐的结果。在推荐计算的过程中只有用户端保留加密算法的秘钥,因此服务器端也无法对其进行解密操作。为验证本文所提出算法的性能,在真实数据集Movie Lens上进行了验证,与常用的BNR,NCF以及基于item2vec的推荐算法进行了比较。Priv Item2Vec的推荐命中率、NDCG结果、精确率等指标均优于其他算法。在比较加密前和加密后的计算效率时,服务器端的平均处理时间差为0.148s,即Priv Item2Vec算法在实际应用过程中消耗的时间相对于整体运行时间几乎没有影响。本文所提出的基于时序性的Priv Item2Vec算法,通过引入长短时记忆网络算法,使得传统的item2vec算法具有了时序性,提高了推荐准确性;Paillier同态加密算法的使用,使得推荐算法执行过程中服务器端获取到的数据全部为加密数据或embedding后的向量数据,降低了数据可读性,防御了半诚实的服务器,避免了由服务器端数据泄露而带来的恶意推荐,同时也保护了用户端到服务器端数据传输过程的安全。未来的工作将探索在隐私保护推荐算法中融入社交网络因素的影响,关注不同亲密程度朋友的偏好对推荐结果的影响;同时考虑如何防御社交网络中半诚实或恶意的用户。
面向心血管病数据信息系统的深度学习数据治理研究
这是一篇关于卷积神经网络,双向长短时记忆网络,多尺度特征提取,临床自然语言处理,PCI手术信息的论文, 主要内容为由于人们日常生活水平的提高和亚健康的生活方式,全国心血管疾病人数已达到23%,大量的心血管病数据堆积而无法得到充分地整合与利用。因此,如何治理心血管病数据已经成为当下的研究热点,该研究可为医生的科研和临床实践提供有价值的数据基础。本课题受到辽宁省自然科学基金资助(2023-MS-054),研究目的是探索面向心血管病数据信息系统的深度学习数据治理研究。力争实现对心血管病数据信息中涉及的非结构化文本进行有效治理。本文的主要工作和贡献如下:(1)为实现对经皮冠状动脉接入治疗(PCI)手术信息的结构化处理,使之能够直接被医生有效利用。本文设计了一个全新的字符级向量嵌入表达方法,并基于此构建了一种新的深度学习网络模型,即基于多尺度特征提取的双向长短时记忆网络(BCC-Bi LSTM)。该模型在经典双向长短时记忆网络(Bi LSTM)基础上进一步融合卷积神经网络(CNN)及Bidirection Encoder Representations from Transformers(BERT)进行特征提取与表示,最后利用条件随机场(CRF)进行解码并预测标签序列。可实现对PCI手术信息的命名实体识别任务,完成对PCI手术信息结构化处理。为验证所提模型的性能,本文同时采用具有代表性的传统方法和智能方法进行对比,包括隐式马尔科夫(HMM),Bi LSTM,Bi LSTM-CRF和BERT-Bi LSTM-CRF。(2)为进一步增强所提BCC-Bi LSTM模型输入数据的质量,防止非结构化文本数据间的混杂,造成数据污染,本文提出一种新型深度金字塔卷积神经网络模型,用于心血管病诊治中PCI手术信息、诊断、现病史和主诉等文本分类问题。该模型通过引入等长卷积来提高词嵌入矩阵表示的丰富性,并对每个卷积块进行池化,增加模型对临床文本的感受野。最后通过加深网络结构和引入多头注意力机制来保留文本的时序,整体增强模型抽取长距离文本依赖关系的能力,提高模型识别的准确率。本文通过对比其他主流的7种文本分类模型,从多方面验证所提模型的性能。(3)为给医生提供良好的科研与临床实践平台,同时也为对上述模型进行临床验证,本文搭建了心血管病数据信息系统。该系统基于Spring Boot和WPF技术框架,运用C#、Xmal和JAVA等编程语言。将本文所提两种模型嵌入到该系统中,并结合医生实际需求,进一步完成了患者基本信息,患者数据查询统计、科研数据管理、命名实体识别及本文分类等主要功能模块设计。该心血管病数据信息系统目前已在辽宁省人民医院部分科室试运行。
基于机器学习与链路预测的医疗问答检测与推荐系统
这是一篇关于医患问答,双向长短时记忆网络,链路预测,SSM框架的论文, 主要内容为随着“互联网+医疗”的政策不断推动,市场上以患者为中心的医患问答平台越来越多,人们现在可以轻松的在网上进行一些医疗咨询与疾病诊断。但是目前还是存在许多问题,比如各个医患问答平台的数据不互通、平台医生的质量良莠不齐、不能在用户有限时间内回答问题、医生根据片面的描述容易误诊等。本文通过市场调研和分析,开发一个在B/S架构下的医疗问答检测与推荐系统,该系统使用命名实体识别算法和链路预测算法,来实现诸如问答分析、疾病自查、历史记录检索、误诊疾病预测、疾病预测等功能。不仅如此,系统还可以进行新的疾病、症状以及问答记录的更新,可以让系统不断注入新数据。具体来说,本文主要有以下几个方面工作:首先,利用java的htmlunit工具类,针对目前使用频次最多的几个医患问答平台依次编写相应的爬虫规则,爬取当前已经记录的疾病、病症以及医患问答记录,并对数据进行结构化处理。其次,使用双向长短时记忆网络和条件随机场算法,对每个问答记录进行命名实体识别,提取出每个问答的疾病和症状的相关信息,并构建相应的“疾病-症状”网络。然后,本文针对实际数据的特点提出一个更能表现单节点预测正确率的N点连接精确度指标,并在已有的链路预测算法上进行改进,提出NIS算法来进行疾病之间连边的预测和症状之间连边的预测。同时,本文分析了医患平台上疾病频次的分布以及症状在每个疾病中的分布,提出了两种权重矩阵的计算方法来进行疾病的预测。最后,使用SSM框架来搭建该系统,在系统中集成了命名实体识别算法、链路预测算法以及疾病预测算法。系统的前端开发,使用AJAX异步传输所有信息,提升用户使用系统的流畅度。为了提高系统的可维护性,在开发该系统时候,采用前后端分离,前后端的交互利用JSON格式传输数据。同时对外提供了API接口,方便其他开发人员使用本系统的方法和结果。
基于机器学习与链路预测的医疗问答检测与推荐系统
这是一篇关于医患问答,双向长短时记忆网络,链路预测,SSM框架的论文, 主要内容为随着“互联网+医疗”的政策不断推动,市场上以患者为中心的医患问答平台越来越多,人们现在可以轻松的在网上进行一些医疗咨询与疾病诊断。但是目前还是存在许多问题,比如各个医患问答平台的数据不互通、平台医生的质量良莠不齐、不能在用户有限时间内回答问题、医生根据片面的描述容易误诊等。本文通过市场调研和分析,开发一个在B/S架构下的医疗问答检测与推荐系统,该系统使用命名实体识别算法和链路预测算法,来实现诸如问答分析、疾病自查、历史记录检索、误诊疾病预测、疾病预测等功能。不仅如此,系统还可以进行新的疾病、症状以及问答记录的更新,可以让系统不断注入新数据。具体来说,本文主要有以下几个方面工作:首先,利用java的htmlunit工具类,针对目前使用频次最多的几个医患问答平台依次编写相应的爬虫规则,爬取当前已经记录的疾病、病症以及医患问答记录,并对数据进行结构化处理。其次,使用双向长短时记忆网络和条件随机场算法,对每个问答记录进行命名实体识别,提取出每个问答的疾病和症状的相关信息,并构建相应的“疾病-症状”网络。然后,本文针对实际数据的特点提出一个更能表现单节点预测正确率的N点连接精确度指标,并在已有的链路预测算法上进行改进,提出NIS算法来进行疾病之间连边的预测和症状之间连边的预测。同时,本文分析了医患平台上疾病频次的分布以及症状在每个疾病中的分布,提出了两种权重矩阵的计算方法来进行疾病的预测。最后,使用SSM框架来搭建该系统,在系统中集成了命名实体识别算法、链路预测算法以及疾病预测算法。系统的前端开发,使用AJAX异步传输所有信息,提升用户使用系统的流畅度。为了提高系统的可维护性,在开发该系统时候,采用前后端分离,前后端的交互利用JSON格式传输数据。同时对外提供了API接口,方便其他开发人员使用本系统的方法和结果。
语音驱动的人脸视频合成系统的设计与实现
这是一篇关于语音动画,人脸动画合成,语音驱动,双向长短时记忆网络,视频合成的论文, 主要内容为人类进化心理学的研究结果表明人从语音序列与面部动画的双模态输入中所获得的信息比其中任何一个单一模态输入所获得的信息都多,而且对信息的理解更加有效。语音动画是指合成出与语音序列一致或同步的人脸动画的一种技术,该技术在人机交互、电影、游戏等领域具有广泛的应用价值,是虚拟人物的人脸表情和动画生成的核心技术基础之一。本文主要研究语音动画中面部特征与语音特征参数之间映射关系模型的建立,并设计和实现一个语音驱动人脸视频合成系统。首先,本文提出了基于深度双向长短时记忆网络(Bi-directional Long Short Term Memory,Bi-LSTM)的人脸特征与语音特征参数之间的映射模型。该模型采用同步的音视频双模态信息进行训练,得到语音信号的梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与人脸约束局部模型(Constrained Local Model,CLM)下人脸特征点的映射关系。其次,提出了语音驱动的人脸动画生成算法。该算法通过训练好的映射模型,得到驱动语音的人脸特征点参数的预测输出,在此基础上结合仿射变换和视频编码技术实现了人脸动画视频的生成。实验使用约1000分钟奥巴马时任美国总统期间的每周电台演讲视频作为训练语料,映射模型实验结果表明,本文提出的基于Bi-LSTM映射模型明显优于单向的长短时记忆网络(Long short-term memory,LSTM),而且在进行参数调优后取得了 89.5%预测准确率。语音驱动的人脸动画生成结果表明,合成的视频具有自然、流畅的效果,视频帧率达到100fps。在输入相同的驱动语音时,合成视频的客观评价指标误差平方和(the Sum of Squares due to Error,SSE)的平均值为9.19,对合成视频的主观评价指标视频流畅度和逼真度,在满分10分的情况下,分别得分7.84和8.98分。最后,根据前述的映射模型和人脸动画合成方法,本文设计和实现了一个基于B/S(Browser/Server,浏览器/服务器模式)架构的语音驱动的人脸视频合成系统,系统拥有良好的可操作性,可以应用于任何人声的驱动语音合成出自然、同步的人脸视频。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码助手 ,原文地址:https://m.bishedaima.com/lunwen/47925.html