基于用户行为的推荐算法研究与应用
这是一篇关于推荐系统,用户行为,神经网络,Item2Vec,特征融合的论文, 主要内容为基于传统协同过滤和基于内容的推荐算法具有运算速度快、可解释性强等特点,是目前主流的推荐算法,但是由于泛化能力较差、个性化程度偏低等局限性,使得推荐性能难以进一步提升。随着人工智能的快速发展,使用深度学习技术解决推荐系统问题成为了一种可行途径。研究工作基于互联网中的点击、浏览、评分等用户行为数据和神经网络算法展开,重点如下:针对显性评分行为,提出了一种基于空间维度距离度量和用户显性行为的推荐算法(Recommendation Algorithm based on Spatial Dimension Distance Measurement and User Explicit Behavior,SDDM-UEB)。首先,对Item2Vec模型进行了改进,采用随评分等级动态变化的窗口来提高项目特征训练的准确性;其次,将所提的空间维度距离度量方法用于用户与项目的特征融合阶段,通过度量用户与项目在潜在空间中不同维度上的距离来获得二者的交互特征,并经全连接层对预测评分进行输出;最后,针对由于长期推荐同类项目而导致的用户兴趣疲劳问题,采用一种基于余弦相似度的Top-K列表重排序方法,以实现兴趣疲劳的有效缓解。针对隐性行为,采用融合标签信息与用户隐性行为的方式挖掘用户兴趣方向,并通过神经网络实现点击预测。特别的,在用户特征表示阶段,引入时间衰减函数来捕捉用户的兴趣变化,从而实现点击预测性能的提升。SDDM-UEB算法在Movie Lens 1M和Movie Lens 100K两个数据集上的RMSE指标分别为0.820和0.867,MAE指标分别为0.641和0.677。融合标签信息与用户隐性行为的推荐算法在Movie Lens 1M数据集上的召回率达到了0.37(推荐长度为100)。所提两种算法均优于传统算法。最后,对电影推荐系统应用进行了系统需求分析,并基于PyQt框架和MySql数据库对系统的客户端和服务端进行了设计和实现。图28幅;表12个;参64篇。
基于通用检测和跨层特征整合的人脸检测算法研究
这是一篇关于人脸检测,目标检测,特征融合,深度学习的论文, 主要内容为计算机视觉技术领域的研究进入了深度学习时代后,人脸检测作为计算机视觉领域中一直都在研究的问题,也跟随人工智能技术不断向前发展,深度学习时代的人脸检测算法也可以从跟通用目标检测的关系来从两个不同的角度看待,分别是专为检测人脸目标而设计的检测器,此类算法大多从人脸与其他目标相比而独有的特征出发而设计,另一种就是在通用目标检测算法的基础上,做一定针对于人脸目标的调整,此类算法的设计往往更加简洁,且具备更高的可复用性。人脸检测中提出的方法几乎涵盖了从数据处理到损失设计的深度学习训练的每个部分。这些方法大部分都专注于小尺寸目标的挑战。然而,实际上在通用对象检测中有很多方法,同样专注于解决类似的问题。因此,基于通用检测的人脸检测和特定人脸目标检测算法都在不断向前发展。随着人脸检测算法的效果越来越好,同时也越来越特定于检测人脸目标,比如经典的SSH、S3FD以及HAMBox里的anchor补偿策略等等。鉴于此,本文基于通用检测模型,设计了一个简单而又实用的人脸检测模型,使其便于使用和复现。在此之前,基于通用检测模型Retina Net设计的人脸检测模型Retina Face和Tina Face已经在WIDER FACE数据集上取得了较好的成绩。YOLO系列是目标检测领域最为广泛使用的单阶段检测模型,YOLOv5是YOLO系列的最新版本,为了便于比较改进效果和使用复现,我们选择了YOLOv5做为基准,通过对于YOLOv5数据增强模块、网络结构和loss函数的改进,此基础上针对人脸检测的部分特性作出修改,设计一个全新的检测模型。在设计基于通用检测的人脸检测算法时,本文对特征融合网络的改进在人脸检测任务上取得了较好的性能表现,包括将PANet与注意力机制相合并以增加不同分辨率特征融合的有效性,增加一个尺度的特征图,也对各个尺度的检测精度带来了一定程度的提升,因此本文从特征融合网络的角度出发,在基于通用检测的人脸检测模型的基础上继续作出改进,增加不同层次特征的之间的跨层连接,提高特征融合的效率,改善尺度差距过大的人脸目标的检测效果,并通过实验验证了这一策略的有效性。
基于特征融合的相关滤波目标跟踪算法研究
这是一篇关于目标跟踪,相关滤波,特征融合,背景感知,深度特征的论文, 主要内容为目标跟踪作为计算机视觉中的一项基础研究,主要任务是确定视频序列中目标的位置。相关滤波目标跟踪算法以其精度高、速度快的特点,成为跟踪领域的主流研究方向之一。但跟踪目标自身的变化以及跟踪场景的复杂多变,仍然给算法的跟踪性能带来巨大挑战。本文主要针对现有相关滤波跟踪算法存在的不足进行研究和改进,以提升算法的跟踪性能。主要工作内容如下:1.针对背景感知相关滤波(Background-Aware Correlation Filter,BACF)算法在特征选择、尺度估计与模型更新方面的不足进行研究与改进,提出了一种基于背景感知与自适应特征融合的相关滤波跟踪算法。以特征可靠性为参考指标在响应层实现方向梯度直方图(Histogram of Oriented Gradient,HOG)特征和颜色名(Color Name,CN)特征的自适应融合,通过融合特征建立更为鲁棒的目标外观模型;引入独立于位置滤波的一维尺度滤波器,实现快速尺度估计;采用一种高置信度模型更新策略,以最大响应峰值和平均峰值相关能量(Average Peak-to-Correlation Energy,APCE)评估样本置信度,将满足高置信度条件的样本用于模型更新,避免模型漂移。实验结果表明,所提算法在跟踪精度和跟踪速度上都有更好的表现。2.针对现有相关滤波算法使用手工特征导致目标外观模型的表达能力和鲁棒性受限的问题以及算法在目标遮挡、快速运动和出视野情况下表现不佳的问题,提出了一种基于Res Net深度特征的相关滤波跟踪算法。使用Res Net-101网络提取多层深度特征,并在响应层面融合多层深度特征,以同时保留浅层特征在定位精度方面和深层特征在辨别目标方面的优势;引入一种目标重检测机制,当位置滤波结果的置信度低于阈值时认为目标已丢失,然后通过Edge Boxes方法结合置信度评估与运动约束重新找回目标,完成后续跟踪,提高算法在目标遮挡、快速运动和出视野情况下的整体表现。实验结果表明,所提算法在复杂场景下拥有较好的跟踪性能。
金融微博细粒度情感分析研究与应用
这是一篇关于情感分析,特征融合,机器学习,股票预测的论文, 主要内容为文本情感分析已经成为自然语言处理领域的研究热点,目前该领域的研究主要集中在电影评价、商品评论和社会舆情等方面,而在金融领域的研究较少。鉴于此,本文提出一种金融微博细粒度情感分析算法,并将情感分析结果应用于股票指数预测模型,通过探究投资者情感与上证综合指数之间的相关性提升模型预测的准确率,为投资者决策提供依据。研究工作分多步完成:首先,设计并实现爬虫系统收集2017/2/27到2017/7/31期间大盘相关微博信息共91万余条,确保研究对象的准确性;其次,将情感细分为好、恶、怒、惧和无情感5类,并提出基于平均余弦相似性的领域情感词典自动构建算法,该算法解决了部分新增情感词余弦值较高但语义却相反的问题,提高了领域情感词典的准确度;然后,根据金融微博情感表达特点提出基于规则和机器学习的细粒度情感分析算法,该算法通过融合先验情感特征和统计规律情感特征使得细粒度情感分析的宏F-measure值提高至70.2%,相较基于情感词典和规则的情感分析算法提高15%;最后,将上述研究成果应用于上证综合指数预测,实验结果显示综合考虑收盘价格和“怒”情感指数的支持向量机模型对股票指数走势预测效果最好,涨跌预测准确率为80.95%,平均绝对百分比误差为0.51%,相较仅考虑收盘价格的模型涨跌预测准确率提高33.34%。本文研究结果表明针对金融领域的情感分析具有现实意义,提出的基于金融微博细粒度情感分析的股票指数走势预测模型具有一定的参考价值。
基于多特征融合的虚假评论识别
这是一篇关于虚假评论识别,特征融合,时间特征的论文, 主要内容为随着互联网和电子商务的快速发展,更多的用户开始依赖电商平台中的在线评论来做出购买决策。然而,虚假评论已成为一个越来越严重的问题,给消费者带来了误导和困惑。因此,如何检测和过滤虚假评论已成为当前研究的热点。目前,大多数虚假评论识别的研究采用传统机器学习方法。然而,这种方法在自然语言处理方面的依赖性较高,而且识别能力较弱。考虑到虚假评论往往具有高度的仿真性,因此仅从单一维度的评论内容特征难以构建准确的识别模型。采用基于多特征融合的检测方法能够有效解决单一特征识别不准确的问题。目前最常见的多特征检测方法是通过对评论文本的内容、情感、语义等方面进行分析来识别虚假评论。但是,这种方法忽略了评论者的行为特征和时间特征,导致准确率偏低。为提高虚假评论检测的准确性,本文研究如何利用评论者的行为特征和时间特征来辅助虚假评论检测。主要内容如下:首先,本文融合文本特征、评论者行为特征以及时间特征,提出了一种多特征融合的虚假评论检测模型。该模型利用深度学习模型中表现优异的Bi LSTM网络和Bert网络,在模型构建阶段提取不同维度的特征进行深度融合。通过这种方式,该模型可以更全面、准确地识别虚假评论。其次,本文依托Yelp芝加哥餐厅公共数据集进行多阶段对比实验,本文提出的方法有效提升了虚假评论检测能力。实验结果表明,本文的方法相较于现有研究模型,在分类精确度、召回率以及F1分数这三个方面分别提高了5.4%、6.1%、5.7%。最后,本文开发了基于多特征融合的虚假评论识别系统。在检测能力上,该系统的优势在于依托本文多特征融合模型,提高了虚假评论的识别准确度。在用户交互上,该系统进行虚假评论识别时支持单条和批量评论检测。用户可以方便、快捷地使用该系统来识别虚假评论,从而更好地保护自己的消费权益。
基于Bi-LSTM与注意力机制的实体关系抽取
这是一篇关于关系抽取,双向长短期记忆网络,注意力机制,最短依存路径,特征融合的论文, 主要内容为随着全民互联网时代的到来,如何从大规模、非结构化信息中快速准确获取所需知识成为了被广泛关注的课题。在对海量信息进行挖掘分析的过程中,信息抽取是一项基本任务。信息抽取是指从一段文本中抽取特定信息并形成结构化数据的过程。而实体关系抽取是信息抽取的重要组成部分,主要用于识别出文本中实体之间的语义关系,也是智能问答和知识图谱等诸多应用系统的基础。传统的关系抽取方法多基于规则或基于统计,成本较高且不适用于大规模数据处理,而基于深度学习的抽取方法可自动学习句子特征,无需复杂的特征工程,抽取效果也更好。但目前大部分基于深度学习的方法忽略了对文本语义的挖掘。因此,基于已有研究基础,考虑到Bi-LSTM可捕捉双向语义依赖的优势以及注意力机制可为不同作用的语义特征分配不同权重的特点,本文结合这两者进行实体关系抽取。并在特征抽取层引入了词性、实体识别类型、相对位置以及实体对上下文这四种特征,为获取实体间的主要联系,还引入了最短依存路径。为使得模型具备判断语义关系方向的能力,引入了实体关系方向表示层。最后将不同的实体特征计算结果通过softmax归一化映射为所有语义关系的概率,输出实体关系所属类别,从而实现一个完整的关系抽取模型。实验采用SemEval2010 Task8数据集,并为输入特征、模型结构、对抗过拟合策略以及模型本身设置了对比实验,结果表明本文所提出方法的F1值与仅结合注意力机制的Bi-LSTM模型和引入实体关系方向表示层后的该模型相比均有一定提升。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码码头 ,原文地址:https://m.bishedaima.com/lunwen/46483.html