基于情感词典与预训练模型的蒙古语多模态情感分析研究
这是一篇关于情感词典,BPE-Dropout,预训练模型,多模态,决策融合的论文, 主要内容为近年来,随着社交媒体的发展,如微博、论坛、抖音的出现,人们越来越倾向于在平台发表文字、表情符、短视频来表达个人情感,由此不同类型数据的信息交互的数量日益增多。面对海量的多模态信息,根据其情感进行分类,从而引导用户从大量数据中找到有价值的信息,已成为当前的研究热点之一。但是,相比中文、英文的情感分析研究,当前蒙古语情感分析研究存在着情感语料匮乏、文本情感特征单一化以及多模态特征提取不充分等问题,在一定程度上影响了蒙古语情感分析的效率。针对以上问题,本文进行以下三个方面的研究。(1)针对蒙古语情感语料匮乏而导致模型训练不足的问题,提出了一种基于情感词典和预训练模型的蒙古语情感分析方法。在该方法中,首先,分别创建蒙古语文本情感词典和表情符情感词典作为先验知识,以增强语料数据的情感信息。其次,采用BPE-Dropout分词技术对蒙古语文本数据进行切分,通过增加蒙古语切分子词的方式来缓解未登录词的问题。然后,将文本词向量和表情符向量拼接得到最终的语料向量化表示。最后,采用基于Transformer结构的模型进行训练,以提高模型特征提取能力。(2)针对蒙古语文本情感特征提取单一化的问题,提出一种基于残差网络(Res Net)和卷积门控循环网络(Convolutional Gated Recurrent Unit,Conv GRU)的图像情感分析模型。首先,预处理动画GIF图像将其转化为静态图像序列。然后,分别利用Res Net和Conv GRU网络提取动画GIF图像的时空特征进行情感类别预测。实验结果表明,该网络结构具有一定的特征提取优势,有利于学习动画GIF图像特征,并且能够在一定程度上提升模型情感分析效率。(3)针对单模态蒙古语情感分析模型鲁棒性不足的问题,提出了一种多模态融合的蒙古语情感分析方法。将提取文本和表情符特征的网络与提取GIF图像特征的网络做并行处理,然后采用决策级融合方法将两个网络模型的分类结果进行加权决策融合,得到最终多模态情感分析模型的预测结果。实验结果表明,充分利用不同类型数据的情感特征,能够有效提升情感分类效率。在以上研究中,本文分别通过多组对比实验验证模型的有效性,并采用准确率、精准率、召回率和F1值指标评估情感分类模型性能。实验结果表明,本文提出的蒙古语多模态情感分析方法能够显著提升情感分类模型的性能,这对包括蒙古语在内的低资源语言的情感分析研究及应用具有重要意义。
基于图像-文本数据融合的推荐方法研究
这是一篇关于推荐系统,SqueezeNet,Word2vec,决策融合,层叠推荐的论文, 主要内容为推荐系统能够利用商品本身的数据或结合用户行为向用户推荐感兴趣的商品,提供信息和建议,是当前电商系统实现精准服务和提高“粘性”的主要技术手段。电商系统中的大部分商品具有文本和图像两种数据,这两种数据中所包含的特征信息常常具有互补性,有效融合这两种信息可以大幅度提高推荐结果的准确性和可解释性,但有很大的难度,是目前的研究热点。本文以探索利用图像和文本两种信息的融合方法实现有效推荐为主要目标,重点解决不同类别数据特征抽取的准确性和两种特征的融合问题。对于商品的图像数据,以SqueezeNet网络为基础,通过缩小Fire Module中Squeeze和Expand结构的卷积核大小,并增加池化层数目,提高类别特征的利用率。对于商品的文本数据,将数据经过分词、去停用词之后的数据输入到网络中,得到特征词向量,然后利用余弦相似度计算方法得到文本间的相似性。最终采用决策融合的方式将两种模态的特征融合。通过对网络层数、卷积核大小以及池化层数目进行实验,本文所改进的SqueezeNet网络,识别精确度达到98%。通过PCA降维算法验证,当隐藏层单元数为10的时候,Word2vec对文本特征有较好的区分性。最后,相比仅利用文本和仅利用图像数据,本文所提出的融合算法在准确率、召回率、F值表现最优。实验和分析表明,论文中改进的图像特征提取算法,提高了对关键特征的利用率,合理的文本特征提取算法对图像特征补充起到了关键作用,将图像和文本数据进行决策融合之后,最终利用层叠推荐解决了不同模态特征在特征层面上的差距较大以及高维难以处理的问题,有效完成了推荐任务。
基于图像-文本数据融合的推荐方法研究
这是一篇关于推荐系统,SqueezeNet,Word2vec,决策融合,层叠推荐的论文, 主要内容为推荐系统能够利用商品本身的数据或结合用户行为向用户推荐感兴趣的商品,提供信息和建议,是当前电商系统实现精准服务和提高“粘性”的主要技术手段。电商系统中的大部分商品具有文本和图像两种数据,这两种数据中所包含的特征信息常常具有互补性,有效融合这两种信息可以大幅度提高推荐结果的准确性和可解释性,但有很大的难度,是目前的研究热点。本文以探索利用图像和文本两种信息的融合方法实现有效推荐为主要目标,重点解决不同类别数据特征抽取的准确性和两种特征的融合问题。对于商品的图像数据,以SqueezeNet网络为基础,通过缩小Fire Module中Squeeze和Expand结构的卷积核大小,并增加池化层数目,提高类别特征的利用率。对于商品的文本数据,将数据经过分词、去停用词之后的数据输入到网络中,得到特征词向量,然后利用余弦相似度计算方法得到文本间的相似性。最终采用决策融合的方式将两种模态的特征融合。通过对网络层数、卷积核大小以及池化层数目进行实验,本文所改进的SqueezeNet网络,识别精确度达到98%。通过PCA降维算法验证,当隐藏层单元数为10的时候,Word2vec对文本特征有较好的区分性。最后,相比仅利用文本和仅利用图像数据,本文所提出的融合算法在准确率、召回率、F值表现最优。实验和分析表明,论文中改进的图像特征提取算法,提高了对关键特征的利用率,合理的文本特征提取算法对图像特征补充起到了关键作用,将图像和文本数据进行决策融合之后,最终利用层叠推荐解决了不同模态特征在特征层面上的差距较大以及高维难以处理的问题,有效完成了推荐任务。
离散型数据的行为表征与分类算法研究
这是一篇关于文本分类,多元表征提取,决策融合,网络流量分类,Transformer 预训练的论文, 主要内容为随着网络技术的发展,文本、图片、视频等数据呈爆发式增长,数据传输过程中也会产生大量的网络流量数据。面对这些海量数据,采用分类技术对其进行高效管理与分析预测,可以为人们提供可靠的行为决策参考和方便的个性化服务。离散型数据因其在深度学习领域更接近知识层面的表达并且是一些算法输入的固定形式被关注,本文选择文本和网络流量两种具有相似组成结构的离散型数据进行分类算法的研究。针对文本领域的多分类场景,基于Transformer进行算法的改进,通过多元表征提取与决策融合机制实现高准确率的文本分类;针对网络流量领域的少量带标签训练样本场景,基于Transformer设计预训练任务实现网络流量表征的提取,并根据不同分类场景下游微调,提升了网络流量分类任务的分类精度和稳定性。另外,本文还开发了一个网络流量行为表征分析与检测系统,实现网络流量分类算法的落地。研究内容如下:1.提出了一种基于多元表征提取与决策融合的文本分类算法。文本序列是一种典型的离散型数据,文本分类技术在实际中也得到广泛应用。针对文本在多分类场景下模型因分类标签过多导致分类精度下降以及分类效果不稳定的问题,本文采用分层级训练方式减少分类标签数,降低因标签数过多对模型训练的影响;基于堆叠的Transformer与多尺度卷积进行多元表征的提取,并采取决策融合机制做出最优行为或语义标签选择,提高模型在不同分类目标上表现的稳定性与分类精度。该算法在海关货物编码分类数据集HS-1和HS-2上进行了验证,分类精度与对比模型相比得到显著提升,为海关人员提供高准确率的报关行为选择。2.提出了一种基于Transformer预训练的网络流量分类算法。网络流量报文是由离散的字符序列构成,也是一种离散型数据。针对网络流量在少量带标签训练样本条件下训练会导致较低分类准确率的问题,将NLP中的预训练模型引用到网络流量上。将网络流量进行类文本化预处理并构建自监督任务训练模型,再根据不同分类场景进行下游微调。该算法在四个公开的数据集、攻击行为检测和协议分类两种分类场景进行了实验,证明了算法的正确性和有效性。3.开发了一个网络流量行为表征分析与检测系统。基于第二个研究点的算法理论,针对现有的异常行为检测平台存在检测精度较低、无法提取中间网络流量表征数据以及界面比较繁琐等问题,开发一个集成网络流量行为表征分析与异常行为检测于一体的系统。用户通过简洁易操作的界面不仅可以进行网络流量表征的分析与提取,还可以实现批量数据的异常行为检测,满足用户的表征分析与检测需求,为用户带来更好的体验感。
双通道信息机制下的微表情识别研究
这是一篇关于微表情识别,面部颜色特征,决策融合,深度互学习,标签平滑损失的论文, 主要内容为微表情作为一种独特的面部表情,和一般的表情比较,通常具有如下几个特点:一、动作显现时间特别短暂,一般只有1/25s~1/3s;二、面部情绪动作强度比较低,很难被人们发觉;三、是由人类在无意识状态下产生的;四、对微表情方面的研究通常在视频资料中展开,而对普通面部宏表情的研究在单帧的图片中就可以进行。由于微表情情绪都是由人类在其自身意识没有感知的状态下自发生成的,一般很难被隐藏,能够揭示人类最为真实的情感,因而使得微表情在人类真实情感的研究中相对可靠,拥有广阔的应用场景。但是微表情情绪较为复杂,存在特征微小不易被捕捉的缺陷,采用单通道情感分析很难提升微表情的识别率;而且微表情样本数目过小,样本类别分布不均匀,搭载深度神经网络进行训练极易造成网络过拟合的问题。针对上述问题,本文设计了双通道决策信息融合网络和双通道信息交互网络两种模型来分别进行微表情识别,实验结果表明这两种网络模型均对微表情的识别率有一定程度的提升。本文主要工作如下:(1)首先介绍了几种微表情数据集及常见的微表情特征提取方法,然后将选用的微表情数据集样本进行人脸的定位与裁剪,获取合适的人脸面部图像,剔除无关的背景信息,接着对裁剪后的微表情序列图片分别进行动作放大和颜色放大,最后为给纹理特征的提取提供帧数统一化的微表情图片序列,对动作放大后的序列图片进行TIM时域插值。(2)针对单一模态的微表情识别准确率无法提高的问题,本文提出一种微表情面部颜色特征提取算法,然后将该算法提取的面部颜色特征与LBP-TOP算法提取的纹理特征进行决策信息融合,构建了一种微表情双模态情感识别模型。该模型首先采用均匀LBP-TOP算法从经过预处理的微表情数据中提取相应的纹理特征;其次计算微表情两帧序列图片的每一个像素点之间的Lab色差,由此获得面部的颜色特征,为剔除获取的颜色特征中冗余的部分对其进行嵌入式特征选择,然后分别训练两种模态的分类器,并将两种模态训练得到的分类信息根据D-S证据理论进行决策信息融合,最后得到微表情情绪分类结果。双模态的微表情情感识别率相比于单一模态的纹理信息和面部颜色信息的识别率均有提升,在CAMSEⅡ和SMIC数据库上分别提升了3.38%、16.47%和2.85%、15.95%。(3)针对小样本的微表情数据集在进行训练时由于样本数据不足进而引起的网络过拟合问题,本文构建了一种双通道信息交互网络,并对两个分支网络分别引入标签平滑损失函数,两个网络之间采用拟态损失函数进行信息交互,并对KL损失、JS损失以及Wasserstein距离损失三种拟态损失的结果进行对比分析。其中,引入标签平滑损失和Wasserstein距离损失后,Net1网络在CASMEⅡ和SMIC数据集上分别提升了7.5%、7.34%,Net2网络在CASMEⅡ和SMIC数据集上分别提升了4.9%、8.06%,标签平滑损失函数和拟态损失函数成功抑制了网络的过拟合问题,提升了网络对于微表情的识别率。
基于纹理特征融合的煤岩图像分类方法研究
这是一篇关于煤,煤岩图像,破坏类型,纹理特征,决策融合,双线性神经网络,智慧矿山的论文, 主要内容为煤体破坏类型是复杂矿区煤岩动力灾害防治和瓦斯突出危险性评估的关键因素,但在井下实际中,其识别方法仍以人工物理观察辨别为主。在智能化、高效化和无人化的智慧矿山建设需求下,将煤体破坏类型作为分类标准,根据不同煤体破坏类型具有显著纹理视觉差异的特点,将通道注意力和差异性纹理特征作为切入点开展了基于深度学习的煤岩图像分类方法研究。针对现有基于深度学习的图像分类方法普遍缺少纹理特征的针对性,存在分类精度较低、难以同时适用于简单纹理和复杂纹理分类的问题。首先提出了改进的双线性神经网络模型B-SE-Res Net,该模型在有益于纹理特征提取的双线性结构基础上,采用SE-Res Net作为特征提取子网络,在避免过拟合的基础上能够给予各特征通道不同程度的注意力,从而提高纹理图像的分类准确率。然后,基于B-Res Net18模型构造能够融合图像差异性纹理特征的并行双线性网络结构,采用自适应决策融合方法,对该网络的通道特征进行权重赋予,获取分类标签,得到了能够满足复杂纹理图像分类需求的B-FT-Res Net模型。以加权平均精确率、召回率和F1-Socre等作为综合评价指标,在与纹理相关的公共数据集KTH-TIPS,KTH-TIPS-2b,UIUC上进行实验,结果表明所提出模型具有较强的纹理图像分类能力,相较于经典方法和近年先进算法中的最优结果,平均提升了3.06%和2.43%。最后,为获得适用于井下煤岩破坏类型图像的分类模型,使用高清防爆相机,在孟村煤矿、神东煤矿、阜生煤矿等矿区井下采集五种破坏类型的煤岩图像,构建了破坏煤岩图像数据集Tectonic Coal,所提出的B-FT-Res Net模型在该数据集上达到了99.52%的平均分类准确率。该论文有图29幅,表9个,参考文献75篇。
离散型数据的行为表征与分类算法研究
这是一篇关于文本分类,多元表征提取,决策融合,网络流量分类,Transformer 预训练的论文, 主要内容为随着网络技术的发展,文本、图片、视频等数据呈爆发式增长,数据传输过程中也会产生大量的网络流量数据。面对这些海量数据,采用分类技术对其进行高效管理与分析预测,可以为人们提供可靠的行为决策参考和方便的个性化服务。离散型数据因其在深度学习领域更接近知识层面的表达并且是一些算法输入的固定形式被关注,本文选择文本和网络流量两种具有相似组成结构的离散型数据进行分类算法的研究。针对文本领域的多分类场景,基于Transformer进行算法的改进,通过多元表征提取与决策融合机制实现高准确率的文本分类;针对网络流量领域的少量带标签训练样本场景,基于Transformer设计预训练任务实现网络流量表征的提取,并根据不同分类场景下游微调,提升了网络流量分类任务的分类精度和稳定性。另外,本文还开发了一个网络流量行为表征分析与检测系统,实现网络流量分类算法的落地。研究内容如下:1.提出了一种基于多元表征提取与决策融合的文本分类算法。文本序列是一种典型的离散型数据,文本分类技术在实际中也得到广泛应用。针对文本在多分类场景下模型因分类标签过多导致分类精度下降以及分类效果不稳定的问题,本文采用分层级训练方式减少分类标签数,降低因标签数过多对模型训练的影响;基于堆叠的Transformer与多尺度卷积进行多元表征的提取,并采取决策融合机制做出最优行为或语义标签选择,提高模型在不同分类目标上表现的稳定性与分类精度。该算法在海关货物编码分类数据集HS-1和HS-2上进行了验证,分类精度与对比模型相比得到显著提升,为海关人员提供高准确率的报关行为选择。2.提出了一种基于Transformer预训练的网络流量分类算法。网络流量报文是由离散的字符序列构成,也是一种离散型数据。针对网络流量在少量带标签训练样本条件下训练会导致较低分类准确率的问题,将NLP中的预训练模型引用到网络流量上。将网络流量进行类文本化预处理并构建自监督任务训练模型,再根据不同分类场景进行下游微调。该算法在四个公开的数据集、攻击行为检测和协议分类两种分类场景进行了实验,证明了算法的正确性和有效性。3.开发了一个网络流量行为表征分析与检测系统。基于第二个研究点的算法理论,针对现有的异常行为检测平台存在检测精度较低、无法提取中间网络流量表征数据以及界面比较繁琐等问题,开发一个集成网络流量行为表征分析与异常行为检测于一体的系统。用户通过简洁易操作的界面不仅可以进行网络流量表征的分析与提取,还可以实现批量数据的异常行为检测,满足用户的表征分析与检测需求,为用户带来更好的体验感。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码海岸 ,原文地址:https://m.bishedaima.com/lunwen/54447.html