8篇关于主题模型的计算机毕业论文

今天分享的是关于主题模型的8篇计算机毕业论文范文, 如果你的论文涉及到主题模型等主题,本文能够帮助到你 基于外部信息的短文本主题建模研究 这是一篇关于主题模型,短文本

今天分享的是关于主题模型的8篇计算机毕业论文范文, 如果你的论文涉及到主题模型等主题,本文能够帮助到你

基于外部信息的短文本主题建模研究

这是一篇关于主题模型,短文本,概念信息,双概念,词特征的论文, 主要内容为主题模型作为一种文本挖掘技术,在常规文本建模上的发展已经较为成熟,被广泛应用于特征提取、主题分析、推荐系统等领域。然而随着社交媒体的发展,短文本正在不断成为互联网中文字表达的主要形式,这为主题模型的研究带来了新的挑战。现有主题模型往往基于文本本身的词共现信息进行建模,没有引入额外先验知识进行补充,同时短文本存在词共现较为稀疏的特性,该特性影响了主题建模的准确性,导致无法提取优质的主题特征。针对此问题,本文从引入外部信息到主题模型中入手,重点解决短文本主题建模文本稀疏性问题以及先验知识匮乏问题。其主要内容包括:(1)词特征二值化。根据词向量的均值将预训练好的词向量转换为数值为0或1的二值化标签,保留词向量中特征突出的部分,舍弃词向量中特征较弱的部分,获取词特征信息。(2)基于Concept Net的Bi-Concept对构建。基于Concept Net语义网络对BTM(Biterm Topic Model)构建biterm的思路进行改进,构建Bi-Concept对集合,获取概念信息并避免引入大量的噪音。(3)双概念主题模型(Bi-Concept Topic Model,BCTM)构建。BCTM结合代表词特征信息的二值化标签,计算出特定主题下词汇受到词特征信息影响的权重,使得主题-词矩阵下每个词汇生成其特有狄利克雷先验。同时基于Bi-Concept对进行采样,补足文本信息并涵盖了概念网络的知识,提升短文本主题模型准确率。就以上研究,本文将词特征信息与概念信息两种外部信息引入到主题建模过程中,补足短文本稀疏的词共现以及先验信息,并将所构建的BCTM在不同的文本单元与基准模型进行了主题建模实验对比。实验结果证明,BCTM在困惑度、主题一致性以及文本分类准确率上的表现皆优于基准模型,证明了引入外部信息到短文本主题建模的有效性。

基于文本处理的新闻推荐系统的设计与实现

这是一篇关于个性化新闻推荐,主题模型,文本处理,用户兴趣模型的论文, 主要内容为信息技术的发展使人们获取资讯的方式愈发便捷,但是也带来了信息过载的问题。同时,随着移动互联网的兴起与智能终端的普及,用户对于精准个性化推荐的要求也越来越高。在个性化新闻推荐领域,如何从大量的新闻资讯中挖掘出用户感兴趣的内容并进行精准推荐是一个亟待解决的问题。在此背景下,本文通过研究个性化推荐技术,对基于内容的推荐算法进行改进,围绕个性化新闻推荐中的文本建模部分,通过结合主题模型与向量空间模型,对文本处理的过程进行优化,提升新闻推荐系统的准确性。在本文设计与实现的基于文本处理的新闻推荐系统中,文本处理方法是关键,文本内容挖掘决定了对用户兴趣的分析是否准确。因此,在新闻文本处理方面,引入主题模型,将其与传统的向量空间模型进行结合,从主题与关键词两个方面对新闻的文本内容进行挖掘,同时,考虑到新闻的时效性问题,新闻发布在系统内的时间也需要作为新闻文本建模的一个重要指标。在此基础上,将新闻与用户的行为结合在一起,对用户的主题及关键词偏好进行计算,结合用户产生行为时的上下文信息,构建更准确的用户兴趣模型。与此同时,对新闻推荐生成的过程也进行改进,综合考虑新闻时效性的问题进行推荐。最后,本文将优化后的推荐算法应用到具体的新闻推荐系统中,给出系统的整体框架,并详细叙述了推荐系统的核心模块的实现细节。在实验验证方面,本文从推荐性能方面对新闻推荐系统进行验证。实验结果表明,本文提出的基于文本处理的推荐算法在准确率、多样性等性能指标上也表现更好。

基于属性的情感分析方法的研究与实现

这是一篇关于情感分析系统,属性挖掘,细粒度,主题模型,LDA的论文, 主要内容为随着Web2.0的兴起和电子商务的飞速发展,通过网络在线购买商品已经成为人们日常生活的一部分。许多消费者习惯在购买商品之后,在电商网站上发表评论信息,表达自己对所购买商品的使用体验和看法。从这些产品评论数据中挖掘出用户对商品的评价信息,一方面可以引导其他潜在消费者选择合适的商品;另一方面商家可以通过这些用户反馈及时改进商品以满足市场需求。然而,对于网络上的海量用户评论,通过人工整理的方式从中获取信息并不现实。因此,使用情感分析技术挖掘用户评论中的有用信息已经成为了近些年来的热门研究课题。传统的情感分析方法难以针对产品属性进行细粒度的情感分析,只能给出产品评论的整体情感倾向。因此,本文在前人研究的基础上,通过对基于属性的情感分析方法进行详细研究,设计并实现了一个针对产品评论的情感分析系统。该系统能够实现对产品属性的情感分析任务。本文首先介绍了情感分析领域的相关技术,然后对情感分析系统做了具体的需求分析。接着介绍了系统的总体架构和详细设计及实现细节。最后通过系统测试,验证了系统功能。具体来说,本文的主要研究成果包括如下两个方面:(1)对现有的情感分析方法进行研究,针对中文产品评论,提出了基于属性的情感分析方法。本文通过基于关联规则的属性提取算法来挖掘产品属性,并利用基于LDA主题模型的情感分类算法对评论的情感倾向进行判别。(2)将基于属性的情感分析方法应用于实际,设计并实现了一个产品评论情感分析系统。使用该系统能够对产品评论进行属性级和评论级两种不同粒度的情感分析。此外,该系统还提供了产品对比和属性搜索等附加功能,使之更加贴近实际应用。通过系统测试,验证了系统的可用性。本文提出的基于属性的情感分析方法在属性挖掘和情感分类上都表现出不错的效果。以此为基础实现的情感分析系统能够较好的对评论文本进行细粒度的情感分析,具有较强的实用性和广阔的应用前景。

学者研究兴趣网络构建与分析

这是一篇关于学者研究兴趣网络,主题模型,复杂网络,二分网络的论文, 主要内容为本文了解到学术领域存在信息过载和信息孤岛等问题,大部分学者没有足够的时间和精力对逐年增长的学术文献进行研读,仅通过关注核心期刊、领域核心人物或领域主要会议来了解研究领域的研究动态,这样容易造成学者在学术上的信息孤岛,无法及时发现和了解自己感兴趣的文章和与自己具有相同研究兴趣的学者。本文受电商平台广泛使用的用户购物兴趣模型启发,以地质领域为例,提出构建学术领域学者研究兴趣网络。在网络构建过程中,利用主题模型良好的主题抽取能力,结合不同的用户兴趣模型构建方法进行网络构建和分析。为了确保学者研究兴趣抽取结果的质量,本文制定了重名消歧规则来识别语料中的唯一作者,并通过领域词典构建、固定短语抽取等方法保证中文分词的质量。在集体学者研究兴趣网络构建过程中,使用LDA主题模型汇总多位学者数据训练一个主题模型,并从中抽取每个学者的研究兴趣,根据学者之间是否具有相同研究兴趣构建学者研究兴趣网络。在个体学者研究网络构建过程中,使用作者主题模型为每个学者训练一个主题模型并抽取研究兴趣,通过计算主题相似度构建学者研究兴趣网络。针对这两种学者研究兴趣网络分别使用复杂网络和二分网络的分析方法进行网络分析,发现地质领域的研究热点集中于油气资源和矿产资源的形成及开发。最后通过抽取学者研究兴趣随时间变化的趋势,构建了动态学者研究兴趣网络。学者研究兴趣网络是学术推荐系统的基础,据此可以进一步探索学者感兴趣文章推荐、具有相似研究兴趣的学者推荐等研究方向。

基于情感分析的推荐系统研究

这是一篇关于文本挖掘,主题模型,情感分析,推荐系统的论文, 主要内容为随着计算机技术的不断更新,互联网逐渐影响着人们的生活方式,相比以前的线下购物,现在更多的采用线上购物的方式,在提高购物效率的同时,消费者也从单纯的购物行为转变为消费体验,随着购物行为的发生,会衍生出一系列的消费者行为,包括购物前的产品咨询、产品历史评论查阅,以及购物后的商品评论、商品追加评论。互联网的便捷性使得电商平台中商品的种类日益增多,对应的商品历史评论也越来越多,导致消费者的选择愈加困难,同时对于商家,怎么快速获取消费者的购物需求并进行精准推荐变得越来越重要。基于上述问题,本文对商品推荐系统进行研究。商品评论以及商品评分能够真实的反映商品的实际情况,而消费者的历史评论又能真实反映消费者的个人偏好,因此本文通过对商品评论文本数据的情感分析,提出了基于消费者情感偏好的商品推荐系统模型。该模型通过主题提取方法,获得消费者最为关注的商品属性,再通过情感分析模型计算出消费者和商品在不同商品属性上的情感得分,进而得到消费者-商品属性情感偏好向量以及商品-商品属性情感得分向量,并引入商品关联度和消费者关联度,最后通过计算推荐度判断出消费者更为感兴趣的商品,实现推荐过程。本文的主要工作如下:首先,通过对推荐系统研究现状的分析,本文总结出主流推荐方法的优缺点,并结合情感分析技术的现状,提出基于消费者情感偏好的推荐系统理论模型。然后,本文提出基于消费者情感偏好的推荐系统分层实施模型,将模型实施分为五个过程,分别为数据获取、数据预处理、商品属性提取、情感分析和商品推荐,并对每个实施过程中使用的方法和技术进行介绍。其次,本文将基于消费者情感偏好的推荐系统理论模型应用在图书销售推荐中,对现有研究中挖掘的图书属性进行分析,引入图书主观属性和客观属性概念。最后,本文利用亚马逊图书数据集进行实证分析,挖掘出图书评论中的图书属性,包括主观属性与客观属性,依据读者评论计算出图书的情感得分矩阵,并构建读者情感偏好矩阵,使用基于消费者情感偏好的图书推荐系统模型进行推荐,并与基于协同过滤的推荐系统进行对比,采用推荐准确率和召回率两个指标判断不同模型的优劣,同时对图书主观属性的有效性进行了验证。

基于商品评论的情感分析的研究与应用

这是一篇关于情感分析,主题模型,情感倾向值,词向量,数据可视化的论文, 主要内容为随着电子商务快速发展,各类电商平台发展迅速的同时,也在改变着消费者的购物方式和购物体验,也极大的改变了我们的生活方式。其中,最能直观反映用户对商品以及电商平台的看法的数据就是商品的评论数据了,如何在大量的评论数据集中寻找具有代表性的主题和情感标签是情感分析的研究重点之一。这些数据不仅仅可以反映出用户对于商品的意见,同时也可以将用户的情感信息提取出来,用来为更多的用户以及电商平台提供商业参考价值,对商品的推荐,商品的改进以及同类商品相互之间的对比提供一个方式。因此基于商品评论数据的情感分析成为了商家和用户所关心的焦点,同时也是本文研究的重要内容。本文的主要研究内容如下:(1)本文研究了LDA主题模型,并在此基础上提出了基于评论的LDA情感主题模型。该模型针对短文本的情感主题分析问题,提出通过LDA主题模型结合情感因子来无监督的分析短文本中的情感主题的算法,并根据此算法建立情感主题模型。(2)本文设计基于情感词典计算词情感倾向值的算法,对传统的词情感倾向值算法SO-HowNet进行了改进。传统情感倾向算法只计算单个词的情感倾向值缺乏实际意义,而没有考虑词语在文档中的权值等问题。本文算法针对情感倾向计算问题,引入TF-IDF度量词的权重和词语普遍重要性,同时结合传统情感倾向值算法来计算词语情感倾向值。(3)本文设计了基于商品评论的情感主题分析模型,该模型通过中文分词以及构建词向量的算法建立可计算的中文词向量词典,然后利用基于评论的LDA情感主题模型分析出情感主题相关词袋,最后结合基于情感词典计算词情感倾向值的算法得出正面评价以及负面评价。通过实验测试,结果表明该推荐模型在准确率和召回率等方面都有了一定程度的提高。(4)最后本文设计了情感主题分析系统,完成了对系统总体功能的设计。通过对数据输入模块,数据分析模块,数据展现模块进行架构以及功能进行详细设计,通过数据可视化实现了情感主题分析系统,帮助用户分析评论数据中的情感主题。

面向专利数据的自动化撮合方法研究

这是一篇关于专利撮合,主题模型,注意力机制,可解释性的论文, 主要内容为随着科技的快速发展和经济全球化步伐的加快,全球范围的知识产权竞争越演越烈。世界各国对知识产权的保护程度越来越高,知识产权中规模最大的专利更是受到世界各国的重视。在我国积极实施创新驱动发展战略的大环境下,我国发明专利申请量和授权量连年稳居世界第一。虽然存在大量的专利文本,但其转化率一直很低。专利转换率低的一个重要原因是专利供需双方找不到其合适的交易对手。专利撮合方法能够为专利供需双方匹配合适的专利交易对手,从而可以提高专利交易的成功机率,进而提高专利转换率。有效提升专利转化率对于我国的自主创新能力和经济创新发展都有着重要的现实意义。然而,专利文本特征复杂且和专利供需文本之间差异性大,专利撮合可解释性弱等都给专利撮合提出了挑战。为了解决上述挑战性问题,本文提出两种面向专利数据的自动化撮合方法,并开发了一个专利自动化撮合系统,具体研究内容如下:(1)针对专利文本特征复杂且和专利需求文本之间的差异性大的问题,本文提出了基于多阶有价关系的专利主题撮合模型。本模型利用语言学配价理论提取专利供需文本中复杂的关系结构特征,并在对关系结构进行分类的基础上进行主题建模。该主题模型通过设计一个专利供需文本共享的隐含主题空间,对专利供需文本进行主题层面的撮合匹配。(2)针对专利撮合可解释性弱的问题,本文提出了基于双层注意力机制的专利撮合模型。本模型利用词级和语句级的注意力机制为专利供需文本中的关键词和关键句子分配较高的权重,使得专利供给文本向量和专利需求文本向量能够获取更有效的供需特征,从而使得专利撮合更加准确,同时根据具有较高权重的词和句子为专利撮合提供细粒度的撮合解释。(3)本文采用Flask后端框架、Vue前端框架和My SQL数据库设计并实现了一个基于上述专利撮合模型的专利自动化撮合系统,该系统包含专利检索、需求检索、专利撮合、需求撮合等功能。

面向微博内容的个性化推荐算法的研究

这是一篇关于微博推荐,社交关系,矩阵分解,主题模型,群组划分的论文, 主要内容为随着社交媒体的普及和广泛应用,导致微博等社交网络信息爆炸,凸显了信息过载问题—一面对海量的数据,用户很难从中找到感兴趣的信息。而推荐系统是解决该问题的一个重要工具,受到了学术界和工业界的广泛关注。但现有微博推荐算法还存在着交互行为时效性考虑不足、数据稀疏条件下推荐准确率低以及群组硬划分等问题。针对上述问题,本文在研究分析现有微博推荐算法的基础上,提出基于联合概率矩阵分解的微博推荐算法和基于拓扑势的微博推荐算法。本文主要的研究内容包括以下三个方面:(1)提出基于联合概率矩阵分解的微博推荐算法。针对交互行为时效性考虑不足的问题,本文在用户之间点赞、转发和评论等交互行为基础上,通过引入遗忘函数,提出一种能区分不同时间段交互行为的影响力评估模型;针对数据稀疏条件下推荐准确率低的问题,引入联合概率矩阵分解方法对用户相似度矩阵和影响力矩阵进行联合概率矩阵分解,缓解了数据稀疏条件下推荐准确率不高的问题。(2)提出基于拓扑势的微博推荐算法。针对群组硬划分的问题,本文使用LDA主题模型分析微博文本的主题,并结合用户自定义标签构建用户兴趣偏好向量,使用KL距离计算用户偏好向量之间的相似度距离,引入拓扑势,根据用户间偏好相似度距离对用户进行聚类,划分出用户群组,实现用户重叠群组划分。(3)设计并实现了微博推荐系统。本文将基于联合概率矩阵分解的微博推荐算法和基于拓扑势的微博推荐算法应用于微博推荐系统,系统包含数据源模块、预处理模块以及微博推荐模块。数据源模块主要功能是爬取微博数据,预处理模块主要是对爬取的数据进行清洗、分类,微博推荐模块实现了两种推荐算法,向用户推荐符合其兴趣的内容。

本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码海岸 ,原文地址:https://m.bishedaima.com/lunwen/46788.html

相关推荐

发表回复

登录后才能评论