分享5篇关于文本推荐的计算机专业论文

今天分享的是关于文本推荐的5篇计算机毕业论文范文, 如果你的论文涉及到文本推荐等主题,本文能够帮助到你

基于主题分析模型的文本推荐和摘要生成方法研究

这是一篇关于文本相似度,文本摘要,文本推荐,主题模型,知识图谱,GPU多线程加速的论文, 主要内容为随着互联网相关技术的不断发展,网络也成为了人与世界沟通必不可少的桥梁。网络中每天都会产生数量极大的文本数据,而如何从大量的网络文本信息中获取到用户喜好的文本信息,便成为了一个热点问题。同时,随着现代人的生活节奏不断加快,大多数人很难花费大量的时间去阅读长篇的报道或是文章,因此,从文章中提取文章的主要信息生成摘要,便可以方便去选择需要阅读的文章。文本推荐与文本摘要生成是常见的自然语言处理任务,文本推荐会根据输入查询序列和文本之间的相似度,挑选出内容相似的文章进行推荐。文本摘要生成,则需要通过分析文本中词汇的关系,提取出长文本中的核心信息予以展示。但常见的文本推荐和摘要模型仅利用了文本表面的字符信息和时序信息,而无法获得到其更深层次的主题特征。同时,此类模型也会因为没有外部知识的引入从而导致常识性问题。所以,本文将分别在文本推荐方法与文本摘要生成方法两个方面做出改进,分别在主题特征,常识知识与后台支持三个方面进行相关研究,并依此对文本分析功能做出实现。其一,文本之间存在语义信息和字符信息的联系,提取出更好的文本特征可以有效的提升下游任务的最终效果。本文提出了在原始文本信息的基础上,通过概率主题模型提取文本隐含的主题特征,知识图谱嵌入获得常识知识,并根据主题特征和常识知识对原始文本信息进行补充,从而将主题层面的语义信息和常识知识引入到文本推荐任务中的方法。同时,文本主题的分析也可以对文本数据中的主题权重进行可视化的分析,从而展示文本中各个主题的关键词。最后通过实验,验证了知识图谱嵌入和主题特征引入的改进方法可以得到更精确的文本相似度,达到了更好的文本推荐效果。其二,文本的摘要根据产生方式的不同分为生成式摘要和抽取式摘要,本文针对生成式摘要生成模型做出了探讨,并分析了常见模型的原理与优劣。之后提出了基于主题注意力的特征修正方法,通过为摘要生成模型引入主题特征的方式,对文本摘要的生成进行了修正。最后通过实验,验证了该方法的有效性。其三,概率主题模型在训练和测试时需要反复进行概率分布采样操作,因此采样的速度极大的影响了模型的训练和测试速度。本文基于GPU的多线程加速算法,建立了概率主题模型工具包,通过在系统底层对常见概率分布的采样算法进行了并行化加速,同时整理、优化了常见的概率主题模型,为概率主题模型的学习与研究提供相应的工具支持。该工具包的采样速度在同类工具包中具有一定的优势。

基于概念抽象水平的文本推荐

这是一篇关于文本推荐,概念从属,信息物理社会,文本难度的论文, 主要内容为随着互联网的快速发展,文本数据规模越来越庞大,给用户带来丰富资源的同时提高了信息获取的代价。传统的文本推荐系统主要根据文本与用户需求的语义或主题的相关性进行推荐。但由于用户自身知识水平或特定目的各异,可能在要求语义或话题相关性的同时,还对被推荐文本的抽象度和难度有要求。当下的文本推荐技术很难满足用户的该项需求。本文主要完成了如下两方面工作:(1)通过结合认知语言学知识,挖掘隐藏在用户行为中的文本阅读方式,本文首先分析用户的当前抽象度认知水平,然后结合文本中概念的抽象度和认知语言学中的认知过程进行推荐文本。用户也可以自主选择抽象和具体两个方向调整推荐内容。(2)为了进一步进行学习内容推荐,本文结合认知语言学知识,分别研究了物理、信息和社会空间下文本抽象度与文本难度之间的内在关联和规律,并分析了用户的学习行为在抽象度上的变化规律,以此扩展文本推荐算法在不同空间内的特征,提高了文本推荐的效率。本文以维基百科文本为数据来源,对上述方法进行实验验证。实验表明,基于抽象度的文本推荐能够满足用户对于不同抽象度文本内容的需求。同时,在物理、信息和社会空间下,我们得到如下结论:(1)物理空间、信息空间下,文本抽象度随着文本难度的增加整体呈现先降低后增加的趋势。该特征反映了用户初入领域时,概括了解该领域的背景和整体知识,再对该领域知识点进行深入学习的学习过程。(2)社会空间下,文本抽象度在文本难度的增加或降低时没有呈现明显变化规律。该特征反映了社会空间下文本的难度不以抽象度的形式体现。结合以上结论,本文针对三大空间下的学习推荐制定了相应的文本内容推荐策略,实验指出该推荐策略能有效优化了用户在三大空间下的学习效率。

基于文档多维度的学术文献推荐研究

这是一篇关于文本推荐,学术文献,用户学术水平,文档概念抽象层次,文档难度的论文, 主要内容为近年来,学术资源的爆炸性增长使得人们在海量数据中快速定位自己需要的信息变得困难。关键词搜索模式虽然可以一定程度缓解信息过载的问题,但是面对海量数据,关键词搜索的结果依旧规模庞大,需要用户在搜索结果中再次甄选所需文献。基于用户历史数据的推荐系统能更精准地获取与用户兴趣相关的文献。现有文档推荐系统通常根据文档的内容和领域相关性或者用户间协同过滤等方式完成推荐,较少考虑到用户的自身学术水平。这使得推荐结果虽然与用户兴趣相关,但部分结果并不符合用户的学术水平和阅读需求,导致利用率较低,造成无效推荐。因此,研究针对学术型用户的学术文献推荐方法具有重要的实用价值。本文完成的主要工作及成果如下:(1)通过网络爬虫技术抓取在线学术文献(2000年-2020年AAAI会议论文集和百度文库文献)作为本研究的数据集。(2)依据维基百科分类词条目录构建概念从属树,将词汇在概念从属树中所处的树深度作为该词汇的概念抽象层次。在学术文献特征提取的过程中考虑了学术文献的文档结构特征和内容特征,改进了传统的词汇权重计算方法,在TF-IDF算法的基础上结合了词汇概念抽象层次和词汇的段落权重。该种计算方法可以更加合理的提取与计算学术类文献的特征关键词及其权值,有利于计算学术类文献之间的语义相似度和领域相似度。(3)为了提高推荐结果的有效性,本文提出了基于文档多维度的学术文献推荐方法,依据用户的学术水平差异将用户分为初级、中级和高级三个等级,从七个文档维度衡量文献内容,将不同等级用户对文献的需求映射到用户对文档各维度的可接受范围上,使得推送给用户的文献在满足用户兴趣偏好的同时还与用户的学术水平相对应。重点研究了基于三个文档维度的推荐方法,包括:针对文档抽象度,提出了基于文档概念抽象层次推荐方法;针对文档内容理解难度,提出了基于文档难度的推荐方法;针对用户学习难度递增的学习历程,提出了基于文档学习难度跨度的推荐方法。基于文档多维度的学术文献推荐方法能够为用户推送满足其兴趣偏好并符合其学术水平的学术文献。(4)为了验证本文所提出的学术文献推荐方法的有效性和实用性,本文实现了基于文档多维度的学术文献推荐系统,利用构建的论文数据集,对本文所提出的学术文献推荐方法进行了实验测试。实验结果表明,基于文档多维度的学术文献推荐方法具有较好的推荐效果。

基于词义相似度的文本推荐系统的研究与实现

这是一篇关于文本推荐,词义相似度,同义词网络,链路预测,推荐系统的论文, 主要内容为随着信息技术的不断发展,由海量文本信息造成的“信息过载”现象越发严重,如何在海量数据中高效的获取目标文本成为了目前信息检索领域的研究重点。基于内容的文本推荐系统是指从用户历史阅读文本信息中提取用户兴趣,然后以此为依据从文本库中将用户可能感兴趣的文本推荐给用户的一种个性化信息检索系统,相比于传统搜索引擎,该系统能够高效的满足用户对个性化信息的需求。但是目前常见的文本推荐算法仅考虑了特征词词形的严格匹配,未考虑语境对词形的影响以及不同词形之间的同义关系。针对该问题,本文研究并实现了基于词义相似度的文本推荐系统。本文的主要工作为:1.一般在向文本推荐引入同义关系时,弱同义词关系及多义词关系会在计算用户兴趣和文档特征相符程度过程中引入误差,降低推荐效果,鉴于此,本文借鉴链路预测思想,从网络结构特征的角度优化同义词网络,提出了基于链路预测的强同义词网络获取方法。2.在强同义词网络的基础上,本文结合最短路径、最优匹配算法,在文本推荐中引入强同义词关系,并应用词干提取技术消除不同语境对词形的影响,提出了基于强同义词网络的文本推荐算法。3.以基于强同义词网络的文本推荐算法为核心,应用IOCP通信模型、多客户端多服务器C/S架构、负载均衡等技术手段,本文设计并实现了基于词义相似度的文本推荐系统。本文首先研究了信息检索模型以及结构化表示文本的方法,结合应用需求选择了合适的信息检索模型与文档预处理技术;实现了基本的基于内容的推荐方法及系统;在此基础上探究了在文本推荐算法中引入同义词关系的途径,鉴于弱同义词关系以及多义词关系对推荐系统的影响,本文从网络结构特征的角度借鉴链路预测的思想提出了强同义词网络的获取方法;随后以基于内容的推荐算法为基础,提出了基于强同义词网络的文本推荐算法,通过仿真验证了其推荐效果的提升;最后以该算法为核心设计并实现了基于词义相似度的文本推荐系统。