面向跨境民族文化领域的文本检索方法研究
这是一篇关于跨境民族文化,跨境民族文化知识图谱,文本分类,文本检索的论文, 主要内容为随着互联网大数据时代的到来,越来越多的信息从书面存储转向了网络存储,数字技术在人们的工作生活中的各个方面都体现的淋漓尽致,越来越多的检索系统被应用到了不同场景下进行信息检索。对于跨境民族文化领域来说,由于人们对于跨境民族文化间的差异了解需求逐渐增加,如何快捷有效的对跨境民族文化文本进行检索,是目前最为重要的任务。因此,本论文通过对跨境民族文化领域文本检索进行研究,可以让人们对于跨境民族文化的了解更加方便快捷。本文的主要工作如下:(1)跨境民族文化知识图谱构建为了使跨境民族文化文本检索的结果更加准确,本文通过构建一个跨境民族文化知识图谱来辅助检索。通过调查研究,选取所要研究的本土民族为傣族、彝族,跨境民族包括傣族的跨境民族泰族、掸族、佬族和彝族的跨境民族倮倮族;定义跨境民族文化知识图谱的分类体系以及数据模式,并且根据定义好的跨境民族文化分类体系从现有的知识图谱和百科类网站的Infobox中来进行相关三元组知识的抽取,总共获取相关的知识三元组863条,将这些三元组导入Neo4j图数据库完成跨境民族文化知识图谱的构建。(2)融合实体向量的跨境民族文化文本分类方法针对跨境民族文化领域的文本语义环境复杂,特征质量参差不齐的问题,提出一种融合实体向量的跨境民族文化文本分类方法。首先利用Trans E模型对跨境民族文化知识图谱中的知识三元组进行向量化表示,得到实体向量、关系向量以及实体的标签向量,把这三种向量进行融合得到实体的语义向量;并且使用BERT预训练模型对文本中的每个词语进行向量表征,通过文本中实体的位置信息把相应的实体语义向量与BERT模型表示的实体词向量相融合,然后采用Bi GRU神经网络模型进行模型训练,最终得到训练好的跨境民族文化文本分类模型,利用训练好的模型来对爬取到的数据进行分类,把分类好的数据作为待检索数据。(3)基于实体语义扩展的跨境民族文化文本检索方法针对用户输入的Query语句语义稀疏的问题,提出一种基于实体语义扩展的跨境民族文化文本检索方法。首先对用户通过输入的Query文本进行预处理,把预处理后的词语分别映射到跨境民族文化知识图谱中,返回包含该实体的三元组以及这些三元组中实体的标签信息;然后把这些知识三元组和实体标签信息通过Trans H模型进行向量化表示,并且把这些相关的关系向量以及实体的标签向量融合到相应的实体向量中,得到扩展后的实体语义向量,把扩展后的实体语义向量融合到Query的实体向量中,对Query中的实体进行语义扩展;再分别利用卷积神经网络提取查询文本Query和待检索文本Document的n_gram文本特征,把Query的文本特征向量与Document的文本特征向量分别进行相似度计算,得到相应的相似度向量,然后把这些相似度向量通过高斯核函数映射到语义空间中得到新的特征向量,利用排序学习中的Point Wise方法来计算Query与Document之间的相关性,最终完成模型的训练,并且利用训练好的模型来根据Query检索出相应的Document文本。(4)跨境民族文化文本检索原型系统的设计与实现使用Django框架构建跨境民族文化文本检索系统,该系统主要分为四个功能模块,分别是实体查询模块、关系查询模块、文本分类模块以及文本检索模块。其中,实体查询模块的主要功能是根据用户输入的实体来查询与该实体直接相关的其它实体;关系查询模块则是通过用户输入的两个实体来查询这两个实体之间存在的关系;文本分类模块则是把用户输入的文本来进行分类,确定该文本的类别标签;文本检索模块是根据用户输入的Query查询文本,通过调用训练好的跨境民族文化文本检索模型从已经分类完成的跨境民族文化文本数据集中检索出相应的文档。
面向跨境民族文化领域的文本检索方法研究
这是一篇关于跨境民族文化,跨境民族文化知识图谱,文本分类,文本检索的论文, 主要内容为随着互联网大数据时代的到来,越来越多的信息从书面存储转向了网络存储,数字技术在人们的工作生活中的各个方面都体现的淋漓尽致,越来越多的检索系统被应用到了不同场景下进行信息检索。对于跨境民族文化领域来说,由于人们对于跨境民族文化间的差异了解需求逐渐增加,如何快捷有效的对跨境民族文化文本进行检索,是目前最为重要的任务。因此,本论文通过对跨境民族文化领域文本检索进行研究,可以让人们对于跨境民族文化的了解更加方便快捷。本文的主要工作如下:(1)跨境民族文化知识图谱构建为了使跨境民族文化文本检索的结果更加准确,本文通过构建一个跨境民族文化知识图谱来辅助检索。通过调查研究,选取所要研究的本土民族为傣族、彝族,跨境民族包括傣族的跨境民族泰族、掸族、佬族和彝族的跨境民族倮倮族;定义跨境民族文化知识图谱的分类体系以及数据模式,并且根据定义好的跨境民族文化分类体系从现有的知识图谱和百科类网站的Infobox中来进行相关三元组知识的抽取,总共获取相关的知识三元组863条,将这些三元组导入Neo4j图数据库完成跨境民族文化知识图谱的构建。(2)融合实体向量的跨境民族文化文本分类方法针对跨境民族文化领域的文本语义环境复杂,特征质量参差不齐的问题,提出一种融合实体向量的跨境民族文化文本分类方法。首先利用Trans E模型对跨境民族文化知识图谱中的知识三元组进行向量化表示,得到实体向量、关系向量以及实体的标签向量,把这三种向量进行融合得到实体的语义向量;并且使用BERT预训练模型对文本中的每个词语进行向量表征,通过文本中实体的位置信息把相应的实体语义向量与BERT模型表示的实体词向量相融合,然后采用Bi GRU神经网络模型进行模型训练,最终得到训练好的跨境民族文化文本分类模型,利用训练好的模型来对爬取到的数据进行分类,把分类好的数据作为待检索数据。(3)基于实体语义扩展的跨境民族文化文本检索方法针对用户输入的Query语句语义稀疏的问题,提出一种基于实体语义扩展的跨境民族文化文本检索方法。首先对用户通过输入的Query文本进行预处理,把预处理后的词语分别映射到跨境民族文化知识图谱中,返回包含该实体的三元组以及这些三元组中实体的标签信息;然后把这些知识三元组和实体标签信息通过Trans H模型进行向量化表示,并且把这些相关的关系向量以及实体的标签向量融合到相应的实体向量中,得到扩展后的实体语义向量,把扩展后的实体语义向量融合到Query的实体向量中,对Query中的实体进行语义扩展;再分别利用卷积神经网络提取查询文本Query和待检索文本Document的n_gram文本特征,把Query的文本特征向量与Document的文本特征向量分别进行相似度计算,得到相应的相似度向量,然后把这些相似度向量通过高斯核函数映射到语义空间中得到新的特征向量,利用排序学习中的Point Wise方法来计算Query与Document之间的相关性,最终完成模型的训练,并且利用训练好的模型来根据Query检索出相应的Document文本。(4)跨境民族文化文本检索原型系统的设计与实现使用Django框架构建跨境民族文化文本检索系统,该系统主要分为四个功能模块,分别是实体查询模块、关系查询模块、文本分类模块以及文本检索模块。其中,实体查询模块的主要功能是根据用户输入的实体来查询与该实体直接相关的其它实体;关系查询模块则是通过用户输入的两个实体来查询这两个实体之间存在的关系;文本分类模块则是把用户输入的文本来进行分类,确定该文本的类别标签;文本检索模块是根据用户输入的Query查询文本,通过调用训练好的跨境民族文化文本检索模型从已经分类完成的跨境民族文化文本数据集中检索出相应的文档。
基于歌词与评论的歌曲推荐方法研究
这是一篇关于推荐系统,音乐,评论,文本检索,深度文本匹配的论文, 主要内容为互联网在近些年发展迅速,已经融入了各行各业和我们工作生活的方方面面。在互联网中也产生了大量各种形式的数据。如何从众多信息中选出每个人感兴趣的信息便成了我们当今研究的热门话题。由此诞生了推荐系统,而随着近几年互联网技术尤其是大数据与人工智能技术的发展,推荐系统也被应用到了各行各业。推荐系统也被广泛应用于音乐领域。音乐作为现代人们生活中必不可少的部分,随着网络中各种风格音乐的数量剧增,更需要一个强大的推荐系统来进行个性化推荐。早期出现了一些推荐方法,这些传统方法确实取得了不错的效果,但随着用户消费信息的增加,音乐的评论信息应该引起足够的重视,很多精彩的评论同样能够反应歌曲本身的信息;而且在自然语言处理领域,近些年发展出了许多强大的基于深度学习的文本匹配模型,如果将此类技术应用到音乐推荐领域,将会比传统推荐方法起到更好的效果。本文在学习大量前人关于音乐推荐系统的研究基础上,总结了常用的音乐推荐方法,设计了基于歌词与评论文本并融合深度文本匹配模型进行音乐推荐的方法。本文首先进行数据获取,即对歌曲信息进行爬取,包含各首歌曲歌词与评论文本信息,以及音乐平台标注的相似歌曲信息;然后采用不同的模型对歌曲文本进行匹配,在模型的选取方面,本文选取了一种传统文本匹配模型和两种深度文本匹配模型,将深度文本匹配模型与传统文本匹配模型进行对比,并在歌词文本的基础上融入歌曲评论文本,来对比前后推荐效果的变化。结果表明基于歌词与评论文本采用深度文本匹配模型的音乐推荐方法具有较高的推荐精准性。另外,为了探索不同比重的评论文本对推荐结果的影响,本文通过确定最佳评论权重从而提升推荐效果。
面向跨境民族文化领域的文本检索方法研究
这是一篇关于跨境民族文化,跨境民族文化知识图谱,文本分类,文本检索的论文, 主要内容为随着互联网大数据时代的到来,越来越多的信息从书面存储转向了网络存储,数字技术在人们的工作生活中的各个方面都体现的淋漓尽致,越来越多的检索系统被应用到了不同场景下进行信息检索。对于跨境民族文化领域来说,由于人们对于跨境民族文化间的差异了解需求逐渐增加,如何快捷有效的对跨境民族文化文本进行检索,是目前最为重要的任务。因此,本论文通过对跨境民族文化领域文本检索进行研究,可以让人们对于跨境民族文化的了解更加方便快捷。本文的主要工作如下:(1)跨境民族文化知识图谱构建为了使跨境民族文化文本检索的结果更加准确,本文通过构建一个跨境民族文化知识图谱来辅助检索。通过调查研究,选取所要研究的本土民族为傣族、彝族,跨境民族包括傣族的跨境民族泰族、掸族、佬族和彝族的跨境民族倮倮族;定义跨境民族文化知识图谱的分类体系以及数据模式,并且根据定义好的跨境民族文化分类体系从现有的知识图谱和百科类网站的Infobox中来进行相关三元组知识的抽取,总共获取相关的知识三元组863条,将这些三元组导入Neo4j图数据库完成跨境民族文化知识图谱的构建。(2)融合实体向量的跨境民族文化文本分类方法针对跨境民族文化领域的文本语义环境复杂,特征质量参差不齐的问题,提出一种融合实体向量的跨境民族文化文本分类方法。首先利用Trans E模型对跨境民族文化知识图谱中的知识三元组进行向量化表示,得到实体向量、关系向量以及实体的标签向量,把这三种向量进行融合得到实体的语义向量;并且使用BERT预训练模型对文本中的每个词语进行向量表征,通过文本中实体的位置信息把相应的实体语义向量与BERT模型表示的实体词向量相融合,然后采用Bi GRU神经网络模型进行模型训练,最终得到训练好的跨境民族文化文本分类模型,利用训练好的模型来对爬取到的数据进行分类,把分类好的数据作为待检索数据。(3)基于实体语义扩展的跨境民族文化文本检索方法针对用户输入的Query语句语义稀疏的问题,提出一种基于实体语义扩展的跨境民族文化文本检索方法。首先对用户通过输入的Query文本进行预处理,把预处理后的词语分别映射到跨境民族文化知识图谱中,返回包含该实体的三元组以及这些三元组中实体的标签信息;然后把这些知识三元组和实体标签信息通过Trans H模型进行向量化表示,并且把这些相关的关系向量以及实体的标签向量融合到相应的实体向量中,得到扩展后的实体语义向量,把扩展后的实体语义向量融合到Query的实体向量中,对Query中的实体进行语义扩展;再分别利用卷积神经网络提取查询文本Query和待检索文本Document的n_gram文本特征,把Query的文本特征向量与Document的文本特征向量分别进行相似度计算,得到相应的相似度向量,然后把这些相似度向量通过高斯核函数映射到语义空间中得到新的特征向量,利用排序学习中的Point Wise方法来计算Query与Document之间的相关性,最终完成模型的训练,并且利用训练好的模型来根据Query检索出相应的Document文本。(4)跨境民族文化文本检索原型系统的设计与实现使用Django框架构建跨境民族文化文本检索系统,该系统主要分为四个功能模块,分别是实体查询模块、关系查询模块、文本分类模块以及文本检索模块。其中,实体查询模块的主要功能是根据用户输入的实体来查询与该实体直接相关的其它实体;关系查询模块则是通过用户输入的两个实体来查询这两个实体之间存在的关系;文本分类模块则是把用户输入的文本来进行分类,确定该文本的类别标签;文本检索模块是根据用户输入的Query查询文本,通过调用训练好的跨境民族文化文本检索模型从已经分类完成的跨境民族文化文本数据集中检索出相应的文档。
基于歌词与评论的歌曲推荐方法研究
这是一篇关于推荐系统,音乐,评论,文本检索,深度文本匹配的论文, 主要内容为互联网在近些年发展迅速,已经融入了各行各业和我们工作生活的方方面面。在互联网中也产生了大量各种形式的数据。如何从众多信息中选出每个人感兴趣的信息便成了我们当今研究的热门话题。由此诞生了推荐系统,而随着近几年互联网技术尤其是大数据与人工智能技术的发展,推荐系统也被应用到了各行各业。推荐系统也被广泛应用于音乐领域。音乐作为现代人们生活中必不可少的部分,随着网络中各种风格音乐的数量剧增,更需要一个强大的推荐系统来进行个性化推荐。早期出现了一些推荐方法,这些传统方法确实取得了不错的效果,但随着用户消费信息的增加,音乐的评论信息应该引起足够的重视,很多精彩的评论同样能够反应歌曲本身的信息;而且在自然语言处理领域,近些年发展出了许多强大的基于深度学习的文本匹配模型,如果将此类技术应用到音乐推荐领域,将会比传统推荐方法起到更好的效果。本文在学习大量前人关于音乐推荐系统的研究基础上,总结了常用的音乐推荐方法,设计了基于歌词与评论文本并融合深度文本匹配模型进行音乐推荐的方法。本文首先进行数据获取,即对歌曲信息进行爬取,包含各首歌曲歌词与评论文本信息,以及音乐平台标注的相似歌曲信息;然后采用不同的模型对歌曲文本进行匹配,在模型的选取方面,本文选取了一种传统文本匹配模型和两种深度文本匹配模型,将深度文本匹配模型与传统文本匹配模型进行对比,并在歌词文本的基础上融入歌曲评论文本,来对比前后推荐效果的变化。结果表明基于歌词与评论文本采用深度文本匹配模型的音乐推荐方法具有较高的推荐精准性。另外,为了探索不同比重的评论文本对推荐结果的影响,本文通过确定最佳评论权重从而提升推荐效果。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设项目助手 ,原文地址:https://m.bishedaima.com/lunwen/50136.html