出版物作者推荐系统的研究与实现
这是一篇关于推荐系统,信息获取,关键词抽取,自媒体出版的论文, 主要内容为随着网络技术的飞速发展,信息化时代已经来到我们身边。在这个信息化的时代里,一方面,人类在接受网络提供愈来愈多的信息和服务;另一方面,人类在大量的信息中,找到所需的信息是比较困难的。为了解决寻找信息困难的问题,搜索引擎应运而生,它以一种被动的方式为人类提供便捷服务,但并没有完全解决问题。随之,推荐系统出现在我们的生活里,它改变了搜索引擎原有的服务方式,以主动的方式为用户提供服务,使用户寻找信息变得相对容易。以主题为推荐系统在中国知网平台进行检索发现,推荐系统已广泛应用于生活的多个方面,其中在电商领域的应用最为广泛,而在出版领域的应用相对较少。随着信息技术的发展,数字出版领域的作者来源越来越多样化,为了解决出版领域内编辑选择自媒体作者的困难性,本文提出了出版物作者推荐系统的研究与实现课题。本文开发了一套完整的推荐系统。整个系统可分割成五个模块:获取数据、处理数据、存储数据、获取用户信息、完成推荐。数据获取模块通过python编程实现,负责从微信平台获取各个自媒体公众号信息,并基于主题信息获取算法实现信息获取的去重;数据处理模块通过LAMP(Linux+Apache+Mysql+PHP)架构编程实现,负责数据源的处理,基于关键词抽取算法将数据源标签化处理,得到各个自媒体公众号所属领域;推荐模块是整个系统的核心模块,也通过LAMP架构实现,并在改进的协同过滤推荐算法基础上实现推荐功能。整个系统已初步应用于某个出版社,给编辑带来方便的同时,为出版社选择合适的自媒体作者提供了参考价值。
基于用户搜索—点击数据的关键词抽取技术研究
这是一篇关于搜索-点击数据,关键词抽取,自举模板法,图神经网络,序列标注的论文, 主要内容为随着互联网服务的发展,搜索引擎、推荐系统等互联网应用越来越深入我们的生活。在这些应用中,关键词在提高对用户搜索意图的理解、改善内容推送的精准度等方面具有非常重要的作用。使用关键词的前提是能够从数据中抽取到大量高质量的关键词,所以研究如何高效地从数据中抽取关键词具有十分重要的意义。关键词主要来源之一的用户搜索-点击数据直接由用户产生,具有很强的随机性和长尾性,而传统的无监督抽取方法过于依赖统计特征和数据的规模,在该问题中抽取效果不佳;有监督抽取方法精准度较高,但需要人工标注训练数据集对模型进行训练,会产生大量人工标注成本。针对以上问题,本文基于UCCM数据集进行研究,使用无监督方法与有监督方法结合的抽取方法,通过自举模板法自动抽取到部分高质量关键词,并使用它们生成训练数据对有监督方法进行训练并完成关键词的抽取。在无监督方法部分,本文采用自举模板法进行抽取,并使用少量人工标记数据训练了一个关键词过滤器对自举模板法进行修正,最终抽取到大量高质量的关键词。在有监督方法部分,本文搭建了一个Bi LSTM-CRF模型进行抽取并使用词性特征与分词特征对模型进行增强。在最终的抽取实验结果中,模板法在测试集中抽取到2546条关键词,深度学习模型抽取到2736条关键词,并使原生标签的召回率提高了5%,该结果表明该算法的抽取质量较高,但相对模板法外延能力较弱。针对上述模型存在的问题,本文提出了一种基于图数据的关键词抽取算法,将一组搜索-点击数据构建成图的形式,并使用基于关系的图卷积网络对图进行标注,使用本文设计的解码方法从图中抽取出关键词,并且使用词性特征和依存关系特征对模型进行增强。最终的统计结果中,该方法抽取到3471条关键词,相对模板法新抽取到2897条关键词,原生标签召回率提高了9.5%,外延性较强。最终的实验结果证明,本文提出的基于图网络的关键词抽取方法,在模板法生成训练数据的基础上能够有效扩大抽取范围,抽取到大量高质量关键词,具有较高的研究价值。
基于知识图谱的个性化农业新闻推荐系统研究
这是一篇关于农业,关键词抽取,新闻推荐,知识图谱,神经网络的论文, 主要内容为农业新闻是推进农业现代化过程中的一个重要方面。农业新闻具备科普和指导功能,宣传国家政策、传播农业经验、农业技术。利用信息技术提高新闻传播效用是新闻传播方式种重要一环。农业新闻传播方式随着时代进步发生变革,读者对农业新闻报道的内容、形式都有着新要求。针对农业新闻报道互动性不高、报道效率较低的问题[1],本文从农业新闻受众的需求出发,构建基于知识图谱的农业新闻推荐系统,旨在提高用户阅读积极性,尽可能发挥农业新闻的作用。本文的主要研究内容如下:农业新闻文本关键词抽取。基于农业新闻的特点,提出融合语义信息的Text Rank算法,构建融合语义信息的词图,利用词图和词语在文本中的重要性计算综合得分。通过一系列实验证明,该方法的有效性,既能为新闻特征建模提供帮助,又可作为新闻展示时的辅助信息帮助用户预先了解新闻内容。基于知识图谱的个性化新闻推荐方法。该方法在新闻特征建模上,融合文章本身信息和从知识图谱中得到的实体及上下文信息,通过卷积神经网络获得融合语义信息的文章特征表示。将用户阅读新闻特征表示序列输入门循环单元神经网络,构建用户兴趣特征。计算用户兴趣与新闻特征的相似性作为用户点击新闻的预测概率。在对比引入信息、用户兴趣计算方法和其他模型的一系列实验中,证明了该方法可以有效提升推荐效果。基于知识图谱的个性化农业新闻推荐系统的设计与实现。本系统以Vue和Spring Boot为框架,使用My SQL数据库,在分析系统需求的基础上,实现系统功能。系统实现了为用户提供个性化新闻推荐的功能,分别为管理员和用户提供相应的服务。
中医知识智能问答系统研究
这是一篇关于中医学,知识图谱,关键词抽取,关系属性匹配,问答系统的论文, 主要内容为问答系统采用自然语言作为交互方式,针对用户提出的问题给出简洁、准确的答案。利用问答系统进行信息检索符合现代社会对于高效获取信息的需求趋势,而知识图谱技术的发展为实现问答系统的目标提供了充裕而又准确的数据支撑,更加有效促进了问答系统的发展进程。知识问答系统旨在利用存储结构化知识的知识图谱作为数据支持平台,基于此平台,实现用户提出的自然语言形式的问题与知识图谱之间的数据交互,从而向用户返回答案。中医作为中国的传统医学,积累了深刻、有效的医疗实践理论。面向中医领域的知识问答系统研究主要包含如下内容:首先,以疾病为中心,利用爬虫技术从中医网站中抽取有效的知识信息。并对其进行实体识别、关系抽取和属性定义,从而构建出包括10种实体类型、9种关系类型和1种属性类型的中医知识图谱。其次,做用户问题解析。主要是对用户输入的自然语言形式的问题进行中医关键词的抽取和关系属性的匹配操作。针对中医术语对仗平衡的表达特点,提出将Aho-Corasick自动机算法应用于自然语言形式问句中的中医关键词抽取,该算法能够达到很好的中医关键词抽取效果。在关系属性匹配操作中,传统的模板匹配方法是从字符层面对问句的提问目的和知识图谱中的关系属性进行匹配,实施简单且效率高。使用孪生结构的Bi LSTM对用户输入的自然语言形式的问句和中医知识图谱的知识单元进行语义向量建模的方法则从语义层面对问句的提问目的和知识图谱中的关系属性进行匹配,有效克服了知识图谱和自然语言问句在表达方式上的差异性。因此,提出将两种方法进行结合从而有效实现关系属性的匹配操作。最后,获取到问题中的中医关键词和对应的关系属性后,将问题转化成中医知识图谱上的查询语言,在中医知识图谱中进行信息检索,获取答案并返回给用户。实验结果表明,面向中医领域的知识问答系统针对中医领域相关知识,完整的实现了从数据采集到问答检索应用的过程,能够实现对用户的自然语言问句进行准确回答。图33幅;表14个;参51篇。
基于知识图谱的个性化农业新闻推荐系统研究
这是一篇关于农业,关键词抽取,新闻推荐,知识图谱,神经网络的论文, 主要内容为农业新闻是推进农业现代化过程中的一个重要方面。农业新闻具备科普和指导功能,宣传国家政策、传播农业经验、农业技术。利用信息技术提高新闻传播效用是新闻传播方式种重要一环。农业新闻传播方式随着时代进步发生变革,读者对农业新闻报道的内容、形式都有着新要求。针对农业新闻报道互动性不高、报道效率较低的问题[1],本文从农业新闻受众的需求出发,构建基于知识图谱的农业新闻推荐系统,旨在提高用户阅读积极性,尽可能发挥农业新闻的作用。本文的主要研究内容如下:农业新闻文本关键词抽取。基于农业新闻的特点,提出融合语义信息的Text Rank算法,构建融合语义信息的词图,利用词图和词语在文本中的重要性计算综合得分。通过一系列实验证明,该方法的有效性,既能为新闻特征建模提供帮助,又可作为新闻展示时的辅助信息帮助用户预先了解新闻内容。基于知识图谱的个性化新闻推荐方法。该方法在新闻特征建模上,融合文章本身信息和从知识图谱中得到的实体及上下文信息,通过卷积神经网络获得融合语义信息的文章特征表示。将用户阅读新闻特征表示序列输入门循环单元神经网络,构建用户兴趣特征。计算用户兴趣与新闻特征的相似性作为用户点击新闻的预测概率。在对比引入信息、用户兴趣计算方法和其他模型的一系列实验中,证明了该方法可以有效提升推荐效果。基于知识图谱的个性化农业新闻推荐系统的设计与实现。本系统以Vue和Spring Boot为框架,使用My SQL数据库,在分析系统需求的基础上,实现系统功能。系统实现了为用户提供个性化新闻推荐的功能,分别为管理员和用户提供相应的服务。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设助手 ,原文地址:https://m.bishedaima.com/lunwen/47966.html