基于文本相似度比较的高校图书馆个性化推荐研究
这是一篇关于数据发现,图书推荐,字词拆分,权重计算,相似度计算的论文, 主要内容为随着物质生活不断得到改善和提高,商品种类繁多而庞大,各网络商品销售平台相继推出各自的商品推荐系统,方便利用购买方在其平台浏览的记录、收藏的情况、购买的历史等数据自动为购买者推荐各类具有一定购买欲望的商品。高校图书馆藏丰富而齐全,图书的种类和数目庞大繁杂,没有具体借阅目标的读者,到图书馆寻找感兴趣图书所花费的时间与精力也在成倍增长。在此背景下,本文章基于文本相似度比较的高校图书馆个性化图书推荐服务应用进行了研究,分析借鉴时下流行网络电商平台的经验,为高校图书馆开辟个性化图书推荐渠道,利用读者的浏览记录、收藏情况、借阅历史等数据,自动为服务的读者推荐有借阅意愿的图书。本文简述了数据挖掘及文本相似度比较的一些相关理论知识,在此基础上对个性化图书推荐系统进行研究与设计,分析了个性化图书推荐系统的必要性和可行性,详细研究推荐算法在高校图书馆个性化推荐服务中的应用,结合黎明职业大学图书馆图书推荐服务的现状,针对读者历史借还记录给出基于图书题名相似度比较的推荐系统设计思路和目标,最后再对图书推荐系统的实验和结果进行分析。对图书题名分词的工具进行微调,主要体现在利用DOS管道命令进行输入输出重定向,调整部分常见停用词,使分词结果更加准确,更加适合图书题名的分词;对关键词TF-IDF权重算法在图书题名的应用给出了具体办法,使其在图书题名关键词权重的计算上更加符合实际,更加准确;为缩短图书推荐的时间,对拆分后的关键词独立记录通过分类号建立分类索引;另外,针对图书分批送库的现实情况,各关键词的权重在空闲时间予以统计,推荐时可直接取出进行计算,缩短推荐的时间。最后推荐结果,利用目前比较常用用户满意度调查表的评价方法进行了评价。
基于文本相似度比较的高校图书馆个性化推荐研究
这是一篇关于数据发现,图书推荐,字词拆分,权重计算,相似度计算的论文, 主要内容为随着物质生活不断得到改善和提高,商品种类繁多而庞大,各网络商品销售平台相继推出各自的商品推荐系统,方便利用购买方在其平台浏览的记录、收藏的情况、购买的历史等数据自动为购买者推荐各类具有一定购买欲望的商品。高校图书馆藏丰富而齐全,图书的种类和数目庞大繁杂,没有具体借阅目标的读者,到图书馆寻找感兴趣图书所花费的时间与精力也在成倍增长。在此背景下,本文章基于文本相似度比较的高校图书馆个性化图书推荐服务应用进行了研究,分析借鉴时下流行网络电商平台的经验,为高校图书馆开辟个性化图书推荐渠道,利用读者的浏览记录、收藏情况、借阅历史等数据,自动为服务的读者推荐有借阅意愿的图书。本文简述了数据挖掘及文本相似度比较的一些相关理论知识,在此基础上对个性化图书推荐系统进行研究与设计,分析了个性化图书推荐系统的必要性和可行性,详细研究推荐算法在高校图书馆个性化推荐服务中的应用,结合黎明职业大学图书馆图书推荐服务的现状,针对读者历史借还记录给出基于图书题名相似度比较的推荐系统设计思路和目标,最后再对图书推荐系统的实验和结果进行分析。对图书题名分词的工具进行微调,主要体现在利用DOS管道命令进行输入输出重定向,调整部分常见停用词,使分词结果更加准确,更加适合图书题名的分词;对关键词TF-IDF权重算法在图书题名的应用给出了具体办法,使其在图书题名关键词权重的计算上更加符合实际,更加准确;为缩短图书推荐的时间,对拆分后的关键词独立记录通过分类号建立分类索引;另外,针对图书分批送库的现实情况,各关键词的权重在空闲时间予以统计,推荐时可直接取出进行计算,缩短推荐的时间。最后推荐结果,利用目前比较常用用户满意度调查表的评价方法进行了评价。
基于协同过滤的Web服务推荐算法研究
这是一篇关于Web服务推荐,协同过滤,相似度计算,稀疏矩阵的论文, 主要内容为随着Web 2.0技术的发展,Web服务作为一种分布式部署、松散耦合的应用程序,独立于开发语言和系统平台,具有良好的自适应性和相互操作能力,近年来得到了学术界和工业界的重点关注。服务的种类和数量日益丰富,一方面满足了用户复杂个性化的需求,另一方面也导致用户难以在海量服务中快速找到符合自身需求的服务。针对这种现象,研究服务推荐算法,构建一个高效的服务推荐系统是解决上述问题的关键所在。而协同过滤推荐算法是服务推荐算法中性能较好的算法之一,该算法基于服务质量与用户之间的密切相关性,计算用户或服务的相似度矩阵,并通过该矩阵进行服务推荐。本文对基于协同过滤的Web服务推荐算法进行研究,首先提出了基于位置聚类的协同过滤推荐算法,该算法对具有相似位置信息的用户和服务进行聚类,然后通过相似度计算得到用户和服务的最近近邻集合,最后根据最近近邻集合进行服务推荐。本文通过实验验证了该算法能在一定程度上缓解服务质量矩阵的稀疏性问题;然后提出了基于服务自适应的协同过滤推荐算法,该算法将共同调用服务与目标服务的相似度作为影响因子加入到用户相似度的计算中,能够根据目标服务的不同自适应地进行服务推荐。本文通过实验验证了该算法能够基于目标服务的不同自适应地进行服务推荐,提高了服务推荐的准确度;最后对以上两种算法进行融合,通过位置聚类算法对服务和用户进行聚类,然后在聚类结果上通过服务自适应算法计算得到目标用户基于不同目标服务的近邻用户,最后根据近邻用户对目标服务的服务质量进行服务推荐。本文通过实验验证了融合算法能在一定程度上缓解服务质量矩阵的稀疏性问题对推荐算法性能的影响,并且能够基于目标服务的不同自适应地进行服务推荐,融合算法具有更好的算法性能。
基于知识图谱的限定域问答系统关键技术研究与应用
这是一篇关于知识图谱,问答系统,语义解析,相似度计算的论文, 主要内容为问答系统是近年来自然语言处理、信息检索等领域研究的热点。相对于传统搜索引擎只能得到繁琐且模糊的信息,问答系统可以返回给用户更加精准的答案。知识图谱可以将碎片化的知识通过三元组的方式组织起来,建立数据间的联系,形成网络,更有利于信息的搜索、挖掘和分析,因此基于知识图谱的问答系统(Knowledge Based Question Answering,KBQA)成为越来越多人的研究对象。但是目前对于KBQA的研究也存在一些难点:一方面,当前的问答方法难以有效实现涉及多实体的复杂问句的问答;另一方面,传统的问答方法在属性映射上的准确率还不高。对于问答系统的研究可以分为开放域问答系统和限定域问答系统。限定域问答系统由于其领域范围小,特征明显,算法精准度更高,因而更易投入使用,对提高专业领域的智能化服务水平具有重要的意义。本文选取了高考咨询领域进行问答系统研究,因为我国高考人数众多,在报考志愿时对于信息查询有着巨大的需求。传统的信息查询方式是上网搜索、书籍查询、人工咨询等,耗时耗力,如果能够建立一个囊括所有学校相关信息的问答系统,快速准确的返回需要的答案,那么就可以弥补目前在报考学校时信息难以查找的不足。本文面向高考咨询领域开展对于基于知识图谱的限定域问答系统关键技术的研究,主要内容如下:第一,设计了在KBQA领域的问句分类体系的构建方法以及对应的分类方法,首先根据爬取的问句设计了高校信息知识图谱的数据模式,然后将问句分类体系的划分与知识图谱的数据模式相结合,根据数据模式中的实体和属性将问句类别划分为大小类,并分两步进行问句分类。第二,提出了BERT-Bi LSTM模型来提升相似度的计算精度,既有利用BERT(Bidirectional Encoder Representations from Transformers)结合上下文动态生成词向量的优势,又利用了双向长短时记忆网络(Bi-directional Long Short Term Memory network,Bi LSTM)进一步捕捉句子信息,用以提高相似度计算的准确率,将此模型用于问句分类和问答过程中。第三,研究了针对复杂问句的问答方法,提出了一个改进的基于语义解析的问答模型,通过添加约束生成查询图,然后将查询图自动转换成Neo4j查询语句,再到数据库中检索得到答案。第四,通过自顶向下的方式构建了高校信息知识图谱,根据问句分类阶段设计好的数据模式从多个网站爬取高校信息、整理格式后导入到Neo4j数据库,然后在此知识图谱的基础上实现了基于语义解析的高考咨询问答系统。
基于混合算法的个性化推荐系统研究与实现
这是一篇关于协同过滤,相似度计算,标签感知,神经网络,推荐系统的论文, 主要内容为随着信息技术的快速发展,互联网用户量和信息量规模不断扩大,海量的信息资源导致了信息过载。推荐系统是解决信息过载的有效方法。但是,现有的推荐系统仍存在稀疏性、冷启动等问题。为此,本文首先提出一种基于Bhattacharyya系数的相似度计算方法,来解决推荐系统中的数据稀疏问题;接着,提出基于标签感知的混合神经网络模型,来解决标签推荐中存在的稀疏、冗余和语义模糊问题,同时缓解了冷启动问题;最后,结合上述两种方法搭建一个完整的个性化推荐系统,实现对用户的个性化电影推荐。本文主要工作如下:(1)针对传统协同过滤算法在相似度计算时存在数据稀疏的问题,本文提出了基于Bhattacharyya系数的相似度计算方法。首先,通过项目评分分类标准对项目评分等级进行分类,实现同类别项目之间相似度的快速计算,有效降低计算成本;接着,利用Bhattacharyya系数实现从概率分布的角度计算项目相似度,打破了共同评分项目的限制;最后,考虑到不同项目之间相似度计算结果的重复性问题,引入了共同评分项目增强函数,进一步对相似度计算方法加以优化。实验结果表明,相较于现有相似度计算方法,改进的相似度计算能够有效地解决推荐过程中数据稀疏性问题,提高了推荐准确率。(2)针对推荐系统中的异构信息融合问题,本文提出了基于标签感知的混合神经网络推荐模型(Hybrid Tag-aware Recommender Model,HTRM)。首先,词嵌入模型分别对评分和标签进行嵌入表示;接着,自编码器对项目标签进行文本特征提取,同时使用长短期记忆网络(Long Short-Term Memory,LSTM)对用户标签行为进行特征提取;最后,采用全连接神经网络对融合的用户和项目特征进行评分预测。实验结果显示,优化的推荐模型有效降低了用户评分预测误差,同时缓解了冷启动问题。(3)基于上述研究,本文利用B/S架构实现个性化电影推荐系统,其基本结构包括系统前端和后端。具体地,前端采用Vue框架开发,通过浏览器向用户进行界面展示;后端业务主要使用Spring框架实现。核心推荐引擎部分分别采用基于Bhattacharyya系数相似度计算的协同过滤和HTRM,设计了离线推荐服务和实时推荐服务,实现对用户的个性化电影推荐。
Java在线考试系统的设计与实现
这是一篇关于Java在线考试系统,浏览器/服务器模式,Java服务器页面,相似度计算的论文, 主要内容为随着计算机应用的迅猛发展,网络应用不断扩大,以及传统的考试方式已经不能适应现代考试的需要,在线考试特别是基于Web的在线考试系统近年来受到越来越多的人青睐。Java在线考试系统就是基于Web的面向Java课程的专一性考试平台。Java在线考试系统实现了在线考试的目的,以减轻教师的工作负担及提高工作效率,并能激发学生的学习兴趣。系统采用浏览器/服务器模式开发,包括身份登录、新用户注册、用户管理、在线考试、代码执行及比较等功能模块。系统不仅完成了常规考试系统所能完成的出题和判卷功能,而且提供代码上传、编译、运行和代码相似度比较的功能。代码相似度计算为老师判断学生的代码是否抄袭提供了一个依据。 代码相似度计算主要用到属性计数技术和结构度量技术来进行设计。属性计数技术是对单一操作符的数量、单一操作数的数量、所有操作符的总数、所有操作数的总数这四个基本属性来对代码进行相似度计算的;结构度量技术根据程序的结构来度量两个程序之间的相似度,它需要对程序的内部结构,如控制流、嵌套深度等进行分析。Java在线考试系统的代码相似度计算就是结合这两种方法,对Java代码进行分析和比较,得出代码相似度的值。 各个模块使用UML技术进行了较为详细的设计,使用JSP(Java服务器页面)技术和MySQL数据库以及DREAMWEAVER开发工具进行开发与实现。经过设计和实现后,针对系统的各个功能进行测试,对代码相似度计算还用实际例子进行测试和分析。
基于知识图谱的合作者推荐系统设计与实现
这是一篇关于知识图谱,相似度计算,可解释性推荐,图数据库的论文, 主要内容为随着互联网和信息技术的不断发展,学术交流与合作不再受地理因素的限制,变得愈加频繁,学者之间的学术合作行为分析逐渐成为科学研究的重要组成。在大数据背景下,如何有效地利用海量学术数据对学者合作网络进行构建,并通过该网络帮助学者挖掘、推荐合适的合作伙伴,成为当前学术网络研究的热点问题。本文提出了基于学术知识图谱的合作者推荐算法,以知识图谱的方式对领域学术网络进行构建,结合基于内容的推荐方法,为学者推荐合作伙伴,并且推荐的结果具有一定的可解释性。首先,对学术数据中学者、研究领域及论文等多源异构信息进行抽取和处理,以图数据库为主要载体,自顶向下的方式构建出计算机领域内的科研知识图谱。其次,通过在知识图谱中定义的元路径组,利用基于网络结构的相似度,为源学者过滤出无直接合作关系但相似度极高的推荐候选集合。然后,利用基于内容过滤推荐中Itembased的思想,根据已经是源学者的合作者的相关特征,计算候选推荐集合中学者与源学者的相似度,依据相似度综合评分生成合作者列表,即为最终推荐结果。最后,在知识图谱中查找推荐的学者与源学者的最短路径,生成对推荐结果的解释。本文提出的基于学术知识图谱的合作者推荐算法已实现为具体的推荐模块,并部署在Web of Scholar系统中。用户可在使用系统时完善个人信息以获得个性化的合作者推荐,推荐结果已经实现可视化展示,供科研人员参考。
基于大数据的销售线索推荐系统的设计与实现
这是一篇关于销售线索,推荐系统,大数据处理,相似度计算的论文, 主要内容为近些年,传统的B2B企业面对“互联网+”这一新形态时摩拳擦掌,但是企业与企业之间的数字化的程度却迥然不同。对于企业命脉生死攸关的销售部来说,同样也面临着行业竞争异常激烈、开发新客户难度日益增加以及获取新客户的成本水涨船高的问题。针对上述问题,基于大数据技术,结合企业特有数据,在保证系统兼容性的前提下,设计并实现一个具有易用性、高响应性以及高精确性的销售线索推荐系统。销售线索推荐系统基于BI大数据平台,主要分为两个部分。一个部分负责海量数据的存储与推荐计算,另一个部分负责系统的数据展示以及业务处理。对于第一部分,利用Scrapy爬虫技术采集垂直行业特有数据,使用Hadoop的HDFS分布式文件系统存储包括业务数据、工商数据、爬虫数据以及其他数据在内的海量数据,结合Flume、Sqoop以及Hive等技术对数据进行ETL处理后入库,通过Spark SQL、Spark MLlib结合Jieba分词进行相似度计算之后得到销售线索,最后将任务放在Azkaban任务调度器上进行任务的调度更新。对于第二个部分,使用Spring Boot和Mybatis框架技术对后台部分进行代码编写和逻辑处理,利用My SQL、Postgre SQL等关系型数据库存储用户信息、客户信息以及线索信息等数据,Redis非关系型数据库提升特殊业务数据处理速度,结合Vue开源框架实现的前端页面进行数据的展示、页面交互与业务处理。由于任务调度策略以及客户的新增会导致推荐线索的计算不及时,因此采用Elasticsearch进行数据的检索以便于新增客户的临时推荐。目前线索推荐系统已经内部测试上线。经过验证,可以较为精准的命中相似线索,解决了销售人员找线索困难的问题。真正意义上打破了传统B2B行业通过传统人工手段寻找潜在客户的局面,实现了销售人员的找线索自由。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕业设计驿站 ,原文地址:https://m.bishedaima.com/lunwen/45311.html