基于Coreseek的垂直搜索引擎研究与优化
这是一篇关于垂直搜索引擎,爬虫,LibMMSeg,BM25,图书的论文, 主要内容为互联网成为了人们获取信息的直接途径,与人们生活息息相关。通用搜索引擎检索的范围大,内容全面,满足用户搜索的基本需求,但是返回结果中包含了大量无关的信息。垂直搜索引擎弥补了通用搜索引擎的不足,垂直搜索引擎检索范围小,只包含某一领域或者某一主题的内容,保证搜索结果的相关性,而且垂直搜索引擎对网页信息进行预处理,将结构化的数据返回给用户,使搜索结果清晰呈现。论文讨论和研究通用搜索引擎和垂直搜索引擎的相关原理、技术和实现过程,对垂直搜索引擎涉及的主题网络爬虫、信息结构化抽取、中文分词技术和中文全文搜索引擎工具Coreseek进行了介绍和分析。在论文中所做的主要工作有:论文采用MMSEG分词算法对图书信息进行分词处理,为了更加精确切分有关于图书类的专有名词,在Lib MMSeg词库中进行了扩充,对改进前后的词库进行对比实验,改进后的词库能够精确切分图书作者、出版社等名词;修改了Coreseek全文搜索工具的排序算法,与Coreseek基本的排序算法进行对比,实验结果表明修改后的CORERANK排序算法更适应于短文本的图书搜索,返回给用户更满意的答案。最后,实现DouCrawler网络爬虫系统爬取豆瓣网站关于图书的网页信息,对网页信息进行结构化抽取、词语切分、创建索引,显示检索结果,完成一个面向图书信息的搜索引擎。
基于卷积神经网络和协同过滤的图书推荐系统
这是一篇关于推荐系统,卷积神经网络,协同过滤,语料库,图书的论文, 主要内容为随着当今网络和大数据的飞速发展,人们已经脱离了信息匮乏的时代。网络给人们带来了便利,提供了大量的信息,同时人们对网络上的服务也提出了更高的要求,人们希望得到更快、质量更高的服务。而信息的爆炸式增长,带来了两个问题,一方面,简单搜索不能针对性的提供个性化服务,用户很难在海量的信息中获取到自己不了解但可能感兴趣的信息。另一方面,作为信息的生产者,如何最有效地利用信息,将信息推送给潜在目标用户也是一个难题。如今网络上图书信息成倍数地增长,用户常常需要花费大量时间来浏览、寻找自己感兴趣的图书。为了优化用户体验,个性化推荐算法是有效的解决方法。本文针对于图书推荐系统,提出了效果较好的推荐方法,对系统的整体框架、算法改进进行了阐述说明,论文的主要工作如下:1.构建了图书中文语料库,使用Word2Vec中的Skip-Gram模型对自然语言进行建模,生成词向量,完成了卷积神经网络输入数据的预处理。并对比了现有的三个语料库和本文的图书中文语料库对卷积神经网络输出结果的影响,得出了本文语料库的预处理结果优于现有中文语料库的结论。构建卷积神经网络,本文实现了基于Yoon Kim的网络模型改进的卷积神经网络。实验证明改进后的卷积神经网络在本文的图书数据集的分类问题上要优于原有模型。2.将基于内容推荐与协同过滤进行结合,设计了图书推荐系统,改进后的卷积神经网络应用于基于内容的推荐,与协同过滤结合,得到了优于传统协同过滤的结果,并在一定程度上改善了冷启动问题。
图书馆信息管理系统的设计与实现
这是一篇关于图书,管理系统,MySQL,JSP,Struts的论文, 主要内容为随着计算机网络技术的迅猛发展,互联网技术的应用已经深入到人们生活的各行各业中,而当今社会信息化、系统化、网络化前进的步伐使得软件信息系统的作用越来越重要。信息化管理方式正在用其独特的方式影响着人们的生活、学习、交流等方面,同时也影响着人们思维的方式,这些影响对于人们的传统观念带来了巨大的冲击。图书一直是获取信息的最好方式。图书馆的正常工作中需要整理大量的图书以及繁琐的读者信息,这些信息衍生的借书、还书信息等等,大量的工作需要整理和处理。传统的图书管理模式由于手续繁琐、工作量大等因素导致效率低下、错误率高等等,同时对于图书的添加、查阅、更新、维护等方面都带来了极大的不便。信息化的今天,自动化、系统化的图书信息管理方式,从而将图书馆的管理简单化、便捷化。通过计算机网络技术开发一个图书馆信息管理系统,从而实现图书管理网络化、信息化,将使得图书的查询和借阅变得更加快捷、方便,有效的提高图书馆的工作效率。在本系统中一般用户及系统管理员可以方便的完成图书馆日常办公事宜。图书馆信息管理系统中包含六个功能模块:用户信息、图书信息、系统管理、借还操作、查询操作和基本操作。本系统设计是基于信息管理系统的理论和数据库技术的支持下完成的。采用JSP技术完成对网页的开发设计,采用MySQL作为系统数据库,整体系统采用了 B/S三层架构体系,并采用了开源框架Struts,具有设计灵活、开发效率高、生成的软件界面大方美观等特点。
图书馆信息管理系统的设计与实现
这是一篇关于图书,管理系统,MySQL,JSP,Struts的论文, 主要内容为随着计算机网络技术的迅猛发展,互联网技术的应用已经深入到人们生活的各行各业中,而当今社会信息化、系统化、网络化前进的步伐使得软件信息系统的作用越来越重要。信息化管理方式正在用其独特的方式影响着人们的生活、学习、交流等方面,同时也影响着人们思维的方式,这些影响对于人们的传统观念带来了巨大的冲击。图书一直是获取信息的最好方式。图书馆的正常工作中需要整理大量的图书以及繁琐的读者信息,这些信息衍生的借书、还书信息等等,大量的工作需要整理和处理。传统的图书管理模式由于手续繁琐、工作量大等因素导致效率低下、错误率高等等,同时对于图书的添加、查阅、更新、维护等方面都带来了极大的不便。信息化的今天,自动化、系统化的图书信息管理方式,从而将图书馆的管理简单化、便捷化。通过计算机网络技术开发一个图书馆信息管理系统,从而实现图书管理网络化、信息化,将使得图书的查询和借阅变得更加快捷、方便,有效的提高图书馆的工作效率。在本系统中一般用户及系统管理员可以方便的完成图书馆日常办公事宜。图书馆信息管理系统中包含六个功能模块:用户信息、图书信息、系统管理、借还操作、查询操作和基本操作。本系统设计是基于信息管理系统的理论和数据库技术的支持下完成的。采用JSP技术完成对网页的开发设计,采用MySQL作为系统数据库,整体系统采用了 B/S三层架构体系,并采用了开源框架Struts,具有设计灵活、开发效率高、生成的软件界面大方美观等特点。
基于融合偏好与用户注意力的盲文图书推荐系统算法研究
这是一篇关于图书,无障碍,注意力,推荐系统的论文, 主要内容为随着互联网的高速发展,海量的数据带来的信息爆炸问题亟待解决,人们每天都面对着如何从百万千万及更高量级的数据流中选取需要的信息的问题,也因此推荐系统应运而生。对于视障用户,因为视觉能力上存在缺陷,无法或者难以通过正常的视觉途径获得信息而只能依托于触觉、听觉等其他感官,普通的阅读手段无法满足他们对于知识获取的需求。市面上的图书推荐系统算法都是针对健全人的阅读习惯进行推荐的,对视障人群来说并不适用,因此需要针对视障人群研究符合他们行为习惯的盲文图书推荐系统算法。首先,为了向视障用户提供准确有效的感兴趣的目标图书集,本文提出了基于融合偏好的推荐算法。为了预测视障人群在选择图书时的偏好,本文探究了视障用户基于行为的兴趣和基于内容的兴趣,并融合了两种兴趣偏好从而更准确的召回用户可能想要阅读的图书。在计算兴趣偏好时,本文改进了现有的内容相似度计算方法,利用图书文本特征和用户行为构建用户融合偏好,在稀疏数据集上实现了用户个性化图书推荐列表的生成。通过该算法,解决了视障用户数据少带来的推荐量不足的问题,并能有效提高推荐用户感兴趣的盲文图书的准确率。其次,为了对目标图书集进行智能化排序以方便视障用户顺序浏览时快速找到感兴趣的图书,本文提出了基于用户注意力的上下文感知推荐算法,用于对图书集进行评分预测。本文引入改进的注意力机制来建模用户的当前偏好,并通过对特征空间融合提高推荐的准确率。通过该算法,适应了在视障用户浏览图书时的顺序浏览方式,有效辅助了视障用户快速找到感兴趣图书。最后,在实验部分中为了充分贴合视障人群的使用特征,本文收集并分析了盲文图书馆上的真实阅读数据集,对本文提出的推荐算法和其基线算法进行了对比试验。通过实验的对比结果,证明了本文提出的推荐算法贴合了视障用户使用习惯,并证明了改进的有效性。
MG图书垂直电商平台运营改进策略研究
这是一篇关于双边市场,垂直电商,中国移动,图书的论文, 主要内容为二十一世纪初,家用电脑与有线互联网的普及,孕育了众多综合电商如淘宝、京东、苏宁。近十年,智能手机与高速移动互联网的普及,带来移动电子商务的繁荣,促使消费者数字消费行为呈现移动化、去中心化,社会消费进入全民手机购物新时代。在“互联网+”大背景下,信息通信技术的快速迭代带来软件开发、数据存储与网络通信成本的急速下降,传统行业企业纷纷凭借自身原有线下核心资源与竞争力,基于产品差异化定位,通过采购、运营、营销的互联网化改造,布局专注于某品类产品的垂直电商市场。中国移动凭借中国最大电信运营商的线下客户与渠道优势,通过与ZX出版社跨界合作,打造MG图书垂直电商平台,提供基于会员优惠购书的图书互联网化销售服务。但MG平台通过5年的探索,面临着平台用户量少、用户数负增长、图书品类少、用户体验差、忠诚度低等现实问题。本文利用双边市场、网络效应与电子商务等理论,通过文献研究、行业定性对比分析与调查问卷定量分析等手段,分析图书电商行业及MG平台的内外部竞争环境,认为MG平台亟需在坚持平台图书销售互联网化的战略下,改进平台运营。研究认为,平台现有唯一供应商垄断供应是造成供需不匹配问题的根源,必需基于双边市场理论与网络效应等理论成果,通过引入更多的B端供应方,来改进平台运营。建议以如下方式改进平台运营:首先,应后向开放平台,吸引更多的B端供应方加入平台,提升平台图书供应资源与能力,激发跨边网络效应吸引C端购买方群体;其次,通过基于分层分级的差异化营销手段,激活C端同边网络效应,扩大C端购买方群体。最终,通过改进平台运营,解决供需不匹配问题,将MG平台改进为拥有正向跨边与同边网络效应循环的垂直电商平台,达到扩张双边群体,提升GMV与市场份额。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码港湾 ,原文地址:https://m.bishedaima.com/lunwen/53470.html