基于在线问诊平台的医生推荐研究
这是一篇关于在线问诊平台,Word2vec,个性化推荐,医生推荐的论文, 主要内容为随着互联网的发展,在线问诊平台由于可以实现医患之间的互动,解决患者轻问诊需求,逐渐受到大众的信赖和认可。如国外的Health Tap、American Well和Doctor On Demand,国内的春雨医生、好大夫在线等。患者浏览医生主页,寻找感兴趣的医生,通过提问的方式与医生进行互动。与传统的线下就诊相比,避免了时间和空间因素带来的限制,能够方便地进行疾病咨询。但是,随着医生和患者规模的扩大,大量的医患互动信息以及评价信息产生,患者无法快速识别并选择优质的医生资源,从而降低患者问诊体验。为了发现优质的医生资源,提高患者满意度,个性化医生推荐受到越来越多的关注。在这种背景下,本文基于对目前医生推荐系统的深入研究,包括对在线问诊平台中医生与患者特征分析后,以复杂网络的相关理论为基础,通过多种推荐策略的组合来提高医生推荐结果的准确性,结合目前主流的个性化推荐技术,同时引入语义挖掘技术、社会网络分析法和统计学方法,构建一种基于组合条件的个性化医生推荐模型,其中包括基于相似患者的医生推荐模型,基于相似领域的医生推荐模型和基于医生绩效的医生推荐模型。在基于相似患者的医生推荐模型中,根据从众心理理论,患者一般更青睐于曾经诊治过相同疾病的医生,从而设计了基于患者咨询文本的推荐,主要运用Word2vec模型训练词向量,计算患者相似度,确定候选医生推荐集A;在基于相似领域的医生推荐模型中,认为相同患者往往关注的医生拥有共同特征,如医生的知识结构相似、行为网络关系密切,基于此,构造了两个子模型:医生知识模型和医生行为网络模型,主要是利用Jaccard系数分别计算医生知识结构相似度和医生行为网络相似度,最后,应用Comb SUM算法整合这两种相似度,得到医生之间的领域相似度,从而确定扩展医生推荐集;在基于医生绩效的医生推荐模型中,根据医生的历史评分数据,通过构建医生绩效指标体系对医生的线上服务质量进行测量,从而确定候选医生推荐集B;最后对三种推荐结果进行合并,计算医生的综合得分,确定最终医生推荐集。同时,为了模型应用的清晰性与完整性,本文构建了基于组合条件的个性化医生推荐模型架构,并采集“好大夫在线”真实数据进行模型验证。实验结果表明,模型具有良好的应用可行性和较好的推荐效果。
基于自然语言处理的能源电池领域的知识图谱构建
这是一篇关于知识图谱,TextRank,Word2vec,句法分析,规则的论文, 主要内容为随着大数据时代的到来,信息剧增,从海量文本中迅速捕获有价值的知识是目前亟待解决的问题,知识图谱就此问世。虽在其他领域,已经成功构建了很多知识图谱库,但针对专业性领域的知识图谱构建还处于起步时期,尤其是能源电池领域,这严重阻碍了该领域知识的应用和共享。因此,本文以该领域50篇科技论文作为研究对象构建知识图谱,研究主要集中在四个方面,即词性标注、实体抽取、关系抽取以及图谱构建。词性标注。首先,依据论文和中英文的结构特点,提取文本中具有特殊特点的实体,经去重、排序,补充到自定义词典;然后,运用HanLP的短语提取功能提取所有可能的短语,经源文本匹配,保留匹配度达到2及以上的短语,经实体规则的筛选,将最终剩下的实体补充到自定义词典中;最后,运用更新的自定义词典,将HanLP标注结果与人工标注的结果作对比,总结出该领域的通用规则,将运用通用规则提取的实体经人工筛选后补充到自定义词典,完成基于自定义词典的词性标注。实体抽取,本文主要是将图模型引入实体抽取,提出了一种基于改进TextRank算法的抽取方法。分别将基于节点长度和节点信息量的节点综合特征值和基于滑动窗口和互信息的边权值共同加权于传统的TextRank算法中,创建新的评分函数,通过不断迭代、设置阈值确定最终的实体抽取结果。实体关系。本文将研究分为分类关系和非分类关系。首先,改进了“is a”模型使其适用于中文的实体关系抽取,即,利用“是一”模型直接提取出文本的上下位关系,即分类关系;其次,基于共现关系抽取所有的实体对,在所有共现实体对的基础上,利用word2vec模型计算实体间的语义关系;再次,利用依存句法分析和规则获得实体间的并列关系、主宾关系、同义关系和聚集关系;最后,量化关系,经降序排列以及阈值分析,得到最终的实体关系。构建图谱。本文根据已经提取的实体以及实体间的关系,运用Pajek软件将知识图谱可视化展示。由于科学研究的不断发展,科技论文的产量与日俱增,因此,绘制知识图谱并不是一个终结性的工作,随着专业信息的不断增加,知识图谱结构也要不断更新,建立越发完善的知识体系。核心任务包括:语料库构建、分词标注、信息量计算、词长统计、TextRank、实体抽取、word2vec、句法分析、关系模型抽取、实体关系抽取、知识图谱构建等操作。
基于改进k-means和卷积神经网络的新闻推荐系统
这是一篇关于TF-IDF,K-means,Word2vec,CNN,推荐算法的论文, 主要内容为互联网+已经成为时代发展的主要趋势,在快节奏的当下生活中,如何筛选海量的数据信息,成为当今信息技术领域急需解决的重要科研问题。为了解决这一问题,新闻推荐系统应运而生,本文开发基于改进K-means和卷积神经网络的新闻推荐系统,分别采用基于改进K-means机器学习技术和基于卷积神经网络的深度学习技术,对用户的兴趣进行建模,对新闻的特征进行捕捉,再基于协同过滤的推荐算法对用户进行推荐,可以更加精准的捕捉用户感兴趣的新闻,增加用户体验的同时,提升系统的性能。在基于改进的K-means新闻推荐模型的研究上,考虑对于中文新闻进行推荐。无论是传统的文本表示模型还是新兴的中文表示模型对于中文文本无法很好的表示,基于TF-IDF和K-means的文本表示模型缺陷在于,K-means聚类分析采用的是随机初始化簇中心的算法,让最终的新闻文本模型差强人意。于是在进行K-means文本处理前先对采用TF-IDF计算得到的文本特征向量进行SVD矩阵分解,在数学意义上对文本特征向量进行降维处理,降低空间稀疏性,从物理意义上也是对文本数据进行粗糙分类,再把分类结果作为K-means算法的初始簇中心,提升文本聚类的准确性。再对用户浏览的新闻历史记录进行用户-文本类别偏好建模,对模型采用基于协同过滤的新闻推荐。在基于卷积神经网络的新闻推荐模型的研究上,考虑对于英文新闻进行推荐,把微软MIND新闻数据集的标题作为文本输入,对文本采用Word2vec构建词向量模型,再把每个标题中的词转化为词向量的形式的数据,传送到卷积神经网络CNN模型的输入层,经过卷积、池化、全连接、Soft Max进行分类得到文本的分类结果,再通过对用户浏览的不同类别新闻历史进行建模,构建用户-新闻偏好矩阵,采用协同过滤推荐技术,最终推荐TOP-N新闻序列给用户。在个性化新闻系统实现方面,采用与前台完全分离的架构进行实现,后端则采用Python的Django架构进行算法的设计,而前台采用vue.js进行页面展示,采用My SQL进行数据管理。实现了用户登录权限认证,标签展示,为你推荐,以及热度榜,相似推荐,后台管理等功能。在此系统中,用户可以根据标签去选择感兴趣的新闻,也可以通过热度榜去关注当下火热的数据顶流内容,也可以根据个人偏好选择“为你推荐”的感兴趣的新闻,也可以在文章右侧点击“相似推荐”推荐文章相关的更多新闻数据,推荐方式多样,既能处理用户冷启动难题,推荐标签新闻及即时的热门新闻,也能捕捉用户感兴趣的新闻,使用户有较高的使用体验。
基于数据挖掘的电商平台促销选品研究
这是一篇关于促销选品,数据挖掘,随机森林,Xgboost,Word2vec的论文, 主要内容为随着中国互联网电商的迅猛发展,全民网购现象已然存在,但随着中国电商体系发展成熟,用户红利开始消失,推出促销节日等形式成为电商平台降低获客成本、增加收益的关键手段,而在这过程中如何合理选择商品进行促销对于平台来说是非常重要的环节。但是目前的电商平台在日常促销选品中,由于运营人员运营水平参差不齐、所负责的商品数量庞大,因而平台推出商品进行促销时无法做到优中选优、或者局部选优,进而无法全盘布局,导致电商平台资源无法合理配置,使得电商平台的促销效果不佳。因此探究一个电商平台在做促销活动时如何完成一站式线上选品策略,并针对影响其促销的因素进一步分析是电商平台目前亟待解决的一个问题。本文先对我国的电商平台市场及促销现状进行了论述,分析了可能会影响电商平台在促销时做商品选择的影响因素如一周优惠力度以及选择购买促销商品用户特点等,进而探讨了利用大数据技术构建电商平台智能选品模型的构建。接着本文应用了国内某大型知名S电商平台的用户端交易历史数据以及运营端的商品、活动信息数据,以数据挖掘方式以及机器学习算法为实现电商平台智能化运营构建了促销选品方案。具体包括利用随机森林、xgboost算法对促销期间平台商品的总交易金额GMV进行预测,从GMV预测结果中,选择top N商品作为主候选商品,并创新性地利用自然语言处理领域的词嵌入工具word2vec来识别主候选商品对应关联商品,进而得到了关联商品列表,供电商平台业务运营人员在促销场景下进行选择。本文提出的电商促销选品是基于商品画像、商品相似相关模型,从商品、商品组合的GMV角度入手,考虑商品的潜在共现关系,构建智能选品模型为促销活动提供较优的商品(商品组合),从而保障促销资源的合理配置及促销效果的正常、以及超预期表现。
基于社会媒体的旅游推荐系统研究与实现
这是一篇关于旅游推荐,社会媒体,Word2vec,LDA的论文, 主要内容为随着信息技术的不断发展,旅游业也在不断地进行创新突破,“旅游+信息化”成为一个备受关注的热点,人们可以通过互联网获取到海量的旅游信息,通过这些信息来帮助用户进行计划的制定以及决策。社会媒体既是一个用户可以自由分享自己的意见和观点的平台,却也会出现信息过载的问题。为了使用户可以在海量信息中快速准确地找到自己想要的内容,个性化推荐系统是一种非常有效的解决方案。目前旅游景点推荐系统仍存在数据稀疏问题,为了更好地进行旅游景点的推荐,本文针对现有推荐算法进行优化与改进,提出一种基于Word2vec和LDA模型的旅游景点推荐模型,并通过设计实现的旅游景点推荐原型系统,将本文提出的推荐模型应用于该原型系统中。本文的主要内容如下:(1)介绍了当前个性化旅游推荐算法的国内外研究现状以及存在的问题,由此引入了基于社会媒体的旅游景点推荐算法,然后详细介绍了基于协同过滤的推荐算法、基于内容的推荐算法以及混合推荐算法的原理以及优缺点,对本文用到的LDA主题模型与Word2vec词向量模型进行了研究与分析。(2)由于LDA是以全局的形式来预测文档中的词汇、Word2vec以局部的形式来预测文档中的词汇的特殊性,本文提出一种基于Word2vec和LDA模型的旅游景点推荐模型。该推荐模型的核心思想是通过LDA主题模型将景点评论文本转换为景点-主题-词矩阵,再通过结合Word2vec词向量模型转换为景点-主题-词向量矩阵,通过上述矩阵生成用户/景点向量模型,基于用户/景点向量模型预测用户对未知景点的评分来产生推荐结果。另外,还对基于Word2vec和LDA的推荐模型进行了拓展研究。通过在爬取的去哪儿网的旅游景点评论数据集上与其他的推荐算法做实验对比,实验结果表明,本文提出的推荐模型在评分预测准确率上有所提升。(3)对旅游景点推荐原型系统进行需求分析,采用B/S架构,将本文提出的基于Word2vec和LDA的推荐模型应用到系统中,设计并实现了一个由用户管理模块、评论管理模块、景点推荐模块等组成的个性化旅游景点推荐系统,最后对系统主要功能模块进行了测试以及界面展示。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码货栈 ,原文地址:https://m.bishedaima.com/lunwen/47927.html