基于知识图谱的健康膳食知识智能问答系统
这是一篇关于健康膳食,知识图谱,条件随机场,Neo4j,朴素贝叶斯分类器的论文, 主要内容为世界卫生组织曾出不健康的饮食是诱发癌症、心血管疾病、糖尿病等一系列慢性疾病以及其它与肥胖相关病症的主要危险因素。健康的饮食不仅可以降低某些的疾病的发生概率,还可以在疾病发生后对病症进行调理以改善身体状况;近些年来公众也越来越多的关注健康合理的膳食,并试图在搜素引擎上获取符合自己需求的膳食信息,或借各种来源不明的推送消息获取健康膳食知识。党的十九大更是基于此作出实施―健康中国‖战略的重大决策,将维护国民健康升到国家战略的高度。政府相关部门为公众供关于健康膳食知识的信息服务则是实施―健康中国‖战略的一项重要举措,而一个科学、有效的智能问答系统则是当前比较先进的信息服务模式之一。传统的问答系统都是通过关键词的匹配来返回答案,无法解析用户的语义信息,且不具备逻辑性,因而无法满足用户的需求。知识图谱在分析事物时,创新的从―关系‖角度切入,通过该方式,基于知识图谱的健康膳食知识智能问答系统能够精确的解析用户输入的原始问题的语义;并正确、迅速的以人类友好的方式反馈给用户所需的答案和相关知识。文章首先使用Python Scrapy爬虫框架在百度百科网站中爬取健康膳食的相关数据,将爬取到的数据和《名老中医药李乾构亲授食疗秘方-食物卷》中的内容作为构建健康膳食知识图谱的知识来源;然后分别通过CRF++工具和Deepdive关系抽取项目对知识源进行了命名实体识别和关系抽取,最终使用Neo4j图数据库成功构建了健康膳食领域的知识图谱,该知识图谱共包含1294个与健康膳食相关的节点和2069个三元组。同时以该健康膳食知识图谱为数据支撑研发了一个健康膳食知识智能问答系统。首先对健康膳食知识问答系统进行系统设计和技术路线分析,然后使用HanLP分词器对用户出的原始问题进行分词和关键特征取,再使用基于Spark的朴素贝叶斯分类器对原始问题进行分类匹配,基于匹配结果和关键特征,再去图数据库Neo4j中查找答案,文章研发的健康膳食知识智能问答系统使用Spring-Boot完成整体系统框架研发,待系统研发成功后,可实现与用户交互式的智能问答功能。最后通过运行展示与实验测试相结合的方式对研发的健康膳食知识智能问答系统的功能实现状况进行了验证,并测试了系统的实际使用效果。经过测试,系统可实现在系统设计阶段预先设定的八大功能;系统实际使用满意率达到了65%,距离真正投入市场使用还有一定的改善空间。
医药知识图谱的构建与应用研究
这是一篇关于知识图谱,BiLSTM-CRF,命名实体识别,关系抽取,朴素贝叶斯分类器的论文, 主要内容为自改革开放后,我国经济发展飞速,互联网技术和计算机技术也随之产生和发展,不论是人们的生活中还是工作中无不充斥着网络的身影。由于互联网在我们生活中的加入,随之产生了大量数据和信息,对于这些信息的运用,传统的检索方式已经无法满足用户的日常所需。那么,如何在大量且复杂的信息中准确且快速的搜索到用户所需信息,便成为了信息检索领域的热点问题。知识图谱这一概念的提出,为该研究领域提供了一个新的解决思路。它能将海量的数据加以处理,提取其中包含的实体和其之间的关系,然后以一种直观的方式存储在数据库中。首先,本文运用当下热门的实体识别技术——BiLSTM-CRF。旨在医疗领域文本中提取药品名,疾病名和症状名等实体类型。CRF是机器学习领域中经典的分词方法,将其与深度学习中双向LSTM技术相结合。CRF接在双向LSTM模型后,获取LSTM模型产生的全局最优输出序列,对其再利用,更好的拟合了数据。实验表明,两者的结合在效果和效率方面都取得了令人满意的结果。接着,本文以当下热门的问答系统为原型,目的是将目前可搜集到的关于医疗卫生方面的数据加以运用。先利用Neo4j图数据库存储数据,依次使用HanLP及机器学习中的朴素贝叶斯分类技术实现对用户问题的分词和匹配。最后,通过问答系统的方式对在数据库中检索的结果加以形象化的展示。此次实验结果表明,基于BiLSTM-CRF的命名实体识别技术在处理医学领域文本时具有一定的高效性。同时,基于朴素贝叶斯算法的分类器在问句匹配方面同样也具有很高的准确率,进而证明了问答系统的可用性。本系统的实现,可以为医生提供辅助医疗服务,故具有一定的现实意义。
基于朴素贝叶斯分类器的A公司的产品推荐方法的研究
这是一篇关于大数据,精准营销,数据挖掘,推荐系统,朴素贝叶斯分类器的论文, 主要内容为随着电子商务的普及,在为用户提供多种商品的同时,也为用户增加了更加多样的选择。然而,面对如此多样的商品信息,如何快速、准确地选择所需的商品已成为用户和企业关注的话题。数据挖掘的发展让营销逐步精准化,通过数学方法进行统计分析以及建模,挖掘数据的价值,可以向客户推荐越来越多有用的信息,同时达到营销的目的。产品推荐已广泛应用于金融、电子商务等领域。推荐的营销模式可以提高公司的竞争力,也可以发现客户需求,改善客户体验。大型电子商务网站都有比较完善的推荐系统,而小型电子商务网站往往没有推荐系统或者缺乏比较有效的推荐系统,在竞争中处于劣势。本研究针对小型电子商务平台,通过对客户基本信息和历史交易数据的分析,向客户推荐有用的信息,达到营销的目的。本文以A公司的营销数据为例,利用数学方法进行建模,建立一套切实可行的为客户提供产品推荐服务的方案。本文研究的主要包含以下内容:(1)利用数学方法对A公司的产品推荐方案进行建模,主要使用的方法包含贝叶斯定理、朴素贝叶斯分类器、拉普拉斯修正。在数学模型的基础上对A公司新客户的产品推荐与老客户的产品推荐进行进一步验证,明确个性化推荐的重要意义。(2)针对A公司现状,对A公司产品推荐问题进行分析,对A公司产品推荐的必要性进行分析,形成A公司推荐方案的总体指导意见。
基于电影知识图谱的自动问答系统的设计与实现
这是一篇关于问答系统,电影知识图谱,朴素贝叶斯分类器的论文, 主要内容为如今生活中,大众媒介已经成为了人们视听生活中必不可少的工具,在各个方面各个领域影响着人们对于事物的认知,进而影响人们的思想,改变人们对事物的思维和判断,而在这其中,电影公认是目前最为普遍、信息负载量最大的媒体。并且人们对于精神生活的高质量的追求,人们对于电影需求也日益增加。同时伴随着网络的广泛覆盖,电影相关的信息量也越来越庞大,因此如何设计构建关于电影的问答系统也就越来越迫切和重要。而知识图谱产生的初衷就是在于表述客观存在于真实世界中的各种各样的实体、概念及它们之间存在的种种关系,可以形象的认为是一张的大图。知识图谱方案能够更好的理解语言中的抽象部分,更好的去对语言中模糊的部分通过交互来确认信息。在推荐上能够锁定较少,较为精确的推荐结果,在算法上会比较好实现。针对以上优势,本论文中的电影问答系统是基于知识图谱构建。本系统旨在构建基于电影知识图谱的自动问答系统,按照软件V模型开发流程,首先从需求着手,从功能以及非功能两个角度全面的对系统进行必要的分析,其次基于已经分析完成的需求,展开整体设计,功能模块设计以及数据库设计。系统从整体功能上分为三大部分:(1)数据的获取:采用网络爬虫技术爬取豆瓣电影的数据,并存入My SQL数据库中。(2)知识图谱的构建:基于My SQL数据库中的数据以及数据之间的关系,存入Neo4j图数据库中。(3)问答处理:分为实体意图提取、问答模板匹配和回答语句生成三部分。应用中文分词、朴素贝叶斯分类器以及Cypher语句匹配查询图数据库。系统的实现则是采用了Python语言。最后从是功能和非功能性两个角度对系统进行较为充分的测试,来验证系统是否满足需求。本自动问答系统基于电影知识图谱的方式解决了当前对于大量电影问题的需求,提供一种更加智能方便的方式去反馈,降低了人工回应以及人工查询的成本。
基于知识图谱的柑橘病虫害问答系统设计与实现
这是一篇关于柑橘病虫害,知识图谱,问答系统,朴素贝叶斯分类器,问句泛化的论文, 主要内容为信息技术服务和提升农业产业是推动国家新农村建设、落实乡村振兴战略的重要举措。柑橘栽培面积大、产量高,在我国农产品种植中占有重要地位。在柑橘种植培育过程中,除气候影响和人为因素外,病虫害对柑橘生长的影响也尤为重要。但目前柑橘病虫害知识多以图书文献形式出现,柑橘种植人员往往无法及时获取柑橘病虫害知识和解决栽培过程中的问题。为帮助柑橘种植户及时、准确地处理生长过程中的病虫害问题,本文基于知识图谱构建了柑橘病虫害知识库,设计并实现基于知识图谱的柑橘病虫害问答系统,为柑橘栽培人员提供便捷准确的信息服务。主要工作如下:(1)柑橘病虫害知识图谱构建。鉴于目前柑橘病虫害开源数据库缺乏,且实际存在的数据也比较分散,本文采用以自顶向下为主、自底向上为辅的知识图谱构建方式,设计柑橘病虫害知识图谱总体结构,即先运用自顶向下的思想构建出柑橘病虫害知识图谱领域模型,再运用自底向上的思想进行结构上的补充。在柑橘病虫害知识获取方面,以农业科学叙词表为主,通过爬取百度百科、各大农业网站为辅的方式进行知识采集,并采用Deepdive为主和人工辅助对数据进行知识补全、降低冗余等预处理操作实现实体抽取和关系抽取,得到柑橘病虫害三元组。针对数据存储的问题,先以csv格式文件对数据进行保存,然后再用LOAD CSV方法将数据传入到Neo4j图数据库中存储并展示。(2)基于知识图谱的柑橘病虫害问句分类研究。首先对获取的问句集做预处理工作,通过Han LP对问句集进行自定义词性处理,并将特征词加载入词典中,在此基础上,设计柑橘病虫害问答系统的问题模板与训练集,对训练集进行问句泛化处理,得到泛化前后的训练集,再采取基于Spark的朴素贝叶斯进行问句分类。实验结果表明,基于Spark的朴素贝叶斯比常用的基于特征词方法的F1值要高出15.9%,达到了77.4%,且问句泛化后朴素贝叶斯分类方法的F1值比问句泛化前高出4.3%。(3)基于知识图谱的柑橘病虫害问答系统设计与实现。在分析柑橘病虫害问答系统需求的基础上,完成系统架构和功能模块设计,用户前端输入的问句后经过Han LP进行分词处理,将得到的信息传递给朴素贝叶斯分类器,经过计算得到模板索引值和关键特征,再通过图数据库Neo4j完成问句答案检索,实现柑橘病虫害交互式问答。综上所述,本文实现的基于知识图谱的柑橘病虫害问答系统,在交互性、准确性和性能等方面效果较好,能够根据用户提出的问题快速返回答案,满足柑橘种植用户病虫害领域知识获取的需求。
基于知识图谱的健康膳食知识智能问答系统
这是一篇关于健康膳食,知识图谱,条件随机场,Neo4j,朴素贝叶斯分类器的论文, 主要内容为世界卫生组织曾出不健康的饮食是诱发癌症、心血管疾病、糖尿病等一系列慢性疾病以及其它与肥胖相关病症的主要危险因素。健康的饮食不仅可以降低某些的疾病的发生概率,还可以在疾病发生后对病症进行调理以改善身体状况;近些年来公众也越来越多的关注健康合理的膳食,并试图在搜素引擎上获取符合自己需求的膳食信息,或借各种来源不明的推送消息获取健康膳食知识。党的十九大更是基于此作出实施―健康中国‖战略的重大决策,将维护国民健康升到国家战略的高度。政府相关部门为公众供关于健康膳食知识的信息服务则是实施―健康中国‖战略的一项重要举措,而一个科学、有效的智能问答系统则是当前比较先进的信息服务模式之一。传统的问答系统都是通过关键词的匹配来返回答案,无法解析用户的语义信息,且不具备逻辑性,因而无法满足用户的需求。知识图谱在分析事物时,创新的从―关系‖角度切入,通过该方式,基于知识图谱的健康膳食知识智能问答系统能够精确的解析用户输入的原始问题的语义;并正确、迅速的以人类友好的方式反馈给用户所需的答案和相关知识。文章首先使用Python Scrapy爬虫框架在百度百科网站中爬取健康膳食的相关数据,将爬取到的数据和《名老中医药李乾构亲授食疗秘方-食物卷》中的内容作为构建健康膳食知识图谱的知识来源;然后分别通过CRF++工具和Deepdive关系抽取项目对知识源进行了命名实体识别和关系抽取,最终使用Neo4j图数据库成功构建了健康膳食领域的知识图谱,该知识图谱共包含1294个与健康膳食相关的节点和2069个三元组。同时以该健康膳食知识图谱为数据支撑研发了一个健康膳食知识智能问答系统。首先对健康膳食知识问答系统进行系统设计和技术路线分析,然后使用HanLP分词器对用户出的原始问题进行分词和关键特征取,再使用基于Spark的朴素贝叶斯分类器对原始问题进行分类匹配,基于匹配结果和关键特征,再去图数据库Neo4j中查找答案,文章研发的健康膳食知识智能问答系统使用Spring-Boot完成整体系统框架研发,待系统研发成功后,可实现与用户交互式的智能问答功能。最后通过运行展示与实验测试相结合的方式对研发的健康膳食知识智能问答系统的功能实现状况进行了验证,并测试了系统的实际使用效果。经过测试,系统可实现在系统设计阶段预先设定的八大功能;系统实际使用满意率达到了65%,距离真正投入市场使用还有一定的改善空间。
医药知识图谱的构建与应用研究
这是一篇关于知识图谱,BiLSTM-CRF,命名实体识别,关系抽取,朴素贝叶斯分类器的论文, 主要内容为自改革开放后,我国经济发展飞速,互联网技术和计算机技术也随之产生和发展,不论是人们的生活中还是工作中无不充斥着网络的身影。由于互联网在我们生活中的加入,随之产生了大量数据和信息,对于这些信息的运用,传统的检索方式已经无法满足用户的日常所需。那么,如何在大量且复杂的信息中准确且快速的搜索到用户所需信息,便成为了信息检索领域的热点问题。知识图谱这一概念的提出,为该研究领域提供了一个新的解决思路。它能将海量的数据加以处理,提取其中包含的实体和其之间的关系,然后以一种直观的方式存储在数据库中。首先,本文运用当下热门的实体识别技术——BiLSTM-CRF。旨在医疗领域文本中提取药品名,疾病名和症状名等实体类型。CRF是机器学习领域中经典的分词方法,将其与深度学习中双向LSTM技术相结合。CRF接在双向LSTM模型后,获取LSTM模型产生的全局最优输出序列,对其再利用,更好的拟合了数据。实验表明,两者的结合在效果和效率方面都取得了令人满意的结果。接着,本文以当下热门的问答系统为原型,目的是将目前可搜集到的关于医疗卫生方面的数据加以运用。先利用Neo4j图数据库存储数据,依次使用HanLP及机器学习中的朴素贝叶斯分类技术实现对用户问题的分词和匹配。最后,通过问答系统的方式对在数据库中检索的结果加以形象化的展示。此次实验结果表明,基于BiLSTM-CRF的命名实体识别技术在处理医学领域文本时具有一定的高效性。同时,基于朴素贝叶斯算法的分类器在问句匹配方面同样也具有很高的准确率,进而证明了问答系统的可用性。本系统的实现,可以为医生提供辅助医疗服务,故具有一定的现实意义。
医药知识图谱的构建与应用研究
这是一篇关于知识图谱,BiLSTM-CRF,命名实体识别,关系抽取,朴素贝叶斯分类器的论文, 主要内容为自改革开放后,我国经济发展飞速,互联网技术和计算机技术也随之产生和发展,不论是人们的生活中还是工作中无不充斥着网络的身影。由于互联网在我们生活中的加入,随之产生了大量数据和信息,对于这些信息的运用,传统的检索方式已经无法满足用户的日常所需。那么,如何在大量且复杂的信息中准确且快速的搜索到用户所需信息,便成为了信息检索领域的热点问题。知识图谱这一概念的提出,为该研究领域提供了一个新的解决思路。它能将海量的数据加以处理,提取其中包含的实体和其之间的关系,然后以一种直观的方式存储在数据库中。首先,本文运用当下热门的实体识别技术——BiLSTM-CRF。旨在医疗领域文本中提取药品名,疾病名和症状名等实体类型。CRF是机器学习领域中经典的分词方法,将其与深度学习中双向LSTM技术相结合。CRF接在双向LSTM模型后,获取LSTM模型产生的全局最优输出序列,对其再利用,更好的拟合了数据。实验表明,两者的结合在效果和效率方面都取得了令人满意的结果。接着,本文以当下热门的问答系统为原型,目的是将目前可搜集到的关于医疗卫生方面的数据加以运用。先利用Neo4j图数据库存储数据,依次使用HanLP及机器学习中的朴素贝叶斯分类技术实现对用户问题的分词和匹配。最后,通过问答系统的方式对在数据库中检索的结果加以形象化的展示。此次实验结果表明,基于BiLSTM-CRF的命名实体识别技术在处理医学领域文本时具有一定的高效性。同时,基于朴素贝叶斯算法的分类器在问句匹配方面同样也具有很高的准确率,进而证明了问答系统的可用性。本系统的实现,可以为医生提供辅助医疗服务,故具有一定的现实意义。
医药知识图谱的构建与应用研究
这是一篇关于知识图谱,BiLSTM-CRF,命名实体识别,关系抽取,朴素贝叶斯分类器的论文, 主要内容为自改革开放后,我国经济发展飞速,互联网技术和计算机技术也随之产生和发展,不论是人们的生活中还是工作中无不充斥着网络的身影。由于互联网在我们生活中的加入,随之产生了大量数据和信息,对于这些信息的运用,传统的检索方式已经无法满足用户的日常所需。那么,如何在大量且复杂的信息中准确且快速的搜索到用户所需信息,便成为了信息检索领域的热点问题。知识图谱这一概念的提出,为该研究领域提供了一个新的解决思路。它能将海量的数据加以处理,提取其中包含的实体和其之间的关系,然后以一种直观的方式存储在数据库中。首先,本文运用当下热门的实体识别技术——BiLSTM-CRF。旨在医疗领域文本中提取药品名,疾病名和症状名等实体类型。CRF是机器学习领域中经典的分词方法,将其与深度学习中双向LSTM技术相结合。CRF接在双向LSTM模型后,获取LSTM模型产生的全局最优输出序列,对其再利用,更好的拟合了数据。实验表明,两者的结合在效果和效率方面都取得了令人满意的结果。接着,本文以当下热门的问答系统为原型,目的是将目前可搜集到的关于医疗卫生方面的数据加以运用。先利用Neo4j图数据库存储数据,依次使用HanLP及机器学习中的朴素贝叶斯分类技术实现对用户问题的分词和匹配。最后,通过问答系统的方式对在数据库中检索的结果加以形象化的展示。此次实验结果表明,基于BiLSTM-CRF的命名实体识别技术在处理医学领域文本时具有一定的高效性。同时,基于朴素贝叶斯算法的分类器在问句匹配方面同样也具有很高的准确率,进而证明了问答系统的可用性。本系统的实现,可以为医生提供辅助医疗服务,故具有一定的现实意义。
基于知识图谱的柑橘病虫害问答系统设计与实现
这是一篇关于柑橘病虫害,知识图谱,问答系统,朴素贝叶斯分类器,问句泛化的论文, 主要内容为信息技术服务和提升农业产业是推动国家新农村建设、落实乡村振兴战略的重要举措。柑橘栽培面积大、产量高,在我国农产品种植中占有重要地位。在柑橘种植培育过程中,除气候影响和人为因素外,病虫害对柑橘生长的影响也尤为重要。但目前柑橘病虫害知识多以图书文献形式出现,柑橘种植人员往往无法及时获取柑橘病虫害知识和解决栽培过程中的问题。为帮助柑橘种植户及时、准确地处理生长过程中的病虫害问题,本文基于知识图谱构建了柑橘病虫害知识库,设计并实现基于知识图谱的柑橘病虫害问答系统,为柑橘栽培人员提供便捷准确的信息服务。主要工作如下:(1)柑橘病虫害知识图谱构建。鉴于目前柑橘病虫害开源数据库缺乏,且实际存在的数据也比较分散,本文采用以自顶向下为主、自底向上为辅的知识图谱构建方式,设计柑橘病虫害知识图谱总体结构,即先运用自顶向下的思想构建出柑橘病虫害知识图谱领域模型,再运用自底向上的思想进行结构上的补充。在柑橘病虫害知识获取方面,以农业科学叙词表为主,通过爬取百度百科、各大农业网站为辅的方式进行知识采集,并采用Deepdive为主和人工辅助对数据进行知识补全、降低冗余等预处理操作实现实体抽取和关系抽取,得到柑橘病虫害三元组。针对数据存储的问题,先以csv格式文件对数据进行保存,然后再用LOAD CSV方法将数据传入到Neo4j图数据库中存储并展示。(2)基于知识图谱的柑橘病虫害问句分类研究。首先对获取的问句集做预处理工作,通过Han LP对问句集进行自定义词性处理,并将特征词加载入词典中,在此基础上,设计柑橘病虫害问答系统的问题模板与训练集,对训练集进行问句泛化处理,得到泛化前后的训练集,再采取基于Spark的朴素贝叶斯进行问句分类。实验结果表明,基于Spark的朴素贝叶斯比常用的基于特征词方法的F1值要高出15.9%,达到了77.4%,且问句泛化后朴素贝叶斯分类方法的F1值比问句泛化前高出4.3%。(3)基于知识图谱的柑橘病虫害问答系统设计与实现。在分析柑橘病虫害问答系统需求的基础上,完成系统架构和功能模块设计,用户前端输入的问句后经过Han LP进行分词处理,将得到的信息传递给朴素贝叶斯分类器,经过计算得到模板索引值和关键特征,再通过图数据库Neo4j完成问句答案检索,实现柑橘病虫害交互式问答。综上所述,本文实现的基于知识图谱的柑橘病虫害问答系统,在交互性、准确性和性能等方面效果较好,能够根据用户提出的问题快速返回答案,满足柑橘种植用户病虫害领域知识获取的需求。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码工坊 ,原文地址:https://m.bishedaima.com/lunwen/54038.html