基于语义网的站内搜索引擎模块的研究与实现
这是一篇关于语义网,知识图谱,搜索引擎,电子商城的论文, 主要内容为互联网时代,信息呈现出爆炸式的扩散和增长,每天我们都在生产和接收海量的各类信息,对于用户而言,想要精准、快速和便捷的获取想要的信息,变得愈发的困难;而对于互联网服务公司而言,如何创新技术应用、提升客户服务水平,成为提升用户满意度、增强用户粘性的重要措施。因此,智能化、情景化、社会化的语义搜索技术,成为众多互联网公司和学者的研究目标。面向语义网的搜索引擎将充分的利用语义网丰富的语义信息作为出发点,通过分析语义文档中的语义标注和本体的知识表示使得用户针对某一个专题进行精确的搜索成为可能,面向语义网的搜索引擎的关键技术研究对推动互联网技术的进一步发展以及语义网的普及具有重要意义。国网商城系国家电网公司统筹安排建设的互联网电子商务平台,平台以网上缴费、在线服务、电商化采购为着力点,打造集公共事业缴费、产业协同发展、商品销售、电动汽车一站式服务、分布式电源、清洁能源替代、金融创新等线上线下服务为一体的电子商务与金融交易平台。客户业务应用众多,搜索引擎无疑需要发挥出重要的支撑作用,为用户提供直接到达目标信息的通道。从系统上线情况来看,搜索也确实一直是用户使用频率最高、关联应用数据最广、使用反馈最多的系统功能。但在搜索过程体验、系统响应速度、搜索结果的精准性等方面,有待改进完善。本文对语义网及其相关的前沿技术进行深入研究,针对自然语言分析处理技术、机器学习技术、语义分词技术等技术进行剖析,集中了上述的观点,提出一种新的信息搜索模式的工作方式——基于语义网的智能搜索引擎模块。结合理论模型,立足国网商城项目,本文从解决实际问题角度出发,分析当前国网商城搜索引擎存在的弊端,对商城搜索引擎改造进行了详细设计,将搜索引擎封装为独立的模块,对外提供WebService接口,搜索功能通过调用服务实现数据和信息的搜索。通过改造,商城搜索功能基本实现前端体验合理化、系统功能智能化、数据应用简单化的总体目标。对于用户,站内搜索的优化可以改善用户搜索的准确率,快速找到用户想要的商品,避免过多操作,提升体验;对于运营,站内搜索系统化的价值巨大,可以了解用户的意图,优化网站的结构,改善站点的用户体验。
基于知识图谱的网购商品评论可信性模型与评估方法研究
这是一篇关于在线商品评论,带权知识图谱,评论可信性,语义网,召回率的论文, 主要内容为随着线上购物的迅速发展,人们愈发热衷于在各大网络电商平台进行商品的选购,而关于商品的各种评价则成为了消费者购物决策的关键因素。电商平台的商品评价蕴含着大量对消费者以及商家有用的信息,而这些海量评价中往往隐藏着一些无用信息以及误导信息,大大降低了评论的可信性。本文基于在线商品评论,进行了评论可信性模型的设计以及评估方法的研究,旨在为消费者购物决策以及工商部门对评论进行监管提供新的解决思路。知识图谱是一种结构化的语义知识库,可通过简易的符号形式来描述物体之间的概念以及相互关系。而评论中所含有的知识是由很多概念组成,即包括语义较为丰富的高层概念也含有语义较为单一的低层概念,本文基于改进后的知识图谱,对商品评论中的知识赋予权重,通过设计合理的可信性模型,达到对评论可信度能够量化的效果。本文针对可信性模型的设计以及评估方法的研究进行了深入的研究,主要工作如下所述:(1)提取专业手机测评网站以及领域专家知识中关于手机的相关实体以及属性,基于现有的知识图谱构建手段,进行手机知识图谱的构建。同时对手机知识图谱进行扩展,赋予相关知识以权重,为后续的可信性模型设计垫定基础。(2)基于已设计的手机知识图谱,通过对手机知识图谱进行扩展,设计带权商品知识图谱,并提取相关评论中与知识图谱中相似度较高的知识构建评论语义网,最后基于评论语义网设计出网购商品评论可信性模型。(3)研究评论可信性度量模型在电商平台上的评论可信性排序的作用,并通过与京东推荐模型和其他研究者的排序模型作对比来验证该模型的可行性以及有效性,借助问卷调查以及召回率、准确率等指标来进行模型的评估。
基于知识图谱的问卷辅助生成系统
这是一篇关于语义网,知识图谱,本体,问卷调查,Jena的论文, 主要内容为随着互联网技术的应用和发展,大量基于知识图谱的问卷辅助生成系统的信息在网络中涌现。分布式的文件存储方式,使得信息的获取成为一’大问题。语义网的概念应运而生,语义网旨在将离散的“文档万维网”转变为通过数据互联的“数据万维网”。语义网技术主要通过本体来定义概念和属性,并将网络中的信息作为实体信息填入本体之中。通过对本体的推理,来实现更为精确的搜索。语义网的研究热潮催生出了大量用户生成内容和开放链接数据,谷歌在此基础上提出了知识图谱的概念。知识图谱目前多被用于智能语义搜索和深度问答系统中。本次课题研究在知识图谱的背景下,将目光聚集于问卷调查这样一个具体的问题上。首先,目前知识图谱的应用主要是研究如何回答问题,而较少有研究如何借助知识图谱去提出问题的;再者,目前网络上的问卷调查系统大都关注的是如何提供形式上的模板,而没有关注问卷内容的设计。基于以上两点,本次课题研究找到了问卷生成和知识图谱的契合点,即如何使用知识图谱的技术来为问卷设计者提供内容上的支持。本课题首先对本体、本体描述语言和本体查询语言做了详细的研究和阐述。基于以上研究,构建出了一个与音乐相关的领域本体。之后,选取了开源的JAVA框架Jena来对所建本体进行存储、推理和查询;并借助Spring MVC框架构建出了一个B/S架构的系统,用于向问卷设计者展现查询信息,从而实现内容上的支持。
基于本体的电影院NFC智能应用系统的设计与实现
这是一篇关于近场通讯,本体,语义网,本体查询的论文, 主要内容为当前,移动互联网飞速发展,NFC近场通信技术正逐渐的走进人们的日常生活中,通过在智能手机上集成NFC芯片,将使人们的日常生活,移动的信息交互、支付方式等更加快捷高效。 使用本体对数据与用户上下文信息管理组织,对领域知识与用户偏好使用OWL构建本体模型,信息数据就会具有更高的价值,应用功能就可以更加个性化。 本文所设计实现的电影院智能应用系统,提供扫描NFC标签获得电影的智能海报等信息,通过构建的电影知识本体,支持对电影信息的查询与评论,以及个性化的电影推荐功能,体现了对NFC近场通信技术与本体的应用。 首先,本文研究了NFC的技术背景与应用模式。确定以扫描NFC标签读取电影的智能海报等信息为应用的入口点,使人们获取电影信息的方式更加便捷高效。 其次,本文研究了本体理论与本体构建方法,使用本体建模工具Protégé对电影院场景进行OWL建模,构建电影知识本体。研究了本体的查询与推理的方法,对本体程序开发框架Jena的结构与关键类做了介绍,确定以电影信息的查询与个性化推荐为应用的两大基本功能点。 然后,对整个系统进行设计与实现。将系统分为应用管理器、电影应用与后台服务端,增加应用管理功能方便以后系统的功能扩展,增加了电影的评论功能满足了人们的分享需求。在设计章节,详细介绍了系统的总体架构与各个功能模块的设计,构建电影本体的方法与过程。在实现章节,对系统关键部分的实现作了详细介绍,包括Android NFC API的使用以及NFC标签的扫描的实现,对传递的数据格式XML进行解析,应用界面之间切换的实现,客户端与服务端通信的命令构造,以及最重要的对本体解析查询实现查询模块,对用户个性化因素进行分析选取,本体推理加上推荐算法实现个性化的电影推荐功能。 最后,对系统的应用各个功能进行了测试,验证了系统对NFC近场通讯技术的有效运用,验证了使用本体实现电影信息的查询与个性化推荐推荐服务。
基于知识树的自适应翻译与推荐学习辅助平台研究
这是一篇关于语义网,学科领域知识树,知识点相似匹配机,推理引擎,多领域映射翻译库,自适应翻译和推荐的论文, 主要内容为计算机在教育中的研究和应用可以追溯到20世纪50年代。随着学习理论、网络技术、人工智能技术的发展,当前基于网络的智能学习系统逐步的改变传统教育方式中交互性差,教学方式单一,不能适应所有学生的认知能力等状况,使得计算机辅助教育在智能化、个性化方面发生了质的飞跃。 随着对网络教育的技术观和学习观的深入认识,不同学科领域知识的多样性和异构性使知识的组织和共享成为难点,我们不但要实现学习课程的网络化,还要实现学科资源的语义化,这样知识的搜索和获得才变得更加有效和方便,而基于语义网构建的远程教育平台克服了传统网络无法理解语言逻辑意义的缺点。本文针对目前网络学习系统对于同一个英文知识点不能在具体专业领域进行中文语义的自适应翻译和根据语义推荐相关学习辅助知识点,提出一种远程学习辅助平台加以解决。 文章分析了目前网络教学系统的特点、要求和支持该学习平台的资源组织方式——知识地图、语义网本体和语义链网络的相关技术,提出一种高效实用的资源组织方式——通过知识地图转化的基于语义链网络的学科领域本体知识树,探讨了自适应翻译推荐辅助学习平台(KTRP)的框架模型和实现流程,对学科领域知识树的构建原则和方法,基于学科领域知识树的知识点语义推理引擎的推理规则和个性化推荐相关知识点的方法、知识点相似匹配机的原理和技术进行了较深入的研究,最后以计算机专业课程《数据结构》中图论章节和物理学两个领域知识树的构建为实践,运用JSP和数据库技术,设计实现了当读者学习英文专业领域的文章,查询文章中的知识点,特别是该英文知识点在这两个专业领域存在多中文释义的时候,能在两个领域自适应地翻译成当前文章领域的中文解释并推荐的相关知识点供读者学习的原型系统,并对该平台与已有的学习辅助平台作出了比较和评价,最后总结了本文工作并提出实现学生模块、多维度推理以及知识点动态标注推荐多维度知识点和文章的进一步工作。
基于知识图谱的问卷辅助生成系统
这是一篇关于语义网,知识图谱,本体,问卷调查,Jena的论文, 主要内容为随着互联网技术的应用和发展,大量基于知识图谱的问卷辅助生成系统的信息在网络中涌现。分布式的文件存储方式,使得信息的获取成为一’大问题。语义网的概念应运而生,语义网旨在将离散的“文档万维网”转变为通过数据互联的“数据万维网”。语义网技术主要通过本体来定义概念和属性,并将网络中的信息作为实体信息填入本体之中。通过对本体的推理,来实现更为精确的搜索。语义网的研究热潮催生出了大量用户生成内容和开放链接数据,谷歌在此基础上提出了知识图谱的概念。知识图谱目前多被用于智能语义搜索和深度问答系统中。本次课题研究在知识图谱的背景下,将目光聚集于问卷调查这样一个具体的问题上。首先,目前知识图谱的应用主要是研究如何回答问题,而较少有研究如何借助知识图谱去提出问题的;再者,目前网络上的问卷调查系统大都关注的是如何提供形式上的模板,而没有关注问卷内容的设计。基于以上两点,本次课题研究找到了问卷生成和知识图谱的契合点,即如何使用知识图谱的技术来为问卷设计者提供内容上的支持。本课题首先对本体、本体描述语言和本体查询语言做了详细的研究和阐述。基于以上研究,构建出了一个与音乐相关的领域本体。之后,选取了开源的JAVA框架Jena来对所建本体进行存储、推理和查询;并借助Spring MVC框架构建出了一个B/S架构的系统,用于向问卷设计者展现查询信息,从而实现内容上的支持。
基于知识图谱的网购商品评论可信性模型与评估方法研究
这是一篇关于在线商品评论,带权知识图谱,评论可信性,语义网,召回率的论文, 主要内容为随着线上购物的迅速发展,人们愈发热衷于在各大网络电商平台进行商品的选购,而关于商品的各种评价则成为了消费者购物决策的关键因素。电商平台的商品评价蕴含着大量对消费者以及商家有用的信息,而这些海量评价中往往隐藏着一些无用信息以及误导信息,大大降低了评论的可信性。本文基于在线商品评论,进行了评论可信性模型的设计以及评估方法的研究,旨在为消费者购物决策以及工商部门对评论进行监管提供新的解决思路。知识图谱是一种结构化的语义知识库,可通过简易的符号形式来描述物体之间的概念以及相互关系。而评论中所含有的知识是由很多概念组成,即包括语义较为丰富的高层概念也含有语义较为单一的低层概念,本文基于改进后的知识图谱,对商品评论中的知识赋予权重,通过设计合理的可信性模型,达到对评论可信度能够量化的效果。本文针对可信性模型的设计以及评估方法的研究进行了深入的研究,主要工作如下所述:(1)提取专业手机测评网站以及领域专家知识中关于手机的相关实体以及属性,基于现有的知识图谱构建手段,进行手机知识图谱的构建。同时对手机知识图谱进行扩展,赋予相关知识以权重,为后续的可信性模型设计垫定基础。(2)基于已设计的手机知识图谱,通过对手机知识图谱进行扩展,设计带权商品知识图谱,并提取相关评论中与知识图谱中相似度较高的知识构建评论语义网,最后基于评论语义网设计出网购商品评论可信性模型。(3)研究评论可信性度量模型在电商平台上的评论可信性排序的作用,并通过与京东推荐模型和其他研究者的排序模型作对比来验证该模型的可行性以及有效性,借助问卷调查以及召回率、准确率等指标来进行模型的评估。
基于本体的语义网爬虫的算法研究与应用实现
这是一篇关于语义网,专题爬虫,本体的论文, 主要内容为语义网是在万维网的基础上进行扩展形成的。语义网对网络中的数据加入语义信息以帮助语义网应用能够在语义层面对数据进行理解并进行处理。近些年,语义网飞速发展,符合语义网标准的语义信息数量迅速增长,对这些信息进行有效的处理和解析可以为用户提供高质量的服务。语义搜索引擎就是这样的一个典型的语义网应用,它充分利用语义信息,将语义信息有效的组织并提供给用户进行语义相关的查询。而语义专题搜索引擎则更加充分的发挥了语义信息的特点,利用语义分析将主题相关的信息进行组织和检索,最终为用户提供准确的搜索结果。 在语义专题搜索引擎框架中,语义专题爬虫是重要的部件之一。它负责搜集与主题相关的语义信息并对其进行初步的处理,例如语义信息的分类、存储以及元数据的抽取等。语义专题爬虫面临的问题是,如何在海量的语义信息中准确高效的获得与主题相关的语义资源。语义专题爬虫需要对语义信息进行内容判断、计算语义信息与主题的相关性、筛选与主题相关的信息并保存到数据存储中。同时,语义专题爬虫的效率也是相关研究的主要内容之一。 因此,针对语义专题爬虫的准确性和效率问题,本文分别提出了相应的方法予以解决。对于语义信息内容的主题相关性判断问题,本文提出了判断语义文档的主题相关度的方法。方法将语义文档和领域本体表示为图形结构并通过计算图形结构之间的相似度来判断文档的主题相关度。在优化语义专题爬虫的效率方面,本文提出了Q学习结合贝叶斯分类器的路径预测算法(以下简称QBLP算法),QBLP算法通过计算页面主题相关度来作为Q学习器的回报函数,并利用回报函数对贝叶斯分类器的先验概率和条件概率进行调整,使先验概率和条件概率逐步趋近于真实值,以此来提高爬虫获取主题相关语义文档的性能。除了对算法进行研究,本文基于上述算法实现了语义专题爬虫FOCSEW系统。 论文在以下方面作了有益的探索和创新性工作。 (1)基于最大概率密度的聚类方法。在语义文档的图形表示方法中,为了对语义文档中的所有代表实体的关键词进行语义消歧并组织成图形结构,本文提出了基于最大概率密度的聚类方法。一个关键词可以包含多重概念,关键词和其在具体文档中概念的对应关系具有一定的概率性。最大概率密度就是一种包含了这样的概率信息的语义距离衡量标准。本文以最大概率密度为基础进行基于密度的聚类形成簇,再将簇中的所有概念连接形成的图形结构作为语义文档的内容表示。 (2)针对语义专题爬虫的路径调整算法进行了分析和阐述。面对大量位置分散的语义文档,对文档内容的分析以及爬行路径的预测和筛选显得非常重要。本文提出了利用WordNet本体作为指导的语义文档图形表示方法,方法可以准确的将语义文档的内容表示为图形结构。在此基础上,本文提出了由Q学习器通过学习为贝叶斯分类器提供先验概率的QBLP爬虫路径调整算法。QBLP方法通过累计语义文档和语义链接特征的知识,调整爬虫爬行路径,提高爬虫的性能。这个目标在实验中得到了验证。 本课题是在语义网搜索引擎研究框架下的重点模块之一。语义专题爬虫主要的目标是搜集与主题相关的语义文档供用户通过语义搜索引擎进行查询。本文对与主题相关的语义资源进行搜索和筛选,对于信息的集成和检索有着积极的意义。实验证明本文阐述的算法以及实现的语义专题爬虫系统FOCSEW可以高效的搜索相关语义资源,为语义搜索引擎系统奠定了数据基础。
面向特定领域的知识图谱构建与实现
这是一篇关于知识图谱,语义网,关系抽取,可视化,电影的论文, 主要内容为作为近几年兴起的热门技术,知识图谱被认为是认知智能的基础,其以结构化的方式对现实世界中的概念、实体和关系进行描述,这为管理和组织互联网中的海量信息提供了有效手段。总体上,知识图谱可以分为开放领域知识图谱和特定领域知识图谱,开放领域知识图谱通常容纳有多个领域内的知识,其知识的范围更大,而特定领域知识图谱则包含更多领域内的专业知识。目前越来越多的知识图谱被应用于特定领域进行智能搜索、语义问答等服务并表现出了良好的效果。随着物质文化水平的提高,国民在电影市场上的消费越投入来越多。当前观众了解电影作品信息的主要途径为电影领域内的专业网站,但其存在检索和展示方式不够人性化的短板,为此本文将知识图谱应用于电影领域,构建了 一个用于电影知识可视化查询的知识图谱系统。本文基于Scrapy爬虫框架设计了一套爬虫程序用于从电影领域网站抓取电影原始数据,在对数据进行清洗和整理后利用本体描述了知识图谱的模式层设计。本文根据知识图谱的模式层,分别构建了基于RDF数据库的知识存储系统和基于图数据库的知识存储系统,在对二者进行对比之后最终选择了RDF数据库来存储知识图谱数据。然后本文利用条件随机场模型实现了电影命名实体识别,并基于已经构建的RDF知识存储系统和远程监督学习的方式提出了一种电影-人物关系的抽取方法,通过电影实体识别和关系抽取的方式从非结构化文本中抽取知识并加入知识图谱中。最后本文基于上述过程中构建的电影知识图谱实现了可视化的电影知识图谱查询系统,并描述了系统的需求分析、设计和实现细节,完成了系统的测试验证。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕业设计工坊 ,原文地址:https://m.bishedaima.com/lunwen/45911.html