8篇关于属性抽取的计算机毕业论文

今天分享的是关于属性抽取的8篇计算机毕业论文范文, 如果你的论文涉及到属性抽取等主题,本文能够帮助到你 基于半结构化信息的产品推荐系统 这是一篇关于产品推荐系统,命名实体识别

今天分享的是关于属性抽取的8篇计算机毕业论文范文, 如果你的论文涉及到属性抽取等主题,本文能够帮助到你

基于半结构化信息的产品推荐系统

这是一篇关于产品推荐系统,命名实体识别,属性抽取,相似度度量,主动学习,条件随机场的论文, 主要内容为产品推荐是指从海量网络产品信息中依据用户兴趣进行选择并向用户进行推荐。好的产品推荐系统一方面能极大节约用户搜索及挑选产品的时间,另一方面能有效增加商家的用户粘性。因此,产品推荐系统在电商中得到了越来越广泛的应用,与此同时,也暴露出了诸多问题,引起了越来越多研究者的关注。 本文在已有研究的基础上,着重研究基于半结构化信息的产品推荐系统中的两个关键技术,其一是从半结构化信息中抽取结构化的产品属性信息,其二是基于抽取的结构化属性信息进行产品相似度的度量。为此,本文开展了如下的研究和开发工作: (1)在产品结构化属性信息抽取方面,本文基于半结构化产品描述信息的特点,采用了基于主动学习的线性条件随机场模型进行产品属性及属性值的抽取。实验表明,该算法在获取较好抽取效果的同时,能减少对语料的标注,因此,具有较好的可移植性。 (2)在产品相似度度量方面,本文提出了基于所抽取的属性进行产品相似度度量的方法。该方法首先基于产品属性进行分类,之后在同类产品间采用最小编辑距离来综合其他属性度量产品相似度。实验表明了该方法的有效性。 (3)综合以上两个技术,本文实现了一个基于半结构化信息的产品推荐系统。在系统原型设计实现中,采用JSP+Servlet+Spring+Hibernate框架。实验表明,本文提出的方法在产品推荐系统中具有较好的可解释性、可扩展性和较好的推荐性能。

农作物知识图谱构建技术研究与应用

这是一篇关于属性抽取,BERT-BILSTM-CRF模型,农作物知识图谱,NEO4J的论文, 主要内容为近年来,知识图谱发展迅猛,已成为人工智能重要研究方向,在各领域都得到了广泛应用。国内外学者在知识图谱构建的各环节都进行了相当深入的研究。本文以农业作物知识图谱为研究对象,利用《农业科学叙词表》、条件随机场模型、双向长短期记忆循环神经网络模型和BERT模型等理论方法,开展对农业作物知识图谱模式构建和属性抽取研究。论文的主要研究工作总结如下:(1)分析了农作物知识图谱的研究背景和现状,研究构建的相关技术并完成农作物的知识图谱构建。(2)现有知识图谱的数据来源多是以维基百科或百度百科这样的公共资源,针对农业领域方面的知识资源缺失等问题,论文运用基于叙词表的知识图谱构建技术研究农作物知识图谱构建方法,并在叙词表到知识图谱模式层和数据层构建的初步农作物知识图谱基础上,添加了各作物的属性。(3)目前在知识图谱研究领域,现有的属性抽取研究方法都是公共数据集,应用在农业领域微乎其微。论文针对现有BILSTM-CRF模型存在的不足,提出了基于BERT预训练的BERT-BILSTM-CRF的组合模型,并将已有数据集按3:1比例随机分隔为训练集和测试集。试验结果表明:BERT-BILSTM-CRF模型与BILSTM-CRF模型相比,准确率较以往提升3.58%,召回率提升2.17%,F1值提高了2.75%,满足农业作物领域的属性抽取要求。

面向法律领域的蒙古文知识图谱自动问答研究

这是一篇关于蒙古文,自动问答,知识图谱,实体抽取,属性抽取的论文, 主要内容为随着我国法律体系的逐步完善,群众的法律咨询需求量与日俱增。现如今蒙古族群众仍停留于人工咨询的方式,导致法律咨询量和律师资源失去了平衡,致使法律从业人员的人力成本变高,蒙古文法律自动问答则可以有效地缓解人工法律咨询供不应求的状态。蒙古文法律问答面临专业性强、从业人员少和数据资源少等难点,引入法律知识图谱能增强问答过程中的法律专业性。本文对面向法律领域的知识图谱自动问答技术进行研究,针对现有法律问答中受到问答库限制、无法推理以及回复专业性低等缺点,设计并实现了面向法律领域的蒙古文知识图谱自动问答系统。主要研究内容有:(1)法律领域自动问答蒙古文数据资源建设本文首先对现有中文法律数据资源进行收集、筛选、翻译、人工校正、自动校正等一系列处理,构建了15万对蒙古文法律问答语料库。然后从蒙古文问答语料中构建了17400句子的实体标注语料库以及16200句子的属性标注语料库,为问句语义解析提供数据支撑。最后,针对缺少蒙古文法律领域知识图谱的现状,构建了857个实体的蒙古文法律罪名相关知识图谱。(2)面向法律领域的蒙古文实体抽取研究首先采用BiLSTM-CRF模型研究了蒙古文法律实体自动抽取方法。为增加模型的泛化性,选择了少数民族多语言预训练模型CINO,研究了基于CINO-BiLSTM-CRF实体抽取模型。另外,为了利用Transformer模型和BiLSTM模型在上下文长距离依赖特征和方向性特征提取方面的有效性,将Transformer模型和BiLSTM模型相结合进行特征提取,研究了基于Transformer-BiLSTM-CRF蒙古文实体抽取模型。实验结果表明,引入CINO预训练模型能有效地提高训练数据少的实体在BiLSTMCRF模型的泛化能力,CINO-BiLSTM-CRF模型在P、R和F1值上都有所提升。通过结合Transformer和BiLSTM模型的特征提取能力,同时捕获长距离和方向性特征,因此Transformer-BiLSTM-CRF取得了综合最优效果,F1值达到了93.30%,在嵌套实体上的表现也是最优的。(3)面向法律领域的蒙古文属性抽取研究在基于多语言的少数民族预训练CINO模型的基础上,设计了CINO-BiLSTM-Attention和CINO-BiGRU-Attention两种蒙古文属性抽取模型。实验结果表明,在蒙古文句子上利用BiLSTM模型进行特征抽取更优于BiGRU模型,CINO-BiLSTM-Attention模型在P、R和F1指标上均高于CINO-BiGRU-Attention模型。(4)面向法律领域的蒙古文知识图谱问答系统针对检索式法律问答结果受到语料库限制的缺点,本文通过蒙古文法律知识图谱辅助检索来提高问答准确率。系统主要分为问句语义解析模块、知识图谱检索模块和检索式自动问答模块。首先,利用蒙古文法律实体抽取模型、属性抽取模型对蒙古文问句进行语义解析。然后将知识图谱问答系统与检索式问答系统相融合,提高了面向法律领域的自动问答系统的回复准确率,在检索式问答系统上准确率提升了2.13%。

领域知识图谱属性自动补全技术研究与实现

这是一篇关于属性自动补全,多源属性融合,属性抽取,知识推理的论文, 主要内容为领域知识图谱能够为应急管理工作提供重要的语义知识支持,有效提高突发事件事前预警的精准度和及时性,并为事中事后处置提供科学的依据。然而,目前的领域知识图谱存在知识不完备的问题,特别是知识图谱中很重要的属性知识面临着属性和属性值缺失的问题,而属性补全过程又面临着属性冗余歧义以及属性值填充错误的情况。因此,本文研究领域知识图谱的属性自动补全技术,具有重要的理论和应用价值。本文首先提出了一种多维特征的多源知识库属性融合算法,利用融合字形特征的词向量表示模型得到属性名称的向量表示,再利用余弦相似度衡量名称之间的相似度,进而构建规范化的属性名称集合,为领域知识图谱属性校正提供知识支撑。在此基础上,针对领域知识图谱属性不完备的问题,本文提出属性补全模型,分为两层:第一层利用图谱外部文本语料进行属性补全和第二层利用图谱内部知识进行属性补全,针对第一层设计了一种改进远程监督的属性抽取模型,使用结合依存句法信息的孪生神经网络对实体相关语料进行去噪,然后使用关系分类方法抽取其中的属性信息并补全到图谱中;针对第二层,充分利用了图谱结构信息、实体背景文本信息和类型信息对三元组进行建模,然后利用知识推理对图谱内的属性知识进行补全和纠错。最后,基于上述核心模型,设计并实现了知识图谱的属性自动补全系统。实验表明,多维特征的多源知识图谱属性融合模型相比对照实验,在评价指标中的准确率上具有一定优势,并且能够满足实际应用中多源知识库属性融合的需求;改进远程监督算法的属性抽取模型能够基于多源外部文本实现属性补全,其准确率、召回率、F1值三个指标均优于对比实验;基于知识推理的属性补全任务的平均补全率优于对照实验。综上所述,本文的属性自动抽取模型能够满足实际的应用需求。

领域知识图谱属性自动补全技术研究与实现

这是一篇关于属性自动补全,多源属性融合,属性抽取,知识推理的论文, 主要内容为领域知识图谱能够为应急管理工作提供重要的语义知识支持,有效提高突发事件事前预警的精准度和及时性,并为事中事后处置提供科学的依据。然而,目前的领域知识图谱存在知识不完备的问题,特别是知识图谱中很重要的属性知识面临着属性和属性值缺失的问题,而属性补全过程又面临着属性冗余歧义以及属性值填充错误的情况。因此,本文研究领域知识图谱的属性自动补全技术,具有重要的理论和应用价值。本文首先提出了一种多维特征的多源知识库属性融合算法,利用融合字形特征的词向量表示模型得到属性名称的向量表示,再利用余弦相似度衡量名称之间的相似度,进而构建规范化的属性名称集合,为领域知识图谱属性校正提供知识支撑。在此基础上,针对领域知识图谱属性不完备的问题,本文提出属性补全模型,分为两层:第一层利用图谱外部文本语料进行属性补全和第二层利用图谱内部知识进行属性补全,针对第一层设计了一种改进远程监督的属性抽取模型,使用结合依存句法信息的孪生神经网络对实体相关语料进行去噪,然后使用关系分类方法抽取其中的属性信息并补全到图谱中;针对第二层,充分利用了图谱结构信息、实体背景文本信息和类型信息对三元组进行建模,然后利用知识推理对图谱内的属性知识进行补全和纠错。最后,基于上述核心模型,设计并实现了知识图谱的属性自动补全系统。实验表明,多维特征的多源知识图谱属性融合模型相比对照实验,在评价指标中的准确率上具有一定优势,并且能够满足实际应用中多源知识库属性融合的需求;改进远程监督算法的属性抽取模型能够基于多源外部文本实现属性补全,其准确率、召回率、F1值三个指标均优于对比实验;基于知识推理的属性补全任务的平均补全率优于对照实验。综上所述,本文的属性自动抽取模型能够满足实际的应用需求。

科技项目资源池系统的设计与实现

这是一篇关于科技项目,文本结构分析,属性抽取,SpringBoot的论文, 主要内容为随着中国经济的蓬勃发展,逐渐形成了优势产业集聚的城市群区域经济带,城市之间的交流合作日益紧密,科技资源流动共享的需求快速增长。加强科技资源管理,提高科技资源整合共享水平,优化科技资源配置成为了科技界的广泛共识,科技资源共享平台应运而生。科技项目作为国家科研资源调配的重要方式,目前仍未得到足够的重视,虽然有一些科技资源共享平台关注科技项目资源,但这些平台普遍存在“信息孤岛”问题,即暂未形成区域内、区域间的信息共享模式,也没有真正实现对科技项目资源的高效利用。针对这一问题,本文通过调研现有科技项目资源信息和发展现状,对科技项目资源池系统的设计与实现展开了系统研究,主要工作包括如下四个方面:(1)针对目前科技项目资源获取存在的困难,通过实地调研多家创业孵化器企业的现状,对系统的用户需求和功能需求进行详细分析,设计了一套多源异构的科技项目资源采集、处理和存储的资源池构建方案。(2)选取了国内多个科技项目资源发布网址,使用Web Magic框架实现了相应的网络爬虫,通过改进Gather Platform开源平台,实现了定时增量的爬虫任务管理平台,解决了对多个网络爬虫任务的管理问题。(3)实现资源池构建,其中包括采用文本分类的技术完成了对科技项目资源识别,实现了从数据到资源的清洗;通过借助基于标题模板库的结构树的方法对文档结构进行了重建,同时结合资源识别模块,对专项项目申报指南进行了课题分解;接着对获得到的通知、申报指南和课题进行了属性抽取;最后将结构化资源进行持久化存储。(4)利用Spring Boot实现了科技项目资源池系统,基于Elasticsearch实现了全文检索和智能推荐功能,通过条件判断实现了资质检测功能。通过使用thymeleaf完成了前端页面,接着通过Ajax技术动态加载数据,结合ECharts框架提供了多种可视化图表,帮助用户分析决策。

面向法律领域的蒙古文知识图谱自动问答研究

这是一篇关于蒙古文,自动问答,知识图谱,实体抽取,属性抽取的论文, 主要内容为随着我国法律体系的逐步完善,群众的法律咨询需求量与日俱增。现如今蒙古族群众仍停留于人工咨询的方式,导致法律咨询量和律师资源失去了平衡,致使法律从业人员的人力成本变高,蒙古文法律自动问答则可以有效地缓解人工法律咨询供不应求的状态。蒙古文法律问答面临专业性强、从业人员少和数据资源少等难点,引入法律知识图谱能增强问答过程中的法律专业性。本文对面向法律领域的知识图谱自动问答技术进行研究,针对现有法律问答中受到问答库限制、无法推理以及回复专业性低等缺点,设计并实现了面向法律领域的蒙古文知识图谱自动问答系统。主要研究内容有:(1)法律领域自动问答蒙古文数据资源建设本文首先对现有中文法律数据资源进行收集、筛选、翻译、人工校正、自动校正等一系列处理,构建了15万对蒙古文法律问答语料库。然后从蒙古文问答语料中构建了17400句子的实体标注语料库以及16200句子的属性标注语料库,为问句语义解析提供数据支撑。最后,针对缺少蒙古文法律领域知识图谱的现状,构建了857个实体的蒙古文法律罪名相关知识图谱。(2)面向法律领域的蒙古文实体抽取研究首先采用BiLSTM-CRF模型研究了蒙古文法律实体自动抽取方法。为增加模型的泛化性,选择了少数民族多语言预训练模型CINO,研究了基于CINO-BiLSTM-CRF实体抽取模型。另外,为了利用Transformer模型和BiLSTM模型在上下文长距离依赖特征和方向性特征提取方面的有效性,将Transformer模型和BiLSTM模型相结合进行特征提取,研究了基于Transformer-BiLSTM-CRF蒙古文实体抽取模型。实验结果表明,引入CINO预训练模型能有效地提高训练数据少的实体在BiLSTMCRF模型的泛化能力,CINO-BiLSTM-CRF模型在P、R和F1值上都有所提升。通过结合Transformer和BiLSTM模型的特征提取能力,同时捕获长距离和方向性特征,因此Transformer-BiLSTM-CRF取得了综合最优效果,F1值达到了93.30%,在嵌套实体上的表现也是最优的。(3)面向法律领域的蒙古文属性抽取研究在基于多语言的少数民族预训练CINO模型的基础上,设计了CINO-BiLSTM-Attention和CINO-BiGRU-Attention两种蒙古文属性抽取模型。实验结果表明,在蒙古文句子上利用BiLSTM模型进行特征抽取更优于BiGRU模型,CINO-BiLSTM-Attention模型在P、R和F1指标上均高于CINO-BiGRU-Attention模型。(4)面向法律领域的蒙古文知识图谱问答系统针对检索式法律问答结果受到语料库限制的缺点,本文通过蒙古文法律知识图谱辅助检索来提高问答准确率。系统主要分为问句语义解析模块、知识图谱检索模块和检索式自动问答模块。首先,利用蒙古文法律实体抽取模型、属性抽取模型对蒙古文问句进行语义解析。然后将知识图谱问答系统与检索式问答系统相融合,提高了面向法律领域的自动问答系统的回复准确率,在检索式问答系统上准确率提升了2.13%。

面向产品评论的问题生成研究

这是一篇关于问题生成,注意力机制,指针模型,属性抽取,多任务学习的论文, 主要内容为随着电商平台的兴起,网络上产生了大量产品相关的评价信息,对市场调研以及潜在客户购买意向决策具有重要意义。面对海量的评价信息,如何快速挖掘产品性能关键评价,从而生成与产品性能息息相关的问答数据具有极大的研究价值。因此,本文针对大量产品评价数据,通过问题生成模型,挖掘用户最关心的产品性能相关问题。传统的问题生成主要针对问答任务相关数据,采用端到端的深度学习架构模型。而基于产品评论的问题生成,不仅需要考虑评论信息中口语化表达,且生成的问题需要精准的围绕产品的类别、属性和性能特点展开,使得之前的问题生成模型在该任务上性能不佳。基于此,本文具体的研究内容包括:(1)基于文本信息的问题生成模型。为了探究如何利用产品相关的评论数据去生成产品相关的问题,本章从产品评价数据文本长度较短,用词较口语化的特点出发,设计相应的算法。首先,针对评论数据文本长度较短的问题,本章提出利用相似评论拼接的方式,丰富文本内容。然后,通过采用指针复制机制,克服评论数据口语化严重和容易产生使用词汇超出词典(out of vocabulary,OOV)限制的问题,这使得模型不仅可以从词典中生成对应的词汇,还可以从原文中抽取问题生成需要的词汇。本文利用京东评论数据进行实验,结果表明,在基于评论等短文本问题生成的任务上,与目前已有的神经网络模型对比,效果有了很大的提升。(2)结合产品属性信息的问题生成模型。采用指针复制机制虽然能避免用词超出词典限制的问题,但如何避免复制机制指向性错误,仍然是巨大的挑战。本章在上一章的基础上,为了增强模型围绕产品生成问题的能力,本章通过数据标注融入了产品的属性信息。这不仅加深了模型对产品相关数据的理解,提升了复制词汇指向性的正确率,也使得模型能够更加关注产品的相关属性信息,明确了实体属性的边界。因此生成的问题能够围绕着产品的相关信息提问,更直观地反映出产品的各个方面。本章在京东数据集上进行实验,结果表明,生成问题的准确性有较大的提升。(3)基于联合学习的产品评论问题生成模型。结合产品的属性信息虽然可以提升问题的准确性,但是仍然存在生成的问题较为简单,内容比较直白,提问的方式比较单一,以及模型无法理解产品相关的敏感方面的信息等问题。因此,本章在上一章的基础上,提出基于联合学习的问题生成模型,结合产品属性和观点信息抽取,使得生成的问题不仅围绕产品类别名称,同时考虑到产品特性。此外,模型还融合了属性信息关系抽取,挖掘观点信息与属性之间的关系,加深了模型对产品数据的理解,从而进一步提升了问题的质量。在中文京东英文亚马逊的双语料的测试下,结果表明,生成的问题在质量上有了显著的提升。

本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码港湾 ,原文地址:https://m.bishedaima.com/lunwen/46162.html

相关推荐

发表回复

登录后才能评论