8篇关于专利知识图谱的计算机毕业论文

今天分享的是关于专利知识图谱的8篇计算机毕业论文范文, 如果你的论文涉及到专利知识图谱等主题,本文能够帮助到你

基于知识图谱的专利技术价值评估方法研究

这是一篇关于评价指标体系,专利知识图谱,技术价值评估,专利评估系统的论文, 主要内容为随着知识经济的快速发展,知识创新日益成为我国经济和社会建设发展的重要组成部分,知识产权逐渐成为了核心竞争力。在这样的大环境下,专利作为一种重要的知识产权形式,越来越受到国家和企业的重视。因此,对专利进行价值评估的需求日益增大,然而,现有的评估方法大多缺乏对专利内在信息和关联关系的挖掘,这势必会对评估结果造成一定影响。知识图谱在信息挖掘与数据分析等方面的优势能够有效解决上述问题,因此本研究提出了基于知识图谱的专利技术价值评估方法。以专利的技术价值为切入点,构建评估指标体系。以构建的指标为基准,设计知识图谱结构。选取科创板企业为样本,对其专利信息进行实体识别,明确实体间关系,构建专利知识图谱。设计并实现专利评估系统,借助专利知识图谱为用户提供评估服务,提高评估效率,减小用户成本。本研究主要工作分为以下3个部分。首先,参考专利价值评估相关的文献,从多个角度对影响专利技术价值的因素进行分析、阐述。在此基础上,综合国家知识产权局出品的专利价值分析指标体系操作手册以及众多学者的研究成果,选取了符合本课题需求的12项指标,构成了一个完整的评估指标体系。然后,从Wind官网、中国专利数据库、国家知识产权局等网站获取关于企业、专利信息的半结构化数据和专利文本的非结构化数据,运用BERT-Bi LSTM-CRF模型融合注意力机制对专利文本进行实体抽取,再利用Word2Vec算法进行实体间的相似度计算,从而完成对相似实体的融合。明确各类实体之间的关系,通过对三元组数据进行格式化,并将这些数据存储入Neo4j图数据库中,完成专利知识图谱的构建。最后,针对用户提供的目标专利,利用已构建的专利知识图谱检索隶属同一技术领域具有相似主题的专利组。基于此专利组的信息数据,采用CRITIC权重法为各项指标分配权重,继而对目标专利的技术价值进行评估,并生成评估报告。为方便用户操作,设计并开发了专利技术价值评估系统。此系统采用B/S架构,前端基于Vue框架,结合D3.js实现知识的可视化展示;后端基于Spring Boot框架;前后端通过fetch接口实现JSON数据交换;数据库综合使用My SQL和Neo4j两种存储模式。

基于知识图谱的专利自动推荐技术研究

这是一篇关于专利知识图谱,知识图谱向量化,推荐的论文, 主要内容为随着我国创新发展战略的大力实施,专利作为一项科技含量较高的知识产权,越来越受到企业和用户的重视。面对海量的专利数据,掌握专利中包含的科技知识对推动企业和国家发展有重大意义。在专利数据分析过程中,如何方便高效地划分专利所属技术领域是一个值得研究的问题。本文引入推荐系统的思想,结合实际需求,根据专利文本数据之间的相似度进行专利的推荐,进而实现未知专利技术领域的推荐。由于知识图谱被广泛应用于推荐领域,本文主要研究了专利知识图谱构建的相关技术、专利相关实体向量化表示以及基于专利知识图谱的技术领域推荐。主要研究内容为以下几个部分:首先,本文研究了构建专利知识图谱的相关技术,对专利的标题、摘要、申请人等数据进行分析,确定了专利相关的实体和关系,完成了专利领域本体库的构建。接着对专利文本中包含的实体、属性和关系数据进行信息抽取,将处理好后的数据存储在Neo4j图数据库中,完成专利知识图谱的构建。其次,根据Trans E模型对实体进行向量化,在模型训练过程中对原有负采样算法进行一些改进,将专利文本实体信息嵌入一个100维的向量中。向量化后的专利实体包含了专利知识图谱中实体间的语义关系,为实现专利推荐做好铺垫。最后,本文提出了基于知识图谱的专利推荐算法(KG-PR),将专利知识图谱向量化结果融入基于内容的推荐算法中,利用知识图谱中的专利标题实体计算专利之间的相似度,实现类似专利的推荐,从而完成专利所属技术领域的推荐。为了验证本文方法的合理性,与基于内容的专利推荐算法(CB-PR)进行比较,对100个专利的技术领域进行推荐,将预测得到的技术领域与实际的进行对比,计算出预测正确所占的比例。实验结果表明,本文提出的KG-PR算法比基于专利内容的推荐算法得到的预测技术领域结果正确率高。最终按IPC分类号的大组推荐100个专利的技术领域,可得基于知识图谱的专利推荐算法在推荐一个IPC分类号的正确率为82%,推荐多个IPC分类号的正确率为98%,说明了本文提出的KG-PR算法在专利推荐方面的可行性。

面向中文专利价值自动评估的知识图谱构建研究

这是一篇关于专利知识图谱,技术点生成,信息抽取,政策维度,专利价值评估的论文, 主要内容为随着科技的发展,技术创新逐渐成为国家和社会前进的重要组成部分。专利作为发明创造的载体,包含丰富的创新技术和科研成果。对专利中包含的知识以及影响专利价值评估的信息进行深度挖掘分析,可以为快速了解专利、判断专利价值、提升专利水平等提供依据。然而,现有的专利信息挖掘与价值评估方法大多基于传统的统计分析方式,需要耗费大量的人力物力,其主观性强并缺乏对专利深层信息和内在关联的挖掘,难以有效、科学和自动地对专利价值进行评估。因此,本文利用深度学习等技术对专利的基础属性、技术维度、政策维度等知识信息进行挖掘分析,旨在构建面向专利价值自动评估的知识图谱,对专利进行知识表示和关联信息链接,以全面地表示专利核心信息,为专利价值评估提供知识评判依据。归纳而言,主要研究工作如下:在影响专利价值评估的技术维度提取方面,提出了一种两阶段的专利技术点生成方法。考虑到专利技术信息分散、专业表达丰富等数据特点,采用文本抽取和文本生成相结合的思想生成专利技术点。首先经过Roberta结合膨胀门控卷积神经网络(DGCNN)对专利文本进行上下文学习和特征提取,以抽取专利文本的核心技术句子信息。然后将抽取的输出结果输入到NEZHA+UNILM生成模型中,进行技术点生成。在模型调整阶段引入Copy机制和外部知识对生成文本进行润色处理得到最终专利技术点。在构建数据集上的实验表明,所提方法的ROUGE-L分数达到68.94%,优于现有主流方法,可以有效解决生成文本逻辑性不足,可读性较差的问题。在影响专利价值评估的政策维度提取方面,提出了一种多策略融合的专利相关政策文件提取方法。首先抽取专利的主题与关键词信息,然后将其投入到相关政策文件检索中,完成相关政策文件的提取。在主题提取方面,针对主题多样、显示主题存在率较低等问题,提出了Bert结合提示学习并融合多特征的主题模型,将专利主题挖掘转化为专利主题分类问题以准确提取主题。在关键词抽取方面,针对专利文本解释性低、术语长度较长等特点,提出Roberta结合头尾识别器(HTR)并融合主题信息的专利关键词抽取方法,首先经过Roberta学习专利文本的上下文信息,将向量传入头尾识别器进行解码得到头尾序列,然后将其配对组合以抽取专利关键词信息。在相关政策文件提取方面,通过构建触发器机制,将主题和关键词作为专利相关政策检索的输入投入到触发器中,以获取政策文件信息。经过实验验证,不同阶段所提方法相较于目前主流的方法能够较为准确有效地提取专利主题、关键词、相关政策文件信息。在知识图谱构建方面,针对专利发明人、发明时间等半结构化信息采用自定义模板规则等方式抽取专利的基本属性信息。针对非结构化信息采用深度学习方法抽取专利技术点、主题、关键词、相关政策文件等信息。对于专利知识中的冗余信息,采用Synonym、Levenshtein、Jaccard等知识融合方式对其进行统一对齐。对获取的信息进行整合处理,构造格式化三元组数据。最后采用Neo4j存储三元组,并构建前端界面进行知识图谱可视化。在知识图谱系统平台方面,设计不同的功能模块实现专利知识的可视化展示。综上,本文在重点研究影响专利价值评估的技术维度和政策维度的基础上,通过技术点生成、主题提取、关键词抽取、相关政策抽取、基本属性提取以及知识融合等方式,实现面向专利价值自动评估的知识图谱构建,可对专利的基础属性和影响专利价值评估的信息进行有效的组织存储和知识信息表示,为中文专利价值的自动评估提供技术和数据支撑。

基于对象代理数据库的专利知识图谱构建方法研究

这是一篇关于对象代理模型,专利知识图谱,数据建模,跨类查询,查询优化的论文, 主要内容为随着科技的发展和技术保护意识的逐渐提升,越来越多的专利获得了申请和授权。然而这其中的大部分专利,并没有得到很好地转化利用。因此,迫切需要对于专利数据进行有效管理。知识图谱在管理海量数据和复杂的关系上有很大的优势,在智能问答和信息检索等多个领域都有广泛的应用,尤其是面向特定领域的知识图谱。知识图谱利用实体间的关系构建知识网络,可以给这些细分领域提供高效的技术指导与帮助。因此,构建一个基于专利领域的知识图谱,对于专利知识管理拥有很大的意义。当前知识图谱管理方案主要有两类:一类是基于关系数据库的建模方案,基于关系数据库的存储方式有三元组表存储方式,六重索引方式,属性表存储方式以及DB2RDF等,这些存储方案构建不同的关系表实现实体和关系的建模,但是不可避免会存在表的连接操作,影响数据查询的效率;一类是基于图数据库建模方案,图数据库的存储方式是将实体和关系映射成图中的节点和边,其在多级跳跃查询时效率比较高,但是对于涉及大节点查询效率会比较低,而且分布式存储实现代价很大。对象代理数据库采用不同于传统关系型数据库的存储模式,将客观实体抽象为对象形式,具有相同属性和方法的对象归纳为一个源类。在源类上利用连接,选择和分组等操作可以生成不同的代理类。对象代理数据库的特点在于利用源类和代理类来构建数据间的语义关联,并通过跨类查询语句实现在对象之间语义查询。由于其丰富的语义表达能力,可以很好地表示专利中复杂的语义关系,对于专利领域复杂的语义网络可以进行很好的建模与表示。因此,本文利用对象代理数据库进行专利知识图谱的构建工作。针对当前知识图谱建模方式的一些局限性,本文提出基于对象代理数据库的专利知识图谱构建方法。首先,本文利用对象代理模型的SELECT、UNION、JOIN、GROUP这四种代理类进行知识图谱的建模工作。本文利用基本类存储专利数据中的基本关系,在基本关系上利用代理类完成对于专利数据中的选择、特化、泛化等关系的构建。本文的建模方式可以有效地解决表的连接操作过多的问题,提高查询效率,并且可以通过选择关系的构建有效地管理知识图谱中的关系丰富的实体。此外,在存储模式设计上,我们针对不同的数据类型构建不同的存储方案,以兼顾数据存储空间的压缩和数据查询效率的提升。在查询上,我们采用了跨类查询方案,并通过优化代理类的构建顺序来提高数据的查询效率。