基于知识图谱的专利技术价值评估方法研究
这是一篇关于评价指标体系,专利知识图谱,技术价值评估,专利评估系统的论文, 主要内容为随着知识经济的快速发展,知识创新日益成为我国经济和社会建设发展的重要组成部分,知识产权逐渐成为了核心竞争力。在这样的大环境下,专利作为一种重要的知识产权形式,越来越受到国家和企业的重视。因此,对专利进行价值评估的需求日益增大,然而,现有的评估方法大多缺乏对专利内在信息和关联关系的挖掘,这势必会对评估结果造成一定影响。知识图谱在信息挖掘与数据分析等方面的优势能够有效解决上述问题,因此本研究提出了基于知识图谱的专利技术价值评估方法。以专利的技术价值为切入点,构建评估指标体系。以构建的指标为基准,设计知识图谱结构。选取科创板企业为样本,对其专利信息进行实体识别,明确实体间关系,构建专利知识图谱。设计并实现专利评估系统,借助专利知识图谱为用户提供评估服务,提高评估效率,减小用户成本。本研究主要工作分为以下3个部分。首先,参考专利价值评估相关的文献,从多个角度对影响专利技术价值的因素进行分析、阐述。在此基础上,综合国家知识产权局出品的专利价值分析指标体系操作手册以及众多学者的研究成果,选取了符合本课题需求的12项指标,构成了一个完整的评估指标体系。然后,从Wind官网、中国专利数据库、国家知识产权局等网站获取关于企业、专利信息的半结构化数据和专利文本的非结构化数据,运用BERT-Bi LSTM-CRF模型融合注意力机制对专利文本进行实体抽取,再利用Word2Vec算法进行实体间的相似度计算,从而完成对相似实体的融合。明确各类实体之间的关系,通过对三元组数据进行格式化,并将这些数据存储入Neo4j图数据库中,完成专利知识图谱的构建。最后,针对用户提供的目标专利,利用已构建的专利知识图谱检索隶属同一技术领域具有相似主题的专利组。基于此专利组的信息数据,采用CRITIC权重法为各项指标分配权重,继而对目标专利的技术价值进行评估,并生成评估报告。为方便用户操作,设计并开发了专利技术价值评估系统。此系统采用B/S架构,前端基于Vue框架,结合D3.js实现知识的可视化展示;后端基于Spring Boot框架;前后端通过fetch接口实现JSON数据交换;数据库综合使用My SQL和Neo4j两种存储模式。
基于知识图谱的专利自动推荐技术研究
这是一篇关于专利知识图谱,知识图谱向量化,推荐的论文, 主要内容为随着我国创新发展战略的大力实施,专利作为一项科技含量较高的知识产权,越来越受到企业和用户的重视。面对海量的专利数据,掌握专利中包含的科技知识对推动企业和国家发展有重大意义。在专利数据分析过程中,如何方便高效地划分专利所属技术领域是一个值得研究的问题。本文引入推荐系统的思想,结合实际需求,根据专利文本数据之间的相似度进行专利的推荐,进而实现未知专利技术领域的推荐。由于知识图谱被广泛应用于推荐领域,本文主要研究了专利知识图谱构建的相关技术、专利相关实体向量化表示以及基于专利知识图谱的技术领域推荐。主要研究内容为以下几个部分:首先,本文研究了构建专利知识图谱的相关技术,对专利的标题、摘要、申请人等数据进行分析,确定了专利相关的实体和关系,完成了专利领域本体库的构建。接着对专利文本中包含的实体、属性和关系数据进行信息抽取,将处理好后的数据存储在Neo4j图数据库中,完成专利知识图谱的构建。其次,根据Trans E模型对实体进行向量化,在模型训练过程中对原有负采样算法进行一些改进,将专利文本实体信息嵌入一个100维的向量中。向量化后的专利实体包含了专利知识图谱中实体间的语义关系,为实现专利推荐做好铺垫。最后,本文提出了基于知识图谱的专利推荐算法(KG-PR),将专利知识图谱向量化结果融入基于内容的推荐算法中,利用知识图谱中的专利标题实体计算专利之间的相似度,实现类似专利的推荐,从而完成专利所属技术领域的推荐。为了验证本文方法的合理性,与基于内容的专利推荐算法(CB-PR)进行比较,对100个专利的技术领域进行推荐,将预测得到的技术领域与实际的进行对比,计算出预测正确所占的比例。实验结果表明,本文提出的KG-PR算法比基于专利内容的推荐算法得到的预测技术领域结果正确率高。最终按IPC分类号的大组推荐100个专利的技术领域,可得基于知识图谱的专利推荐算法在推荐一个IPC分类号的正确率为82%,推荐多个IPC分类号的正确率为98%,说明了本文提出的KG-PR算法在专利推荐方面的可行性。
中文专利知识图谱构建研究
这是一篇关于专利知识图谱,BiLSTM,注意力机制,BERT,术语抽取,关系抽取的论文, 主要内容为专利是一种发明创造也是一种知识产权并且受到法律的保护,包含了大量的科技成果和创新技术。对已有专利中包含的知识资源进行深层次的挖掘和分析,是科技创新的前提。本文拟通过构建新能源汽车领域的专利知识图谱来实现对该领域专利知识的表示、分析以及挖掘,从而更加有效的分析专利之间的联系,优化专利的检索。知识图谱是通过符号的形式来描述物理世界中的概念及其概念之间的关系,是结构化的语义知识库,不仅能以更接近人类认知的方式表达海量信息,而且为海量信息提供了更好的组织和管理形式。知识图谱是由实体-关系-实体三元组,以及实体及其相关属性-值对组成,构成网状的知识结构。在构建新能源汽车领域专利知识图谱的过程中,本文重点研究了专利术语抽取方法、专利术语关系抽取方法以及专利属性值抽取方法。主要内容可以概括为以下几个方面:提出了基于多特征融合及BiLSTM-CRF模型的专利术语抽取方法。为提高中文专利领域术语抽取结果的准确率和召回率,从深度学习的角度出发,并选取词性和依存关系作为特征,提出一种基于多特征融合及双向长短时记忆网络(BiLSTM)与条件随机场(CRF)相结合的专利领域术语抽取模型(BiLSTM-CRF),在词性和依存关系两个显性特征的基础上,使用双层双向LSTM神经网络挖掘专利数据中的语义信息及其时序信息,解决了传统方法中存在的通用性不强以及无法捕捉上下文中隐含信息的缺点,同时又能够通过CRF层考虑输出标签之间前后的依赖关系。实验结果表明,该深度学习方法在领域术语抽取方面是行之有效的,并获得89.79%的准确率和85.35%的召回率。提出了一种基于注意力机制的BiLSTM和关键词策略的专利术语关系抽取方法。在专利文本信息向量化中加入通过改进的关键词抽取算法(TextRank)获得的每个句子中的类别关键词特征,然后使用BiLSTM神经网络及注意力机制挖掘数据中的时序信息以及句子级别的整体特征信息,同时使用池化层获得文本的局部特征,最后将得到的文本信息的整体特征和局部特征进行融合,并通过分类器输出最终的分类结果。类别关键词的加入提高了类别的区分度。实验结果表明,该深度学习方法在专利术语关系抽取方面是行之有效的,并获得90.85%的准确率和90.64%的召回率。提出了一种基于BERT-BiGRU-CRF模型的专利属性值抽取方法,该方法首先使用BERT模型将专利文本按字训练成为低维向量矩阵,由BiGRU模型结合数据中的时序信息以及语义信息计算出属于每个标签的概率,最后由条件随机场CRF根据标签之间的前后依赖关系求解出最优的标签序列。通过反向传播算法对模型进行优化,辅以Dropout使模型更加健壮。实验结果表明,BERT-BiGRU-CRF模型在专利属性值抽取方面是行之有效的,并获得85.09%的准确率和80.03%的召回率。
基于知识图谱的专利质量评估方法研究
这是一篇关于专利质量评估,专利知识图谱,本体建模,图神经网络的论文, 主要内容为科技创新和技术进步是国家的核心竞争力,创新助推高水平科技自立自强。作为技术创新的重要产物之一,专利中蕴含着创新的核心要素,其质量受到国家和企业的重视。专利质量的提高对于国家和企业来说具有重要意义。当前,自动化专利质量评估能够实现高效地筛查和分析专利,提高评估的准确性和效率,进而推动专利质量的提升。然而,目前的专利质量自动化评估方法主要侧重于专利评估指标和文本数据的分析,而忽视了专利之间复杂关系的分析。这种复杂关系表现为专利之间的多关系多属性网络,如专利之间的引用关系、发明人关系、独立权利要求数量等。因此,本研究针对上述不足,首先构建专利质量评估数据集以获取专利的多关系多属性数据。其次,将多关系多属性网络建模为专利知识图谱作为获取专利初始特征的基础。最后,提出基于知识图谱的图神经网络方法以预测专利质量。本文的主要工作如下:(1)构建专利质量评估数据集。首先,本研究选取人工智能领域专利作为研究对象。其次,将专利的质量定义为其对后续专利的影响,并以此确定专利质量的划分标准。最后,采用专利数据库平台进行数据的采集,并根据质量划分标准标注专利样本,从而完成专利质量评估数据集的构建。(2)构建专利知识图谱。本研究以专利质量评估任务为核心,通过自顶向下的方式构建专利知识图谱,包括三部分工作:本体建模、信息抽取、知识存储。在本体建模阶段,通过咨询相关领域专家,选择与专利质量相关的实体关系和属性构建专利知识图谱本体模型并进行实例化。在信息抽取阶段,通过属性三元组抽取和关系三元组抽取将原始专利数据转换为知识图谱三元组数据。在知识存储阶段,将三元组数据导入图数据库进行存储和可视化分析。(3)提出了一种基于知识图谱的关系图神经网络专利质量评估方法(Knowledge Graph based Relational Graph Neural Network,KGRGNN)。该方法首先通过知识表示学习模型获取专利知识图谱的实体节点和关系的表征向量。然后,针对传统图神经网络不能充分挖掘专利知识图谱包含的多关系多属性语义信息的问题,本研究构建了关系图卷积网络。该网络通过聚合蕴含关系语义信息的邻居实体表征,使得KGRGNN能够捕获专利实体不同关系的高阶邻域语义信息。最后,在专利质量评估数据集上进行了大量的实验,实验结果验证了KGRGNN方法的有效性。
基于知识图谱的专利技术价值评估方法研究
这是一篇关于评价指标体系,专利知识图谱,技术价值评估,专利评估系统的论文, 主要内容为随着知识经济的快速发展,知识创新日益成为我国经济和社会建设发展的重要组成部分,知识产权逐渐成为了核心竞争力。在这样的大环境下,专利作为一种重要的知识产权形式,越来越受到国家和企业的重视。因此,对专利进行价值评估的需求日益增大,然而,现有的评估方法大多缺乏对专利内在信息和关联关系的挖掘,这势必会对评估结果造成一定影响。知识图谱在信息挖掘与数据分析等方面的优势能够有效解决上述问题,因此本研究提出了基于知识图谱的专利技术价值评估方法。以专利的技术价值为切入点,构建评估指标体系。以构建的指标为基准,设计知识图谱结构。选取科创板企业为样本,对其专利信息进行实体识别,明确实体间关系,构建专利知识图谱。设计并实现专利评估系统,借助专利知识图谱为用户提供评估服务,提高评估效率,减小用户成本。本研究主要工作分为以下3个部分。首先,参考专利价值评估相关的文献,从多个角度对影响专利技术价值的因素进行分析、阐述。在此基础上,综合国家知识产权局出品的专利价值分析指标体系操作手册以及众多学者的研究成果,选取了符合本课题需求的12项指标,构成了一个完整的评估指标体系。然后,从Wind官网、中国专利数据库、国家知识产权局等网站获取关于企业、专利信息的半结构化数据和专利文本的非结构化数据,运用BERT-Bi LSTM-CRF模型融合注意力机制对专利文本进行实体抽取,再利用Word2Vec算法进行实体间的相似度计算,从而完成对相似实体的融合。明确各类实体之间的关系,通过对三元组数据进行格式化,并将这些数据存储入Neo4j图数据库中,完成专利知识图谱的构建。最后,针对用户提供的目标专利,利用已构建的专利知识图谱检索隶属同一技术领域具有相似主题的专利组。基于此专利组的信息数据,采用CRITIC权重法为各项指标分配权重,继而对目标专利的技术价值进行评估,并生成评估报告。为方便用户操作,设计并开发了专利技术价值评估系统。此系统采用B/S架构,前端基于Vue框架,结合D3.js实现知识的可视化展示;后端基于Spring Boot框架;前后端通过fetch接口实现JSON数据交换;数据库综合使用My SQL和Neo4j两种存储模式。
中文专利知识图谱构建研究
这是一篇关于专利知识图谱,BiLSTM,注意力机制,BERT,术语抽取,关系抽取的论文, 主要内容为专利是一种发明创造也是一种知识产权并且受到法律的保护,包含了大量的科技成果和创新技术。对已有专利中包含的知识资源进行深层次的挖掘和分析,是科技创新的前提。本文拟通过构建新能源汽车领域的专利知识图谱来实现对该领域专利知识的表示、分析以及挖掘,从而更加有效的分析专利之间的联系,优化专利的检索。知识图谱是通过符号的形式来描述物理世界中的概念及其概念之间的关系,是结构化的语义知识库,不仅能以更接近人类认知的方式表达海量信息,而且为海量信息提供了更好的组织和管理形式。知识图谱是由实体-关系-实体三元组,以及实体及其相关属性-值对组成,构成网状的知识结构。在构建新能源汽车领域专利知识图谱的过程中,本文重点研究了专利术语抽取方法、专利术语关系抽取方法以及专利属性值抽取方法。主要内容可以概括为以下几个方面:提出了基于多特征融合及BiLSTM-CRF模型的专利术语抽取方法。为提高中文专利领域术语抽取结果的准确率和召回率,从深度学习的角度出发,并选取词性和依存关系作为特征,提出一种基于多特征融合及双向长短时记忆网络(BiLSTM)与条件随机场(CRF)相结合的专利领域术语抽取模型(BiLSTM-CRF),在词性和依存关系两个显性特征的基础上,使用双层双向LSTM神经网络挖掘专利数据中的语义信息及其时序信息,解决了传统方法中存在的通用性不强以及无法捕捉上下文中隐含信息的缺点,同时又能够通过CRF层考虑输出标签之间前后的依赖关系。实验结果表明,该深度学习方法在领域术语抽取方面是行之有效的,并获得89.79%的准确率和85.35%的召回率。提出了一种基于注意力机制的BiLSTM和关键词策略的专利术语关系抽取方法。在专利文本信息向量化中加入通过改进的关键词抽取算法(TextRank)获得的每个句子中的类别关键词特征,然后使用BiLSTM神经网络及注意力机制挖掘数据中的时序信息以及句子级别的整体特征信息,同时使用池化层获得文本的局部特征,最后将得到的文本信息的整体特征和局部特征进行融合,并通过分类器输出最终的分类结果。类别关键词的加入提高了类别的区分度。实验结果表明,该深度学习方法在专利术语关系抽取方面是行之有效的,并获得90.85%的准确率和90.64%的召回率。提出了一种基于BERT-BiGRU-CRF模型的专利属性值抽取方法,该方法首先使用BERT模型将专利文本按字训练成为低维向量矩阵,由BiGRU模型结合数据中的时序信息以及语义信息计算出属于每个标签的概率,最后由条件随机场CRF根据标签之间的前后依赖关系求解出最优的标签序列。通过反向传播算法对模型进行优化,辅以Dropout使模型更加健壮。实验结果表明,BERT-BiGRU-CRF模型在专利属性值抽取方面是行之有效的,并获得85.09%的准确率和80.03%的召回率。
基于知识图谱的专利技术价值评估方法研究
这是一篇关于评价指标体系,专利知识图谱,技术价值评估,专利评估系统的论文, 主要内容为随着知识经济的快速发展,知识创新日益成为我国经济和社会建设发展的重要组成部分,知识产权逐渐成为了核心竞争力。在这样的大环境下,专利作为一种重要的知识产权形式,越来越受到国家和企业的重视。因此,对专利进行价值评估的需求日益增大,然而,现有的评估方法大多缺乏对专利内在信息和关联关系的挖掘,这势必会对评估结果造成一定影响。知识图谱在信息挖掘与数据分析等方面的优势能够有效解决上述问题,因此本研究提出了基于知识图谱的专利技术价值评估方法。以专利的技术价值为切入点,构建评估指标体系。以构建的指标为基准,设计知识图谱结构。选取科创板企业为样本,对其专利信息进行实体识别,明确实体间关系,构建专利知识图谱。设计并实现专利评估系统,借助专利知识图谱为用户提供评估服务,提高评估效率,减小用户成本。本研究主要工作分为以下3个部分。首先,参考专利价值评估相关的文献,从多个角度对影响专利技术价值的因素进行分析、阐述。在此基础上,综合国家知识产权局出品的专利价值分析指标体系操作手册以及众多学者的研究成果,选取了符合本课题需求的12项指标,构成了一个完整的评估指标体系。然后,从Wind官网、中国专利数据库、国家知识产权局等网站获取关于企业、专利信息的半结构化数据和专利文本的非结构化数据,运用BERT-Bi LSTM-CRF模型融合注意力机制对专利文本进行实体抽取,再利用Word2Vec算法进行实体间的相似度计算,从而完成对相似实体的融合。明确各类实体之间的关系,通过对三元组数据进行格式化,并将这些数据存储入Neo4j图数据库中,完成专利知识图谱的构建。最后,针对用户提供的目标专利,利用已构建的专利知识图谱检索隶属同一技术领域具有相似主题的专利组。基于此专利组的信息数据,采用CRITIC权重法为各项指标分配权重,继而对目标专利的技术价值进行评估,并生成评估报告。为方便用户操作,设计并开发了专利技术价值评估系统。此系统采用B/S架构,前端基于Vue框架,结合D3.js实现知识的可视化展示;后端基于Spring Boot框架;前后端通过fetch接口实现JSON数据交换;数据库综合使用My SQL和Neo4j两种存储模式。
基于知识图谱的专利技术价值评估方法研究
这是一篇关于评价指标体系,专利知识图谱,技术价值评估,专利评估系统的论文, 主要内容为随着知识经济的快速发展,知识创新日益成为我国经济和社会建设发展的重要组成部分,知识产权逐渐成为了核心竞争力。在这样的大环境下,专利作为一种重要的知识产权形式,越来越受到国家和企业的重视。因此,对专利进行价值评估的需求日益增大,然而,现有的评估方法大多缺乏对专利内在信息和关联关系的挖掘,这势必会对评估结果造成一定影响。知识图谱在信息挖掘与数据分析等方面的优势能够有效解决上述问题,因此本研究提出了基于知识图谱的专利技术价值评估方法。以专利的技术价值为切入点,构建评估指标体系。以构建的指标为基准,设计知识图谱结构。选取科创板企业为样本,对其专利信息进行实体识别,明确实体间关系,构建专利知识图谱。设计并实现专利评估系统,借助专利知识图谱为用户提供评估服务,提高评估效率,减小用户成本。本研究主要工作分为以下3个部分。首先,参考专利价值评估相关的文献,从多个角度对影响专利技术价值的因素进行分析、阐述。在此基础上,综合国家知识产权局出品的专利价值分析指标体系操作手册以及众多学者的研究成果,选取了符合本课题需求的12项指标,构成了一个完整的评估指标体系。然后,从Wind官网、中国专利数据库、国家知识产权局等网站获取关于企业、专利信息的半结构化数据和专利文本的非结构化数据,运用BERT-Bi LSTM-CRF模型融合注意力机制对专利文本进行实体抽取,再利用Word2Vec算法进行实体间的相似度计算,从而完成对相似实体的融合。明确各类实体之间的关系,通过对三元组数据进行格式化,并将这些数据存储入Neo4j图数据库中,完成专利知识图谱的构建。最后,针对用户提供的目标专利,利用已构建的专利知识图谱检索隶属同一技术领域具有相似主题的专利组。基于此专利组的信息数据,采用CRITIC权重法为各项指标分配权重,继而对目标专利的技术价值进行评估,并生成评估报告。为方便用户操作,设计并开发了专利技术价值评估系统。此系统采用B/S架构,前端基于Vue框架,结合D3.js实现知识的可视化展示;后端基于Spring Boot框架;前后端通过fetch接口实现JSON数据交换;数据库综合使用My SQL和Neo4j两种存储模式。
中文专利知识图谱构建研究
这是一篇关于专利知识图谱,BiLSTM,注意力机制,BERT,术语抽取,关系抽取的论文, 主要内容为专利是一种发明创造也是一种知识产权并且受到法律的保护,包含了大量的科技成果和创新技术。对已有专利中包含的知识资源进行深层次的挖掘和分析,是科技创新的前提。本文拟通过构建新能源汽车领域的专利知识图谱来实现对该领域专利知识的表示、分析以及挖掘,从而更加有效的分析专利之间的联系,优化专利的检索。知识图谱是通过符号的形式来描述物理世界中的概念及其概念之间的关系,是结构化的语义知识库,不仅能以更接近人类认知的方式表达海量信息,而且为海量信息提供了更好的组织和管理形式。知识图谱是由实体-关系-实体三元组,以及实体及其相关属性-值对组成,构成网状的知识结构。在构建新能源汽车领域专利知识图谱的过程中,本文重点研究了专利术语抽取方法、专利术语关系抽取方法以及专利属性值抽取方法。主要内容可以概括为以下几个方面:提出了基于多特征融合及BiLSTM-CRF模型的专利术语抽取方法。为提高中文专利领域术语抽取结果的准确率和召回率,从深度学习的角度出发,并选取词性和依存关系作为特征,提出一种基于多特征融合及双向长短时记忆网络(BiLSTM)与条件随机场(CRF)相结合的专利领域术语抽取模型(BiLSTM-CRF),在词性和依存关系两个显性特征的基础上,使用双层双向LSTM神经网络挖掘专利数据中的语义信息及其时序信息,解决了传统方法中存在的通用性不强以及无法捕捉上下文中隐含信息的缺点,同时又能够通过CRF层考虑输出标签之间前后的依赖关系。实验结果表明,该深度学习方法在领域术语抽取方面是行之有效的,并获得89.79%的准确率和85.35%的召回率。提出了一种基于注意力机制的BiLSTM和关键词策略的专利术语关系抽取方法。在专利文本信息向量化中加入通过改进的关键词抽取算法(TextRank)获得的每个句子中的类别关键词特征,然后使用BiLSTM神经网络及注意力机制挖掘数据中的时序信息以及句子级别的整体特征信息,同时使用池化层获得文本的局部特征,最后将得到的文本信息的整体特征和局部特征进行融合,并通过分类器输出最终的分类结果。类别关键词的加入提高了类别的区分度。实验结果表明,该深度学习方法在专利术语关系抽取方面是行之有效的,并获得90.85%的准确率和90.64%的召回率。提出了一种基于BERT-BiGRU-CRF模型的专利属性值抽取方法,该方法首先使用BERT模型将专利文本按字训练成为低维向量矩阵,由BiGRU模型结合数据中的时序信息以及语义信息计算出属于每个标签的概率,最后由条件随机场CRF根据标签之间的前后依赖关系求解出最优的标签序列。通过反向传播算法对模型进行优化,辅以Dropout使模型更加健壮。实验结果表明,BERT-BiGRU-CRF模型在专利属性值抽取方面是行之有效的,并获得85.09%的准确率和80.03%的召回率。
中文专利知识图谱构建研究
这是一篇关于专利知识图谱,BiLSTM,注意力机制,BERT,术语抽取,关系抽取的论文, 主要内容为专利是一种发明创造也是一种知识产权并且受到法律的保护,包含了大量的科技成果和创新技术。对已有专利中包含的知识资源进行深层次的挖掘和分析,是科技创新的前提。本文拟通过构建新能源汽车领域的专利知识图谱来实现对该领域专利知识的表示、分析以及挖掘,从而更加有效的分析专利之间的联系,优化专利的检索。知识图谱是通过符号的形式来描述物理世界中的概念及其概念之间的关系,是结构化的语义知识库,不仅能以更接近人类认知的方式表达海量信息,而且为海量信息提供了更好的组织和管理形式。知识图谱是由实体-关系-实体三元组,以及实体及其相关属性-值对组成,构成网状的知识结构。在构建新能源汽车领域专利知识图谱的过程中,本文重点研究了专利术语抽取方法、专利术语关系抽取方法以及专利属性值抽取方法。主要内容可以概括为以下几个方面:提出了基于多特征融合及BiLSTM-CRF模型的专利术语抽取方法。为提高中文专利领域术语抽取结果的准确率和召回率,从深度学习的角度出发,并选取词性和依存关系作为特征,提出一种基于多特征融合及双向长短时记忆网络(BiLSTM)与条件随机场(CRF)相结合的专利领域术语抽取模型(BiLSTM-CRF),在词性和依存关系两个显性特征的基础上,使用双层双向LSTM神经网络挖掘专利数据中的语义信息及其时序信息,解决了传统方法中存在的通用性不强以及无法捕捉上下文中隐含信息的缺点,同时又能够通过CRF层考虑输出标签之间前后的依赖关系。实验结果表明,该深度学习方法在领域术语抽取方面是行之有效的,并获得89.79%的准确率和85.35%的召回率。提出了一种基于注意力机制的BiLSTM和关键词策略的专利术语关系抽取方法。在专利文本信息向量化中加入通过改进的关键词抽取算法(TextRank)获得的每个句子中的类别关键词特征,然后使用BiLSTM神经网络及注意力机制挖掘数据中的时序信息以及句子级别的整体特征信息,同时使用池化层获得文本的局部特征,最后将得到的文本信息的整体特征和局部特征进行融合,并通过分类器输出最终的分类结果。类别关键词的加入提高了类别的区分度。实验结果表明,该深度学习方法在专利术语关系抽取方面是行之有效的,并获得90.85%的准确率和90.64%的召回率。提出了一种基于BERT-BiGRU-CRF模型的专利属性值抽取方法,该方法首先使用BERT模型将专利文本按字训练成为低维向量矩阵,由BiGRU模型结合数据中的时序信息以及语义信息计算出属于每个标签的概率,最后由条件随机场CRF根据标签之间的前后依赖关系求解出最优的标签序列。通过反向传播算法对模型进行优化,辅以Dropout使模型更加健壮。实验结果表明,BERT-BiGRU-CRF模型在专利属性值抽取方面是行之有效的,并获得85.09%的准确率和80.03%的召回率。
基于知识图谱的专利质量评估方法研究
这是一篇关于专利质量评估,专利知识图谱,本体建模,图神经网络的论文, 主要内容为科技创新和技术进步是国家的核心竞争力,创新助推高水平科技自立自强。作为技术创新的重要产物之一,专利中蕴含着创新的核心要素,其质量受到国家和企业的重视。专利质量的提高对于国家和企业来说具有重要意义。当前,自动化专利质量评估能够实现高效地筛查和分析专利,提高评估的准确性和效率,进而推动专利质量的提升。然而,目前的专利质量自动化评估方法主要侧重于专利评估指标和文本数据的分析,而忽视了专利之间复杂关系的分析。这种复杂关系表现为专利之间的多关系多属性网络,如专利之间的引用关系、发明人关系、独立权利要求数量等。因此,本研究针对上述不足,首先构建专利质量评估数据集以获取专利的多关系多属性数据。其次,将多关系多属性网络建模为专利知识图谱作为获取专利初始特征的基础。最后,提出基于知识图谱的图神经网络方法以预测专利质量。本文的主要工作如下:(1)构建专利质量评估数据集。首先,本研究选取人工智能领域专利作为研究对象。其次,将专利的质量定义为其对后续专利的影响,并以此确定专利质量的划分标准。最后,采用专利数据库平台进行数据的采集,并根据质量划分标准标注专利样本,从而完成专利质量评估数据集的构建。(2)构建专利知识图谱。本研究以专利质量评估任务为核心,通过自顶向下的方式构建专利知识图谱,包括三部分工作:本体建模、信息抽取、知识存储。在本体建模阶段,通过咨询相关领域专家,选择与专利质量相关的实体关系和属性构建专利知识图谱本体模型并进行实例化。在信息抽取阶段,通过属性三元组抽取和关系三元组抽取将原始专利数据转换为知识图谱三元组数据。在知识存储阶段,将三元组数据导入图数据库进行存储和可视化分析。(3)提出了一种基于知识图谱的关系图神经网络专利质量评估方法(Knowledge Graph based Relational Graph Neural Network,KGRGNN)。该方法首先通过知识表示学习模型获取专利知识图谱的实体节点和关系的表征向量。然后,针对传统图神经网络不能充分挖掘专利知识图谱包含的多关系多属性语义信息的问题,本研究构建了关系图卷积网络。该网络通过聚合蕴含关系语义信息的邻居实体表征,使得KGRGNN能够捕获专利实体不同关系的高阶邻域语义信息。最后,在专利质量评估数据集上进行了大量的实验,实验结果验证了KGRGNN方法的有效性。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码货栈 ,原文地址:https://m.bishedaima.com/lunwen/52547.html