基于化学图谱的复杂体系定性定量分析新方法开发及其可视化研究
这是一篇关于化学计量学,图谱分析,机器学习,数据融合,可视化界面的论文, 主要内容为化学图谱在食品、药物分析等各个领域具有广泛应用。但在进行复杂体系测定时,容易出现光谱信号重叠现象,使得传统的分析方法得到的结果不够精确。此外,使用程序代码建立模型较为困难。针对以上情况,本研究对传统化学计量学方法进行改进,旨在提高传统分析方法的准确度;同时引入一些先进的算法到化学图谱分析领域解决一些实际问题,最后开发了跨软件平台的分析系统,这些研究工作主要分为五个子课题,对应于以下第二章到第六章,继第一章引言之后依次展开。第二章多线性回归模型在EEM图谱定量分析中的应用及可视化研究。此章节提出了一种基于EEM图谱定量测定目标化合物的有效方法。该方法采用逐步回归和多元线性回归相结合的方法,利用EEM图谱的特征值建立数学模型。同时验证了所建立模型的准确性和可靠性,结果表明所提出方法能够实现准确的定量分析。本研究开发了与上述方法相应的图形用户界面,该界面提供了数据输入、模型建立、模型优化和结果展示的过程,更便于后续应用。第三章一种变量筛选与建模方法联用的策略开发及其定量分析应用。此章节提出了一种i PLS算法与GD算法结合的联用策略,用于建立可用于不同光谱数据集中目标化合物的定量分析的新方法。本研究的新颖之处在于将i PLS方法用于图谱特征区间选择,并根据所选的特征区间采用GD算法建立定量模型。在i PLS-GD联用方法的应用中,优化了影响i PLS方法特征区间选择的区间数和GD方法的学习率、迭代次数等影响定量准确度的因素。然后利用NIR数据集、1H NMR数据集和EEM数据集对i PLS-GD方法的性能进行了测试和验证。基于测试集比较了i PLS-GD联用方法与PLS、i PLS方法所得结果,结果表明新方法具有更好的预测能力,分析其原因在于综合了i PLS方法变量筛选能力强和GD方法建模能力强的优点。因此,i PLS-GD方法可作为复杂光谱数据建模的一种较好的可用方法。第四章基于GC-MS和MIR结合XGBoost方法对不同年份陈皮进行判别及相应过程的图形用户界面设计。此章节首次报道了XGBoost算法结合分别基于MIR光谱图谱和GC-MS色谱图谱使用XGBoost算法对不同贮藏年份(2年、4年、6年和8年)陈皮的鉴别。首先,分别从MIR一阶导数光谱数据和GC-MS色谱数据中提取重要特征,然后根据提取的重要特征使用XGBoost算法建立判别模型。结果表明,两种数据集的判别准确率均为100%。验证了XGBoost方法对不同贮藏年限陈皮样品的鉴别潜力。此外,在基于GC-MS色谱图谱提取的重要特征的基础上,本研究发现同一公司陈皮样品随着贮存年限的延长β-松油醇的相对含量增加,这一发现可以为陈皮的年份鉴别提供有益的物质基础依据。最后,为上述过程开发了友好的GUI,便于对陈皮样品的贮藏年限进行判别。本研究为陈皮样品不同贮藏年限的鉴别提供了新的思路。第五章基于GC和MIR利用机器学习方法结合改进后的中水平数据融合方式对陈皮地理产地进行判别研究。此章节旨在为区分不同产地的陈皮提供一种有效的策略。为此,采用GC和MIR光谱法对广东省新会区8个不同地区的39份陈皮样品进行了分析。首先采用随机森林方法从GC和MIR数据中提取特征信息。其次,采用中水平数据融合和改进的中水平数据融合方式对GC和MIR特征数据进行融合。然后,采用Adaboost、NB、KNN和ANN四种机器学习方法分别建立判别模型。最后,用混淆矩阵对各模型的判别性能进行了验证。结果表明,与单独的GC或MIR数据的建模结果相比,使用数据融合策略可以明显改善判别准确度,并且基于改进后的中水平融合数据所建立的KNN和ANN模型表现最佳,只有一个样本产地分类错误。本研究使用先进的机器学习方法与改进的中水平数据融合策略相结合,为不同地理来源的陈皮样本分类提供了新的思路第六章跨软件平台数据分析系统的建立与应用。此章节开发了一款开源跨软件平台的数据分析系统,该系统基于Java Web语言编写,可以调用其它平台的算法模型。该系统由登录注册、用户管理、数据管理、数据分类管理、数据建模五大模块组成,可以将数据上传至平台进行界面化的建模操作。为了验证系统的可行性,在系统中上传了数据进行建模分析操作,最后得到了预期的结果。该系统降低了对数据进行分析处理的难度。
基于化学图谱的复杂体系定性定量分析新方法开发及其可视化研究
这是一篇关于化学计量学,图谱分析,机器学习,数据融合,可视化界面的论文, 主要内容为化学图谱在食品、药物分析等各个领域具有广泛应用。但在进行复杂体系测定时,容易出现光谱信号重叠现象,使得传统的分析方法得到的结果不够精确。此外,使用程序代码建立模型较为困难。针对以上情况,本研究对传统化学计量学方法进行改进,旨在提高传统分析方法的准确度;同时引入一些先进的算法到化学图谱分析领域解决一些实际问题,最后开发了跨软件平台的分析系统,这些研究工作主要分为五个子课题,对应于以下第二章到第六章,继第一章引言之后依次展开。第二章多线性回归模型在EEM图谱定量分析中的应用及可视化研究。此章节提出了一种基于EEM图谱定量测定目标化合物的有效方法。该方法采用逐步回归和多元线性回归相结合的方法,利用EEM图谱的特征值建立数学模型。同时验证了所建立模型的准确性和可靠性,结果表明所提出方法能够实现准确的定量分析。本研究开发了与上述方法相应的图形用户界面,该界面提供了数据输入、模型建立、模型优化和结果展示的过程,更便于后续应用。第三章一种变量筛选与建模方法联用的策略开发及其定量分析应用。此章节提出了一种i PLS算法与GD算法结合的联用策略,用于建立可用于不同光谱数据集中目标化合物的定量分析的新方法。本研究的新颖之处在于将i PLS方法用于图谱特征区间选择,并根据所选的特征区间采用GD算法建立定量模型。在i PLS-GD联用方法的应用中,优化了影响i PLS方法特征区间选择的区间数和GD方法的学习率、迭代次数等影响定量准确度的因素。然后利用NIR数据集、1H NMR数据集和EEM数据集对i PLS-GD方法的性能进行了测试和验证。基于测试集比较了i PLS-GD联用方法与PLS、i PLS方法所得结果,结果表明新方法具有更好的预测能力,分析其原因在于综合了i PLS方法变量筛选能力强和GD方法建模能力强的优点。因此,i PLS-GD方法可作为复杂光谱数据建模的一种较好的可用方法。第四章基于GC-MS和MIR结合XGBoost方法对不同年份陈皮进行判别及相应过程的图形用户界面设计。此章节首次报道了XGBoost算法结合分别基于MIR光谱图谱和GC-MS色谱图谱使用XGBoost算法对不同贮藏年份(2年、4年、6年和8年)陈皮的鉴别。首先,分别从MIR一阶导数光谱数据和GC-MS色谱数据中提取重要特征,然后根据提取的重要特征使用XGBoost算法建立判别模型。结果表明,两种数据集的判别准确率均为100%。验证了XGBoost方法对不同贮藏年限陈皮样品的鉴别潜力。此外,在基于GC-MS色谱图谱提取的重要特征的基础上,本研究发现同一公司陈皮样品随着贮存年限的延长β-松油醇的相对含量增加,这一发现可以为陈皮的年份鉴别提供有益的物质基础依据。最后,为上述过程开发了友好的GUI,便于对陈皮样品的贮藏年限进行判别。本研究为陈皮样品不同贮藏年限的鉴别提供了新的思路。第五章基于GC和MIR利用机器学习方法结合改进后的中水平数据融合方式对陈皮地理产地进行判别研究。此章节旨在为区分不同产地的陈皮提供一种有效的策略。为此,采用GC和MIR光谱法对广东省新会区8个不同地区的39份陈皮样品进行了分析。首先采用随机森林方法从GC和MIR数据中提取特征信息。其次,采用中水平数据融合和改进的中水平数据融合方式对GC和MIR特征数据进行融合。然后,采用Adaboost、NB、KNN和ANN四种机器学习方法分别建立判别模型。最后,用混淆矩阵对各模型的判别性能进行了验证。结果表明,与单独的GC或MIR数据的建模结果相比,使用数据融合策略可以明显改善判别准确度,并且基于改进后的中水平融合数据所建立的KNN和ANN模型表现最佳,只有一个样本产地分类错误。本研究使用先进的机器学习方法与改进的中水平数据融合策略相结合,为不同地理来源的陈皮样本分类提供了新的思路第六章跨软件平台数据分析系统的建立与应用。此章节开发了一款开源跨软件平台的数据分析系统,该系统基于Java Web语言编写,可以调用其它平台的算法模型。该系统由登录注册、用户管理、数据管理、数据分类管理、数据建模五大模块组成,可以将数据上传至平台进行界面化的建模操作。为了验证系统的可行性,在系统中上传了数据进行建模分析操作,最后得到了预期的结果。该系统降低了对数据进行分析处理的难度。
基于化学图谱的复杂体系定性定量分析新方法开发及其可视化研究
这是一篇关于化学计量学,图谱分析,机器学习,数据融合,可视化界面的论文, 主要内容为化学图谱在食品、药物分析等各个领域具有广泛应用。但在进行复杂体系测定时,容易出现光谱信号重叠现象,使得传统的分析方法得到的结果不够精确。此外,使用程序代码建立模型较为困难。针对以上情况,本研究对传统化学计量学方法进行改进,旨在提高传统分析方法的准确度;同时引入一些先进的算法到化学图谱分析领域解决一些实际问题,最后开发了跨软件平台的分析系统,这些研究工作主要分为五个子课题,对应于以下第二章到第六章,继第一章引言之后依次展开。第二章多线性回归模型在EEM图谱定量分析中的应用及可视化研究。此章节提出了一种基于EEM图谱定量测定目标化合物的有效方法。该方法采用逐步回归和多元线性回归相结合的方法,利用EEM图谱的特征值建立数学模型。同时验证了所建立模型的准确性和可靠性,结果表明所提出方法能够实现准确的定量分析。本研究开发了与上述方法相应的图形用户界面,该界面提供了数据输入、模型建立、模型优化和结果展示的过程,更便于后续应用。第三章一种变量筛选与建模方法联用的策略开发及其定量分析应用。此章节提出了一种i PLS算法与GD算法结合的联用策略,用于建立可用于不同光谱数据集中目标化合物的定量分析的新方法。本研究的新颖之处在于将i PLS方法用于图谱特征区间选择,并根据所选的特征区间采用GD算法建立定量模型。在i PLS-GD联用方法的应用中,优化了影响i PLS方法特征区间选择的区间数和GD方法的学习率、迭代次数等影响定量准确度的因素。然后利用NIR数据集、1H NMR数据集和EEM数据集对i PLS-GD方法的性能进行了测试和验证。基于测试集比较了i PLS-GD联用方法与PLS、i PLS方法所得结果,结果表明新方法具有更好的预测能力,分析其原因在于综合了i PLS方法变量筛选能力强和GD方法建模能力强的优点。因此,i PLS-GD方法可作为复杂光谱数据建模的一种较好的可用方法。第四章基于GC-MS和MIR结合XGBoost方法对不同年份陈皮进行判别及相应过程的图形用户界面设计。此章节首次报道了XGBoost算法结合分别基于MIR光谱图谱和GC-MS色谱图谱使用XGBoost算法对不同贮藏年份(2年、4年、6年和8年)陈皮的鉴别。首先,分别从MIR一阶导数光谱数据和GC-MS色谱数据中提取重要特征,然后根据提取的重要特征使用XGBoost算法建立判别模型。结果表明,两种数据集的判别准确率均为100%。验证了XGBoost方法对不同贮藏年限陈皮样品的鉴别潜力。此外,在基于GC-MS色谱图谱提取的重要特征的基础上,本研究发现同一公司陈皮样品随着贮存年限的延长β-松油醇的相对含量增加,这一发现可以为陈皮的年份鉴别提供有益的物质基础依据。最后,为上述过程开发了友好的GUI,便于对陈皮样品的贮藏年限进行判别。本研究为陈皮样品不同贮藏年限的鉴别提供了新的思路。第五章基于GC和MIR利用机器学习方法结合改进后的中水平数据融合方式对陈皮地理产地进行判别研究。此章节旨在为区分不同产地的陈皮提供一种有效的策略。为此,采用GC和MIR光谱法对广东省新会区8个不同地区的39份陈皮样品进行了分析。首先采用随机森林方法从GC和MIR数据中提取特征信息。其次,采用中水平数据融合和改进的中水平数据融合方式对GC和MIR特征数据进行融合。然后,采用Adaboost、NB、KNN和ANN四种机器学习方法分别建立判别模型。最后,用混淆矩阵对各模型的判别性能进行了验证。结果表明,与单独的GC或MIR数据的建模结果相比,使用数据融合策略可以明显改善判别准确度,并且基于改进后的中水平融合数据所建立的KNN和ANN模型表现最佳,只有一个样本产地分类错误。本研究使用先进的机器学习方法与改进的中水平数据融合策略相结合,为不同地理来源的陈皮样本分类提供了新的思路第六章跨软件平台数据分析系统的建立与应用。此章节开发了一款开源跨软件平台的数据分析系统,该系统基于Java Web语言编写,可以调用其它平台的算法模型。该系统由登录注册、用户管理、数据管理、数据分类管理、数据建模五大模块组成,可以将数据上传至平台进行界面化的建模操作。为了验证系统的可行性,在系统中上传了数据进行建模分析操作,最后得到了预期的结果。该系统降低了对数据进行分析处理的难度。
面向图谱分析的表示学习技术研究
这是一篇关于图谱分析,表示学习,图谱表示,网络表示,知识图谱,知识表示的论文, 主要内容为图谱数据是一种重要的数据表示,它出现在各种各样的现实世界场景中,例如,社交网络中的社交图谱,研究领域中的引文图谱,知识图谱等。有效的图谱分析可以使用户更深入地了解数据背后的内容,从而使许多现实中的应用受益,如推荐系统,自然语言处理,可视化等。但是,大多数图谱分析方法都会遇到计算效率低下和空间代价高昂的问题。图谱表示学习,是解决图谱分析问题有效且高效的方法。它将图谱数据映射到低维空间中,最大程度地保留了图谱结构信息和图谱的属性。本文的研究侧重于图谱表示的两种主要学习技术,即网络表示和知识表示学习技术。现有的图谱表示方法面临着计算效率低下和数据稀疏的问题。特别的,现有的网络表示模型也无法处理异构信息网络,这些信息网络在真实场景中比同构信息网络更常见。具体的,本文提出了四个图谱表示模型来解决上述问题,一个用于同构信息网络,两个用于异构信息网络,一个用于知识图谱。首先介绍同构信息网络表示模型BimoNet,该模型基于双模式表示模型和深度神经网络模型。在双模式表示模型中,加法模式和减法模式分别表示边的实体共享特征和实体特定特征。深度自编码器可以表征边的结构信息。之后,通过联合优化这两个模型的目标函数,BimoNet可以保留边的语义和结构信息。在实验中,采用的数据集是一个同构信息网络,它是作者研究领域共享网络,唯一的节点类型是作者。最后在关系提取的基准任务上评估BimoNet。然而,相较于同构信息网络,异构信息网络更为广泛地存在于现实世界的图谱数据中。因此,提出了一种新的异构信息网络表示模型TransPath,它将位移机制与元路径结合在一起。将元路径视为路径中第一个节点至最后一个节点的位移操作。此外,提出了一种用户引导的元路径抽样策略,将用户的偏好作为引导,可以更精确地探索路径的语义,同时通过避免其他噪声和无意义的元路径的干扰来提高模型效率。在两个大型真实数据集DBLP和YELP以及两个基准任务相似性搜索和节点分类上评估所提模型。元路径的表示能力仍然有限,因为当使用路径捕获两个节点之间的邻域结构时存在明显的信息丢失。因此,提出了一种新的机制,通过元图谱捕获节点的特征,这些特征保留了比路径更多的语义和结构信息。模型将节点和元图谱构建为异构信息网络三元组,然后应用Hadamard函数来编码节点和元图谱之间的关系,并且可以评估异构信息网络三元组是否为正的概率。此外,为了更好地区分元图谱对称和非对称情况,引入了一种复数表示的机制,它能够精确地表示异构信息网络节点。最后在真实数据集上评估所提出的模型metagraph2vec的有效性。本文还提出了一个名为Bi-Mult的新知识表示模型,它利用动态双模式表示机制来表征知识图谱并结合了组合模型和位移模型的优点。在双模式表示模型中,实体(关系)表示被分解为两部分,一部分表示实体(关系)的内在状态,另一部分表示实体(关系)的交互状态。双模式的关系表示增强了关系与实体的相互作用,从而增强了模型处理非对称关系的能力。此外,通过映射矩阵将双模式表示的实体应用在位移模型中,构建了用于表征复杂关系的动态表示模型。在实验中,在基准数据集和基准任务链路预测上评估所提模型。总之,许多研究提出了图谱表示学习技术来分析图谱数据背后所隐藏的丰富信息。然而,传统的图谱表示模型存在计算效率低下和数据稀疏性问题。为了解决这些问题,本文提出了四种新的图谱表示方法,更具体的,网络表示和知识表示方法,它们都提供了一种新的角度来实现图谱的表示学习。在实验中,所得结果验证了算法和模型的有效性。
我国教师教育研究主题变化的图谱分析——以《教师教育研究》为文本
这是一篇关于教师教育,研究主题,图谱分析,《教师教育研究》的论文, 主要内容为随着教育改革的深入,对教师教育研究不管是从现实方面还是教师教育学科自身建设方面都显得十分重要。《教师教育研究》杂志作为教师教育领域的核心刊物,具有一定的权威性和代表性。基于此,本文以《教师教育研究》为文本,对2003-2019年(杂志更名以来)的文章进行分析,力求从中发现教师教育研究主题及其演变趋势,为未来教师教育研究提供参考。本研究采用文献计量学中的内容分析法,以杂志论文的关键词为基础,利用Cite Space和Excel软件绘制知识图谱、折线、柱形统计趋势图,对多年来教师教育研究主题及其变化进行分析。从教师教育理念、教师教育制度与政策、教师培养模式、教师类别和教师发展五个维度入手,发现八大关键主题依次为教师素养、教师教育、农村教师、教师培训、中小学教师、教师专业发展、教师流动、教师专业化。根据共现关键词维度和关键主题,从中发现各主题变化趋势,整理得出六大变化趋势:从师范教育走向教师教育、从群体专业化走向个体专业化、从职前培养走向职前职后一体化、从师范教育走向教师教育、从群体专业化走向个体专业化、从职前培养走向职前职后一体化、从农村教师走向教师流动、从能力素养走向道德素养、从中小学教师走向幼儿教师研究。最后,在前面研究得出的结论和变化趋势的基础上,对教师教育研究五大方面的未来发展进行展望和设想。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设向导 ,原文地址:https://m.bishedaima.com/lunwen/55551.html