鸡microRNA新基因预测与检索自动化软件系统及Web可视化
这是一篇关于miRNA,鸡,支持向量机,pre-miRNA的论文, 主要内容为MicroRNA是在真核生物中发现的内源性的非编码RNA,简称miRNA,长度大约为22至25个核苷酸。miRNA的主要作用是在基因转录后水平发挥调节作用,是一种重要的调节分子。它参与生命过程中一系列调节。miRNA的作用机制是通过作用于相应靶标来参与细胞调控。每个microRNA可以有多个靶基因,而几个miRNA也可以调节同一个基因。这种复杂的调节网络既可以通过一个miRNA来调控多个基因的表达,也可以通过几个miRNA的组合来精细调控某个基因的表达。 自从第一个miRNA发现至今,很短的十几年时间内,有关miRNA的研究突飞猛进。目前,miRNA数据库(miRBase17.0)中的miRNA数量已达到15172条,虽然每一种生物的miRNA总数难以确定,生物信息学研究表明,miRNA占动物基因总数的1-5%,鸡的miRNA总数约为1000条(Stark 2005)。因此,还存在大量鸡miRNA未被发现。 鸡是一种重要的经济动物,在人们生活生产中占有重要的地位,同时它也是重要的人类疾病研究模型。在miRBase17.0中,已经收录人类miRNA1424条,但是鸡的miRNA只有499条。已经收录在miRBase中的鸡的miRNA多数都是基于其保守性发现的,而基于序列保守性预测miRNA的方法准确性较低,而且速度太慢,难以在短时间内预测出大量miRNA。另一方面,基于序列保守性的预测方法也无法预测已经发现miRNA没有同源性的miRNA。本实验中,我们综合了以往关于miRNA研究发现的miRNA所具有的特征,将其抽象成相应的数学模型,作为筛选pre-miRNA的条件,采用Java语言开发了预测miRNA的软件包:GlaMiRFilter。另外,还基于支持向量机开发了一款鸡的pre-miRNA分类器:GluMiRPred。最后,我们还采用JSP语言开发了预测鸡的新miRNA的网络平台,为进一步研究鸡的miRNA提供支持。 本研究利用miRBase中收录的鸡的pre-miRNAs构建了训练集和测试集,我们给予SVM训练得到预测模型Glutrain300125并利用测试集对我们的预测软件进行评价,发现其敏感度达到100%,特异性是88.4%,准确性是90.3%。这些结果证明GluMiPRed是一个有效区分鸡pre-miRNA的分类器,该分类器具有较高的准确性。最后,我们利用GluMiPRed对鸡的基因组进行扫描,预测得到了7471条候选鸡pre-miRNAs。目前,还没有一款miRNA预测软件是专门针对鸡的。为了验证我们开发的软件对鸡miRNA预测具有特异性,我们利用猪的miRNA构建了测试集进行检验,得到的结果是该软件在猪的数据集上的敏感度只有74%,从而证明该软件对鸡的miRNA预测具有特异性。
鸡microRNA新基因预测与检索自动化软件系统及Web可视化
这是一篇关于miRNA,鸡,支持向量机,pre-miRNA的论文, 主要内容为MicroRNA是在真核生物中发现的内源性的非编码RNA,简称miRNA,长度大约为22至25个核苷酸。miRNA的主要作用是在基因转录后水平发挥调节作用,是一种重要的调节分子。它参与生命过程中一系列调节。miRNA的作用机制是通过作用于相应靶标来参与细胞调控。每个microRNA可以有多个靶基因,而几个miRNA也可以调节同一个基因。这种复杂的调节网络既可以通过一个miRNA来调控多个基因的表达,也可以通过几个miRNA的组合来精细调控某个基因的表达。 自从第一个miRNA发现至今,很短的十几年时间内,有关miRNA的研究突飞猛进。目前,miRNA数据库(miRBase17.0)中的miRNA数量已达到15172条,虽然每一种生物的miRNA总数难以确定,生物信息学研究表明,miRNA占动物基因总数的1-5%,鸡的miRNA总数约为1000条(Stark 2005)。因此,还存在大量鸡miRNA未被发现。 鸡是一种重要的经济动物,在人们生活生产中占有重要的地位,同时它也是重要的人类疾病研究模型。在miRBase17.0中,已经收录人类miRNA1424条,但是鸡的miRNA只有499条。已经收录在miRBase中的鸡的miRNA多数都是基于其保守性发现的,而基于序列保守性预测miRNA的方法准确性较低,而且速度太慢,难以在短时间内预测出大量miRNA。另一方面,基于序列保守性的预测方法也无法预测已经发现miRNA没有同源性的miRNA。本实验中,我们综合了以往关于miRNA研究发现的miRNA所具有的特征,将其抽象成相应的数学模型,作为筛选pre-miRNA的条件,采用Java语言开发了预测miRNA的软件包:GlaMiRFilter。另外,还基于支持向量机开发了一款鸡的pre-miRNA分类器:GluMiRPred。最后,我们还采用JSP语言开发了预测鸡的新miRNA的网络平台,为进一步研究鸡的miRNA提供支持。 本研究利用miRBase中收录的鸡的pre-miRNAs构建了训练集和测试集,我们给予SVM训练得到预测模型Glutrain300125并利用测试集对我们的预测软件进行评价,发现其敏感度达到100%,特异性是88.4%,准确性是90.3%。这些结果证明GluMiPRed是一个有效区分鸡pre-miRNA的分类器,该分类器具有较高的准确性。最后,我们利用GluMiPRed对鸡的基因组进行扫描,预测得到了7471条候选鸡pre-miRNAs。目前,还没有一款miRNA预测软件是专门针对鸡的。为了验证我们开发的软件对鸡miRNA预测具有特异性,我们利用猪的miRNA构建了测试集进行检验,得到的结果是该软件在猪的数据集上的敏感度只有74%,从而证明该软件对鸡的miRNA预测具有特异性。
基于图卷积网络的miRNA与疾病关联预测研究
这是一篇关于miRNA,疾病,图卷积网络,关联预测,多类别预测的论文, 主要内容为mi RNA通过负调控基因表达影响疾病,因此mi RNA与疾病间存在潜在关联。计算模型是预测mi RNA与疾病关联的重要途径,可降低mi RNA与疾病关联分析成本。现有方法只关注于预测二元关联且难以捕获高阶拓扑特征,如何提高预测效果,并进一步对关联类型进行预测,对后续mi RNA与疾病预测研究至关重要。论文以mi RNA与疾病关联为研究对象,从相似度网络重构、mi RNA与疾病关联预测、mi RNA与疾病关联类型预测三方面开展模型研究,并设计实现mi RNA与疾病关联预测平台,论文主要工作如下:1、针对mi RNA与疾病关联预测过程中相似度网络稀疏且存在噪声的问题,提出基于对称三因子非负矩阵分解的相似度网络重构模型,对相似度矩阵进行三因子非负矩阵分解,添加对称和正则约束,使用加性梯度下降法求解。仿真结果显示,本模型在mi RNA相似度数据集上具有0.0016的正常平均绝对误差和0.1425的均方根误差,在疾病相似度数据集上具有0.0052的正常平均绝对误差和0.1160的均方根误差,基于重构相似度网络的用于mi RNA疾病关联预测的组内与组间得分模型的受试者工作曲线下面积为0.8362。2、针对mi RNA与疾病关联网络高阶拓扑特征难以捕获的问题,提出基于二维超图卷积网络的mi RNA与疾病关联预测模型,基于相似度矩阵和已知mi RNA与疾病关联网络构建超图,将图卷积神经网络迁移至超图,通过联合因子求解实现mi RNA与疾病关联预测。仿真结果表明,本模型在全局留一法交叉验证和五折交叉验证的受试者工作曲线下面积分别达0.9256和0.9211。3、针对mi RNA与疾病关联类型网络拓扑特征难以获取,相似度信息利用不充分的问题,提出基于分解异构图神经网络的mi RNA与疾病关联类型预测模型,基于相似度矩阵和已知mi RNA与疾病关联类型网络构建异构图,引入相似度边权、自适应结合函数和类型特征进行消息聚合和节点更新,通过Dis Mult进行链路预测。仿真结果表明,在四类数据集上top1 F1分别为0.6684、0.6619、0.6618、0.6536,受试者工作曲线下面积分别为0.9202、0.8735、0.9090、0.9116。4、采用浏览器/服务器架构,基于Vue前端、Spring Boot框架和My SQL数据库,设计并实现mi RNA与疾病关联预测平台,满足mi RNA与疾病关联预测应用场景。平台包括用户管理、数据分析和关联预测等功能。
癌基因和相关miRNA特征研究
这是一篇关于癌基因,miRNA,数据库,蛋白质结构域的论文, 主要内容为癌症常常是由于基因的不恰当表达造成的,因此本文针对癌基因相关的生物学数据,特别是对基因具有重要调控作用的miRNA进行研究。为了便于数据的存储、提取和处理,建立癌基因及相关miRNA特征数据库和数据库查询网站。随后利用癌基因及相关miRNA数据库分析了miRNA对癌基因的调控情况,各种癌症发生过程中可能起重要作用的miRNA,miRNA在癌症癌基因上调控位置与调控频度的特性,miRNA与癌基因表达的蛋白质结构域之间的联系以及这种联系对癌症的影响。同时,以pathway为桥梁,推断了与癌症密切相关的miRNA和siRNA之间的关系。所建立的癌基因及相关miRNA数据库及查询网站方便生物学家和癌症相关研究人员对特征数据的查询,所有分析结论对于癌症的进一步研究具有一定意义。
基于JSP癌基因与其相关miRNA特征数据库查询系统
这是一篇关于生物信息,病毒,miRNA,siRNA,病毒库查询,JSP的论文, 主要内容为病毒基因一直是影响我们人类生命健康的大敌,尤其癌症病毒更是危害人类的重大疾病之一,患有癌症的患者一般都具有非常高的致死率,在全球范围内其中五年的生存率大约只有15%,而在我国的百分比还不足10%。在全球多家研究机构中得出的结果,多种证据已经表明逆转录酶病毒与我们人类癌症的发生有着密切相关的联系。与此同时,由于病毒基因既具有结构和组分简单的特点,又具有生命的基本特征,所以是全球生物科学研究机构中的重要素材。 人类现已进入二十一世纪,随着科研人员对siRNA和miRNA的发现,这两种病毒之间的关系和应用前景已经成为科研人员研究的新热点问题,同时欧美及日本等国家地区相继建立起了该领域的病毒查询数据库,而我国在这方面还处在真空状态。本文采用了免费提供生物信息学数据库中的病毒及小RNA序列的数据为基础数据源,利用生物信息学中的工具和方法,对科研人员新发现的miRNA、siRNA病毒等,一级序列之间的关系。我们并从它们所产生的关键“靶位点”、“启动子”、“完整序列”等几个层次进行了分析比对并做了相应统计。我们小组在这个研究过程中产生的一些分析程序和表单信息,并制作了可以实时查询的病毒库,在此查询库中可以输入相应的原始参数,根据病毒裂变产生一种电脑虚拟结果,根据结果来判断病毒的发展。建立这个平台可以给科研工作者提供系统性的信息服务。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码港湾 ,原文地址:https://m.bishedaima.com/lunwen/52590.html