序列编码区注释系统及非编码区预测系统研究
这是一篇关于Wiki,EST,转录组,注释,预测的论文, 主要内容为生物数据大量增加,各类生物数据库和服务系统的构建与维护则是生物信息学应用到基因组领域的一个重要体现,但是这些数据库并不包含那些在生物学界具有针对性的信息类型。同时,利用生物实验方法识别或预测序列,尚存在一定的困难,而且费用高、预测的精确度较低、还比较耗时。基于以上理念,序列编码区注释系统wikicell和非编码区预测系统PMirP应运而生。 Wikicell做为转录组的数据库及注释系统,具有很强的针对性和应用性。其逻辑结构基于人体解剖细化图,节点多达上千个,关系复杂混乱,而且存储到节点的数据量逾千万。本课题应用了改进的有根图遍历算法,把逾千万的数据归类整理到上千个节点中,并自动产生根路径。还通过一系列数据处理方法,并结合wiki理念构建成一个应用广泛,便于交流的转录组学平台。添加的搜索引擎功能模块,分类图索引功能模块,数据状态模块,BLAST模块丰富了系统的功能,方便于用户的使用。 PMirP用于非编码区调控因子microRNA前体pre-microRNA的预测。其预测原理是应用支持向量机(SVM)作为二分类,对FASTA格式的pre-microRNA数据进行一系列的处理与分析,生成SVM的输入格式,应用训练的模型预测序列的真假值。其具有较低的计算时间,一次可预测多个序列,并且所有相关的软件及源程序可以从网站上免费获得。
烟酰胺腺嘌呤二核苷酸(NAD)代谢通过调节肿瘤相关成纤维细胞(CAF)促进胃癌进展
这是一篇关于胃癌预后,GEO,免疫治疗靶点,TCGA,转录组,肿瘤相关成纤维细胞的论文, 主要内容为背景:胃腺癌(GC)是五种最常见的癌症之一,也是癌症相关死亡的第三大最常见原因,每年在全球造成近800,000人死亡。胃癌的治疗方式一般以手术为主(D2和腹腔镜切除术),虽然近年来取得了一些进展,但是结果仍不令人满意,晚期胃癌患者术后的5年生存率仍不足50%。针对参与免疫调节途径的免疫检查点抑制剂(ICIs)有助于打破免疫耐受循环,从而增加免疫细胞对癌症的免疫应答并抑制癌细胞诱导的免疫逃逸。代谢重编程在肿瘤细胞中的作用与支持肿瘤中不同关键细胞过程的烟酰胺腺嘌呤二核苷酸(NAD)水平密切相关。以往的研究表明,靶向GC细胞中的NAD+合成可以有效抑制能量和代谢产物的产生。目的:在本次研究中,我们聚焦在NAD+代谢相关基因(NMRGs)在胃癌中可能发挥的作用,为寻找NAD+代谢相关的治疗提供帮助。研究方法:1.数据下载和细胞获取:从TCGA在线数据库(https://portal.gdc.cancer.gov/)下载完整的基因表达数据、临床信息和突变数据(包括375个GC样本和32个正常胃组织样本)。此外,还下载了来自Gene Expression Omnibus(GEO,https://www.ncbi.nlm.nih.gov/geo/database)在线数据库的GSE84437数据集,共有433个GC样本测序数据。GSE163558单细胞数据集包括6例患者的原发性胃癌组织和6例不同器官或组织(肝、腹膜、卵巢、淋巴结)的转移癌组织,共计96810个细胞。从中国医学科学院细胞培养中心获得了人胃粘膜上皮细胞GES-1和五种胃癌细胞系(N87、SGC7901、MKN45、AGS、MGC803)。2.一致性聚类和基因集变异分析(GSVA):基于筛选出的NMRGs,使用“Consensus Cluster Plus”包对来自TCGA和GEO数据库的胃癌样本进行聚类分组。从分子特征数据库(MSig DB,https://www.gsea-msigdb.org/gsea/index.jsp)获得c2.cp.kegg.v7.4来执行GSVA。分别比较不同聚类样本间的患者临床信息,生存曲线和信号通路的差异。3.最小绝对收缩和选择算子(LASSO)回归分析:使用LASSO回归分析,我们构建了基于NMRGs的预后模型。在该模型下,探索了风险评分与肿瘤组织免疫细胞浸润、基因突变和肿瘤干细胞评分之间的关联。4.单细胞测序数据分析:对胃癌单细胞数据进行质控,剔除低质量细胞后,对构建预后模型的关键基因在细胞中的表达模型进行验证。5.通过实时定量PCR(qRT-PCR)技术,在人胃粘膜上皮细胞GES-1和五种胃癌细胞系(N87、SGC7901、MKN45、AGS、MGC803)中,对构建预后模型的关键基因在细胞中的表达水平进行对比。结果:1.我们基于33个NMRGs将808个GC样本聚类成3个簇。不同样本簇间的生存分析显示,来自具有较低NMRGs表达的集群的GC患者具有更好的生存时间(P=0.017)。高NMRGs表达组中,糖胺聚糖生物合成硫酸软骨素、ECM受体相互作用和粘着斑信号通路的富集显著高于NMRGs低表达组(P<0.05)。2.LASSO回归分析筛选并构建了由SGCE、APOD和PPP1R14A组成的预后模型。低风险组GC患者的总生存期(OS)优于高危组,风险评分、年龄和N分期对GC患者的预后很有价值。低风险组患者的免疫评分和基质评分低于高风险组患者。具体来说:滤泡辅助性T细胞和CD4记忆激活T细胞与三个关键基因的表达水平呈负相关,而CD4记忆静息T细胞、单核细胞和静息肥大细胞呈正相关。生存分析表明,SGCE、APOD和PPP1R14A的较低表达与患者的较好预后相关。3.风险评分与GC突变状态和微卫星不稳定性的相关性:低风险组的突变率高于高风险组,在前20个驱动突变基因中,TTN和TP53的突变率最高。高风险组的TMB评分低于低风险组,基于m RNA表达的干性评分与风险评分呈负相关。不同微卫星稳定性状态组的风险评分显著不同(P<0.05)。4.qRT-PCR验证SGCE、APOD和PPP1R14A的表达量:GC细胞系中SGCE、APOD和PPP1R14A的表达水平较正常人胃黏膜上皮细胞系明显增加(P<0.05)。5.胃癌单细胞数据的分析:SGCE、APOD和PPP1R14A与CAFs经典标志物在细胞中的表达高度一致(用于鉴定的CAFs标志物为ACTA2、FAP、PDGFRA、PDGFRB、PDPN、THY1和COL1A1)。我们通过CAFs标志物对转录组样本进行量化和评分,以验证SGCE、APOD和PPP1R14A与CAFs之间的关系。结果显示,高风险组样本的CAFs得分较高,同样,相关性热图也显示它们具有非常明显的正相关性。最后,生存曲线的结果显示,CAFs较少的胃癌患者预后较好(P<0.001)。结合基因风险评分,发现CAFs较少且风险评分较低的患者预后最好(P<0.001)。结论:我们首次初步揭示了NMRGs与GC患者预后的相关性,并鉴定了与NMRGs协同作用的基因SGCE、APOD和PPP1R14A。NAD代谢可能通过SGCE、APOD和PPP1R14A调控CAFs,共同影响GC患者的预后、免疫细胞浸润和免疫治疗效果,这可能为免疫生物标志物和GC的潜在机制提供新的见解。
烟酰胺腺嘌呤二核苷酸(NAD)代谢通过调节肿瘤相关成纤维细胞(CAF)促进胃癌进展
这是一篇关于胃癌预后,GEO,免疫治疗靶点,TCGA,转录组,肿瘤相关成纤维细胞的论文, 主要内容为背景:胃腺癌(GC)是五种最常见的癌症之一,也是癌症相关死亡的第三大最常见原因,每年在全球造成近800,000人死亡。胃癌的治疗方式一般以手术为主(D2和腹腔镜切除术),虽然近年来取得了一些进展,但是结果仍不令人满意,晚期胃癌患者术后的5年生存率仍不足50%。针对参与免疫调节途径的免疫检查点抑制剂(ICIs)有助于打破免疫耐受循环,从而增加免疫细胞对癌症的免疫应答并抑制癌细胞诱导的免疫逃逸。代谢重编程在肿瘤细胞中的作用与支持肿瘤中不同关键细胞过程的烟酰胺腺嘌呤二核苷酸(NAD)水平密切相关。以往的研究表明,靶向GC细胞中的NAD+合成可以有效抑制能量和代谢产物的产生。目的:在本次研究中,我们聚焦在NAD+代谢相关基因(NMRGs)在胃癌中可能发挥的作用,为寻找NAD+代谢相关的治疗提供帮助。研究方法:1.数据下载和细胞获取:从TCGA在线数据库(https://portal.gdc.cancer.gov/)下载完整的基因表达数据、临床信息和突变数据(包括375个GC样本和32个正常胃组织样本)。此外,还下载了来自Gene Expression Omnibus(GEO,https://www.ncbi.nlm.nih.gov/geo/database)在线数据库的GSE84437数据集,共有433个GC样本测序数据。GSE163558单细胞数据集包括6例患者的原发性胃癌组织和6例不同器官或组织(肝、腹膜、卵巢、淋巴结)的转移癌组织,共计96810个细胞。从中国医学科学院细胞培养中心获得了人胃粘膜上皮细胞GES-1和五种胃癌细胞系(N87、SGC7901、MKN45、AGS、MGC803)。2.一致性聚类和基因集变异分析(GSVA):基于筛选出的NMRGs,使用“Consensus Cluster Plus”包对来自TCGA和GEO数据库的胃癌样本进行聚类分组。从分子特征数据库(MSig DB,https://www.gsea-msigdb.org/gsea/index.jsp)获得c2.cp.kegg.v7.4来执行GSVA。分别比较不同聚类样本间的患者临床信息,生存曲线和信号通路的差异。3.最小绝对收缩和选择算子(LASSO)回归分析:使用LASSO回归分析,我们构建了基于NMRGs的预后模型。在该模型下,探索了风险评分与肿瘤组织免疫细胞浸润、基因突变和肿瘤干细胞评分之间的关联。4.单细胞测序数据分析:对胃癌单细胞数据进行质控,剔除低质量细胞后,对构建预后模型的关键基因在细胞中的表达模型进行验证。5.通过实时定量PCR(qRT-PCR)技术,在人胃粘膜上皮细胞GES-1和五种胃癌细胞系(N87、SGC7901、MKN45、AGS、MGC803)中,对构建预后模型的关键基因在细胞中的表达水平进行对比。结果:1.我们基于33个NMRGs将808个GC样本聚类成3个簇。不同样本簇间的生存分析显示,来自具有较低NMRGs表达的集群的GC患者具有更好的生存时间(P=0.017)。高NMRGs表达组中,糖胺聚糖生物合成硫酸软骨素、ECM受体相互作用和粘着斑信号通路的富集显著高于NMRGs低表达组(P<0.05)。2.LASSO回归分析筛选并构建了由SGCE、APOD和PPP1R14A组成的预后模型。低风险组GC患者的总生存期(OS)优于高危组,风险评分、年龄和N分期对GC患者的预后很有价值。低风险组患者的免疫评分和基质评分低于高风险组患者。具体来说:滤泡辅助性T细胞和CD4记忆激活T细胞与三个关键基因的表达水平呈负相关,而CD4记忆静息T细胞、单核细胞和静息肥大细胞呈正相关。生存分析表明,SGCE、APOD和PPP1R14A的较低表达与患者的较好预后相关。3.风险评分与GC突变状态和微卫星不稳定性的相关性:低风险组的突变率高于高风险组,在前20个驱动突变基因中,TTN和TP53的突变率最高。高风险组的TMB评分低于低风险组,基于m RNA表达的干性评分与风险评分呈负相关。不同微卫星稳定性状态组的风险评分显著不同(P<0.05)。4.qRT-PCR验证SGCE、APOD和PPP1R14A的表达量:GC细胞系中SGCE、APOD和PPP1R14A的表达水平较正常人胃黏膜上皮细胞系明显增加(P<0.05)。5.胃癌单细胞数据的分析:SGCE、APOD和PPP1R14A与CAFs经典标志物在细胞中的表达高度一致(用于鉴定的CAFs标志物为ACTA2、FAP、PDGFRA、PDGFRB、PDPN、THY1和COL1A1)。我们通过CAFs标志物对转录组样本进行量化和评分,以验证SGCE、APOD和PPP1R14A与CAFs之间的关系。结果显示,高风险组样本的CAFs得分较高,同样,相关性热图也显示它们具有非常明显的正相关性。最后,生存曲线的结果显示,CAFs较少的胃癌患者预后较好(P<0.001)。结合基因风险评分,发现CAFs较少且风险评分较低的患者预后最好(P<0.001)。结论:我们首次初步揭示了NMRGs与GC患者预后的相关性,并鉴定了与NMRGs协同作用的基因SGCE、APOD和PPP1R14A。NAD代谢可能通过SGCE、APOD和PPP1R14A调控CAFs,共同影响GC患者的预后、免疫细胞浸润和免疫治疗效果,这可能为免疫生物标志物和GC的潜在机制提供新的见解。
冬眠对马铁菊头蝠(Rhinolophus ferrumequinum)肠组织转录组的影响
这是一篇关于转录组,冬眠,差异表达基因,肠道,马铁菊头蝠的论文, 主要内容为冬眠是一种复杂的生理反应,它有助于动物适应极端的环境条件。冬眠期间,动物遭受长期的低温和禁食,这严重影响了肠道的正常功能。目前还没有相关研究在转录组水平上探讨冬眠对肠道的影响。本课题对翼手目动物马铁菊头蝠(Rhinolophus ferrumequinum)在冬季冬眠期和夏季活跃期肠道组织的转录组进行了比较研究,这是首次对冬眠哺乳动物的肠转录组进行研究,以期通过寻找两种状态之间的差异表达基因,来探讨冬眠对动物肠组织功能的影响。本研究使用两种寻找差异表达基因的方法(edgeR和DESeq2),并设置严格参数,来寻找马铁菊头蝠冬眠期与夏季活跃期间的差异表达基因。最终共鉴定出78个差异表达基因,其中冬季冬眠期高表达的基因有16个,低表达(即夏季活跃期高表达)的基因有62个。对这些差异表达基因进行基因本体(Gene ontology)功能富集分析,共得到521个基因本体号(GO term),通过设置FDR值<0.05,共得到5个具有显著意义的基因本体号(GO term),其中三个与免疫功能有关,一个位于细胞外区域,一个位于质膜部分。本课题的研究结果证实了在冬眠蛰伏期肠组织整体免疫系统受到抑制,而部分固有免疫功能却是增强的(6个冬眠期高表达且与固有免疫有关的基因:GPC1、ALOX15、CTSL、SMPDL3A、CDH26、PGD)。其次,本研究揭示了5个编码膜骨架连接蛋白的基因(ALPK3、LAMB3、LAMC2、KRT19、PLXNA2)在冬眠蛰伏期是高表达的,这可能有助于维持冬眠蛰伏期肠道的完整性。此外,本研究还发现了两个与消化吸收相关的基因(LCT和TCN2)在冬眠期是高表达的。最后,根据与以前其他冬眠哺乳动物的其他组织的转录组、蛋白组学研究结果进行比较,作者发现,几乎所有本研究鉴定的差异表达基因都在之前的研究中出现过,这说明动物在冬眠蛰伏期可能通过相似的基因调控网络或通路来适应冬眠。本研究有助于理解动物在冬眠期间为适应潜在的压力其肠道功能所发生的变化。
楚香黑猪黑色素瘤的致病基因鉴定及淘汰选育
这是一篇关于楚香黑猪,黑色素瘤,关联分析,液态芯片测序,转录组,通路分析的论文, 主要内容为随着市场经济欣欣向荣的发展,人民生活水平逐年提高,肉类市场特别是猪肉对于品质的要求也越来越高,各大养猪企业纷纷开始肉质性状育种以及利用地方猪种进行新品种培育。楚香黑猪作为华中农业大学与湖北金旭农业发展股份有限公司基于地方猪和瘦肉猪两类资源培育的黑猪新品种,有着高瘦肉率与肉质优良的特点。但毛色纯化过程中出现的黑色素瘤对楚香黑猪整体的外观一致性和市场口碑造成了影响,并给公司带来经济损失。黑色素瘤作为人类皮肤高发恶性肿瘤,缺乏特效治疗手段以及极差的预后,已逐渐成为人类发病率增长最快的肿瘤之一。因此,为了通过育种手段将黑色素瘤易感基因从楚香黑猪群体中淘汰,并将楚香黑猪作为研究黑色素瘤的模式动物,本研究对比了楚香黑猪黑色素瘤家系中141个样本,包括26个病例和115个对照,利用SNP芯片数据和多种测序数据,结合全基因组关联分析和选择信号,在多条染色体上鉴定到楚香黑猪中可能与黑色素瘤直接相关的易感基因,如 KCNMA1、NTRK2、GRHL3、RUNX3、PDE1C、TNC 和 NFKB1。转录组学分析得到了与黑色素瘤进展相关的调控基因CDH13、IVL和P4HA3,及主要与黑色素瘤相关的表达上调通路:MAPK、Wnt、RAS、IL-17、TNF、VEGF、P13K-Akt以及NF-KappaB通路。本研究的主要结果如下:(1)表型数据的卡方假设检验表明楚香黑猪群体的黑色素瘤性状可能是由2~3个基因控制的隐性遗传性状,并在楚香黑猪中表现为结节黑色素瘤(NM)和扩散黑色素瘤(SSM)。(2)收集141头黑色素瘤家系样品,通过液态芯片测序共得到743,601个全基因组分布SNP。芯片数据的GWAS分析中,通过FarmCPU模型关联到14号染色体KCNMA1第一内含子c.541-46827C>T与黑色素瘤性状显著相关,-log10p值为4.76E-33。(3)利用PCA的分群结果,通过群体分群间的选择信号分析与GWAS分析共同鉴定到KCNMA1,FST值为0.15,XP-EHH值为-2.27,10号染色体上NTRK2和18号染色体上PDE1C在黑色素瘤与正常群体中存在明显分化,FST值为0.18和0.20。选择信号与转录组差异表达分析共鉴定到GRHL3、RUNX3、PDE1C,全部为上调DEGs,并在基因内变异位点呈很强的连锁不平衡,R2为0.85~1.0。(4)基于正常皮肤与皮肤黑色素瘤的转录组分析得出的显著差异表达基因中,通路富集结果显示上调的基因显著富集在MAPK/ERK(LogP=-4.33)、WNT/β-catenin/MITF(LogP=-3.53)以及 Ras(LogP=-6.14)等相关调节通路,NTRK2富集到MAPK、Ras、P13K-Akt通路并显著下调表达(log2FC=-1.65),GRHL3在Wnt通路中富集并显著上调表达(log2FC=1.82)TNC在PI3K-Akt通路中显著富集并著上调表达(log2FC=1.83),CDH13、IVL分别富集在与细胞粘附、角质化进程相关通路(CDH13/log2FC=0.84,IVL/log2FC=2.57)。(5)基于3头黑色素瘤与3头正常小猪的全基因组重测序数据的变异注释,在常染色体共12,777,586个变异位点中共发现123,476个位点在3头黑色素瘤个体中出现隐性突变纯合,存在于2634个基因的编码区中,包括NTRK2和转录组中显著表达上调的IVL(log2FC=2.57)和P4HA3(log2FC=2.82)。
冬眠对马铁菊头蝠(Rhinolophus ferrumequinum)肠组织转录组的影响
这是一篇关于转录组,冬眠,差异表达基因,肠道,马铁菊头蝠的论文, 主要内容为冬眠是一种复杂的生理反应,它有助于动物适应极端的环境条件。冬眠期间,动物遭受长期的低温和禁食,这严重影响了肠道的正常功能。目前还没有相关研究在转录组水平上探讨冬眠对肠道的影响。本课题对翼手目动物马铁菊头蝠(Rhinolophus ferrumequinum)在冬季冬眠期和夏季活跃期肠道组织的转录组进行了比较研究,这是首次对冬眠哺乳动物的肠转录组进行研究,以期通过寻找两种状态之间的差异表达基因,来探讨冬眠对动物肠组织功能的影响。本研究使用两种寻找差异表达基因的方法(edgeR和DESeq2),并设置严格参数,来寻找马铁菊头蝠冬眠期与夏季活跃期间的差异表达基因。最终共鉴定出78个差异表达基因,其中冬季冬眠期高表达的基因有16个,低表达(即夏季活跃期高表达)的基因有62个。对这些差异表达基因进行基因本体(Gene ontology)功能富集分析,共得到521个基因本体号(GO term),通过设置FDR值<0.05,共得到5个具有显著意义的基因本体号(GO term),其中三个与免疫功能有关,一个位于细胞外区域,一个位于质膜部分。本课题的研究结果证实了在冬眠蛰伏期肠组织整体免疫系统受到抑制,而部分固有免疫功能却是增强的(6个冬眠期高表达且与固有免疫有关的基因:GPC1、ALOX15、CTSL、SMPDL3A、CDH26、PGD)。其次,本研究揭示了5个编码膜骨架连接蛋白的基因(ALPK3、LAMB3、LAMC2、KRT19、PLXNA2)在冬眠蛰伏期是高表达的,这可能有助于维持冬眠蛰伏期肠道的完整性。此外,本研究还发现了两个与消化吸收相关的基因(LCT和TCN2)在冬眠期是高表达的。最后,根据与以前其他冬眠哺乳动物的其他组织的转录组、蛋白组学研究结果进行比较,作者发现,几乎所有本研究鉴定的差异表达基因都在之前的研究中出现过,这说明动物在冬眠蛰伏期可能通过相似的基因调控网络或通路来适应冬眠。本研究有助于理解动物在冬眠期间为适应潜在的压力其肠道功能所发生的变化。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码向导 ,原文地址:https://m.bishedaima.com/lunwen/50981.html