基于机器学习的乳腺癌新辅助化疗辅助诊疗系统的设计与实现
这是一篇关于机器学习,集成学习,乳腺癌,新辅助化疗的论文, 主要内容为乳腺癌是一种常见于女性的恶性肿瘤,数据显示,2020年全球乳腺癌新增病例高达226万例,首次超过肺癌的年新增病例数,成为世界范围内年度新增病例最多的癌症。自20世纪90年代以来,中国乳腺癌发病率的增长速度是全球增长速度的两倍之多,目前乳腺癌已成为中国女性发病率第一,死亡率第五的癌症。长期快速增长的发病率,使得国家和社会所面临的经济负担与健康压力日益加重。所幸的是,与其他癌症患者相比较,乳腺癌患者的预后较好,通过积极的全身性、系统性治疗可以有效提高乳腺癌患者的生存率。新辅助化疗是现代乳腺癌治疗中一种重要的治疗手段,可以有效的提高患者的生存率与生存质量。但是新辅助化疗需要2-4个周期的治疗,才能确定患者对新辅助化疗的敏感性。相关研究数据表明,10%-35%的患者对于新辅助化疗不敏感,5%的患者病情甚至可能会进一步恶化,进行新辅助化疗直接延误了此类患者的治疗时机。另一方面,随着信息技术的快速发展,运用机器学习算法来预测患者对新辅助化疗的敏感性成为可能,在此基础上运用软件开发技术构建乳腺癌新辅助化疗辅助诊疗系统能够辅助医生决策,提高患者生存率。本研究致力于开发一套乳腺癌新辅助化疗辅助诊疗系统,其核心是使用机器学习算法建立预测模型,对乳腺癌患者的新辅助化疗敏感性进行预测。首先,采用缺失值填充、特征选取以及数据集的平衡处理方法对患者的病理数据进行预处理操作。其次,使用支持向量机、Logistic回归、随机森林、XGBoost四种机器学习算法建立初步的预测模型并进行测试,并根据F1-score与AUC指标选取预测效果最好的XGBoost模型。然后,结合网格搜索和SMOTE-NC过采样算法,提出GSCVSN模型优化方法,对XGBoost模型进一步优化。最后,引入Stacking算法的堆栈融合思想,将GSCVSN优化后的四种算法进行融合,得到最终预测模型GSCVSN-Stacking,从而达到乳腺癌患者的新辅助化疗敏感性精确预测的目标。本研究在GSCVSN-Stacking预测模型的基础上,设计并实现了乳腺癌新辅助化疗辅助诊疗系统,主要功能包括患者基本信息、病理信息、治疗信息的录入、患者信息查询、敏感性分析等。在辅助诊疗系统的构建过程中,使用Vue.js框架和Element UI来实现前端页面,使用Spring Boot和Mybatis-Plus来完成后端系统的开发,对系统进行功能性测试和非功能性测试,用以确保系统部署上线后的可用性。
实时超声造影技术在乳腺癌诊断及新辅助化疗疗效评估中的应用
这是一篇关于时间—强度曲线,实时超声造影技术,乳腺癌,乳腺良性肿块,新辅助化疗,常规彩色多普勒超声的论文, 主要内容为背景乳腺癌已经成为当前危害女性健康的常见疾病之一,其发病率正呈逐年递增的趋势发展,且越来越年轻化。目前尚未有明确的预防方法,已有大量的临床研究证实,提高乳腺癌患者治疗的有效性和减少其死亡率的最常用方法就是通过影像学检测来达到早期的诊断和及时的治疗,这是决定患者预后的关键步骤。由于大多数中国女性的乳房相对较小并且腺体致密,传统的乳房X射线检查难以清晰显示和明确诊断出较小的乳腺肿块。而常规彩色多普勒超声因其无创伤性、图像实时动态、对软组织分辨率高和能清晰显示肿瘤周边和内部的血流分布等优点而成为了中国女性乳腺癌诊断的主要影像学方法之一,在鉴别诊断乳腺良、恶性肿瘤中发挥了重要作用。然而,由于常规彩色多普勒超声对流速较低的血流以及管腔较细的微血管结构显示相对较差,这一局限性在直径≤2.0cm的乳腺良、恶性肿瘤中尤为突出。随着超声影像技术的不断发展实时超声造影技术(contrast-enhanced ultrasound,CEUS)在临床各种疾病的诊断及治疗中的应用得到了不断拓展,特别是在肝脏、肾脏、乳腺和甲状腺等器官良恶性肿瘤的鉴别诊断中发挥了重要的临床意义。由于超声造影剂直径小于红细胞直径,经静脉注射后其可通过肺循环达到组织或器官,并且能够在血液和微泡之间产生较大的声阻差,增强了它在血液中散射的回声信号,从而提高了超声的对比显像。超声造影剂能够使直径70μm的血管显像,充分显示肿瘤内部的微血管结构,大大提高了其内部细小血管的检出率以及低速血流的敏感度,因此有助于显示直径≤2.0cm乳腺肿瘤的血管灌注特征,从而有助于乳腺良恶性肿瘤的鉴别诊断。当前治疗乳腺癌的主要措施依旧是手术切除[1]。然而,大量的后期临床随访发现,有一部分患者在术后出现复发的情况,导致患者预后较差。因此,乳腺癌的早期诊断并制定合理的治疗方案都有助于提高患者的生存率及术后的生活质量。新辅助化疗(neoadjuvant chemotherapy,NAC)是乳腺癌患者进行的一种协助性治疗方式,即早期化疗、术前化疗。研究表明,不论是术前化疗还是术后化疗,对乳腺癌患者的生存率没有造成较大的影响[2-3]。但是,大量的临床研究已经证实,新辅助化疗(NAC)能有效减小乳腺癌病灶的范围、缩小手术面积,能够有效减少乳腺癌术后复发的发生率。因此,nac已经被作为局部进展性乳腺癌的标准化治疗方法之一,在临床上广泛应用。但是,怎样应用无创性的影像学手段准确地评估nac对乳腺癌的治疗效果是目前研究的热点和难点。由于恶性肿瘤的微血管密度(microvesseldensity,mvd)通常约为正常组织的1.9倍。因此,ceus技术能使恶性肿块的新生血管检测可视化,显著提高了超声检查对乳腺癌定性检查的敏感度。目的1、研究和探讨实时超声造影技术在直径≤2.0cm乳腺良恶性实性肿块的时间—强度曲线(time-intensitycurve,tic)相关定量参数上的区别,以及其实时超声造影的灌注特征。2、探究实时超声造影技术(ceus)是否能够准确地评估乳腺癌的新辅助化疗(nac)疗效,并为其早期的治疗效果进行评定。资料和方法1、实时超声造影技术在乳腺癌早期鉴别诊断中的应用价值回顾性分析在2012年9月到2013年12月期间,因临床触诊发现乳房包块就诊于西南医院门诊部或者住院部治疗的患者共63例,肿块的直径均≤2.0cm,直径为(1.44±0.45)cm。患者检查时,首先应用常规彩色多普勒超声确定肿块的方位,检查其形态、范围以及血供特点,然后启用ceus模式,在注入sonovue(bracco,italy)超声微泡造影剂之后,动态观察该肿块超声造影的灌注情况,观察总结乳腺良、恶性实性肿块的造影图像特点。然后,运用qontrast图像分析软件处理获得时间—强度曲线(tic)的定量参数,研究探讨其在乳腺实性肿块良、恶性上的不同。所有患者均经超声引导下穿刺活检或者外科手术获得病理诊断,其中良性30例,恶性33例。2、实时超声造影技术在评估乳腺癌新辅助化疗效果中的应用价值收集从2014年10月至2015年3月到我院行乳腺肿块穿刺活检确诊为乳腺癌,并在我院接受te方案(即第一天经静脉滴注多西他赛75mg/m2和表柔比星60mg/m2,总共治疗四个周期,每21天作为一个周期)进行新辅助化疗以及化疗后手术的患者。再告知本次研究目的、潜在的风险以及益处之后,确定10名患者愿意参与本次研究,同时在书面知情同意书上签字。10名参与者的性别均为女性,年龄:35-64岁。接受te方案治疗之前肿块病灶的最大直径为20.56±7.06mm。患者检查时先用常规彩色多普勒超声确定乳腺肿瘤的位置以及测量其最大直径。随后换用造影探头,经静脉注射超声造影剂(sonovue),实时动态观测病灶的造影图像特点,重新测量造影后肿块的最大直径。常规彩色多普勒超声与实时超声造影(ceus)测得的肿块大小将分别于术后病理标本的实际数值进行对比。最后,动态图像由qontrast图像分析软件进行分析处理,得到相关时间-强度曲线(tic)的定量参数。结果1、本研究中,76.67%(23/30)乳腺良性肿的增强方式表现为离心性增强,乳腺良性病灶中有73.33%(22/30)的增强程度为低增强,78.79%(26/30)的增强类型为均匀性增强。而乳腺恶性肿块中有75.76%(25/33)的增强方式显示为向心性增强;87.88%(29/33)乳腺癌病灶的增强程度为高增强,90.91%(30/33)乳腺恶性肿瘤的增强类型是不均匀性增强。经图像分析软件定量分析结果显示,乳腺实性良恶性肿瘤的感兴趣区(regionofinterest,roi)在达峰时间(timeofpeak,tp)上具有一定的区别,但是无统计学上的意义(p>0.05);此外,直径≤2.0cm的乳腺良、恶性肿瘤在峰值强度(peakintensity,pi)以及曲线上升支斜率(ascendingslopeofthecurve,k)上存在显著的不同,乳腺癌组明显高于良性组,二者具备统计学意义(p<0.05)。应用常规彩色多普勒超声诊断早期乳腺癌的诊断准确率是73.02%,特异度是73.33%,敏感度是72.73%;当常规彩色多普勒超声结合实时超声造影(ceus)检查后,通过良恶性病灶在造影图像特点以及定量参数的区别,诊断的灵敏度为81.82%、特异度为83.33%,准确率为82.54%。2、本研究中,10名患者在行新辅助化疗后,其中有7名(7/10,70%)的病灶减少超过了50%,3名(3/10,30%)的病灶减少小于50%;没有患者出现病灶完全消失或者病灶增大的现象。由实时超声造影(ceus)检查测量肿瘤的最大直径明显大于行常规彩色多普勒超声检查检测的数据,二者之间的区别具备统计学上的意义(p<0.05)。与术后病理标本相较,行ceus检查测得的数据与其差别较小,但是无统计学差异(p>0.05);而经常规彩色多普勒超声检查测得的数据明显小于ceus所测数据(p<0.05)。经图像分析软件定量分析结果显示,行nac前后乳腺癌的感兴趣区(roi)在达峰时间(tp)上的差异没有统计学意义(p>0.05),而二者在峰值强度(pi)以及曲线上升支斜率(k)上的具备统计学差异,乳腺癌nac治疗后明显低于治疗前(p<0.05)。结论1、实时超声造影技术(ceus)能够实时动态观测直径≤2.0cm的良、恶性乳腺肿瘤内部的灌注特征,清晰显示肿块内部的新生血管结构,提高了超声诊断早期乳腺癌诊断的灵敏度、特异性和准确性。2、与常规彩色多普勒超声相比,实时超声造影技术(ceus)在评估乳腺恶性肿块的新辅助化疗(NAC)治疗效果方面更具优势,主要表现在能清晰显示化疗后肿瘤血管的变化情况。
基于GAN的乳腺癌新辅助化疗早期阶段影像生成及疗效预测研究
这是一篇关于乳腺磁共振成像,新辅助化疗,生成对抗网络,疗效预测,影像生成的论文, 主要内容为乳腺癌是女性生命健康的严重威胁,新辅助化疗(Neoadjuvant Chemotherapy,NACT)是乳腺癌治疗的重要手段。新辅助化疗通常具有多个疗程,治疗周期长并且疗效果因人而异。部分患者疗效良好,但部分患者或因疗效不佳导致疾病恶化,而错过接受其他治疗手段的最佳时期。若在化疗前准确预测出患者化疗后疗效,或病灶在化疗中的变化趋势,将具有重要的临床意义。动态增强磁共振成像(Dynamic Enhanced Magnetic Resonance Imaging,DCEMRI)技术是乳腺癌诊断的常用方法。影像组学研究通过提取影像学特征构建疗效预测模型对辅助医生临床决策具有重要意义。现有方法多基于单次采集的DCE-MRI预测疗效而实际效果不佳,有研究结合首次化疗前后两次采集的DCE-MRI预测疗效,而其模型仅对经历过一次治疗的患者可用,具有局限性。本文基于乳腺癌患者在新辅助化疗早期阶段(首次疗程后)前后采集的两组DCE-MRI及其最终疗效数据,进行化疗早期阶段影像生成及疗效预测研究,利用化疗早期阶段DCEMRI作为训练约束,设计了一种新颖的基于生成对抗网络(Generative Adversarial Network,GAN)的疗效预测模型。本模型可利用化疗前影像生成化疗早期阶段影像,来替代患者实际经历一次治疗再采集影像以观察治疗情况,并可通过生成对抗训练过程来约束疗效预测学习方向,以更准确地预测患者疗效。本模型在运用中可直接利用化疗前影像同时预测和生成患者最终疗效和化疗早期阶段DCE-MRI。医生和患者可利用本模型生成影像来直观观察病灶在首次化疗后可能的变化形态,并结合疗效预测信息来制定更加精准的治疗方案。本文主要包含以下几项研究内容:(1)基于CNN的疗效预测研究及感知损失设计。本文首先基于化疗前DCE-MRI进行基线性的疗效预测研究,并根据疗效预测模型设计感知损失用于后文影像生成研究。本文采用了多种CNN结构设计疗效预测模型,并引入注意力机制提升预测性能。结果显示,CNN疗效预测模型最佳AUC与准确率分别为0.78、0.72。由于患者前后影像中乳腺形态存在差异,采用经典距离损失约束生成模型效果欠佳,且原始感知损失采用Image Net预训练模型作为感知损失模型,而DCE-MRI与自然图像在特征上存在差异,因此本文基于DCE-MRI的CNN疗效预测模型设计感知损失。(2)基于GAN的化疗早期阶段影像生成研究。本文基于GAN进行化疗早期阶段DCEMRI生成研究,通过GAN由患者化疗前影像生成化疗早期阶段影像,尝试从两组DCE-MRI之间的联系与差异中学习乳腺病灶在化疗中的变化模式。本文采取了pix2pix GAN与Cycle GAN两种生成策略设计生成模型,并引入注意力机制优化生成器网络,采用前文设计的感知损失来约束生成化疗后影像与真实化疗后影像之间的深度特征相似性。实验结果显示,加入注意力机制与感知损失的Cycle GAN模型生成性能最佳,影像生成指标SSIM均值达到0.90,模型评价指标FID为19.83,模型生成性能较好。(3)基于化疗早期阶段影像约束的深度学习模型疗效预测研究。本文通过将分类器嵌入到GAN中构建多模态预测模型,实现对患者最终疗效及化疗早期阶段DCE-MRI同时进行预测及生成。本文将二者结合,期望通过在疗效预测训练中引入化疗早期阶段影像作为约束,来促进模型学习到乳腺病灶在化疗中的变化趋势,从而准确预测疗效;且在影像生成训练中加入疗效信息作为约束,让模型生成结果更加接近真实疗效影像。结果显示,本模型生成化疗后影像指标SSIM均值达0.92,FID为19.33;使用化疗前影像预测疗效,测试集中最佳AUC及准确率表现分别为0.86、0.80。本模型在影像生成与疗效预测上的性能表现均相对上述单任务模型有明显提升。最后,本文通过消融实验验证本模型有效性,采用类激活图对本模型进行可解释性研究。本文提出了一种新型的基于GAN的乳腺癌新辅助化疗早期阶段的影像生成与疗效预测方法。相较于传统GAN方法在单个时间上的生成应用,本文将GAN方法拓展到了跨时间的医学影像生成领域;相较于传统的疗效预测方法,本方法在训练过程中引入了化疗早期阶段影像作为训练约束,提升了疗效预测的性能。本研究对于通过技术手段辅助医生临床决策,为不同乳腺癌患者制定个性化诊疗方案具有重要的临床价值和意义。
乳腺癌新辅助化疗后病理完全缓解可能性预测模型及术后生存模型的建立和验证
这是一篇关于乳腺癌,新辅助化疗,病理完全缓解,肿瘤残余负荷,生存,列线图的论文, 主要内容为【背景和目的】乳腺癌是女性发病率第一的恶性肿瘤,也是引起女性癌症特异性死亡的重要原因,给女性的身心健康及生存构成了极大的危害。尽管手术已经较明显地延长了乳腺癌的生存期,但是对乳腺癌患者而言术前、术后化疗能进一步改善其预后,提高其生存质量。新辅助化疗(NAC,neoadjuvant chemotherapy)即乳腺癌手术之前的化疗,能够缩小乳腺癌瘤块、使肿瘤降级降期、提高保乳率并改善保乳效果,现已在临床上得到了越来越广泛的应用。多项临床试验证实NAC后病理完全缓解(p CR,pathological complete remission)的乳腺癌人群往往具有更长的无病生存期(DFS,disease-free survival)和总生存期(OS,overall survival)。国外研究已建立了多个p CR预测模型用于预测乳腺癌NAC后实现p CR状态的可能性,但由于种族、生存环境的较大差异,基于欧美国家乳腺癌人群建立的模型很可能并不适用于我国乳腺癌人群。构建适合于我国乳腺癌人群的p CR个体化预测模型对我国乳腺癌的新辅助治疗具有一定的参考价值和指导意义。因此,本课题收集临床工作中易得的临床、病理变量,对已实施NAC的乳腺癌患者开展了p CR的回顾性研究,构建了适用于我国乳腺癌人群NAC后p CR的个体化预测模型(实验一)。此外,恶性肿瘤患者的治疗中,生存期(如OS和DFS)的改善对患者意义重大。近年来,NAC在乳腺癌的临床治疗应用更加广泛,然而接受NAC的乳腺癌人群存在较大的异质性。因此,为实施NAC的乳腺癌患者构建个体化的预后模型具有重要临床意义。目前,尽管多个乳腺癌NAC术后的预后模型(如Rouzier模型、CPS+EG评分系统、Colleoni模型、neoadjuvant response指数、Keam模型、Nottingham Clinico-Pathological Response指数和Neo-Bioscore评分)已经被建立、验证并得到了较广泛的临床应用,但上述模型在当时的研究背景下没有考虑HER2的靶向治疗或没有进行细致的病理评估,在当前的临床应用中具有较大局限性。对于NAC后的乳腺癌患者而言,残余肿瘤负荷(RCB,residual cancer burden)从p CR或残留少数浸润性癌细胞到大面积的浸润性癌块不等,其RCB具有很大的异质性。因此,本研究旨在建立、验证接受NAC乳腺癌患者术后复发、转移风险预后模型并与先前模型进行预测准确性及临床决策净获益的比较(实验二)。实验一旨在:1.探索并确定我国乳腺癌人群NAC后p CR的独立预测因素;2.构建适用于我国人群的p CR个体化预测模型。实验二旨在:1.探索并确定我国NAC乳腺癌术后DFS的独立预测因素;2.构建适用于NAC乳腺癌术后的个体化预后模型;3.验证模型的预测性能,并与现有模型的预测性能和临床决策净获益进行比较;4.使用风险分层模型预测术后高危复发转移人群。【方法】实验一:1.回顾性分析2013.01~2017.12在我院确诊并行NAC的1 046例临床Ⅰ~Ⅲ期的乳腺癌患者的临床及病理变量。2.将2015.01~2017.12确诊的689例乳腺癌患者纳入训练集,进行单因素及多因素Logistic回归分析确定p CR的独立预测因素并构建p CR的个体化预测模型(列线图)。使用bootstrap=200、由本中心2013.01~2014.12确诊的357例患者构成的独立队列(验证集)对模型分别进行内部、外部验证(本中心的独立队列进行的验证)。3.计算ROC曲线下面积(AUROC,area under receiver operating characteristic curve)及绘制校准曲线对列线图预测p CR的性能进行检验。实验二:1.回顾性分析2012.01~2015.12在我院确诊、行NAC并接受乳腺癌手术的749例临床Ⅰ~Ⅲ期的乳腺癌患者的临床及病理资料。按照纳入标准筛选后,对符合入组的人群进行生存状态及生存期的随访(门诊随访和电话随访)。2.收集患者每次门诊及电话随访的相关临床事件信息、影像学检查和患者体征等。使用从本单位病理科档案室挑选的研究人群的病理切片及石蜡标本,评估研究人群的病理分级,脉管瘤栓(LVI,lymphovascular invasion)和RCB等指标。3.使用计算机以3:1的比例随机将研究人群分为训练集和验证集。对训练集人群进行单因素和多因素Cox回归分析确定NAC病人术后DFS的独立预测因素。使用R软件3.6.3版本构建NAC乳腺癌术后的个体化DFS模型。4.绘制ROC曲线及校准曲线检验预后模型的预测性能。计算一致性指数(C指数),绘制时间依赖的ROC曲线和临床决策曲线比较本研究组所建模型与先前模型的预测准确性及临床决策获益。5.使用X-tile软件确定训练集人群总分的截断点,将研究人群分为三个不同的危险分层。绘制Kaplan-Meier曲线进行生存分析,使用Log-rank检验确定生存差异的显著性。【结果】实验一:1.多因素Logistic回归分析表明乳腺癌患者NAC后p CR的独立预测因素有:绝经状态、乳腺癌家族病史、HER2/neu状态、Ki-67表达、肿瘤大小和ER表达。2.基于以上变量构建的列线图在训练集和验证集中预测乳腺癌NAC后个体化p CR的可能性时,均具有较高的准确度(分别为0.762和0.768),校准曲线进一步证实模型基本具备无偏性预测。实验二:1.单因素和多因素Cox分析表明:AJCC分期、病理分级、ER表达水平、HER2状态及靶向治疗情况、Ki-67、LVI及RCB为接受NAC乳腺癌患者术后DFS的独立预测因素。2.使用R软件绘制NAC乳腺癌术后的个体化预后模型。模型在内部及外部验证中,3年及5年的AUROC均在0.80及0.80以上,校准曲线与理想曲线(列线图的预测结果与实际观察情况完全一致)也较为接近。3.使用本单位数据,本课题组构建的预后模型的预测性能高于先前的模型及单个独立预后因素的预测性能(P<0.05);依据我们的模型进行临床决策的净获益也明显优于先前模型及单个独立预后因素的决策净获益。4.以280和360作为截断点,本课题组构建的预后模型能够对NAC乳腺癌患者术后复发、转移风险分层,且其区分性能良好。风险分层模型可帮助筛选潜在的高危复发、转移人群。【结论】实验一:1.本研究揭示了绝经状态和乳腺癌家族史是乳腺癌NAC后p CR的独立预测因素。2.本课题组所建模型对乳腺癌p CR可能性预测有较高准确性,为乳腺癌手术方式的选择、病人的临床咨询提供指导。实验二:1.本研究首次将RCB作为独立预后因素纳入NAC乳腺癌的预后模型中,构建的预后模型能个体化预测患者DFS且预测性能良好。2.模型的风险分层效果良好,能够对NAC乳腺癌患者术后复发、转移风险进行分层,帮助筛选潜在的高危复发、转移人群。
乳腺癌新辅助化疗后病理完全缓解可能性预测模型及术后生存模型的建立和验证
这是一篇关于乳腺癌,新辅助化疗,病理完全缓解,肿瘤残余负荷,生存,列线图的论文, 主要内容为【背景和目的】乳腺癌是女性发病率第一的恶性肿瘤,也是引起女性癌症特异性死亡的重要原因,给女性的身心健康及生存构成了极大的危害。尽管手术已经较明显地延长了乳腺癌的生存期,但是对乳腺癌患者而言术前、术后化疗能进一步改善其预后,提高其生存质量。新辅助化疗(NAC,neoadjuvant chemotherapy)即乳腺癌手术之前的化疗,能够缩小乳腺癌瘤块、使肿瘤降级降期、提高保乳率并改善保乳效果,现已在临床上得到了越来越广泛的应用。多项临床试验证实NAC后病理完全缓解(p CR,pathological complete remission)的乳腺癌人群往往具有更长的无病生存期(DFS,disease-free survival)和总生存期(OS,overall survival)。国外研究已建立了多个p CR预测模型用于预测乳腺癌NAC后实现p CR状态的可能性,但由于种族、生存环境的较大差异,基于欧美国家乳腺癌人群建立的模型很可能并不适用于我国乳腺癌人群。构建适合于我国乳腺癌人群的p CR个体化预测模型对我国乳腺癌的新辅助治疗具有一定的参考价值和指导意义。因此,本课题收集临床工作中易得的临床、病理变量,对已实施NAC的乳腺癌患者开展了p CR的回顾性研究,构建了适用于我国乳腺癌人群NAC后p CR的个体化预测模型(实验一)。此外,恶性肿瘤患者的治疗中,生存期(如OS和DFS)的改善对患者意义重大。近年来,NAC在乳腺癌的临床治疗应用更加广泛,然而接受NAC的乳腺癌人群存在较大的异质性。因此,为实施NAC的乳腺癌患者构建个体化的预后模型具有重要临床意义。目前,尽管多个乳腺癌NAC术后的预后模型(如Rouzier模型、CPS+EG评分系统、Colleoni模型、neoadjuvant response指数、Keam模型、Nottingham Clinico-Pathological Response指数和Neo-Bioscore评分)已经被建立、验证并得到了较广泛的临床应用,但上述模型在当时的研究背景下没有考虑HER2的靶向治疗或没有进行细致的病理评估,在当前的临床应用中具有较大局限性。对于NAC后的乳腺癌患者而言,残余肿瘤负荷(RCB,residual cancer burden)从p CR或残留少数浸润性癌细胞到大面积的浸润性癌块不等,其RCB具有很大的异质性。因此,本研究旨在建立、验证接受NAC乳腺癌患者术后复发、转移风险预后模型并与先前模型进行预测准确性及临床决策净获益的比较(实验二)。实验一旨在:1.探索并确定我国乳腺癌人群NAC后p CR的独立预测因素;2.构建适用于我国人群的p CR个体化预测模型。实验二旨在:1.探索并确定我国NAC乳腺癌术后DFS的独立预测因素;2.构建适用于NAC乳腺癌术后的个体化预后模型;3.验证模型的预测性能,并与现有模型的预测性能和临床决策净获益进行比较;4.使用风险分层模型预测术后高危复发转移人群。【方法】实验一:1.回顾性分析2013.01~2017.12在我院确诊并行NAC的1 046例临床Ⅰ~Ⅲ期的乳腺癌患者的临床及病理变量。2.将2015.01~2017.12确诊的689例乳腺癌患者纳入训练集,进行单因素及多因素Logistic回归分析确定p CR的独立预测因素并构建p CR的个体化预测模型(列线图)。使用bootstrap=200、由本中心2013.01~2014.12确诊的357例患者构成的独立队列(验证集)对模型分别进行内部、外部验证(本中心的独立队列进行的验证)。3.计算ROC曲线下面积(AUROC,area under receiver operating characteristic curve)及绘制校准曲线对列线图预测p CR的性能进行检验。实验二:1.回顾性分析2012.01~2015.12在我院确诊、行NAC并接受乳腺癌手术的749例临床Ⅰ~Ⅲ期的乳腺癌患者的临床及病理资料。按照纳入标准筛选后,对符合入组的人群进行生存状态及生存期的随访(门诊随访和电话随访)。2.收集患者每次门诊及电话随访的相关临床事件信息、影像学检查和患者体征等。使用从本单位病理科档案室挑选的研究人群的病理切片及石蜡标本,评估研究人群的病理分级,脉管瘤栓(LVI,lymphovascular invasion)和RCB等指标。3.使用计算机以3:1的比例随机将研究人群分为训练集和验证集。对训练集人群进行单因素和多因素Cox回归分析确定NAC病人术后DFS的独立预测因素。使用R软件3.6.3版本构建NAC乳腺癌术后的个体化DFS模型。4.绘制ROC曲线及校准曲线检验预后模型的预测性能。计算一致性指数(C指数),绘制时间依赖的ROC曲线和临床决策曲线比较本研究组所建模型与先前模型的预测准确性及临床决策获益。5.使用X-tile软件确定训练集人群总分的截断点,将研究人群分为三个不同的危险分层。绘制Kaplan-Meier曲线进行生存分析,使用Log-rank检验确定生存差异的显著性。【结果】实验一:1.多因素Logistic回归分析表明乳腺癌患者NAC后p CR的独立预测因素有:绝经状态、乳腺癌家族病史、HER2/neu状态、Ki-67表达、肿瘤大小和ER表达。2.基于以上变量构建的列线图在训练集和验证集中预测乳腺癌NAC后个体化p CR的可能性时,均具有较高的准确度(分别为0.762和0.768),校准曲线进一步证实模型基本具备无偏性预测。实验二:1.单因素和多因素Cox分析表明:AJCC分期、病理分级、ER表达水平、HER2状态及靶向治疗情况、Ki-67、LVI及RCB为接受NAC乳腺癌患者术后DFS的独立预测因素。2.使用R软件绘制NAC乳腺癌术后的个体化预后模型。模型在内部及外部验证中,3年及5年的AUROC均在0.80及0.80以上,校准曲线与理想曲线(列线图的预测结果与实际观察情况完全一致)也较为接近。3.使用本单位数据,本课题组构建的预后模型的预测性能高于先前的模型及单个独立预后因素的预测性能(P<0.05);依据我们的模型进行临床决策的净获益也明显优于先前模型及单个独立预后因素的决策净获益。4.以280和360作为截断点,本课题组构建的预后模型能够对NAC乳腺癌患者术后复发、转移风险分层,且其区分性能良好。风险分层模型可帮助筛选潜在的高危复发、转移人群。【结论】实验一:1.本研究揭示了绝经状态和乳腺癌家族史是乳腺癌NAC后p CR的独立预测因素。2.本课题组所建模型对乳腺癌p CR可能性预测有较高准确性,为乳腺癌手术方式的选择、病人的临床咨询提供指导。实验二:1.本研究首次将RCB作为独立预后因素纳入NAC乳腺癌的预后模型中,构建的预后模型能个体化预测患者DFS且预测性能良好。2.模型的风险分层效果良好,能够对NAC乳腺癌患者术后复发、转移风险进行分层,帮助筛选潜在的高危复发、转移人群。
基于机器学习的乳腺癌新辅助化疗辅助诊疗系统的设计与实现
这是一篇关于机器学习,集成学习,乳腺癌,新辅助化疗的论文, 主要内容为乳腺癌是一种常见于女性的恶性肿瘤,数据显示,2020年全球乳腺癌新增病例高达226万例,首次超过肺癌的年新增病例数,成为世界范围内年度新增病例最多的癌症。自20世纪90年代以来,中国乳腺癌发病率的增长速度是全球增长速度的两倍之多,目前乳腺癌已成为中国女性发病率第一,死亡率第五的癌症。长期快速增长的发病率,使得国家和社会所面临的经济负担与健康压力日益加重。所幸的是,与其他癌症患者相比较,乳腺癌患者的预后较好,通过积极的全身性、系统性治疗可以有效提高乳腺癌患者的生存率。新辅助化疗是现代乳腺癌治疗中一种重要的治疗手段,可以有效的提高患者的生存率与生存质量。但是新辅助化疗需要2-4个周期的治疗,才能确定患者对新辅助化疗的敏感性。相关研究数据表明,10%-35%的患者对于新辅助化疗不敏感,5%的患者病情甚至可能会进一步恶化,进行新辅助化疗直接延误了此类患者的治疗时机。另一方面,随着信息技术的快速发展,运用机器学习算法来预测患者对新辅助化疗的敏感性成为可能,在此基础上运用软件开发技术构建乳腺癌新辅助化疗辅助诊疗系统能够辅助医生决策,提高患者生存率。本研究致力于开发一套乳腺癌新辅助化疗辅助诊疗系统,其核心是使用机器学习算法建立预测模型,对乳腺癌患者的新辅助化疗敏感性进行预测。首先,采用缺失值填充、特征选取以及数据集的平衡处理方法对患者的病理数据进行预处理操作。其次,使用支持向量机、Logistic回归、随机森林、XGBoost四种机器学习算法建立初步的预测模型并进行测试,并根据F1-score与AUC指标选取预测效果最好的XGBoost模型。然后,结合网格搜索和SMOTE-NC过采样算法,提出GSCVSN模型优化方法,对XGBoost模型进一步优化。最后,引入Stacking算法的堆栈融合思想,将GSCVSN优化后的四种算法进行融合,得到最终预测模型GSCVSN-Stacking,从而达到乳腺癌患者的新辅助化疗敏感性精确预测的目标。本研究在GSCVSN-Stacking预测模型的基础上,设计并实现了乳腺癌新辅助化疗辅助诊疗系统,主要功能包括患者基本信息、病理信息、治疗信息的录入、患者信息查询、敏感性分析等。在辅助诊疗系统的构建过程中,使用Vue.js框架和Element UI来实现前端页面,使用Spring Boot和Mybatis-Plus来完成后端系统的开发,对系统进行功能性测试和非功能性测试,用以确保系统部署上线后的可用性。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码客栈网 ,原文地址:https://m.bishedaima.com/lunwen/50362.html