关键词:
机器学习方法
超声多参数
乳腺导管内原位癌
预测模型
摘要:
背景:乳腺癌在我国女性群体中是一类比较常见的肿瘤。2020年WHO调查显示乳腺癌全球发病率达17.1%,死亡率也较高,达到8.16%。全球乳腺癌患者数量已超过肺癌,其患者数量位居各类癌症之首。目前,导管原位癌(Ductal carcinoma in situ DCIS)已成为乳腺癌的常见类型,其占比达到15-25%。随着超声机器更新换代,导管内肿物的诊出率较前明显提高,因导管内乳头状瘤和导管内原位癌的临床表现和形态学特征很相似,目前的超声技术水平对两者的区分比较难。有研究表明,联合多参数分析可明显提高诊断准确率。因此,利用影像组学预测乳腺导管内原位癌具有一定的研究价值。基于此,我院特设计本试验。目的:本研究旨在利用机器学习相关超声参数,找出预测导管内原位癌的影像学特征,构建导管内病变鉴别诊断模型,以期早期筛查出导管内病变中的原位癌,减少穿刺等有创检查,提升治疗的准确率。方法:本研究回顾性收集我院2019年3月至2022年7月期间经病理证实的289例女性乳腺导管内病变患者的临床信息进行分析。将256位患者作为训练集,提取其超声特征后根据病理结果进行良恶性导管内病变鉴别模型的构建,将33位患者作为验证集,验证本研究所构建模型的准确性。采用LOGIQ E9/E8等超声诊断仪对患者乳房各层次结构进行检查,对发现的病灶观察并记录其年龄(岁)、肿物最大径(mm)、形态是否规则(是0,否1)、边缘是否光滑(光滑0,毛糙1)、超声分型(根据导管内病变常见形态分为5型,1型为乳腺导管扩张,同时有管腔内的实性回声充填或乳头状实性回声;2型为实性的回声周边有液性无回声区包绕,或囊实性回声团块;3型为有乳腺导管扩张,远端的乳腺导管壁中断或不规则;4型为乳腺导管扩张,同时在远端中断处有实性团块或结节;5型为乳腺腺体内部有低回声结节,并且周边未发现明显的导管扩张)、纵横比(≥1=1,<1=0)、微钙化(无0、单发1、多发2)、距乳头距离(mm)、后方回声(不变0,增强1,衰减2)、肿物内部血流信号(无0,少量1,中量2,大量3)、周围血流信号(无0,少量1,中量2,大量3)、肿瘤类型(中央型0,外周型1)以及是否为癌(是1,否0)等超声及病理特征。根据病理结果,通过训练组提取可以鉴别导管内乳头状癌及导管内乳头状瘤的相关超声特征,相关数据经统计学处理后,将P<0.10的变量纳入二元logistic回归分析以构建诊断效能最佳的乳腺导管内原位癌与导管内乳头状瘤病变鉴别诊断的机器学习模型。最后,通过验证组验证该模型的准确性及诊断效能。结果:以术后病理为金标准,对于鉴别导管内乳头状癌与导管内乳头状瘤有统计学意义的特征包括有肿瘤最大直径、边缘是否光滑、超声分型、微钙化、肿瘤内部血流信号以及肿瘤周围血流信号(P<0.05)。将肿瘤最大直径、边缘是否光滑、超声分型、微钙化、肿瘤内部血流信号以及肿瘤周围血流信号、年龄、形态是否规则以及病变距离乳头的距离(P<0.10)纳入二元logistic回归分析(条件:LR,向前)发现诊断效能最佳的模型为通过边缘是否光滑、超声分型、微钙化、肿瘤周围血流信号以及年龄构建的导管内病变鉴别诊断机器学习模型:模型公式:乳腺导管内病变鉴别诊断结果=B边缘*&+B钙化*&+B周围血流信号*&+B年龄*&+B超声分型*&(B为变量对应的模型回归系数,&取值为0或1,患者该变量特征阳性时取值为1,否则为0)。该模型在训练组区分导管内原位癌与导管内乳头状瘤的受试者工作特征曲线(receiver operating characteristic curve,ROC)曲线下面积(Area Under Curve,AUC)为0.776(95%CI:0.721,0.832)。而在33位导管内病变患者的验证集中,导管内乳头状癌14例,导管内乳头状瘤19例,年龄17~67岁,平均(44.36±9.92)岁。以术后病理为金标准,该导管内病变鉴别诊断模型在验证组区分导管内原位癌与导管内乳头状瘤的AUC为0.914(95%CI:0.821,1.000)。结论:本研究基于机器学习相关超声及病理特征,构建导管内病变鉴别诊断模型,有望提高导管内病变的鉴别诊断准确率,有助于早期筛查出导管内病变中的原位癌,减少穿刺等有创检查,提升治疗的准确率。