DiabetesLiver score: A non-invasive algorithm for advanced liver fibrosis and liver-related outcomes in type 2 diabetes mellitus population
DiabetesLiver 评分:一种用于 2 型糖尿病人群晚期肝纤维化和肝脏相关结局的非侵入性算法
本论文的在线版本提供了详细方法,包括以下内容:
- 关键资源表
| REAGENT or RESOURCE | SOURCE | IDENTIFIER |
|---|---|---|
| Deposited data | ||
| NHANES cross-sectional cohort | NHANES database | https://wwwn.cdc.gov/nchs/nhanes/analyticguidelines.aspx |
| UK Biobank follow-up cohort | UK BioBank | https://www.ukbiobank.ac.uk/enable-your-research/apply-for-access |
| Software and algorithm | ||
| R 4.4.2 | R Core Team | https://www.r-project.org/ |
| SPSS version 27.0.1 | IBM | https://www.ibm.com/cn-zh/spss |
| ggplot2 package | Wickham 26 | https://ggplot2.tidyverse.org |
| pROC package | Robin et al. 27 | https://xrobin.github.io/pROC/ |
| survminer package | Kassambara et al. 28 | https://rpkgs.datanovia.com/survminer/index.html |
| rms package | Harrell 29 | https://hbiostat.org/R/rms/ |
| survival package | Therneau et al. 30 | https://github.com/therneau/survival |
| Other | ||
| DiabetesLiver Score | This paper | https://chess.51medai.net/calculator/Diabetes\_liverScore |
- 实验模型和研究参与者详情
- 研究设计与参与者:这项多队列研究由两部分组成,在中国肝脏健康联盟(CHESS)和糖尿病与肝脏疾病联合管理联盟的指导下开展。
- 研究的第一部分旨在开发并验证一种用于筛查晚期肝纤维化的非侵入性评分系统。(28197=推导队列1129+内部验证队列1000+NHANES横断面队列1432+英国生物银行队列24,636)
- 第二部分则旨在探究该评分在筛查2型糖尿病(T2DM)患者晚期肝纤维化以及预测肝细胞癌(HCC)和肝脏相关死亡率方面的能力(图S3和S4)。参与者的性别、年龄和种族信息均为自我报告,而性别和社会经济地位相关信息未被收集。 (NHANES横断面队列1432+英国生物银行队列24,636)
- 图S3. DiabetesLiver评分的开发、验证和预后评估。
注:LSM为肝硬度测量;NHANES为美国国家健康与营养检查调查;T2DM为2型糖尿病。 - 图S4. 推导队列和内部验证队列的患者流程图。与STAR方法相关。

- 图S3. DiabetesLiver评分的开发、验证和预后评估。
- 推导队列与内部验证队列
- 2021年1月至2023年8月期间,研究从中国五家三级医院共纳入2129例2型糖尿病(T2DM)患者,包括南方医科大学附属顺德医院(1278例)、江苏省中医院(640例)、温州医科大学第一附属医院(191例)、沈阳市第六人民医院(12例)和太和医院(8例)。符合条件的成年患者需满足以下五项标准之一:(1)空腹血糖(FPG)≥7.0 mmol/L;(2)随机血糖≥11.1 mmol/L;(3)糖化血红蛋白(HbA1c)≥6.5%;(4)正在服用抗糖尿病药物;(5)自我报告诊断为T2DM。排除标准包括:(1)诊断为乙型肝炎、丙型肝炎、自身免疫性肝病或肝细胞癌(HCC);(2)1型糖尿病(T1DM)、妊娠糖尿病或其他类型糖尿病;(3)无法通过瞬时弹性成像(TE)测量肝硬度值(LSM);(4)缺乏腰围(WC)等相关体格检查数据;(5)缺乏糖化血红蛋白、天冬氨酸氨基转移酶(AST)、丙氨酸氨基转移酶(ALT)、血小板计数(PLT)、总胆红素(TB)或白蛋白(ALB)等实验室指标。患者被随机分配至推导队列(n=1129)和内部验证队列(n=1000),以开发并验证该评分对晚期肝纤维化的诊断效能。
- 美国国家健康与营养检查调查(NHANES)横断面队列 :2017年至2020年间,从美国国家健康与营养检查调查(NHANES)数据库中检索到==1432例2型糖尿病(T2DM)==患者的横断面队列。以下情况的T2DM个体被排除:(1)诊断为乙型肝炎、丙型肝炎、自身免疫性肝病或肝细胞癌(HCC);(2)缺乏糖化血红蛋白(HbA1c)、天冬氨酸氨基转移酶(AST)、丙氨酸氨基转移酶(ALT)、血小板计数(PLT)或白蛋白(ALB)水平;(3)缺乏腰围(WC)等相关体格检查结果;(4)缺乏通过瞬时弹性成像(TE)测量的肝硬度值(LSM)。该队列用于评估评分预测晚期肝纤维化的效能。(28197=推导队列1129+内部验证队列1000+NHANES横断面队列1432+英国生物银行队列24,636)
- 其他文献查得2型糖尿病:HbA1c≥6.5%或空腹血糖≥126 mg/dL;或自述使用胰岛素或降糖药物。优先采用HbA1c结果进行判定,若该数据缺失则采用空腹血糖值。- 糖尿病前期:HbA1c 5.7%-6.4%或空腹血糖100-125 mg/dL- 高血压:收缩压≥130 mmHg或舒张压≥80 mmHg;或自述服用降压药物- 血压升高:收缩压120-129 mmHg且舒张压<80 mmHg
- AIH 以血清转氨酶升高为主伴碱性磷酸酶轻度升高为特征。免疫学检查为高循环γ 球蛋白和高滴度的自身抗体。AIH 根据血清自身抗体检测分为 3 型:①1 型,以抗平滑肌抗体(SMA)和(或)抗核抗体(ANA)阳性为特征,最常见;②2 型,以抗肝肾微粒体抗体(LKM-1)阳性为特征,该型成人罕见;③3 型, 特征为抗可溶性肝抗原抗体 / 抗肝胰抗体(SLA/LP)阳性。
- 肝活检队列 :2017年4月至2023年2月期间,温州医科大学第一附属医院的肝活检队列纳入了年龄≥18岁且接受过肝活检的2型糖尿病(T2DM)患者。以下人群被排除在外:(1)诊断为乙型肝炎、丙型肝炎、自身免疫性肝病、肝细胞癌(HCC)或酒精滥用;(2)缺乏糖化血红蛋白(HbA1c)、天冬氨酸氨基转移酶(AST)、丙氨酸氨基转移酶(ALT)、血小板计数(PLT)、总胆红素(TB)或白蛋白(ALB)等实验室参数;(3)缺乏总胆固醇、高密度脂蛋白和甘油三酯等血脂指标;(4)缺乏腰围(WC)等相关体格检查数据。该队列共纳入191例有可用肝活检结果的T2DM患者,用于评估该评分预测晚期肝纤维化的效能。
- 英国生物银行随访队列 :符合以下条件的个体被排除:(1)基线时诊断为乙型肝炎、丙型肝炎、自身免疫性肝病、失代偿期肝病或肝细胞癌(HCC);(2)缺乏糖化血红蛋白(HbA1c)、天冬氨酸氨基转移酶(AST)、丙氨酸氨基转移酶(ALT)、血小板计数(PLT)、总胆红素(TB)或白蛋白(ALB)等实验室参数;(3)缺乏腰围(WC)等相关体格检查数据;(4)缺乏诊断2型糖尿病(T2DM)的变量。研究共从英国生物银行数据库(项目编号91486)纳入24,636例T2DM患者。英国生物银行随访队列用于探究该评分系统在预测HCC和肝脏相关死亡率方面的效能。HCC诊断依据国际疾病分类第十版(ICD-10)编码C22.0、C22.7和C22.9,肝脏相关死亡率依据ICD-10编码C22、K70-K74和K76记录。C22.0编码患者93例、C22.7编码患者5例、C22.9编码患者3例。周老师晚上好,我最近在读《DiabetesLiver score: A non-invasive algorithm for advanced liver fibrosis and liver-related outcomes in type 2 diabetes mellitus population》,其中涉及UKB数据库(项目编号91486)的分析,不知道用于复现这篇文章的话,尹老师方便提供相关数据吗
- 伦理考量 :所有程序均遵循人类实验责任委员会的伦理标准及《赫尔辛基宣言》。本研究获东南大学医学院附属中大医院伦理委员会批准(编号:2023ZDSYLL116-P01)。所有三级医院的患者均已签署知情同意书。美国国家健康与营养检查调查(NHANES)方案获美国疾病控制与预防中心(CDC)国家健康统计中心伦理审查委员会批准,调查期间所有个体均提供了书面知情同意书。英国生物银行队列的伦理审批获西北多中心研究伦理委员会许可,所有参与者均签署了书面知情同意书。
- 研究设计与参与者:这项多队列研究由两部分组成,在中国肝脏健康联盟(CHESS)和糖尿病与肝脏疾病联合管理联盟的指导下开展。
- 方法细节
- 结局定义 :主要终点为晚期肝纤维化,定义为通过瞬时弹性成像(TE,FibroScan,Echosens,法国巴黎)测量的肝硬度值(LSM)≥12 kPa¹³。次要终点包括肝细胞癌(HCC)的发生率和肝脏相关死亡率。
- 肝硬度测量,非侵入性检测与肝活检 :
- 通过FibroScan(Echosens,法国巴黎)进行的瞬时弹性成像(TE)检查由训练有素的临床医生操作。患者需取仰卧位,右臂完全外展,通过肋间间隙对右肝叶进行检查。根据设备制造商的建议,当获得≥10个有效肝硬度测量值(LSM)且四分位距/中位数比值<30%时,结果视为有效。LSM值同时以千帕(kPa)记录。
- 本研究纳入4种非侵入性检测(NITs)——FIB-4、NFS、FNI和BARD评分,以与DiabetesLiver评分的诊断效能进行对比。具体计算公式如下:
- FIB-4 =(年龄[岁]×天冬氨酸氨基转移酶[AST,U/L])/(血小板计数[10⁹/L]×丙氨酸氨基转移酶[ALT,U/L]的平方根);
- NFS = -1.675 + 0.037×年龄(岁)+ 0.094×体重指数(BMI,kg/m²)+ 1.13×空腹血糖异常/糖尿病(是=1,否=0)+ 0.99×AST/ALT比值 - 0.013×血小板计数(10⁹/L) - 0.66×白蛋白(g/dL)²;
- FNI = e^(-10.33 + 2.54×ln AST[U/L] + 3.86×ln HbA1c[%] - 1.66×ln 高密度脂蛋白[HDL,mg/dL]) / {1 + e^(-10.33 + 2.54×ln AST[U/L] + 3.86×ln HbA1c[%] - 1.66×ln HDL[mg/dL])};
- BARD评分包含三个加权变量(BMI≥28 kg/m²=1分,AST/ALT≥0.8=2分,糖尿病=1分)³。
- 肝活检由资深肝病学专家完成,该专家对患者的人口学数据和临床信息保持盲态。各中心均依据非酒精性脂肪性肝炎临床研究网络(Nonalcoholic Steatohepatitis Clinical Research Network)分类标准评估肝组织学。
- 非侵入性检测(NITs)的截断值:为排除和确诊晚期肝纤维化,
- FIB-4的截断值分别为1.3和2.67³¹,
- NFS的对应截断值为-1.455和0.675³²。
- BARD评分将截断值设为2以识别晚期肝纤维化³³。
- 定量与统计分析:本研究采用以下统计方法进行数据分析:
-
数据呈现方式
- 分类变量:以频数和加权比例表示。
- 连续变量:以加权均数±标准差(SD)或中位数(四分位距[IQR])表示。
-
统计模型与变量筛选
- 单变量和多变量逻辑回归模型:
- 用于评估各变量对晚期肝纤维化风险的影响,并构建评分系统。
- 采用向前似然比选择法进行变量筛选。
- 诊断效能评估:
- 基于受试者工作特征曲线(ROC曲线),计算曲线下面积(AUC)、阳性预测值(PPV)、阴性预测值(NPV)、灵敏度和特异度,以评估DiabetesLiver评分与FIB-4、NFS、FNI、BARD评分对晚期肝纤维化的诊断效能。
- 使用DeLong法比较四种工具的诊断准确性。DeLong方法是一种用于比较两个或多个诊断模型(或生物标志物)的受试者工作特征曲线(ROC曲线)下面积(AUC)是否存在统计学差异的统计方法,尤其适用于同一组样本(或配对样本)的ROC曲线比较。当需要判断两种诊断方法(如两种肿瘤标志物、两个预测模型)的诊断效能(AUC)是否有显著差异时,可采用DeLong方法。例如,在医学研究中比较两种生物标志物对某疾病的鉴别诊断能力,判断哪种更优。
- • 考虑了同一受试者在两种诊断方法下结果的相关性(配对数据),避免了因样本相关性导致的统计误差。
- • 通过计算AUC差值的标准误,构建置信区间或进行假设检验(如t检验),从而判断AUC差异是否具有统计学意义(P<0.05为差异显著)。
- 风险分层:
- 采用灵敏度≥90%或特异度≥90%的两个截断值,将患者分为低、中、高风险组。
- 单变量和多变量逻辑回归模型:
-
生存分析
- Cox回归分析和对数秩检验(Log rank test):评估不同风险组的生存差异。
- Kaplan-Meier曲线:可视化英国生物银行队列中的生存曲线。
- 受限立方样条曲线(Restricted cubic spline):反映肝脏事件与评分之间的关系。
-
其他分析说明
- 未对统计假设(如正态性)进行正式诊断检验。
- 统计学显著性定义为双侧p<0.05。
- 分析工具:SPSS 27.0.1(IBM)或R 4.4.2。
- 具体实验的统计方法在图注中说明,数据集中趋势、离散程度和精确性指标在结果部分报告,统计学显著性结果在结果部分及图表注释中呈现。
-
- 附加资源:DiabetesLiver评分可通过以下免费计算器获取:http://www.pan-chess.cn/calculator/Diabetes_liverScore。
背景与意义
肝纤维化是2型糖尿病(T2DM)患者的主要并发症之一,但用于早期检测的有效筛查工具仍然有限。本研究开发并验证了DiabetesLiver评分,这是一种新型非侵入性模型,用于识别T2DM患者的晚期肝纤维化并预测肝脏相关结局。
该模型利用五家三级医院的数据,纳入了腰围、肝酶、血小板计数和白蛋白等指标,与现有非侵入性检测相比,显示出较强的诊断准确性。在国家健康与营养检查调查(NHANES)和英国生物银行(UK Biobank)中的外部验证证实了其预测价值。研究结果表明,DiabetesLiver评分是一种很有前景的工具,可用于肝纤维化风险分层和指导早期干预,有望减轻不断增长的T2DM人群的肝脏疾病负担。
摘要
背景:本研究旨在开发并验证一种非侵入性模型,用于筛查2型糖尿病(T2DM)患者的晚期肝纤维化并预测肝脏相关结局。
方法:本研究纳入了来自五家三级医院的2型糖尿病(T2DM)患者,用于开发和内部验证一种非侵入性模型。晚期肝纤维化的定义为肝脏硬度测量值≥12 kPa。外部验证队列来自国家健康与营养检查调查(NHANES),并在英国生物银行(UK Biobank)中评估了该模型对肝细胞癌(HCC)和肝脏相关死亡率的预测性能。
结果:
总共纳入了28,197例2型糖尿病(T2DM)患者。(28197=推导队列1129+内部验证队列1000+NHANES横断面队列1432+英国生物银行队列24,636)
在推导队列(n=1,129)中,腰围、丙氨酸氨基转移酶、天冬氨酸氨基转移酶、血小板计数和白蛋白被确定为晚期肝纤维化的独立危险因素,并据此构建了“DiabetesLiver评分”。该评分的曲线下面积(AUC)为0.835(95%置信区间[CI]:0.781-0.890),显著高于其他非侵入性检测方法的AUC(均p<0.01)。
在内部验证队列(n=1,000)和NHANES横断面队列(n=1,432)中,其AUC分别维持在0.870和0.823的较高水平。采用2.39和3.99的双重截断值(灵敏度≥90%、特异性≥90%)将患者分为低、中、高风险组。
在英国生物银行队列(n=24,636)中,高风险组的肝脏相关结局风险显著升高。
结论:DiabetesLiver评分在识别2型糖尿病(T2DM)人群的晚期肝纤维化和预测肝脏相关事件发生方面表现出良好的性能。
资助:国家自然科学基金。
介绍
糖尿病是全球主要的代谢性疾病,影响约5.29亿人,其中2型糖尿病(T2DM)占大多数。T2DM与代谢功能障碍相关脂肪性肝病(一种常见的代谢性疾病)密切相关,被认为是进展为肝硬化和肝细胞癌(HCC)的危险因素。先前的研究报道,在T2DM人群中,经肝活检证实的晚期肝纤维化患病率高达38%,这一数据令人担忧,并且强调了与非糖尿病患者相比,T2DM患者的肝纤维化进展更为迅猛。此外,基线时存在2型糖尿病(T2DM)被确定为肝失代偿和肝细胞癌(HCC)的独立预测因子。至关重要的是,即使在失代偿期肝硬化中,若及时给予适当干预,肝脏仍可获得代偿。在整个肝脏病理过程中,肝纤维化是肝脏相关不良结局的典型标志,这凸显了在2型糖尿病人群中早期检测肝纤维化的迫切性。
肝活检仍是诊断肝纤维化的金标准,但在糖尿病专科门诊或基层医疗环境中,实施这种有创操作并不现实。非侵入性检测(NITs)已成为替代肝活检筛查肝纤维化的可行选择,不过这些检测方法主要源自慢性肝病队列。因此,这些NITs在2型糖尿病(T2DM)人群中的诊断性能并不理想。因此,需要针对T2DM患者诊断肝纤维化的非侵入性工具。(即很多检测的模型都不是基于2型糖尿病而是慢性肝病的人群)
在本研究中,我们旨在开发并验证一种专为2型糖尿病(T2DM)患者定制的晚期肝纤维化筛查非侵入性评分系统,将该评分系统的诊断性能与三种已确立的非侵入性检测(NITs)进行比较,并探究其在不同T2DM队列中预测长期不良结局的潜力。
结果
不同队列中患者的基线特征
(28197=推导队列1129+内部验证队列1000+NHANES横断面队列1432+英国生物银行队列24,636)
本项多队列研究共纳入28197例2型糖尿病(T2DM)患者。推导队列与验证队列的特征高度匹配,平均年龄(SD)分别为52.3(12.6)岁和52.3(12.2)岁,体重指数(BMI)分别为25.9(4.3)kg/m²和26.2(4.7)kg/m²。推导队列、内部验证队列和NHANES横断面队列的晚期肝纤维化发生率分别为6.1%、5.5%和10.1%。
具体基线特征见表1,肝活检队列的详细基线特征见表S1。
表1. 不同队列中患者的基线特征
| Variables | Derivation cohort (n = 1,129) | Internal validation cohort (n = 1,000) | NHANES cross-sectional cohort (n = 1,432) | UK Biobank follow-up cohort (n = 24,636) |
|---|---|---|---|---|
| Age, mean (SD), years | 52.3 (12.6) | 52.3 (12.2) | 60.7 (13.1) | 59.2 (7.4) |
| Male, n (%) | 562 (49.8) | 464 (46.4) | 768 (53.6) | 14,786 (60.0) |
| Race, n (%) | ||||
| White | - | - | 786 (54.9) | 23,391 (94.9) |
| Non-white | 1,129 (100) | 1,000 (100) | 646 (45.1) | 1,245 (5.1) |
| BMI, mean (SD), kg/m² | 25.9 (4.3) | 26.2 (4.7) | 32.8 (7.6) | 31.4 (5.9) |
| WC, mean (SD), cm | 88.8 (12.4) | 89.0 (12.8) | 110.0 (16.2) | 102.5 (14.6) |
| ALT, mean (SD), U/L | 34.4 (30.4) | 35.8 (32.2) | 24.1 (18.2) | 29.4 (17.9) |
| AST, mean (SD), U/L | 26.8 (15.2) | 28.8 (20.4) | 22.0 (14.5) | 28.1 (13.1) |
| ALB, mean (SD), g/L | 45.6 (3.4) | 45.7 (3.5) | 39.8 (3.5) | 44.9 (2.9) |
| TB, mean (SD), μmol/L | 14.8 (6.3) | 14.0 (5.8) | 7.9 (4.8) | 8.9 (4.3) |
| PLT count, mean (SD), 10⁹/L | 246.2 (66.9) | 248.6 (69.3) | 241.5 (69.6) | 249.6 (65.1) |
| HbA1c, mean (SD), % | 7.3 (1.7) | 7.2 (1.6) | 7.3 (1.7) | 6.9 (1.4) |
| TC, mean (SD), mmol/L | 5.3 (1.2) | 5.3 (1.2) | 4.6 (1.2) | 4.7 (1.2) |
| TG, mean (SD), mmol/L | 2.2 (2.2) | 2.2 (2.2) | 1.5 (1.2) | 2.2 (1.3) |
| HDL, mean (SD), mmol/L | 1.3 (0.3) | 1.3 (0.3) | 1.2 (0.4) | 1.2 (0.3) |
| LDL, mean (SD), mmol/L | 3.2 (6.4) | 3.3 (10.1) | 2.6 (1.0) | 2.9 (0.9) |
| UA, mean (SD), μmol/L | 364.3 (103.6) | 357.0 (103.7) | 338.5 (94.3) | 331.7 (86.2) |
| CR, mean (SD), μmol/L | 71.0 (23.7) | 70.3 (23.5) | 86.8 (63.3) | 75.0 (27.5) |
| CAP, mean (SD), dB/m | 278.0 (54.7) | 278.1 (52.4) | 302.6 (60.5) | - |
| LSM, mean (SD), kPa | 6.7 (3.7) | 6.7 (3.4) | 7.6 (6.9) | - |
| Advanced liver fibrosis, n (%) | 69 (6.1) | 55 (5.5) | 146 (10.1) | - |
| Follow-up time, months, median (IQR) | - | - | - | 139.1 (128.6-148.8) |
表S1. 肝活检队列患者的基线特征。与STAR方法相关。
| 变量 | 肝活检队列(N=191) |
|---|---|
| 年龄,平均值(标准差),岁 | 46.7(12.4) |
| 男性,例数(%) | 110(57.5) |
| 种族,例数(%) | |
| 白人 | - |
| 非白人 | 191(100) |
| 体重指数,平均值(标准差),kg/m² | 27.6(4.1) |
| 腰围,平均值(标准差),cm | 94.5(9.2) |
| 丙氨酸氨基转移酶,平均值(标准差),U/L | 64.2(46.7) |
| 天冬氨酸氨基转移酶,平均值(标准差),U/L | 45.9(26.7) |
| 白蛋白,平均值(标准差),g/L | 44.1(3.6) |
| 总胆红素,平均值(标准差),μmol/L | 12.8(4.8) |
| 血小板计数,平均值(标准差),10⁹/L | 236.0(61.7) |
| 糖化血红蛋白,平均值(标准差),% | 7.7(1.5) |
| 总胆固醇,平均值(标准差),mmol/L | 4.9(1.2) |
| 甘油三酯,平均值(标准差),mmol/L | 2.5(1.9) |
| 高密度脂蛋白,平均值(标准差),mmol/L | 1.0(0.39) |
| 低密度脂蛋白,平均值(标准差),mmol/L | 2.9(0.9) |
| 尿酸,平均值(标准差),μmol/L | 368.8(96.0) |
| 肌酐,平均值(标准差),μmol/L | 65.4(15.4) |
| 晚期肝纤维化,例数(%) | 25(13.0) |
2型糖尿病患者晚期肝纤维化非侵入性评分的推导
分析框架中包含16项指标。
单变量逻辑回归分析显示,年龄、体重指数(BMI)、腰围(WC)、丙氨酸氨基转移酶(ALT)、天冬氨酸氨基转移酶(AST)、白蛋白(ALB)、总胆红素(TB)、血小板(PLT)计数、糖化血红蛋白(HbA1c)、高密度脂蛋白和尿酸(UA)是晚期肝纤维化的危险因素(表2)。
表2. 晚期肝纤维化的单变量和多变量逻辑回归分析
| Variable | Univariate analysis OR | p Value | OR Multivariate analysis | p Value |
|---|---|---|---|---|
| Age | 0.978 (0.960–0.997) | 0.023 | – | – |
| Male | 1.254 (0.769–2.045) | 0.365 | – | – |
| BMI | 1.239 (1.178–1.304) | <0.001 | – | – |
| WC | 1.083 (1.063–1.103) | <0.001 | 1.079 (1.056–1.102) | <0.001 |
| ALT | 1.018 (1.013–1.024) | <0.001 | 0.984 (0.970–0.997) | 0.018 |
| AST | 1.048 (1.036–1.060) | <0.001 | 1.064 (1.038–1.092) | <0.001 |
| ALB | 0.891 (0.833–0.953) | <0.001 | 0.925 (0.856–0.999) | 0.049 |
| TB | 0.980 (0.940–1.023) | <0.001 | – | – |
| PLT count | 0.994 (0.990–0.998) | 0.005 | 0.993 (0.988–0.998) | 0.003 |
| HbA1c | 1.209 (1.075–1.360) | <0.001 | – | – |
| TC | 0.884 (0.718–1.087) | 0.243 | – | – |
| TG | 1.008 (0.906–1.121) | 0.886 | – | – |
| HDL | 0.218 (0.091–0.524) | 0.001 | – | – |
| LDL | 0.949 (0.704–1.279) | 0.729 | – | – |
| UA | 1.003 (1.001–1.005) | 0.010 | – | – |
| CR | 0.987 (0.972–1.001) | 0.077 | – | – |
多变量逻辑回归分析中,腰围(优势比[OR] 1.079;95%置信区间[CI]:1.056-1.102;P<0.001)、ALT(OR 0.984;95% CI:0.970-0.997;P=0.018)、AST(OR 1.064;95% CI:1.038-1.092;P<0.001)、ALB(OR 0.925;95% CI:0.856-0.999;P=0.049)和PLT计数(OR 0.993;95% CI:0.988-0.998;P=0.003)是晚期肝纤维化的独立危险因素(表2)。基于腰围、ALT、AST、PLT计数和ALB建立了非侵入性评分,称为“DiabetesLiver评分”。可通过免费计算器获取,网址:https://chess.51medai.net/calculator/Diabetes_liverScore。
多变量逻辑回归的优化:向前似然比选择法
是逻辑回归的变量进入和退出模型的方法之一,
比如logistic回归方法的选择,打开下拉菜单后,从【Enter】到【向后:Wald】我们会看到7种方法,怎么选?仔细观察这7种方法,实际上分为两大板块,输入法、向前法、向后法规定了如何选择自变量进入模型,而Conditional条件法、LR偏似然估计法、Wald瓦尔德法规定了自变量如何退出模型。
DiabetesLiver评分在推导队列中的诊断准确性
在推导队列中,DiabetesLiver评分诊断晚期肝纤维化的曲线下面积(AUC)为0.835(95%置信区间:0.781-0.890),其诊断性能显著优于纤维化-4指数(FIB-4)、非酒精性脂肪性肝病纤维化评分(NFS)、纤维化非酒精性脂肪性肝炎指数(FNI)以及体重指数、天冬氨酸氨基转移酶/丙氨酸氨基转移酶比值和糖尿病(BARD)评分(均P<0.05,图1A)。

A推导队列 B内部验证队列 C NHANES横截面队列
选择DiabetesLiver评分的截断值2.39和3.99将推导队列分为低风险(n=538,47.7%)、中风险(n=456,40.4%)和高风险(n=135,11.9%)晚期肝纤维化组,其中低阈值2.39的灵敏度为90%,阴性预测值(NPV)为99%;高阈值3.99的特异度为91%,NPV为97%。
对于FIB-4,截断值1.3显示出较高的NPV(95%),但灵敏度欠佳(73%)。
对于NFS和BARD,相应的截断值-1.455和2具有较高的NPV(95%),但灵敏度中等(分别为61%和52%)。
the low threshold of 2.39 achieved a sensitivity of 90% and a negative predictive value (NPV) of 99%, and the high threshold of 3.99 achieved specificity of 91% and an NPV of 97%. For FIB-4, the cutoff value of 1.3 showed a high NPV (95%) but a suboptimal sensitivity (73%). For NFS and BARD, the corresponding cutoff values of − 1.455 and 2 showed a high NPV (95%) but had a modest sensitivity (61% and 52%, respectively).
此外,DiabetesLiver评分在==预测肝脏硬度测量(LSM)==≥8 kPa和≥10 kPa时表现良好,AUC分别为0.775(95%置信区间:0.738-0.812;图S1)和0.835(95%置信区间:0.794-0.876;图S1)。
图S1. DiabetesLiver评分在推导队列、内部验证队列和NHANES横断面队列中对肝硬度值(LSM)≥8 kPa和≥10 kPa的诊断准确性。与STAR方法相关。
受试者工作特征曲线用于评估诊断准确性。ROC

DiabetesLiver评分在内部验证队列和NHANES横断面队列中的诊断准确性
在内部验证队列中,DiabetesLiver评分的曲线下面积(AUC)高于FIB-4、NFS、FNI和BARD评分(分别为0.870[95%置信区间:0.813-0.927] vs. 0.680[95%置信区间:0.591-0.769]、0.858[95%置信区间:0.800-0.916]、0.633[95%置信区间:0.549-0.717]和0.509[95%置信区间:0.422-0.597];图1B)。
类似地,在NHANES横断面队列中,DiabetesLiver评分的表现优于FIB-4、NFS、FNI和BARD评分(0.823[95%置信区间:0.786-0.859] vs. 0.602[95%置信区间:0.548-0.657]、0.699[95%置信区间:0.651-0.747]、0.661[95%置信区间:0.612-0.709]和0.584[95%置信区间:0.541-0.627];所有P<0.05,图1C)。
此外,DiabetesLiver评分在诊断肝脏硬度测量(LSM)≥8 kPa和≥10 kPa时具有良好的准确性[内部验证队列中AUC分别为0.783(95%置信区间:0.743-0.924)和0.842(95%置信区间:0.790-0.895);NHANES横断面队列中AUC分别为0.758(95%置信区间:0.728-0.787)和0.794(95%置信区间:0.762-0.823);图S1]。
在肝活检队列中,DiabetesLiver评分也显示出优于FIB-4、NFS、FNI和BARD评分的性能(分别为0.769[95%置信区间:0.663-0.875] vs. 0.735[95%置信区间:0.616-0.855]、0.699[95%置信区间:0.575-0.823]、0.601[95%置信区间:0.474-0.727]和0.608[95%置信区间:0.474-0.742];图S2)。
图S2. 在肝活检队列中DiabetesLiver评分与FIB-4、NFS、FNI和BARD评分的诊断准确性比较。与STAR方法相关。

受试者工作特征曲线用于评估诊断准确性。
英国生物银行随访队列中DiabetesLiver评分的预后评估
在英国生物银行随访队列中,纳入了101例肝癌患者,其中C22.0编码患者93例、C22.7编码患者5例、C22.9编码患者3例。
当DiabetesLiver评分达到3.99时,肝细胞癌(HCC)风险和肝脏相关死亡率均显著升高(图2)。

- cox回归算HR,有结局自然有HR
- RCS:自变量:评分,因变量:结局(肝脏事件)。但是纵坐标是HR
与英国生物银行队列中的低风险组相比,高风险组的HCC风险增加了35.344倍(风险比[HR];95%置信区间:4.926-253.589)(图3A)。此外,高风险组正确分类了92例HCC患者。

图3. 英国生物银行队列中根据DiabetesLiver评分分层的不同风险组的肝细胞癌(HCC)和肝脏相关死亡率的累积发生率
(A)肝细胞癌(HCC)。外层图表展示总体趋势,Y轴范围为0-1,插图显示较小范围,Y轴范围为0-0.015。
(B)肝脏相关死亡率。外层图表展示总体趋势,Y轴范围为0-1,插图显示较小范围,Y轴范围为0-0.06。采用对数秩检验(Log rank test)评估生存差异,使用 Kaplan-Meier 生存曲线可视化生存数据。
在死亡原因方面,4154例患者发生全因死亡,其中181例为肝脏相关死亡。值得注意的是,86%(181例中157例)的肝脏相关死亡患者被正确分类为高风险组。
与低风险组相比,英国生物银行随访队列中高风险组的肝脏相关死亡风险增加了6.091倍(HR;95%置信区间:3.214-11.543;P<0.001)(图3B)。
在调整混杂因素后,高风险组与低风险组相比,HCC和肝脏相关死亡的HR分别为22.931(95%置信区间:3.153-166.793;P<0.001)和4.729(95%置信区间:2.438-9.172;P<0.001)(表S2)。
表S2 英国生物银行队列中按DiabetesLiver评分分层的不同风险组肝细胞癌和肝脏相关死亡率的风险比。与STAR方法相关。
| 模型 | 肝细胞癌 | 肝脏相关死亡率 | ||
|---|---|---|---|---|
| 风险比(95%置信区间) | P值 | 风险比(95%置信区间) | P值 | |
| 模型1 | ||||
| 低风险组 | 1.000(参照组) | 1.000(参照组) | ||
| 中风险组 | 2.432 (0.299-19.763) |
0.406 | 0.838 (0.401-1.752) |
0.638 |
| 高风险组 | 35.344 (4.926-253.589) |
<0.001 | 6.091 (3.214-11.543) |
<0.001 |
| 模型2 | ||||
| 低风险组 | 1.000(参照组) | 1.000(参照组) | ||
| 中风险组 | 1.794 (0.220-14.640) |
0.585 | 0.698 (0.331-1.469) |
0.344 |
| 高风险组 | 22.931 (3.153-166.793) |
<0.001 | 4.729 (2.438-9.172) |
<0.001 |
| 注: | ||||
| 模型1纳入了按DiabetesLiver评分分层的不同风险组,未进行校正。 | ||||
| 模型2则对年龄、总胆红素(TB)、总胆固醇(TC)、甘油三酯(TG)、肌酐、尿酸和糖化血红蛋白(HbA1c)进行了校正。TB为总胆红素;HbA1c为糖化血红蛋白;TC为总胆固醇;TG为甘油三酯;HDL为高密度脂蛋白;LDL为低密度脂蛋白;HR为风险比。HR和P值均来自逻辑回归分析。 |
讨论
在本研究中,开发了一种名为DiabetesLiver评分的非侵入性评分工具,旨在针对2型糖尿病(T2DM)人群进行晚期肝纤维化筛查。该评分工具的诊断效能已在多个队列中得到验证,以确定其可靠性。研究确定了2.39和3.99的双重截断值用于T2DM患者的风险分层,相应地实现了高敏感性和特异性。此外,DiabetesLiver评分在英国生物银行队列中显示出良好的预后能力。本研究表明,DiabetesLiver评分在诊断T2DM患者晚期肝纤维化以及预测肝细胞癌(HCC)发生率和肝脏相关死亡率方面具有巨大潜力。
流行病学研究已表明,2型糖尿病(T2DM)患者中肝纤维化的患病率呈上升趋势。既往研究显示,晚期肝纤维化的比例在7.3%至15.4%之间[10-12]。在本研究中,通过瞬时弹性成像(TE)评估的晚期肝纤维化患者比例为5.5%至10.1%,这与既往研究结果一致。推导队列与验证队列中晚期肝纤维化患者比例的一致性,凸显了人群样本的真实性——这是建立诊断评分工具并将其外推应用的关键因素。
美国肝病研究协会(AASLD)[13]和美国临床内分泌学家协会(AACE)[14]均强调,2型糖尿病(T2DM)患者存在肝病进展的高风险,建议进行晚期肝纤维化检测。
FIB-4等基于血清指标的非侵入性检测(NITs)是临床实践中常用的评估工具。然而,研究表明这些NITs在糖尿病人群中的诊断效能有限: - 韩国一项纳入267例代谢风险因素患者的研究显示,FIB-4在合并T2DM的非酒精性脂肪性肝病(NAFLD)患者中检测晚期肝纤维化的曲线下面积(AUC)仅为0.653,显著低于无T2DM患者的0.826[15]。 - 另一项横断面研究表明,T2DM患者中FIB-4和NFS的AUC分别为0.78和0.64[9]。 - 本研究中,FIB-4、NFS和BARD评分的诊断准确性均较差(AUC均<0.74)。 与之相反,更优化的非侵入性评分系统——DiabetesLiver评分在不同队列中始终保持高AUC,展现出稳健的诊断性能。
Singh等人[16]开发了一种名为糖尿病肝纤维化评分(DLFS)模型的非侵入性检测方法,用于预测合并糖尿病和非酒精性脂肪性肝病(NAFLD)患者的晚期肝纤维化。该DLFS模型纳入了年龄、血小板计数(PLT)、天冬氨酸氨基转移酶(AST)、高血压、慢性肾脏病(CKD)以及降脂药物使用情况。该模型的曲线下面积(AUC)达0.78-0.79,诊断效能优于现有非侵入性检测方法。相比之下,DiabetesLiver评分的构建基于腰围(WC)、丙氨酸氨基转移酶(ALT)、天冬氨酸氨基转移酶(AST)、白蛋白(ALB)和血小板计数(PLT)这五个常见变量,具有更高的临床实用性。
在本研究中,DiabetesLiver评分将腰围(WC)纳入为重要变量。此前一项国际横断面研究显示,FIB-4和NFS在普通人群中均会产生较高的假阴性和假阳性结果。然而,多变量分析表明腰围是最重要的指标,其在通过瞬时弹性成像(TE,TE≥8 kPa)诊断肝纤维化时的曲线下面积(AUC)达0.716,显著高于FIB-4的0.572和NFS的0.643。即便在体重指数(BMI)正常的个体中,腰围仍是评估体脂分布和腹部肥胖的优越指标。[18] Zhong等人[19]发现,以腰围定义的中心性肥胖(女性≥80 cm,男性≥94 cm)在BMI正常的糖尿病前期和糖尿病患者中,与全因死亡率、心血管相关死亡率及糖尿病视网膜病变风险升高约40%-44%相关。这些研究表明,在代谢性疾病患者中,腰围是比BMI更可靠的指标。
既往研究已报道糖尿病患者发生肝脏相关不良事件的风险更高。一项纳入27万例非酒精性脂肪性肝病(NAFLD)患者、随访9年的回顾性队列研究显示,糖尿病患者患肝细胞癌(HCC)的风险较非糖尿病患者增加2.77倍。在全面的多变量分析中,糖尿病被单独认定为各种代谢风险因素中与HCC风险相关的最显著独立因素[20]。一项涵盖22项研究数据的荟萃分析强调,2型糖尿病(T2DM)与严重肝脏疾病事件风险增加2.25倍显著相关[21]。此外,一项涉及30多万例糖尿病患者的研究表明,这些患者的肝脏相关死亡率呈上升趋势[22]。T2DM患者肝纤维化的进展过程提醒临床医生需预判临床终点,并推动对该人群的综合管理。
在我们的研究中,DiabetesLiver评分在英国生物银行随访队列中显示出评估肝细胞癌(HCC)发生风险和肝脏相关死亡率的预后能力。与晚期肝纤维化低风险组相比,晚期肝纤维化高风险组个体发生HCC的风险显著增加35.344倍。在英国生物银行随访队列的肝脏相关死亡率方面,被确定为晚期肝纤维化高风险的2型糖尿病(T2DM)患者与晚期肝纤维化低风险患者相比,死亡几率显著升高。同样,另一项回顾性分析报告称,通过FIB-4和NFS分类为高纤维化风险的T2DM患者,与低纤维化风险患者相比,全因死亡率分别增加3.69倍和2.32倍。
针对当前的关注点,研究人员已主张将肝脏健康评估纳入2型糖尿病(T2DM)人群的年度检查,并强调将晚期肝纤维化筛查作为T2DM综合管理框架中的重要组成部分[24]。本研究设计DiabetesLiver评分的目的,是为了在初级保健机构或糖尿病专科门诊中,提高T2DM患者晚期肝纤维化的检出率。通过可能提高转诊率和改善预测效率,该评分工具的应用有望改善T2DM患者的整体预后。
本研究的优势包括样本量庞大,并且纳入了来自不同国家/地区的多个队列。此外,在英国生物银行队列中对长期结局进行了预测,这彰显了DiabetesLiver评分在风险分层和预后评估方面的价值。
局限
本研究存在一些局限性。缺乏对长期心血管疾病相关不良结局的全面评估仍是一项挑战。晚期肝纤维化患者比例相对较低,导致阳性预测值较低,这削弱了DiabetesLiver评分明确确诊晚期肝纤维化的能力。此外,缺乏药物使用和糖尿病病程的信息可能给研究带来了偏倚。最后,由于推导队列和内部验证队列是回顾性的,无法获得γ-谷氨酰转移酶水平、酒精摄入、高血压、慢性肾脏病和降脂药物使用等数据,因此这些因素未能纳入研究。未来需要更先进的技术[25]和更多的外部队列来验证该评分工具的准确性。另一个局限性是未收集性别和社会经济地位的信息。
综上所述,DiabetesLiver评分在诊断2型糖尿病(T2DM)人群的晚期肝纤维化及识别肝脏相关事件高风险个体方面表现优异。这一非侵入性工具在T2DM患者的晚期肝纤维化筛查及长期肝脏相关结局预测中展现出良好的应用前景。
| 补充数据 | 标题 |
|---|---|
| 表S1 | 肝活检队列患者的基线特征 |
| 表S2 | 英国生物银行队列中按DiabetesLiver评分分层的不同风险组肝细胞癌和肝脏相关死亡率的风险比 |
| 图S1 | DiabetesLiver评分的开发、验证和预后评估 |
| 图S2 | 推导队列和内部验证队列的患者流程图 |
| 图S3 | DiabetesLiver评分在推导队列、内部验证队列和NHANES横断面队列中对LSM≥8kPa和≥10kPa的诊断准确性 |
| 图S4 | DiabetesLiver评分与FIB-4、NFS、FNI和BARD评分在肝活检队列中的诊断准确性比较 |
| 图S5 | DiabetesLiver评分值在不同队列中的分布 |
图S5. 不同队列中DiabetesLiver评分值的分布。与STAR方法相关。
A. 推导队列;B. 内部验证队列;C. 美国国家健康与营养检查调查(NHANES)横断面队列;D. 英国生物银行(UK Biobank)随访队列。
