华南预防医学 ›› 2025, Vol. 51 ›› Issue (2): 142-147.doi: 10.12183/j.scjpm.2025.0142
陈舸1, 李观海2, 杨朔1, 贾卫东3, 李粤平3, 郜艳晖4, 梁晓峰4
CHEN Ge1, LI Guanhai2, YANG Shuo1, JIA Weidong3, LI Yueping3, GAO Yanhui4, LIANG Xiaofeng4
摘要: 目的 构建乙肝肝硬化患者住院风险及高医疗费用的预测模型,以提高患者管理和临床决策的科学性。方法 研究样本来源于广州市某传染病专科医院诊断为乙肝肝硬化的患者。通过随机抽样方法,将数据划分为训练集(70%)和验证集(30%)。针对类别不平衡问题,运用合成少数类过采样技术(SMOTE)算法均衡训练集后,通过随机森林算法结合logistic回归构建次年住院风险及高医疗费用的预测模型。随后,采用类别平衡数据集和验证数据集对模型进行验证,以评估其预测效能。结果 共纳入7 022例乙肝肝硬化患者,其中次年住院患者602例(8.57%),次年高医疗费用患者179例(2.55%)。随机森林算法、logistic回归预测模型结果显示,当年住院、总蛋白异常、白蛋白偏低是发生次年住院和次年高费用的危险因素(均OR 95% CI>1),高谷丙转氨酶、恩替卡韦使用分别是次年住院和次年高费用的保护因素(均OR 95% CI<1)。在类别平衡数据集中,次年住院风险预测模型的AUC为0.944,高医疗费用预测模型的AUC为0.962。在验证数据集中,次年住院风险预测模型的AUC为0.787,高医疗费用预测模型的AUC为0.857,模型具有良好的预测性能。结论 本研究构建的预测模型在预测乙肝肝硬化患者次年住院风险及高医疗费用方面表现出良好的性能,对于优化患者管理、降低医疗成本及提高医疗服务质量具有重要价值。
中图分类号: