河北医科大学学报 ›› 2024, Vol. 45 ›› Issue (2): 165-171.doi: 10.3969/j.issn.1007-3205.2024.02.008
摘要: 目的 综合运用生物信息学方法及机器学习算法筛选与非酒精性脂肪性肝炎相关的趋化因子核心基因。
方法 公共数据库GEO下载非酒精性脂肪性肝病芯片数据集GSE49541,采用R studio软件进行差异分析筛选差异基因,对差异基因进行GO 功能注释和 KEGG 信号通路富集分析,将差异基因与趋化因子通路相关基因集取交集获取趋化因子相关差异基因,然后采用机器学习LASSO回归及SVM-RFE算法筛选核心基因,通过Genemania数据库构建核心基因互作网络图,构建核心基因列线图预测模型,并通过ROC曲线验证列线图效能。
结果 共筛选获取差异基因148个,GO及KEGG富集分析提示差异基因富集于脂质代谢、趋化因子、细胞外基质等。最后筛选获得核心基因CCL19、CD24、ROBO1、SLC12A2,构建核心基因互作网络图,基于核心基因建立NASH列线图预测模型,该模型ROC曲线的AUC=0.997,95%置信区间(confidence interval,CI)为0.988~1.000。
结论 CCL19、CD24、ROBO1、SLC12A2可能与非酒精性脂肪性肝炎发生与进展密切相关,有望成为诊断和精准治疗的潜在靶点。