恶性肿瘤是当前全球最受关注的公共卫生难题之一,据世界卫生组织统计,全球每年新发肿瘤病例超1900万,死亡病例近1000万。传统抗肿瘤药物研发始终面临“高投入、高风险、高失败率、长周期”的痛点,平均一款新药上市需要10年以上时间,研发成本超10亿美元,且90%的候选药物会在临床试验阶段折戟。作为生命科学与计算机科学交叉形成的新兴学科,生物信息学近年来已经渗透到抗肿瘤药物研发、临床应用的全链条,为破解行业痛点提供了新的解决方案。
首先,生物信息学为抗肿瘤药物新靶点挖掘提供了高效路径。传统靶点发现依赖低通量的分子生物学实验,往往耗时数年,且容易漏过肿瘤特异性靶点。而生物信息学可以整合TCGA、ICGC等公共肿瘤数据库中上万例样本的基因组、转录组、表观遗传组、蛋白质组数据,通过差异分析、驱动基因预测、通路富集等算法,快速定位在肿瘤发生发展中起关键作用、且在正常组织中低表达的分子,大幅提升靶点筛选的特异性和效率。比如全球首款“不限癌种”的靶向药拉罗替尼,其作用靶点NTRK融合基因就是通过泛癌种生信分析发现的——研究人员通过分析17种肿瘤的测序数据,证实NTRK融合是广泛存在的致癌驱动因素,才推动了这款覆盖多癌种的创新药落地。此外,生物信息学还能提前预测靶点的成药性、脱靶风险,提前排除无效靶点,降低后续研发的沉没成本。
其次,虚拟筛选技术大幅压缩了先导化合物的研发周期。传统的化合物筛选需要对数十万甚至上百万个化合物逐一开展细胞实验,耗时数月且成本极高。而基于生物信息学的虚拟筛选技术,依托分子对接、分子动力学模拟、AI构效关系预测等模型,能在短时间内完成数十万级化合物库的筛选,精准匹配能和靶点蛋白稳定结合的候选化合物。尤其是AlphaFold等AI蛋白结构预测工具成熟后,大量此前无法通过实验解析的靶点三维结构得以精准预测,打破了虚拟筛选的结构限制。2021年上市的全球首款KRAS G12C抑制剂Sotorasib,研发阶段就通过虚拟筛选举荐了200多个潜在结合分子,仅用6个月就找到了高活性的先导化合物,研发周期较传统方式缩短了70%以上。
第三,生物信息学是肿瘤精准用药和老药新用的核心支撑。在临床端,生物信息学可以对患者的肿瘤测序数据、临床病史数据进行整合分析,识别患者携带的驱动突变、微卫星不稳定状态、肿瘤突变负荷等指标,为患者匹配最适配的抗肿瘤药物,同时预测耐药风险和不良反应发生率,真正实现个体化治疗。目前临床广泛应用的肿瘤大panel测序,已经使晚期非小细胞肺癌患者的精准用药覆盖率超过60%。此外,生物信息学还能通过药物-靶点-通路的关联分析,从已上市的非抗肿瘤药物中筛选出具有抗肿瘤活性的候选药物,即“老药新用”,这类研发路径的成本仅为新药研发的1/10,周期可缩短3-5年。比如常用降糖药二甲双胍、抗寄生虫药伊维菌素,都通过生信分析被证实具有调控肿瘤细胞周期、抑制免疫抑制微环境的作用,目前已进入多项抗肿瘤临床试验阶段。
最后,生物信息学为耐药机制解析和联合用药优化提供了全新工具。抗肿瘤药物耐药是临床治疗失败的核心原因,传统耐药研究往往聚焦单个分子,很难发现复杂的调控网络。生物信息学可以通过比对患者用药前后、耐药前后的多组学数据差异,构建耐药相关的分子调控网络,定位耐药的核心驱动通路,在此基础上模拟不同药物组合的协同作用,筛选出能逆转耐药的联合用药方案。比如针对EGFR靶向药耐药后出现MET扩增的患者,生信分析证实EGFR抑制剂联合MET抑制剂具有显著的协同抑瘤效果,这一组合方案目前已经被纳入非小细胞肺癌临床指南,使耐药患者的客观缓解率提升了40%以上。
当然,目前生物信息学在抗肿瘤药物领域的应用还面临不少挑战:多中心数据的异质性较高、AI预测模型的可解释性不足、临床转化的验证体系还不完善等。但随着单细胞测序、空间转录组等新技术的普及,以及大模型、深度学习算法的不断优化,未来生物信息学将进一步贯穿抗肿瘤药物研发、临床转化、精准用药的全流程,有望将抗肿瘤药物的研发周期缩短一半以上,大幅降低研发成本,最终让更多肿瘤患者从精准治疗中获益。
本文由AI大模型(Doubao-Seed-1.6)结合行业知识与创新视角深度思考后创作。