大数据时代口腔癌精准诊疗的思考
黄洪章1, 王成2
1. 中山大学光华口腔医学院·附属口腔医院口腔颌面外科, 广东 广州(510055);
2. 广东省口腔医学重点实验室, 广东 广州(510070)
【摘要】 现代科学技术的进步使得医学数据越来越复杂、丰富和多样,生物医学已然进入大数据时代。在大数据时代背景下,当前主流的循证医学模式可能被精准医学模式替代,肿瘤的诊疗策略也在发生重大变革。本文将评述大数据时代背景下口腔癌精准诊疗策略的进展,包括口腔癌的筛查、早期诊断、分子分型、预后判断和治疗方案的选择、转移和化疗敏感性的预测等,以期为口腔癌的精准诊疗提供新的思路。
【关键词】 大数据; 精准医学; 口腔癌; 头颈肿瘤
【中图分类号】 R739.8 【文献标志码】A 【文章编号】 2096-1456(2017)05-0273-09
【引用著录格式】黄洪章, 王成. 大数据时代口腔癌精准诊疗的思考[J]. 口腔疾病防治, 2017,25(5): 273-281.
Consideration of precision medicine and big data in oral cancer HUANG Hong-zhang1, WANG Cheng2 1. Department of Oral and Maxillofacial Surgery, Hospital of Stomatology, Guanghua School of Stomatology, Sun Yat-sen University, Guangzhou 510055, China
2. Guangdong Key Laboratory of Stomatology, Guangzhou 510070, China
【Abstract】 With the development of computer science and biotechnology, medical data has been dramatically increased and demonstrated the properties of variety and complexity. Biological and clinical researchers now face increasingly large and complex data sets. In the era of big data, strategies of diagnosis and treatment of cancer are gradually changed from evidence-based medicine to precision medicine. The promise of the big data paradigm may affect patients with oral cancer by enabling personalized monitoring, diagnosis and treatment. In this article, we will review the advances of diagnosis and treatment modality in oral cancer based on big data platform, which is mainly focused on oral cancer screening, early detection, molecular classification, prediction of metastasis and chemosensitivity.
【Key words】 Big data; Precision medicine; Oral cancer; Head and neck tumor
【收稿日期】2017?02?07; 【修回日期】2017?03?20
【作者简介】黄洪章,教授,博士生导师,E?mail: hhzhang@mail.sysu.edu.cn
【基金项目】国家自然科学基金(81572661,81202136),广州市珠江科技新星专项(2014J2200045),国家重点研发计划(精准医
学)2016YFC0902700
口腔癌是头颈部常见的恶性肿瘤, 多为鳞状细胞癌, 易发生颈淋巴结转移, 预后较差, 治疗方法主要包括手术、放疗、化疗和生物治疗等; 肿瘤异质性和遗传不稳定性决定了现有的治疗模式无法准确、全面清除口腔癌细胞, 导致治疗失败, 出现转移、复发和耐药[1]。随着分子生物学、高通量测序和计算机技术在肿瘤研究领域中的应用, 肿瘤生物医学大数据(big data)应运而生, 基于大数据分析和挖掘的医学知识正悄然改变着当前肿瘤的诊疗模式, 使得肿瘤的精准诊治成为可能[2]。本文以精准医学(precision medicine)为切入点, 系统评述大数据时代背景下口腔癌精准诊疗的研究进展和面临的挑战。
1 ,大数据与肿瘤精准医学
1.1 大数据
目前, 大数据在国际上无严格统一的定义, 其最早由麦肯锡公司提出, 是指一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合, 具有海量的数据规模(volume)、快速的数据流转(velocity)、多样的数据类型(variety)和价值密度低(value)四大特征。近年, 大数据的内涵逐渐扩大, 不仅指数据本身, 还包括一整套用于收集、存储、管理、分析大型数据和解决复杂数据问题的技术[3]。
1.2 精准医学
精准医学是以个体化医疗为基础, 随着各种高通量组学技术快速进步以及生物信息与大数据科学的交叉应用而发展起来的新型医学概念与医疗模式; 本质指通过现代遗传技术、分子影像技术、生物信息技术, 对大样本人群与特定疾病进行生物标记物的分析与鉴定, 精确寻找病因和治疗靶点, 对疾病不同状态和过程进行精确分类, 实现对疾病和患者进行个性化精准治疗的目的[4, 5]。因此, 大数据是精准医学的根本和基础。
1.3 肿瘤精准医学
精准医学是未来医学模式发展的方向和目标。为了推动精准医学的发展, 2015年1月20日, 美国总统奥巴马在国情咨文报告中提出精准医学计划, 希望通过增加医学研究经费来推动个体化基因组学研究, 依照基因信息为癌症及其它疾病患者制定个性化治疗方案; 2015年1月30日奥巴马正式推出精准医学计划, 并计划投入 2.15 亿美元, 以推动精准医学的快速发展。2015年3月, 我国科技部召开精准医学战略专家会议, 计划启动精准医学计划, 并列为国家“ 十三五” 健康保障发展问题研究的重大专项。
肿瘤是一种复杂的多样性疾病, 在分子遗传学上具有极大的异质性和遗传不稳定性, 具有相似临床症状和同一病理类型的肿瘤可展现出不同的分子特征, 其治疗的效果也不同。
目前, 现有的治疗手段往往只对部分肿瘤患者有效, 而无法在治疗前预测不同肿瘤个体或同一肿瘤个体在不同治疗阶段对特定治疗方案的敏感性, 患者往往可能接受无效治疗或过度治疗; 肿瘤精准诊疗是解决上述问题的关键, 各种组学研究手段则为实现肿瘤的精准诊疗提供了数据支持, 主要包括基因组学、表观基因组学(甲基化组学、miRNA组学和其他ncRNA组学数据)、代谢组学(糖代谢、氨基酸代谢、脂肪代谢等)和微生物组学等研究方法[6]。
基于上述各种组学数据和患者的临床资料建立肿瘤精准医学数据库, 构建肿瘤研究大数据平台, 可推动肿瘤早期筛查、诊断和分子分型的发展, 提高对肿瘤转移和治疗效果预测的时效性, 进而更加精准制定治疗计划并评估患者预后。目前, 国际上已有数个肿瘤大数据平台, 提供海量肿瘤相关组学和临床数据, 主要包括Oncomine、TCGA、COSMIC和CancerLinQ, 但目前仍无基于中国人基因组研究数据的肿瘤相关大数据库。
2 ,大数据与精准医学时代口腔癌的筛查和早期诊断
总体而言, 口腔癌患者的五年生存率为50%~60%, 但临床Ⅰ 期患者的五年生存率可达80%以上, 而Ⅳ 期患者的五年生存率仅为20%; 遗憾的是, 仅有1/3的患者在诊断时为临床早期[7, 8]; 因此, 早发现、早诊断、早治疗仍是口腔癌的重要防治策略。但是, 目前针对口腔癌的筛查和早期诊断缺乏简单有效、敏感度和特异性高的筛查手段和分子标记物, 随着测序和各种组学(omics)手段广泛用于口腔癌的研究, 各种分子标记物与口腔癌阶段性进展的关系越来越明确, 为口腔癌早期筛查和诊断提供了一些具有较好应用前景的分子标记物[6]。
2.1 基于肿瘤组织的多组学研究
测序和基因组学相关研究已证实, 染色体3p、9p的丢失和3q、11q、16p、16q、17p、17q的扩增与口腔癌早期癌变密切相关, 位于3q26区的基因人端粒酶RNA基因(human telomerase RNA gene, hTERC)和SOX2(sex determining region Y-box 2)的扩增在口腔癌中较普遍, 并可用于口腔癌的早期筛查和诊断[9, 10, 11]; Grandis JR课题组[12]、Myers JN课题组[13]和TCGA(The Cancer Genome Atlas)[14]相继采用外显子测序技术鉴定了头颈鳞癌中重要的突变基因, 包括肿瘤蛋白P53(tumor protein P53, TP53)、细胞周期依赖性激酶抑制基因2A(cyclin dependent kinase inhibitor 2A, CDKN2A)、 10号染色体缺失的磷酸酶及张力蛋白同源的基因(phosphatase and tensin homologue deleted on chromosome10, PTEN)、磷脂酰肌醇-4, 5-二磷酸激酶催化亚基α (phosphatidylinositol-4, 5-bisphosphate 3-kinase catalytic subunit alpha, PIK3CA)、HRAS、NOTCH1、干扰素调节因子6(interferon regulatory factor 6, IRF6)、肿瘤蛋白P63(tumor protein P63, TP63)、凋亡相关半胱氨酸肽酶8(apoptosis-related cysteine peptidase, CASP8)、FAT1和F框/WD40域蛋白基因(F-box/WD repeat-containing protein 7, FBXW7)等, 上述基因的改变可应用于口腔癌的早期诊断或作为潜在的治疗靶点。但以肿瘤组织标本整体为研究对象获得的海量测序数据并不能反映肿瘤的异质性特点, 单细胞测序技术可能帮助解决上述难题, 揭示肿瘤细胞克隆进化的机制[15]。
表观基因组学的研究从另一个层面揭示了口腔癌发生发展的内在机制和分子事件, 为肿瘤筛查和早期诊断提供了新的分子标记物, 主要包括DNA甲基化相关分子标记物和miRNA。基于甲基化测序分析和miRNA芯片分析, 目前已有诸多学者研究口腔癌相关的DNA甲基化图谱和miRNA差异表达谱, 初步获得多个潜在的分子标记物。Cheng等[16]研究证实锌指蛋白582(zinc finger protein 582, ZNF582)和配对盒基因1(paired box1, PAX1)甲基化状态可用于鉴别口腔黏膜异常增生和口腔癌, 作为口腔癌筛查和早期诊断的分子标记物, 而P16启动子区域甲基化状态可作为口腔黏膜早期恶变的预测因子[17]; Towle等[18]则利用甲基化芯片检测口腔癌前病变和口腔癌组织中DNA甲基化情况, 证实死亡相关蛋白激酶1(death associated protein kinase 1, DAPK1)、Runt相关转录因子3(runt related transcription factor 3, RUNX3)和分泌型卷曲相关蛋白4(secreted frizzled related protein 4, SFRP4)启动子区域甲基化是口腔癌癌变的重要分子事件; 但是, 目前尚缺乏口腔黏膜癌变过程中全基因组甲基化状态的数据和相关研究。
miRNA组学研究获得的口腔癌早期筛查和诊断的分子标记物主要有miR-21、miR-181b、miR-345、miR-375、miR-196a和miR-196b等[19]; 蛋白质组学研究则发现Cornulin、Myoglobin和S100钙结合蛋白A8(S100 calcium-binding protein A8, S100A8)及活化蛋白C激酶1受体(receptor of activated protein C kinase 1, RACK1)可作为口腔癌早期诊断的潜在分子标记物[20, 21]。Yonezawa等[22]通过代谢组学研究证实糖酵解途径代谢产物在头颈鳞癌组织中较非肿瘤性组织下调, 而缬胺酸、酪氨酸、丝氨酸、蛋氨酸的含量较非肿瘤性组织上调; Srivastava等[23]则证实乳酸、胆碱磷酸、胆碱在口腔癌组织中上调, 而多不饱和脂肪酸(poly-unsaturated fatty acid, PUFA)和肌酸在口腔癌组织含量下降, 根据上述代谢产物的变化情况, 可为口腔癌早期筛查和诊断提供新的线索。上述系列研究证实, 基于各种组学研究结果, 检测组织中特异的分子标记物或分子表达谱可用口腔癌早期筛查。
2.2 基于液体活检的多组学研究
此外, 近年来液体活检(liquid biopsy)作为一项革命性技术开始应用于肿瘤的诊疗过程中, 具有广阔的市场前景和应用价值[24, 25]。
液体活检广义上指对以血液为主的非固态生物组织进行取样和分析, 是一种新兴的疾病诊断和监测工具, 与传统的组织活检相比, 具有迅速、便捷、损伤性小、可实时监控等众多优点; 狭义的液体活检针对肿瘤诊断与治疗领域, 是指通过检测血液中的循环肿瘤细胞(circulating tumor cell, CTC)、循环肿瘤DNA(circulating tumor DNA, ctDNA)、循环miRNA和肿瘤细胞外泌体(exosomes)等, 用于癌症早期筛查和诊断、精准治疗、实时监控和预后判断。
此外, 通过组学研究手段检测血液中ctDNA、CTC或外泌体的遗传信息同样有助于肿瘤分子诊断、分子分型, 并可分析用药后患者肿瘤细胞的突变情况, 实时调整治疗方案。
2.2.1 CTC和ctDNA
目前, 有关口腔癌CTC和ctDNA的相关研究尚处于起始阶段, 有研究证实在头颈鳞癌患者外周血中可检测出CTC, 可用于远处转移筛查和预测, 但尚无基于头颈鳞癌CTC单细胞测序和相关组学研究[26, 27]; Wang等[28]研究证实头颈鳞癌患者ctDNA中能稳定检测出TP53、PIK3CA、CDKN2A、HRAS和NRAS的突变; 也有研究则发现TP53(72%)、PIK3CA(30%)、FAT1(23%)和CDKN2A(22%)是头颈鳞癌的关键突变, 提示ctDNA检测可用于口腔癌的早期筛查和诊断[14]。
相对于CTC和ctDNA, 针对唾液的相关研究为口腔癌提供了更方便、简单和无创的活检手段, 我们称之为唾液活检(saliva biopsy)。
已有研究证实唾液中含有诸多肿瘤相关分子标记物, 包括蛋白、DNA、miRNA和各种代谢产物等[29]。Wang等[28]研究发现, 在头颈肿瘤患者血浆和唾液中均可稳定检出肿瘤特异DNA, 口腔癌患者血浆中ctDNA检出率为80%, 而唾液中肿瘤特异DNA检出率为100%, 提示对于口腔癌患者, “ 唾液活检” 可能优于常规的液体活检。
加州大学洛杉矶分校David Wong研究团队针对唾液开展了系列组学研究, 通过转录组学研究发现白细胞介素8(interleukin 8, IL-8)、白细胞介素1β (interleukin 1β , IL-1β )、双特异性磷酸酶1(dual specificity phosphatase 1, DUSP1)、A激酶锚定蛋白13(A-kinase anchoring protein 13, AKAP13)、鸟氨酸脱羧酶抗酶1(ornithine decarboxylase antizyme 1, OAZ1)、S100钙结合蛋白P(S100 calcium binding protein P, S100P)和亚精氨N1乙酰转移酶(spermidine/spermine N1-acetyltransferase, SAT)在口腔癌患者唾液中表达上调, 上述唾液分子标记物诊断口腔癌的敏感度和特异度均为91%[30]。
基于唾液蛋白质组学研究发现, Mac-2结合蛋白(Mac-2 binding protein, M2BP)、迁移抑制因子相关蛋白14(migration inhibitory factor-related protein, MRP14)、CD59、过氧化氢酶(catalase)、抑丝蛋白(profilin)组合可用于口腔癌诊断, 其特异度为90%, 敏感度为83%[31]。Yu等[32]通过蛋白质组学研究证实唾液蛋白基质金属蛋白酶1(matrix metallopeptidase 1, MMP-1)、激肽原1(kininogen-1, KNG1)、膜联蛋白A2(annexin A2, ANXA2)、热休克蛋白A5(heat shock protein A5, HSPA5)用于口腔癌早期诊断的敏感度为87.5%, 特异度为80.5%。基于唾液miRNA组学研究发现, miR-184[33]和miR-27b[34]可用于口腔癌早期诊断, miR-200a和miR-125在口腔癌患者唾液中下调, 可用于口腔癌筛查[35]。
上述研究提示“ 唾液活检” 可作为一种无创的手段用于口腔癌筛查, 但是, 如何建立唾液组学大数据平台, 整合分析口腔癌患者唾液组学数据和临床资料, 获得可用于口腔癌筛查和早期诊断的唾液分子表达谱亟待解决。
因此, 基于肿瘤组织和体液样本的多组学研究可获得用于口腔癌筛查和诊断的分子标记物, 具有广阔的市场和临床应用前景。口腔癌液体活检相关研究处于初级阶段, 但已较常规组织活检显示出巨大优势, “ 唾液活检” 是最具口腔特色的前沿技术, 不仅可以用于口腔癌诊疗, 还可用于全身其他肿瘤的诊疗, 是最无创的活检技术之一, 并可实现肿瘤实时监测。
3, 大数据与精准医学时代口腔癌的分子分型
肿瘤的本质是遗传不稳定性和异质性, 同一肿瘤中可以存在很多具有不同的基因型或者亚型的肿瘤细胞, 这种肿瘤内部异质性是癌症产生抗药性、转移的主要原因。Ling等[36]基于测序研究估算, 一个直径约3.5 cm的肿瘤中携带了上亿个基因编码区的突变, 异质性和遗传不稳定性决定同一组织来源的肿瘤, 其治疗方案应该不同, 同一个体的肿瘤组织在不同阶段其治疗方案也应不同, 否则将无法有效杀灭具有先天性或获得性耐药的肿瘤细胞。因此, 基于肿瘤细胞不同的分子特征对其进行分类, 将有效提高肿瘤治疗的准确性和效果。
肿瘤分子分型是指基于组学研究, 对所获得的生物信息学的数据进行聚类分析, 根据不同的分子特征将肿瘤分成不同的亚型, 这些亚型表现出显著差异的基因组特征, 结合其相应的组织病理学和临床特征, 将有助于指导靶向药物的研发和针对这些特定肿瘤亚型进行个体化治疗。一般而言, 肿瘤在DNA水平可以依据基因突变、多态性、基因组的细胞遗传学改变或甲基化差异进行分型; 在蛋白质水平, 可以根据蛋白质表达谱的差异、亚细胞结构蛋白组成的不同或蛋白质翻译后修饰的改变来进行分型; 在RNA水平可根据mRNA和ncRNA表达谱进行分型。肿瘤的分子分型可能颠覆现有肿瘤的诊疗模式, 将从形态学为基础的分类转变为以分子特征为基础的新分类, 基于不同分子分型, 给予不同治疗; 而且可以依据液体活检结果实时调整治疗方案, 以实现精准治疗。目前, 临床上尚无明确的口腔癌分子分型方法, 但基于基因组学研究, 已有学者提出以下4种头颈鳞癌的分子分型方法, 包括Belbin分子分型、Chung分子分型、Walter分子分型、Loris分子分型。
3.1 Belbin分子分型
Belbin分子分型于2002年由Belbin等[37]根据基因组学研究提出, 共检测出9 216个基因, 筛选验证375个基因, 根据细胞分化程度、预后和患者年龄及转化生长因子β (transforming growth factor β , TGF-β )表达和血清癌胚抗原(carcino-embryonic antigen, CEA)水平分将头颈鳞癌分为两个亚型:GroupⅠ 为细胞分化差、预后差的年轻患者, 高表达TGF-β 和血清CEA; GroupⅡ 预后较好。
3.2 Chung分子分型
2004年, Chung等[38]利用基因芯片共检测60例头颈鳞癌组织标本中12 814个基因, 筛选验证582个基因, 提出将头颈鳞癌分为4个分子亚型:Ⅰ 型为基底细胞样, 胎盘钙粘蛋白(P-cadherin)、层粘连蛋白2 (laminin 2)、脑肽A1(brain peptide A1, BPA-1)、激肽释放酶10 (Kallikrein 10)、Ⅹ Ⅶ 型胶原α (Collagen Ⅹ Ⅶ α )等基因上调, 基因表达与表皮生长因子受体(epidermal growth factor receptor, EGFR)信号通路密切相关, 患者预后最差; Ⅱ 型为间质细胞型, Vimentin、Syndecan、Lysyl oxidase和Collagen subunits等基因高表达, 基因表达与上皮-间充质转变(epithelial-mesenchymal transition, EMT)信号通路相关, 提示肿瘤细胞发生EMT, 患者预后较差; Ⅲ 型为正常上皮型, 基因表达与正常上皮类似, 预后较好; Ⅳ 型为抗氧化型, 抗氧化酶表达上调, 患者预后较好。该分类奠定了头颈鳞癌分子分型的基础, 为目前头颈鳞癌较为公认的一种分子分型方法。
3.3 Walter分子分型
Walter等[39]则在2013年提出将头颈鳞癌分为基底型(basal, BA)、间质型(mesenc hymal, MS)、非典型(atypical, AT)和经典型(classical, CL)。基底型中Ⅹ Ⅶ 型胶原α (collagen type Ⅹ Ⅶ alpha 1 chain, COL17A1)、转化生长因子α (transforming growth factor alpha, TGFA)、EGFR和TP63等高表达; 间质型中EMT相关基因表达上调, 包括Vimentin、肌间线蛋白(desmin, DES)、TWIST和肝细胞生长因子(hepatocyte growth factor, HGF); 非典型具有人乳头状病毒(human papilloma virus, HPV)阳性头颈肿瘤的特征, CDKN2A、DNA连接酶1 (DNA ligase 1, LIG1)和复制蛋白A2(replication protein A2, RPA2)表达上调; 经典型有典型的吸烟史, 阿尔多酮还原酶家族1成员C1/3 (aldo-keto reductase family 1 member C1/3, AKR1C1/3)、谷胱甘肽过氧化物酶2(glutathione peroxidase 2, GPX2)和核因子E2L2(nuclear factor, erythroid 2 like 2, NFE2L2)等药物代谢相关基因表达上调; 其基因表达模式与Chung分型中的Ⅰ 、Ⅱ 、Ⅲ 、Ⅳ 型相对应, 但对预后预测与Chunag分型不一致, 需结合HPV感染情况分析。
3.4 Loris分子分型
2015年Loris等[40]基于基因组学研究和Meta分析建立了头颈鳞癌新的分子分型系统, 该研究纳入分析20个数据集, 138个正常组织标本和1 386个肿瘤组织标本, 并将基因组学数据和患者的临床病理学资料全面分析、比较, 提出颈鳞癌可分为以下6个亚型:Class1 为HPV样(HPV like), 多为HPV阳性的口咽癌患者, HPV和细胞增殖相关基因表达上调; Class2为间质型(mesenchymal), 基因表达与EMT、细胞运动和血管再生有关, Wnt和Notch信号通路激活, EGFR、RAS、TGF-β 和Cyclin D1信号通路相关基因表达上调; Class3为低氧相关型(hypoxia associated), 富集低氧相关和药物代谢相关基因, beta-catenin信号通路激活, EGFR、RAS、TGF-β 和Cyclin D1信号相关基因表达同样上调; Class4为防御反应相关型(defense response), 富集免疫反应、干扰素相关基因, 间变性淋巴瘤激酶(anaplastic lymphoma kinase, ALK)信号通路激活; Class5为经典型(classical), 富集烟草和药物代谢相关基因, Wnt和E2F转录因子3(E2F transcription factor 3, E2F3)激活, 患者具有典型的吸烟史; Class6为免疫反应型(immunoreactive), 富集免疫系统和细胞自稳相关基因, ALK信号通路激活。上述6个亚型中, 间质型和低氧相关型头颈鳞癌患者的预后最差, HPV样头颈鳞癌患者预后最好。
上述研究证实, 基于基因组学数据可对口腔癌进行分子分型, 但上述4种分型方法均未在临床验证和应用, 缺乏指导意义。此外, 基因组数据无法全面反映肿瘤生物学特性, 目前尚无基于整合分析多个组学数据和患者临床资料建立的分子分型系统。因此, 整合分析结合临床资料的口腔癌相关大数据, 建立新的口腔癌分子分型系统亟待解决, 将肿瘤的表型和基因型结合以实现更为精准的分类。
4, 大数据与精准医学时代口腔癌的治疗
目前, 口腔癌的主要治疗手段有手术、放疗、化疗和生物治疗, 精准医学的核心要求是判断哪些患者能够从不同的治疗模式中获益。
4.1 早期口腔癌
早期口腔癌一般采用手术治疗或放疗, 一般均能取得较好的治疗效果, 但据统计, 20%~40%的早期口腔癌患者可发生隐匿性颈淋巴结转移, 而T1, 2cN0的早期口腔癌患者是否需要行选择性颈淋巴清扫术仍无定论, 并长期困扰着头颈肿瘤外科医生。因此, 如何精准预测早期口腔癌隐匿性颈淋巴结转移, 对制定治疗计划和判断预后至关重要, 此为患者是否应该接受选择性颈淋巴清扫术的基础; 而基因测序和组学研究提供了可能用于预测转移和指导手术的分子标记物。
已有研究报道口腔癌患者区域淋巴结转移情况可用基因预测, 如:联合应用皮肌动蛋白基因(cortactin, CTTN)、基质金属蛋白酶9(matrix metallopeptidase 9, MMP-9)基因和EGFR可用于预测口腔癌患者颈淋巴结转移; 联合应用CTTN、真核细胞翻译延伸因子1α 1(eukaryotic translation elongation factor 1 alpha 1, EEF1A)和MMP-9可用于预测淋巴包膜外扩散[41]。Thangara等[42]则证实细胞外基质降解和EMT信号通路的特征分子表达谱可用于口腔癌转移预测和预后判断。
张志愿院士研究团队则发现微纤丝相关蛋白5(microfibrillar associated protein 5, MFAP5)和肌钙蛋白C1(troponin C1, TNNC1)可预测早期舌鳞癌隐匿性颈淋巴结转移, 并可用于预后判断[43]; Jessen等[44]以肿瘤芽(tumor budding)为研究对象, 基于转录组和miRNA组学整合分析, 发现TGF-β 信号通路相关的EMT基因和miRNA表达谱可用于预测口腔癌患者颈淋巴结转移和患者预后。
本课题组利用基因芯片研究证实, EMT相关转录因子Snai2和EZH2与口腔癌患者颈淋巴转移密切相关, 并用于判断患者预后[45, 46]。同时, 本课题组也以肿瘤芽(tumor budding)为切入点, 证实肿瘤芽(tumor budding)与口腔癌EMT密切相关, 并可预测口腔癌患者颈淋巴结转移、隐匿性颈淋巴结转移并判断患者预后, 进一步以miRNA组学为切入点, 证实联合miR-320a和肿瘤芽(tumor budding)用于患者预后判断[47, 48, 49]。
因此, 对具有上述分子特征的容易发生转移的早期口腔癌, 可选择行颈淋巴清扫术。此外, CTC和ctDNA对口腔癌转移的预测和实时监测也具有重要意义, 应用液体活检技术实现早期口腔癌的精准治疗同样具有广阔的发展前景。
4.2 晚期口腔癌
晚期口腔癌则主要采用多学科协作的综合治疗, 手术仍是治疗的核心手段, 机器人手术为口腔癌手术的精准化提供了契机, 视野放大、精细操作等优势使得手术操作的精准度越来越高; 数字化外科技术使得手术切除和重建更为精准, 患者的形态和功能恢复更佳。
化疗则是晚期口腔癌的主要治疗手段之一, 也是大数据和精准医学时代口腔癌治疗发展的重点。有效的术前诱导化疗和(或)术后化疗能够提高肿瘤的局部控制率和患者的生存率, 然而肿瘤细胞的耐药性往往导致化疗失败, 给患者带来不必要的毒副作用, 延误治疗时机而最终出现复发和转移, 因此, 如何精准预测肿瘤细胞对化疗的敏感性以保证化疗的有效性, 无疑对患者临床治疗效果和生存率都具有十分重要的意义。
肿瘤的异质性和遗传不稳定性可导致先天性和获得性耐药出现, 基于大数据分析策略, 在化疗前可利用肿瘤分子分型或分子特征预测肿瘤细胞对不同化疗药物的敏感性, 在化疗过程中可采用液体活检实时监测化疗效果和肿瘤细胞新的获得性突变和耐药情况, 及时识别患者对特定治疗的反应, 调整化疗药物和方案, 从而实现精准化疗。
Loris等[40]在其分子分型系统的基础上, 利用Genomics Drug Sensitivity Project系统数据库[50]分析了6种不同亚型头颈鳞癌的化疗药物敏感性, 结果发现Class1对紫杉醇敏感, Class2宜采用Z-LLNle-CHO治疗, Class3对阿法替尼(Afatinb)最为敏感, Class4和Class6对Nutlin3a敏感, Class5对雷帕霉素最敏感。该分子分型首次为头颈鳞癌化疗方案的选择提供了指导。
此外, 口腔癌患者的全基因组测序结果可用于预测不同药物的化疗敏感性, TP53在头颈肿瘤中的突变最常见, 超过一半的头颈鳞癌患者存在TP53的突变, 其突变可导致顺铂和5-FU化疗耐药, 是预测口腔癌铂类药物化疗敏感性的重要指标[51, 52]。
PIK3CA是PI3K信号通路的关键基因, 在头颈肿瘤中的突变也较常见, PIK3CA突变提示肿瘤细胞对mTOR/PI3K 抑制剂(BEZ-235)更为敏感[53, 54], 而MAPK1E322K突变的头颈鳞癌患者对埃罗替尼(erlotinib)更为敏感[55, 56], D型受体型蛋白络氨酸磷酸酶(protein tyrosine phosphatase, receptor type D, PTPRD)突变则可预测头颈鳞癌对信号传导与转录激活因3(signal transducer and activator of transcription 3, STAT3)抑制剂的敏感性[57]。上述研究证实:针对患者的全基因组测序结果可预测各种药物的敏感性, 为口腔癌治疗提供个体化治疗方案, 提高化疗的准确性。
综上所述, 在大数据时代背景下, 手术和化疗均向精准化发展, 但多学科治疗模式仍是口腔癌治疗的主要方法; 因此, 如何在手术、放疗、化疗和生物治疗等多学科治疗模式下找到针对个体患者的最优治疗方案成为精准医学的重要挑战。
5 展望与挑战
5.1 展望
随着计算机技术在生物医学领域的广泛应用, 奠定了数字化医学发展的基础, 大数据与生物医学的结合是数字化医学发展的必然, 推动了医学模式的革命和创新, 促进了精准医学和个体化诊疗的发展。
精准医学的提出汇集了现代医学科技发展的前沿科技与知识, 体现了现代医学的发展趋势, 是提高肿瘤治疗效果的希望, 而肿瘤大数据是实现这一愿望的基础。在未来, 大数据是人们获得新知识、创造新价值的源泉, 数据就是资源, 其核心在于预测和探索事物的相关性。可以预见, 在大数据时代, 口腔领域的唾液活检将迎来革命性发展, 口腔肿瘤与唾液解剖上密切相关, 唾液容易获取、转运、保存, 建立基于唾液研究的口腔癌大数据平台可开创“ 唾液活检” 时代。
目前, 加州大学研究团队建立了唾液组学知识网络, 包括Saliva Ontology和SdxMart两大功能模块, 不同研究者间以及唾液组学与其他系统组学间的数据可以相互对接, 以实现在蛋白组学、转录组学、非编码小RNA组学、代谢组学等层面查找口腔癌分子标记物, 整合并共享唾液组学研究数据与临床资源, 促进基础研究成果向临床精准医疗的转化。
5.2 挑战
大数据和精准医学本身也存在着一定局限性和缺点。首先, 并非所有的癌症都可以找到驱动肿瘤发生发展的核心突变基因, 而找到相关驱动突变基因后, 可用于精准治疗的靶向药物有限, 单一药物也无法完全阻断肿瘤细胞的生长和转移, 联合用药的副作用问题仍需进一步解决[58, 59]; 其次, 肿瘤进化上的异质性和遗传不稳定性决定现有的精准诊疗手段也只是靶向杀灭或抑制部分肿瘤细胞; 再次, 尽管测序费用逐年下降, 但应用在整个精准诊疗过程中的费用仍然十分昂贵, 极大限制了精准诊疗在临床上的广泛应用; 最后, 大数据的存储、整合、分析仍面临重重困难, 数据的安全、伦理、隐私等问题也亟待国家立法保障。
来源:黄洪章,王成 口腔疾病防治杂志