前言

世界范围内鼻咽癌发病率不到1/10万,但在我国南方地区其发病率可达30/10万~50/10万,我国每年的新发病例数占世界的47%[1],是肿瘤防治领域不容忽视的重要问题。随着信息技术的飞速发展,医学大数据已在许多疾病的诊断和治疗中发挥了重要作用。目前,美国国家癌症数据库(National Cancer Database,NCDB)[2]、SEER多瘤种数据库[3]等已成为全球性的肿瘤大数据中心。这些医学大数据平台可以帮助医师总结经验,提升疾病诊治水平,达到精准治疗的目的。然而,鼻咽癌数据在这些平台仍十分匮乏,我国建设鼻咽癌单病种数据中心责无旁贷。

目前,全国范围内不同医院使用的商业化医院信息系统提供者达300多家,数据结构和标准有所差异。同时,不同医疗系统通常也不需要交换数据,各自存储着区域内鼻咽癌患者的医学资料。由于每个医院的数据存储方式各不相同而形成了一个个“信息孤岛”,导致这些宝贵的医学资料无法有效地整合、共享和利用。

在术语体系方面,虽然我国自2002年就采用了国际疾病编码和国际手术编码,但这两大术语体系还不能覆盖医疗记录中所有临床信息。而且目前较为广泛采用的医学系统命名法——临床术语(Systematized Nomenclature of Medicine-Clinical Terms,SNOMED CT)[4],统一医学语言系统(Unified Medical Language System,UMLS)[5],以及医学语言、百科全书与术语命名通用架构(GALEN)等在我国并未应用。在这精准医学飞速发展的年代,建立规范统一的标准术语体系、打破大数据时代的壁垒迫在眉睫。

中山大学肿瘤防治中心已建成单中心的鼻咽癌单病种数据平台,通过医渡云(北京)技术有限公司的数据平台标准建设流程,将分散于不同医疗业务信息系统中的多维度临床信息通过数据采集、清洗、结构化、存储、整合等步骤集成云端的数据中心。基于数据平台建设经验,现中山大学肿瘤防治中心、中国临床肿瘤学会鼻咽癌专家委员会联合医渡云(北京)技术有限公司,基于相关术语规范、鼻咽癌指南及专家共识等建立中国的鼻咽癌标准数据集。为鼻咽癌多中心数据平台建设及后续多中心真实世界研究筑基,共同构建及推进中国鼻咽癌诊疗规范。

孙 颖

2023年4月

参考文献

[1] SIEGEL R L,MILLER K D,JEMAL A. Cancer statistics[J]. CA Cancer J Clin,2018,68(1):7-30.

[2] National Cancer Database[DB/OL]. [2022-05-22]. https://www.facs.org/quality-programs/cancer/ncdb.

[3] Surveillance,Epidemiology,and End Results Program[EB/OL]. [2022-05-22]. https://seer.cancer.gov/.

[4] SNOMED CT[EB/OL]. [2022-05-22]. https://www.snomed.org/snomed-ct.

[5] Uni fi ed Medical Language System (UMLS)[EB/OL]. [2022-05-22]. https://www.nlm.nih.gov/research/umls/.