在上述基础上,团队对公开发表的文献中的临床病例文章进行大规模的文本挖掘,并对提取的信息进行全面的人工校对和标准化,最终确认了中国人群的罕见病名录。
石铁流透露,目前,平台共收录4455种罕见病,并以相关的文献和病例为支持。即以中国罕见病患者为中心,形成具有中国人群特色的罕见病名录。以“渐冻症”肌萎缩侧索硬化症为例,平台信息展示。
该数据库包含五大模块:一是基础信息模块,包含疾病定义、遗传模式、相关基因、疾病分类等疾病注释信息;二是疾病表征模块,包含疾病表型及部分表型来源的文章句子;三是相关基因模块,包含疾病关联的基因及每个基因的变异注释信息;四是治疗药物模块,包含中国获批上市的罕见病治疗药物及其是否被纳入甲类/乙类医保;五是病例信息模块,包含罕见病的文章支撑信息及部分案例图片。
CCRD的搭建,旨在为临床医生对罕见病的精准诊断提供重要的决策支持;为高校和研究机构的科研人员对罕见病的机制研究及药物的开发打下更好的基础;为罕见病患者及家属了解相关的罕见病提供了更加全面、系统的信息。本名录中对罕见病信息的标准化为罕见病AI辅助诊断体系的建立奠定了坚实基础。
“未来,通过大规模的信息整合和标准化,结合疾病AI大模型,我们有望为国家卫生健康管理部门、研究机构、医疗机构、临床医生以及国际社会提供关于罕见病领域的全面、系统的信息。”石铁流说。
暂无评论,1687人围观