序 言

赵国屏*
中国科学院上海营养与腱康研究所,生物医学大数据中心,上海 200031

摘 要:

    生物医学大数据不仅是生物医学领域开展数据密集型研究的基石,成为与人口健康、社会发展和国家安全相关的战略资源,而且还是利用人工智能赋能“大健康”产业发展的核心生产要素之一。如何把海量的生物医学数据转换成能发挥研究基石和产业要素作用的“生物医学大数据”,即实现其“价值”,是长期以来生物医学领域的相关人员、机构乃至政府部门都深感“机遇与挑战”的大问题。但是,该问题基本上未被全面、系统、深入地加以讨论并探索出解决途径。究其原因,可能是源于该问题的核心,既与海量生物医学数据与生俱来的“跨尺度、多源性、高维度、细粒度、异质性复杂体系”的“低价值密度”的数据特征有关,又与数据的产生者、收集者、使用者之间在“管——安全与私密,用——投入/ 产出,放——竞争/ 合作”等一系列“复杂利益关系”的社会特征有关。2016 年,当时的中国科学院上海生命科学研究院,依托其所属马普计算生物学研究所,秉承“面向生物医学科技前沿、面向国家生物安全需求、面向生物医药产业主战场、面向人民生命健康”的初心,以“先投入战斗,然后再见分晓”的只争朝夕精神,建立“生物医学大数据中心”,在整整7 年的时间里,努力探索解决这一问题的途径,获得了一些体会和经验。他们特别认识到对于生物学、健康医学等数据而言,标准化规范整合与开放共享是使数据“要素化”的重要环节;而且只有秉承“安全管理、信息共享、标准增值、技术创新、尊重产权、高效利用”的理念,将生物、医学、工程、技术等多学科交叉融合并在工程技术层次上紧密协作,才能形成落实这一环节
的数据治理体系,源源不断地供给高质量的生物医学大数据。
    鉴于生物医学大数据这几年实践中形成了多方面的合作伙伴,本刊特委托他们组织“生物医学大数据”专辑,邀请我国在该领域长期从事数据基础性工作的研究团队从多个视角向读者介绍大型数据中心的建设经验及相关数据技术的进展,回顾健康与疾病人群队列研究历史及趋势,总结微生物组大数据研究动态,以期通过梳理生命科学、环境科学、公共卫生等领域的大数据进展,为生物医学大数据科学相关的工程、技术与研究提供新思路,促进我国高质量的数据供给与应用。

通讯作者:赵国屏 , Email:gpzhao@sibs.ac.cn

Back to top