生命科学   2025, Vol. 37 Issue (7): 748-754.  DOI: 10.13376/j.cbls/2025075.
0

蛋白质设施支持下的科学研究

引用本文 [复制中英文]

吴家睿. 国家蛋白质科学研究(上海)设施开放十周年记. 生命科学, 2025, 37(7): 748-754. DOI: 10.13376/j.cbls/2025075.
[复制中文]
WU Jia-Rui. Ten-year for National Facility for Protein Science in Shanghai. Chinese Bulletin of Life Sciences, 2025, 37(7): 748-754. DOI: 10.13376/j.cbls/2025075.
[复制英文]

作者简介

吴家睿,中国科学院分子细胞科学卓越创新中心研究员。现任中国科学院上海高等研究院国家蛋白质科学研究(上海)设施主任、上海交通大学主动健康战略与发展研究院执行院长、中国科学院系统生物学重点实验室主任、上海市科普作家协会理事长。国家杰出青年科学基金获得者(1998)、中国科学院百人计划入选者(1998)、上海市领军人才入选者(2009)。吴家睿实验室主要采用系统生物学方法研究糖尿病和肿瘤等重大慢性病发生与发展的分子机制 。

通信作者

吴家睿,E-mail: wujr@sibs.ac.cn

文章历史

收稿日期:2025-06-23
国家蛋白质科学研究(上海)设施开放十周年记
吴家睿 1,2     
(1 中国科学院上海高等研究院国家蛋白质科学研究(上海)设施,上海 201210)
(2 上海交通大学主动健康战略与发展研究院,上海 200030)
摘要:国家蛋白质科学研究(上海)设施是全球首个生命科学领域的综合性大科学装置,包括由不同仪器设备构成的9个技术系统;该设施自2015年7月开放运行以来,十年来为广大科技人员提供结构生物学等各类科研技术服务,目前已服务10万余人次,在推进我国生命科学,尤其是蛋白质结构研究方面做出了巨大的贡献。
关键词蛋白质科学    蛋白质结构    大科学设施    
Ten-year for National Facility for Protein Science in Shanghai
WU Jia-Rui 1,2     
(1 National Facility for Protein Science in Shanghai, Shanghai Advanced Research Institute, Chinese Academy of Sciences, Shanghai 201210, China)
(2 Institute of Proactive Healthcare, Shanghai Jiao-Tong University, Shanghai 200030, China)
Abstract: The National Facility for Protein Science in Shanghai (NFPSS) is the world′s first comprehensive scientific facility for big-science in the field of life sciences, consisting of nine technical systems composed of different equipment and instruments. Since NFPSS operation in July 2015, this facility has provided various scientific research and technical services such as structural biology for a large number of researchers over the past ten years. So far, it has served more than 100, 000 person-time and made tremendous contributions to promoting life sciences in China, especially the researches on protein structures.
Key words: protein science    protein structure    scientific facility for big-science    

随着世纪之交人类基因组计划的实施和完成,破解遗传信息的研究工作已取得了重大的突破,生命科学进入了后基因组时代,研究对象的重心转向了生命活动过程中的主要载体和功能执行者——蛋白质。不同于由4种化学碱基组件构成的线性基因组序列,蛋白质是由20种天然氨基酸作为基本“砖块”组成的、具有复杂三维结构的生物大分子。生命科学的最主要任务之一就是要充分理解蛋白质的空间结构与功能之关系,进而在分子、细胞和生物活体等多个尺度上全面揭示生命活动的规律。同时,蛋白质科学的研究成果还将催生一系列新型生物技术,带动医药、农业和绿色产业的发展,引领未来生物经济。蛋白质科学已经成为国际生命科学领域中争夺最激烈的前沿阵地。我国政府高度重视蛋白质科学研究,在《国家中长期科技发展战略规划(2006—2020年)》中,蛋白质研究被列为基础研究领域里四大科学研究计划之一。

在后基因组时代,生命科学研究也从传统的小科学范式进入到大科学范式,集成了规模化科学设备和仪器的大科学设施成为推进蛋白质研究不可或缺的重要技术手段,如日本政府于2000年开始,在理化研究所(RIKEN)下属的横滨研究所(Yokohama Institute)打造了一个当时世界上最大的、基于核磁共振技术研究蛋白质结构的大科学设施,拥有从600 MHz到900 MHz的高场核磁共振谱仪(NMR)共40台。

根据国际生命科学的发展态势和国家战略需求,国家发展和改革委员会于2008年决定建设针对蛋白质研究的国家重大科技基础设施,包括在上海市建设以蛋白质结构解析能力为主的蛋白质研究设施,在北京市建设以蛋白质组学研究能力为主的蛋白质研究设施。为此,中国科学院决定上海生命科学研究院作为“国家蛋白质科学研究(上海)设施”(以下简称蛋白质设施)的项目法人单位;随后在上海市政府的大力支持下,其他兄弟研究所和高校专家的积极参与下,生物化学与细胞生物学研究所的科技力量作为建设主体,开始了蛋白质设施的建设工作;该设施在2015年7月顺利通过国家验收,正式面向国内外科技界开放。值此开放十周年之际,笔者将系统地总结蛋白质设施运行情况以及取得的主要成果。

1 生命科学领域的综合性大科学设施

蛋白质本身的复杂性和多样性使得蛋白质研究技术面临着巨大的挑战。首先,蛋白质在空间尺度有着很大的差异:单个蛋白质分子通常是在纳米水平,而蛋白质复合物和蛋白质机器则可以达到亚微米水平;而在细胞和动物等活体内的蛋白质,则有着更大的空间尺寸。其次,蛋白质在时间尺度有着很大的变化:不同种类的蛋白质的寿命通常是不一样的,有的几分钟,有的数小时;而在信号转导过程中,蛋白质之间的相互作用则可能发生在毫秒级。此外,生命体内的蛋白质总是处在运动之中,包括蛋白质的修饰变化、转位运动以及数量的改变。更重要的是,细胞内存在成千上万种不同的蛋白质,它们之间形成复杂的相互作用网络。

由于每一种研究技术装备都有其特定的空间分辨率和时间分辨率,因此蛋白质设施的总体设计思路是,将多种研究技术和装备按照空间尺度和时间尺度两个维度进行综合配置。从空间尺度来看,蛋白质设施配备了能够研究从原子间的距离(纳米)到蛋白质空间构象(微米)以及更大尺寸生物体的技术装备;从时间尺度来看,蛋白质设施配备了能够研究从超短时程构象变化(纳秒)到长时程信号分子传递(毫秒)以及更长时程生命活动的技术装备。这些技术系统配置充分考虑了不同仪器设备特有的空间分辨率和时间分辨率,从而能够满足蛋白质研究涉及的蛋白质时空复杂性与多样性(图 1)。蛋白质设施正是在这样的设计思路指导下建成,并在2015年的国家验收报告中被明确认定为“全球首个生命科学领域的综合性大科学装置”。

图 1 蛋白质设施的设计思路示意图

蛋白质设施综合性特点表现在其拥有的9个技术系统:(1)规模化蛋白质制备系统;(2)蛋白质晶体结构分析系统;(3)核磁分析系统;(4)电镜分析系统;(5)蛋白质动态分析系统;(6)质谱分析系统;(7)复合激光显微镜系统;(8)分子影像系统;(9)数据库与计算分析系统。每个技术系统由若干种仪器与设备组成。特别要指出的是,蛋白质设施不仅在其海科路园区装备了当时国际上最先进的科研仪器如900 MHz高场核磁共振谱仪,而且基于上海光源拥有的世界先进水平的第三代同步辐射光源,利用5条光束线建立了蛋白质晶体研究实验站和小角散射实验站等共6个实验站(简称“5线6站”)(图 2),实现了两个国家级重大科技基础设施的强强联合与优势互补,从而使我国蛋白质设施跻身于国际上最大的综合性蛋白质研究设施系列。

图 2 蛋白质设施的总体结构示意图

蛋白质设施通过这些系统之间的结合与互补,建立了从蛋白质样品制备、结构解析到功能研究的完整技术体系,进而构成了实现蛋白质研究的五种技术能力:(1)规模化蛋白质制备能力;(2)多尺度结构分析能力;(3)多层次动态研究能力;(4)整体与定量分析能力;(5)数据库与计算能力(图 2)。

1.1 规模化蛋白质制备能力

建立了规模化的基因表达与蛋白质纯化的技术平台,实现从载体构建、转染、细胞培养、诱导表达到菌体破碎、产物抽提、蛋白质纯化、结晶等试验样品的全过程自动化与精密控制,以及规模化的抗体制备。

1.2 多尺度结构分析能力

建立了基于同步辐射的蛋白质晶体学技术,以及核磁共振波谱学和冷冻电子显微镜技术的结构生物学研究平台,从而可以开展对蛋白质单体、蛋白质复合物,以及蛋白质机器等超大分子复合体、细胞器结构等的综合研究。

1.3 多层次动态研究能力

建立了包括X射线小角散射、红外光谱学的生物大分子动态分析技术平台;并建立了包括单分子技术、示踪技术以及分子标记技术等先进技术在内的分子影像技术平台。通过这些平台的技术支持,从而能够开展对蛋白质折叠、转运、降解等蛋白质动态平衡过程,以及细胞信号转导等活体功能过程中的蛋白质的时空定位等功能分析。

1.4 整体与定量分析能力

建立了规模化分离鉴定以及高精度定量化检测蛋白质的色谱-质谱技术研究平台,从而能够开展对细胞内成千上万种蛋白质的表达、翻译后修饰,以及蛋白质相互作用网络的规模化和定量研究。

1.5 数据库与计算分析能力

建立了海量实验数据保存、管理与分析的数据软件系统,形成具有国际先进水平的国家蛋白质科学研究综合数据库;建立了高性能的计算与系统生物学技术支撑平台;通过这两个部分构成一个完整的数据处理与计算中心。

2 支撑我国蛋白质科学研究的利器

随着时间进入21世纪,我国的蛋白质科学研究有了长足的进步,在局部研究方向上已经有所领先;但是,整体研究实力依然不容乐观。根据国际蛋白质结构数据库(Protein Data Bank, PDB) 2006年6月在其网站(http://www.rcsb.org/pdb)的统计数据,当时国际科学界已经测定蛋白质结构的数量超过37 000种,而由我国科学家测定的蛋白质结构仅占其中的0.5% (约180种)。这种落后世界科研的一个主要原因是我国在蛋白质科学方面的基础条件与国际先进水平仍有明显差距,例如,我国的高场核磁谱仪数量极少,当时只有北京大学的1台800 MHz谱仪和香港科技大学的1台750 MHz谱仪。显然,先进的实验设备和技术能力已成为制约我国生命科学创新发展的一个关键因素。

蛋白质设施的建立标志着我国蛋白质科学研究进入“快车道”,尤其是在结构生物学研究方面。近年来,由我国科学家研究测定的蛋白质等生物大分子的结构数量不断提高,2021年度投递到PDB的结构数量已经跃居全球第二,仅次于美国;2024年度投递到PDB的结构数量近5 000个,全球占比超过24% (见本专辑综述文章“中国蛋白质结构数据库:立足当下,着眼未来”的图 2)。自蛋白质设施2015年正式开放运行以来,设施的研究技术队伍利用手中先进的仪器设备,为我国广大科研人员提供了大量技术服务,在推进我国生命科学,尤其是蛋白质结构研究方面做出了巨大的贡献。

2.1 蛋白质设施十年来的运行情况

蛋白质设施自2015年通过国家验收正式开放,就把全方位开放共享作为基本运行原则,建立了参与设施运行管理的用户科技委员会,并有针对性地制定了一系列管理制度,如针对三类课题——普通课题、紧急课题以及即约即用类课题制定了相应的申请与执行流程。开放十年来,蛋白质设施的科研用户已覆盖全国32个省市直辖市;截至2024年12月底,使用蛋白质设施的国内外高校和科研单位达到504家,其中包括中国科学院的多个研究所,以及北京大学、清华大学、复旦大学、浙江大学、香港大学等一流的研究型大学,并且还有哈佛医学院、斯坦福大学、剑桥大学等多所国际名校(图 3);蛋白质设施目前已服务10万余人次,涉及2 500余个课题组、13 400余项课题,其中结构生物学研究课题总数为国内第一。

图 3 蛋白质设施用户分布图

蛋白质设施开放运行初期是将重点放在科研单位和高校学术用户的技术服务。随着近年来国家提出将高质量发展作为社会经济发展的主题,通过科技创新推动新质生产力发展成为了全社会的主旋律。蛋白质设施为此加强了对产业用户的技术服务。不久前将原有的用户科技委员会进行了扩充,增加了“产业用户分委员会”和“临床研究用户分委员会”。此外,通过对设施各系统的技术服务内容的梳理,除了将原有的技术研发类横向课题合作研究领域扩增至8个,如高通量小分子药物筛选、病理检测等,还提出了种类繁多的简单常规技术服务,涉及技术支持、技术培训、技术辅助、技术服务等4种类型共219项。蛋白质设施目前已经为上百家产业用户提供了相关的技术服务和合作研究。

值得一提的是,蛋白质设施在运行过程中不仅建设了相关的数据库,而且还在2022年成功加入PDB。这是蛋白质科学研究领域中最重要的一个数据库,2003年7月由RCSB蛋白质结构数据库(RCSB PDB,美国)、欧洲蛋白质结构数据库(PDBe)、日本蛋白质结构数据库(PDBj)共同组建成立。而随着中国蛋白质结构数据库(PDBc)的加盟,在世界PDB的版图上点亮了中国的地标。关于PDBc的详细介绍请看本专辑的综述文章“中国蛋白质结构数据库:立足当下,着眼未来”。

2.2 蛋白质设施十年来取得的科研成果

蛋白质设施不仅拥有世界先进水平的同步辐射光源与实验站,以及国际先进水平的仪器设备,而且不断对设施的各个技术系统进行性能提升和技术创新;在开放运行期间,蛋白质设施工作人员不断对部分技术系统进行升级改造,同时还开展技术研发和平台搭建,包括自动化药物筛选平台、吸收谱平台、mRNA脂质体传递鉴定平台、广角掠入射散射测试平台、广角小角连用实验平台、结构质谱实验方法、冷冻电镜样品处理优化技术、冷冻电镜探测器升级,确保了蛋白质设施仍处于国际先进性能的地位和部分领域国际领先的成果产出能力。

开放十年来,蛋白质设施支撑其用户已发表高水平研究论文4 000余篇,其中在CellNatureScience等三大高水平研究期刊上合计发表论文125篇,数量占到我国整个生命科学领域发文量的10%以上,在全国国家重大科技基础设施中名列前茅(图 4)。可以说蛋白质设施这十年来为我国在蛋白质结构生物学、生物医药研发领域的研究提供了相当重要的技术支撑。

图 4 蛋白质设施用户发表的研究论文统计图

值得注意的是,在我国科技人员取得的众多代表性成果中,蛋白质设施也做出了突出的贡献——20余项蛋白质设施用户成果荣获“十大”国家级荣誉,包括“中国科学十大进展”3项,“中国生命科学十大进展”8项;“中国十大科技进展新闻”4项、“国内十大科技新闻(科技日报)”2项、“国内十大科技新闻(中央广播电视台)”1项、“中国医学科技十大新闻”3项;“中国高等学校十大科技进展”2项(表 1)。

表 1 蛋白质设施支撑取得的具有重大影响的科学成果
3 蛋白质设施未来的发展思路

蛋白质设施今后的首要任务是进一步提升结构生物学相关的研究能力,从而为广大科技用户和产业用户提供更好的技术支撑;同时还要下大力气发展面向国际科技前沿和国家战略需求的新技术。当前国际科学前沿的一个重大挑战是蛋白质动态结构研究。传统的蛋白质研究技术如X射线晶体学和冷冻电镜等主要用于蛋白质静态结构研究。随着近年来蛋白质结构研究仪器和方法的发展,如基于同位素标记的质谱分析技术以及分子动力学模拟技术,蛋白质动态研究已经成为国际研究的热点和重要趋势。因此,蛋白质设施的一个重点发展方向是围绕蛋白质动态结构开展研究,将对各实验技术系统进行升级改造,建立高时间分辨率的蛋白质动态结构研究平台,着力提升蛋白质动态结构研究数据采集、动态结构模拟分析和模拟数据验证。

针对蛋白质结构动态研究方向,蛋白质设施不久前与上海思朗万维计算技术有限责任公司合作成立了“高性能蛋白质动态计算中心”,计划在张江蛋白质设施园区内引进该公司的高性能分子动力学计算机——MHPC系统,配合蛋白质设施的技术系统形成重要“底座”型蛋白质动态结构研究高地,利用国际先进水平的科学计算能力与先进实验技术设备验证的“干湿结合”研究策略,在蛋白质动态结构预测、活性药物分子动态虚拟筛查等方面发挥重大作用。关于“MHPC”分子动力学计算机的详细介绍请看本专辑的综述文章“蛋白质动态结构解析研究进展”。

合成生物学正在成为生物技术的“朝阳”领域。这方面最具代表性的是蛋白质从头设计与合成技术。以2024年度诺贝尔化学奖获得者、美国科学家David Baker为代表的研究者正在利用人工智能技术来创造具有特定结构和功能的蛋白质,甚至是生命世界从未有过的非天然蛋白质。这些研究不仅推动了我们对蛋白质结构和功能关系的深入理解,也为生物技术和药物设计带来了全新的机遇。蛋白质设施计划将其拥有的PDB数据库和计算能力进行提升改造,达到国际一流的蛋白质设计水平,同时与成立于2015年的康码(上海)生物科技有限公司合作,利用该公司具有国际领先水平的DNA-to-Protein蛋白质体外无细胞合成技术,在蛋白质设施搭建国际上第一个高通量的蛋白质智造设备,形成国际先进水平的蛋白质设计与智造技术平台,支撑我国的蛋白质科学研究和合成生物学的高速领先发展。关于“DNA-to-Protein蛋白质体外无细胞合成技术”的详细介绍请看本专辑的综述文章“无细胞蛋白质合成技术的发展:从实验室到工业制造”。

综上所述,蛋白质设施作为全球首个生命科学领域的综合性大科学装置,自2015年7月开放运行以来,十年来为广大科技人员提供蛋白质结构研究等各类科研技术服务,在推进我国生命科学,尤其是蛋白质结构研究做出了巨大的贡献。展望未来,蛋白质设施在继续做好为我国科技创新服务的同时将进一步加强为产业界的技术服务,并与拥有世界先进技术的企业联手发展具有自主知识产权的关键技术,进而在蛋白质动态结构研究和蛋白质智造领域打造世界级的研究高地。