近日,国际超级计算大会SC21正式公布全球最新IO500榜单。附属瑞金医院转化医学大科学设施建设的大数据平台ASTRA,在代表全球顶尖数据存储性能的IO500全球榜单上,获得全球第八。据悉,该榜单上强手如林,包括了华为、intel、谷歌等国际大公司以及鹏城实验室、阿贡国家实验室、广州、长沙等国内外国家级超算中心巨头。
IO500 10-node 效能榜:https://io500.org/list/sc21/ten)
转化医学大科学设施是首次参评的医疗机构,该平台由瑞金医院同仁和intel工程师一起经过近半年的准备和技术反复优化,最终提交评测。
目前在AI和大数据向各行各业渗透,元宇宙概念方兴未艾的时代背景下,算力和存储性能是评价超算平台尤为重要的两个指标,如果说算力是车的话,存储就是路,好车需要有好路,而在生信领域组学数据容量巨大的环境下更是如此。
转化医学大科学设施研究员吕纲说,转化医学大科学设施的ASTRA平台是医学生信领域第一台能在存储性能上冲进全球榜单前十名的高性能生信大数据系统,从存储性能上打破了生信行业的天花板,随着高性能计算技术与医学研究的融合,高效的存储技术会对未来生信分析和AI技术在临床的应用带来重要的推动作用。
项目由瑞金医院国家转化医学中心生信大数据平台建设完成,此次研究团队成员包括生信大数据团队负责人方海、共同负责人吕纲以及徐敏、代雨婷、乔妞、郜晨序、桂团团、王学龙、包超慧等共同完成,由吕纲领衔完成项目实施,该项工作得到了国家转化中心主任陈赛娟院士的关键性指导,以及瑞金医院院领导的大力支持。
ASTRA平台
ASTRA平台隶属于转化医学国家重大科技基础设施(上海)生信大数据平台。转化医学国家重大科技基础设施(上海)是“十二五”期间国家重点规划的16项重大科技基础设施之一,于2013年7月经国家发展和改革委员会正式批准建设,是我国在生物医药领域第一家国家级大设施。上海交通大学和上海交通大学医学院附属瑞金医院为大设施两大建设主体。
生物标记物和新药研发平台是转化医学国家重大科技基础设施技术支撑系统的重要组成之一。其目标是建立致力于提供系统鉴定用于疾病早期诊断、预防、分子分型和指导个体化治疗的生物标记物的平台,并围绕临床实践建立系统筛选与验证干预疾病的药物靶点及研发新型靶向治疗方法的平台,为新型疾病诊疗研发开辟一条快捷的新途径。
生信大数据平台对生物标记物和新药研发提供“生信”及“计算”基础,包括生信分析、算力支撑、数据存储等,主要将围绕基因组测序、转录组测序、蛋白质组学、代谢组学、药物筛选等各种先进组学检测技术与平台,紧密结合各种患者生理生化指标,组织病理检查、器官影像检查、家族遗传背景、疾病历史诊疗信息等形成多维度的数据流,然后通过各种生物信息学手段进行原始数据的综合分析和挖掘,提供与疾病诊断和治疗相关的遗传和临床信息。待形成特征数据,再通过机器学习、深度学习和人工智能算法整合特征数据与临床诊疗的方案,从而形成真正意义上的精准分析、辅助诊断和个性化医疗。在运行过程中,对丰富的临床诊疗和组学科研数据进行有机存储,提供包括各种相关数据检索、统计分析、图形化呈现在内的大规模数据挖掘能力,支持转化医学的医疗、科研人员进行总结和探索性的科研工作。
生信大数据平台的关键性性能
在转化医学的背景下,生信大数据平台采取了定制化的高性能计算平台技术思路,为生信计算的“存”“传”“算”“用”四个方面(即:数据存储、数据传输、数据分析计算和数据的整合应用)量身定制。包括了围绕数据的全生命周期建立组学原始数据的高效存储和读出技术、数据存储跨广域网的数据传输技术、高效的并行计算体系和前沿的数据计算方法以及数据计算结合的跨组学整合、数据建模评估方法和形成对临床科研上的应用。为了适应转化医学中心对数据存储和数据分析多层次复合型的需求,大数据分析平台的架构需要具有适合大规模计算,数据挖掘,支持横向扩展和跨平台移植等特性。
生信大数据核心硬件平台主要包括液冷计算节点和融合计算节点,计算系统拥有高性能cascade lake计算核心超过4160核,双精度计算能力超900万亿次以及目前AI计算能力最强的服务器DGX-A100等GPU计算节点,AI计算能力超15Peta AI Flops,以及云服务器节点与多路胖节点等。系统采用200Gb HDR inifiniband高速核心计算网络。存储系统采用分层的高速分布式并行文件系统与超高速异步对象存储构成,存储容量为10PB,兼顾容量和性能,提供充足的数据存储资源和计算资源来支撑各种多组学研究计算需求,数据能与国内国际研究社区进行有效互联互通,有效整合;
生信大数据平台的支撑作用
5月20日,《自然》杂志在线发表了一篇来自上海市公共卫生临床中心与转化医学国家重大科技基础设施(上海)以及瑞金医院等单位合作研究的题为《与新冠临床结果相关的病毒和宿主因素》的论文,对上海市公共卫生临床中心在2020年1月20日-2月25日期间收治的326例患者,进行了病毒基因组、临床表现特点、免疫反应改变等数据的全面深度分析。揭示了新型冠状病毒性肺炎的分子流行病学和临床表现特征,尤其是发现了向重症转化的关键预警因子。这其中从1月27日收到第一例测序样本到完成基因组组装和临床数据分析、向国际数据库递交了112个病例的SARS-CoV-2基因组高质量序列数据,以及文章撰写提交等只用了短短45天时间,这其中2020年1月刚刚上线ASTRA平台提供了强劲的算力和存储支撑、可谓功不可没。
此外在新冠研究过程中建立了具有重要公共卫生安全意义的应用算法平台,对国家疾病防控研究有所助益。
该平台目前开设了对外服务,主要包含三类:
1、计算类服务:主要包括并行计算服务、虚拟化计算服务、数据存储、数据归档等;
2、组学通用分析服务:WES/WGS分析、RNAseq转录组分析、单细胞数据分析、病原微生物数据分析等;
3、大数据服务:数据采集、清洗、AI数据标注、AI建模、AI数据推理等;
4、组学深层解析:主要包括多组学数据二维聚类分析、多组学数据整合分析、潜在治疗靶点预测分析等。
IO500是高性能计算领域针对存储性能评测的全球排行榜,是高性能计算领域最权威的榜单之一。超算系统包括计算系统和存储系统。TOP500是针对计算系统算力性能排名,而IO500主要针对存储系统性能进行排名。自2017年11月开始,每年IO500榜单会在高性能计算领域的顶级会议——美国的Supercomputing Conference(SC,全球超级计算大会)和德国的International Supercomputing Conference(ISC,国际超级计算大会)大会上发布。自提出以来已经得到了包括大学、国家实验室在内的研究机构和商业公司的广泛公认。最新的榜单已与11月18日在2021年国际超算大会(SC21)公布。
IO500测试为了全面反应存储在各类不同工作状态中的性能,通过模拟应用需要的不同IO模型,来考察数据带宽(GIB/s)和元数据(KIOP/S)两个关键维度的性能表现,各项分数取几何平均后得到总分。与Top500榜单相对平稳的排名和趋势相比,IO500榜单的竞争显得异常激烈。IO500包括总榜单及10节点榜单两大类别。其中,10节点榜单统一了客户机的规模,也更接近于日常使用的状态,更能反映存储系统可为实际程序提供的I/O性能的效率,参考价值更高。
