伯克利实验室和SLAC的科学家正在利用NERSC和ESnet在光合作用研究方面取得突破
劳伦斯·伯克利国家实验室(伯克利实验室)和SLAC国家加速器实验室(SLAC)的研究人员进行的一系列实验为光合作用过程提供了新的线索。这项工作还说明了如何通过“光子科学高速公路”将光源和超级计算设施连接起来,作为大规模数据分析中新出现的挑战的解决方案。
去年,伯克利实验室和SLAC的研究人员在SLAC的直线ac相干光源(LCLS)领导了一项蛋白质晶体学实验,以观察光系统II的不同光激发状态,光系统II是在光合作用中起关键作用的大分子蛋白质的集合。随后,美国能源部(DOE)国家能源研究科学计算中心(NERSC)的超级计算机上的数据分析帮助解释了自然界在光合作用过程中是如何分裂水分子的,这一发现可能推动清洁、绿色和可再生能源的人工光合作用的发展。
伯克利实验室物理生物科学部门的化学家、该研究的负责人之一维塔尔·亚雅德拉(Vittal Yachandra)说:“基于太阳能的有效水分解方法对人工光合作用的成功至关重要,但开发这样的方法被证明是难以实现的。”“这项研究在实时描述光系统II中氧分子的形成方面取得了重大进展,并获得了一些信息,这些信息应该被证明对设计基于太阳能的人工水分离装置有用。”
研究结果发表在2014年7月9日的《自然通讯》上。
实时数据采集
该实验也是连接LCLS和NERSC的“光子科学高速公路”的早期示范。过去,光源用户必须前往LCLS和伯克利实验室的高级光源(ALS)等设施进行实验。然后,他们将原始数据下载到一个外部硬盘驱动器,并将这些信息带回家,在他们的个人电脑上进行处理和分析。然而,在这种情况下,研究人员通过能源部的能源科学网络(ESnet)看到他们的数据实时到达NERSC。
在5天的时间内(2013年2月28日至3月3日)共收集了114 tb的数据;在每天12小时的实验运行中,数据以每秒7.5千兆的速度通过ESnet传输,这使NERSC的数据处理团队能够确定每晚的数据与前一天的数据相比有多好。伯克利实验室物理生物科学部门的计算科学家、该研究的数据处理负责人尼古拉斯·绍特解释说,SLAC的科学家可以在需要的时候修改第二天的实验。
“出了门,高速公路的方法大大提高了研究人员的效率。更重要的是,它在建立在先进计算基础上的束线科学中建立了新的研究议程,”NERSC的战略合作伙伴关系负责人和《自然通信》研究的合著者David Skinner说。“我们看到了通过ESnet连接这些功能的光明前景。
Sauter说,数据收集和分析的速度使研究团队能够研究光合作用过程的时间进程,这是获得光合作用如何工作以及如何用人造材料复制光合作用的新见解的关键一步。
他说:“我们正试图了解一种化学反应,它负责产生我们大气中的大部分氧气。”“从长远来看,如果我们了解绿叶将阳光转化为能量的方式,就可以帮助我们制造更好的材料,进行人工光合作用。只有通过研究反应是如何随着时间推移发生的,才能了解其化学机理。我们必须使用NERSC来快速处理所有这些数据,以回答哪些样本是好的问题。”
新的软件工具
由于数据的独特性质和收集速度,Sauter和Paul Adams(也是实验室的物理生物科学部门的成员)不得不开发新的软件——cctbx。xfel是实验室计算晶体学工具箱的一个子集,用于处理数据。
“cctbx的独特之处在于。xfel是我们应用了一些特殊的程序来纠正系统误差,这些误差是由我们在x射线自由电子源(如LCLS)上测量x射线衍射数据的方式造成的,”Sauter说。“因此,我们比其他不包含这些程序的软件获得了更好的信噪比。”
ESnet科学参与小组的网络工程师Eli Dart说,实验成功的另一个关键因素是ESnet为SLAC的管道增加了额外的容量,以支持工作流程。
Dart说:“就直接实验耦合而言,这是ESnet促成的最大的实时数据传输之一。”“LCLS实验的占空比非常紧;他们会获取数据,推送数据,分析数据,然后在第二天的设置中使用分析结果。”
在2014年7月在LCLS进行的后续实验中,研究人员增加了另一个转折:SPOT套件,这是伯克利实验室开发的一套软件工具,让科学家在使用ALS和LCLS等仪器时,可以访问自动数据管理、数据分析和模拟工具。
伯克利实验室软件系统组和SPOT套件实验室指导研究与开发(LDRD)项目的负责人克雷格·图尔说:“这些波束线上的科学家正在进行的实验涉及大量方面、组件、探测器、专业知识和科学类型。”SPOT Suite所做的是将科学家或他们的博士后通常需要反复手工完成的工作进行自动化,使他们能够专注于科学,启动并运行他们的实验。”
Tull说,在最近的LCLS实验中使用SPOT套件就做到了这一点。
他说:“他们第一次看到这一特殊作业的晶体学数据是来自SPOT套件。”“当他们在设置实验时,它是在后台工作的,所以每次有数据传输,数据就会出现一张图片。一旦一切就绪,他们就可以打开电脑屏幕,你瞧,结果就出来了,否则他们还得再花一两个小时分析数据才能得到。”
扩大高速公路
所有这些都预示着建立光子科学高速公路的好兆头,该高速公路将连接像LCLS和ALS这样的光束线和像nersc这样的超级计算中心——随着这些设施的实验产生的数据集越来越大,这种情况将变得越来越关键。
Dart说:“这是一种新型实验工作流程的先行者之一,它得益于将高性能计算设备连接到光源光束线上。”“这为我们提供了一个世界,在那里从事光和中子源的人不必部署超级计算机来进行下一代实验所必需的分析。光束科学家不需要成为高性能计算专家,就可以充分利用光源的潜力。”
建立一个光子科学高速公路可以把这些早期的例子推向光源的新操作模式。斯金纳说:“一些非常令人兴奋的探测器正在推动光源数据速率冲破屋顶。”“SLAC和NERSC认识到,当我们提高科学家从数据中提取知识的速度限制时,这些仪器对科学发现的价值就会增加。”
欲了解更多信息,请访问www.lbl.gov.
了下:M2M(机对机)

