热点关注:  
放射性同位素 粒子加速器 辐照杀菌 无损检测 高新核材 辐射成像 放射诊疗 辐射育种 食品辐照保鲜 废水辐照 X射线 中广核技 中国同辐

国际大科学计划和大科学工程介绍系列—大型强子对撞机(LHC)(3)信息基础设施

2021-08-08 18:10     来源:中国科技云     国际大科学计划LHC
欧洲核子研究中心的大型强子对撞机(LHC-Large Hadron Collider)作为最庞大的国际大科学工程之一。本文将从工程简介、我国参与情况以及信息基础设施等方面进行初略介绍。
 
三、信息基础设施

1. 总体介绍

欧洲核子研究中心(CERN)是研究界对计算环境要求最高的组织之一。万维网最初是在CERN构思和开发的,以满足世界各地大学和研究所的科学家之间自动分享信息的需求。从软件开发到数据处理和存储、网络、支持LHC和非LHC实验计划、自动化和控制,以及为加速器综合体和整个实验室及其用户提供服务,计算是CERN基础设施的核心所在。


第一个网站的重建页面截图
 
其中,全球大型强子对撞机计算网格(WLCG),一个分层排列的分布式计算基础设施,为成千上万的物理学家社区提供了近乎实时的LHC数据访问。CERN数据中心是WLCG的核心,是LHC的实验数据与网格之间的第一个接触点。通过CERN openlab这一独特的公私合作项目,CERN与领先的信息通信技术(ICT)公司和其他研究机构合作,加速为研究界开发尖端的ICT解决方案。

CERN数据中心

CERN数据中心是CERN整个科学、行政和计算基础设施的核心。所有服务,包括电子邮件、科学数据管理和视频会议都需要使用这里的设备。

23万个处理器核心和15000台服务器全天候运行。数据中心90%以上的计算资源是通过基于提供大规模可扩展云操作系统的开源项目OpenStack的私有云提供的。
 
 

国际高能物理网格(WLCG)
 
WLCG的任务是为LHC产生的数据的存储、分发和分析提供全球计算资源。

WLCG结合了来自42个国家170多个站点的约90万个计算机核心的计算资源,形成了一个巨大的分布式计算基础设施,为全世界12000多名物理学家提供了近乎实时的LHC数据访问,并提供了处理数据的能力。

它每天运行超过200万个任务,在LHC第二期运行结束时,全球传输率经常超过60GB/s。

随着时间的推移,以及世界各地的计算资源和新技术越来越多,这些数字将会增加。

欧洲核子研究中心(CERN)提供了WLCG大约20%的资源。


WLCG全球站点分布及实时运行状态

存储

LHC中产生的粒子往往以复杂的方式衰变为更多的粒子。电子电路将每个粒子通过探测器的情况记录为一系列电子信号,并将数据发送到CERN数据中心进行数字重建。数字化的摘要被记录为一个 "碰撞事件"。在LHC实验的探测器内,每秒钟可发生多达约10亿次粒子碰撞。要读出所有这些事件是不可能的。因此,一个 "触发器 "系统被用来过滤数据,并选择那些研究人员有可能感兴趣的事件进行进一步分析。

即使在实验进行了大幅度的数据削减之后,CERN的数据中心平均每天处理1PB(100万GB)的数据。LHC实验每年产生约90PB的数据,CERN其他(非LHC)实验的数据每年还产生25PB的数据。归档大量的数据是CERN的一项重要职能。磁带被用作主要的长期存储介质,档案中的数据被不断迁移到更新的技术、更高密度的磁带上。

CERN的存储系统EOS是为极端的LHC计算要求而创建的。CERN的EOS存储了超过30亿个文件(截至2019年),与LHC机器和实验的特殊性能相匹配。EOS目前正在扩展,以满足高能物理学以外的其他数据存储需求,澳大利亚学术和研究网络(AARNET)和欧盟数字地球和参考数据联合研究中心在其大数据系统中均采用了EOS。
 
 

网络挑战
 
内部和外部网络通信对CERN至关重要。在内部,超过50000公里的光纤为整个CERN站点提供网络连接。CERN数据中心也是CERN互联网交换点(CIXP)的所在地,这是一个运营商的中立交换点,通过它,CERN在互联网发展中发挥了核心作用。1991年,欧洲80%的互联网国际流量容量都安装在CERN数据中心。

WLCG最令人印象深刻的组成部分之一是其网络和连接。由于在CERN建立了良好的连接和专用的网络基础设施,它可以将数据分配到全球数百个合作机构。自第二个长达四年的LHC运行期开始,全球的数据传输率也达到了新的峰值,约每秒60千兆字节的速率,比LHC运行1期间的速率高出约三倍。
为开放科学提供的开放资源
自1994年在开源模式下发布万维网以来,CERN一直是开源领域的先锋,支持开源硬件(通过CERN开放硬件许可证)、开放存取(通过粒子物理开放存取出版联盟 - SCOAP³)和开放数据(通过LHC实验的开放数据门户)。


CERN的开放数据门户网站是其开放存取和开放数据政策的见证。该门户网站允许LHC实验分享他们的数据,重点是:为科学界,包括CERN实验团队以外的研究人员以及公民科学家,提供用于培训和教育目的资源。第一篇基于CERN开放数据门户数据的论文已经发表。

CERN的一些技术在开发时考虑到了开放存取。Invenio是一个开源的图书馆管理包,现在国际受益于合作机构的贡献,通常用于数字化图书馆。Indico是一个基于Invenio的会议包,是CERN开发的另一个开源工具,被全世界200多个网站使用,包括联合国。高能物理信息系统INSPIRE是CERN与DESY、Fermilab和SLAC共同开发的另一个开源软件。

CERN在欧盟委员会的共同资助下,还投资了Zenodo,这是一个用于存储数据、软件和其他研究工具的免费存储库。它旨在供高能物理学界以外的人使用,并利用CERN在分享和保存科学知识方面的长期传统和经验,使所有人受益。Zenodo由CERN托管,为更广泛的科学界提供了在非商业环境中存储其数据的选择,并将数据免费提供给整个社会。


数据保存
 
作为一个拥有60多年历史的组织,CERN创造了许多不同类型的大量数据。这不仅涉及科学数据,截至2019年初,从前至今高能物理实验的数据约为330PB(3.3亿GB),还涉及许多其他类型的数据,包括照片、视频、会议记录、备忘录、网页等。因此,CERN面临着保存其数字化记忆的挑战。数据格式和访问工具不断变化,需要不断努力解决这个问题,而许多与保存LHC和其他实验数据有关的工具也适用于其他类型的数据。CERN一直处于最前沿,并作为创始成员参加了DPHEP(高能物理中的数据保存)合作。


 
CERN openlab

CERN openlab是一个独特的公私合作项目,致力于为全球LHC社区和更广泛的科学研究加速开发尖端的ICT解决方案。通过CERN openlab,CERN与领先的ICT公司和研究机构合作。

应用此框架,CERN为各组织,甚至世界各地的合作机构,提供了其复杂的ICT基础设施使用和工程经验分享的机会。在CERN高标准的环境中进行测试,为ICT行业的合作者提供了关于其产品的宝贵反馈,同时也使CERN能够在新技术的早期发展阶段评估其优点,以便未来使用。这个框架还为与多家公司开展先进的研究和开发活动提供了一个中立的场所。

2017年CERNopenlab发表了一份白皮书,确定了CERN和其他"大科学 "项目在未来几年面临的主要ICT挑战,以便与行业和研究机构合作解决这些问题。

它在2018年初开始了第六个为期三年的阶段。

志愿计算

人们可以通过加入LHC@home,加速LHC的研究。

LHC@Home是一个志愿计算平台,人们可以捐出自己电脑上的闲置时间,帮助物理学家将理论与实验进行比较,寻找新的基本粒子和关于宇宙的问题的答案。

志愿者计算是一种成熟的公民科学形式,人们在自己的笔记本电脑或台式机上下载科学软件并运行模拟,其方式不会干扰计算机的正常运行。


 
网络中立性

网络中立性是指互联网服务提供商应向每个人提供相同的服务的原则。这是一个非常类似于开放存取活动的民主原则,允许每个人平等地访问在线资源。

高能物理研究是高度合作的,开放科学涉及到公开分享科学成果、软件和必要的数据,这样在更广泛的科学界和整个社会中,知识可以很容易传播,新的想法可以蓬勃发展。在这方面,互联网的可用性和开放性是至关重要的。

为了有效地进行基础科学研究和履行其使命,CERN一直非常重视网络中立性,以确保其全球用户群体中的每一个成员都能平等地获取科学数据。

CERN主张,其所有用户和整个科学界对科学数据的访问应完全由科学过程决定,而不是由外部参与者决定。第三方不应:
1.改变正在传输的数据。
2.监测传输的数据类型或内容,但传输本身的技术方面除外。
3.根据对数据类型、来源地或目的地的了解,对传输进行限制。

参考文献:
https://home.cern/science/computing
https://lhcathome.web.cern.ch/
推荐阅读

大型强子对撞机(LHC)成功安装CMS像素跟踪器

经过两年多的维护和升级,像素跟踪器已经安装在大型强子对撞机(LHC)的紧凑介子线圈(CMS)探测器的中心,现在已经准备好进行调试。在所有CMS子探测器中,像素追踪器是最接近相互作用点(IP)的,即质子束之间的碰撞点。 2021-08-12

国际大科学计划和大科学工程介绍系列—大型强子对撞机(LHC)(6)信息基础设施

欧洲核子研究中心的大型强子对撞机(LHC-Large Hadron Collider)作为最庞大的国际大科学工程之一。本文将从工程简介、我国参与情况以及信息基础设施等方面进行初略介绍。 2021-08-11

物理学院朱世琳教授课题组曾预言的双粲奇特强子被LHCb实验发现

近日,欧洲核子研究中心大型强子对撞机底夸克探测器(LHCb)探测到四夸克态TCC+,从而证实了物理学院朱世琳教授与合作者2012年预言的由DD*介子构成的双粲奇特强子态。 2021-08-11

物理学家为大型强子对撞机的 CMS 实验安装新金刚石传感器

紧凑型μ子电磁阀(CMS)是大型强子对撞机(LHC)的大型通用粒子探测器之一,背景辐射监测系统和碰撞光束参数已更改。光束状态监测器泄漏 (BCML) 系统是保护 CMS 独立单元和单元电子设备免受关键辐射损坏所需的系统中最重要的部分之一。 2021-08-10

国际大科学计划和大科学工程介绍系列—大型强子对撞机(LHC)(5)信息基础设施

欧洲核子研究中心的大型强子对撞机(LHC-Large Hadron Collider)作为最庞大的国际大科学工程之一。本文将从工程简介、我国参与情况以及信息基础设施等方面进行初略介绍。 2021-08-10

阅读排行榜