在大型强子对撞机(LHC)上,面对海量碰撞事件,快速明智决策至关重要。高亮度LHC(HiLumi LHC)上,ATLAS和CMS实验预计处理探测器数据速度达2025年全球互联网流量约四分之一,且需在事件选择第一阶段实时完成。
LHC的四个碰撞点每秒有数十亿质子相互碰撞,产生海量无法全部存储的数据,需“触发系统”实时筛选。专用算法依预定义特征估计碰撞事件研究价值,每20000个事件中读取存储约一个供进一步分析。
为探寻粒子物理标准模型漏洞或发现全新物理现象,LHC的CMS和ATLAS实验研究人员正为探测器构建更智能、计算能力更强的触发系统,以实时处理更多数据。近期,基于人工智能和机器学习的解决方案用于提升触发系统物理探测能力,为识别潜在有趣或异常事件开辟新途径。
粒子物理学家很早就采用神经网络,自20世纪90年代起用机器学习算法进行数据分析,主要用于识别探测器中粒子痕迹、分类潜在物理过程,显著提升数据分析性能,使CMS和ATLAS探测器能更早测量关键过程,尤其是与希格斯玻色子相关过程。
机器学习不仅提升性能,还为发现未知现象开辟新途径,无监督异常检测就是例子。该技术不针对特定粒子或过程,而是寻找数据与理论差异,通过随机选择LHC碰撞数据训练,对“标准”事件编码,使物理学家无偏筛选潜在有趣事件。CMS的毛里齐奥·皮耶里尼称这对粒子物理学是颠覆性突破,在LHC精确计算时代至关重要。
不过,要充分利用该技术,需在触发层级应用算法,避免触发算法提前移除潜在重要事件,但这带来巨大挑战,因触发系统每秒要决策4000万次,即每25纳秒一次,没时间运行计算密集型机器学习算法。
2018年,CMS研究人员开发开源工具,将机器学习算法翻译成控制现场可编程门阵列(FPGA)的语言,FPGA用于一级触发超快速决策。随后团队开发“压缩”算法策略,适配一级触发电子设备且不显著降低性能。ATLAS和CMS实验已在一级触发阶段采用此方法,研究人员首次能分析基于新型触发方法的数据集。
ATLAS的Dylan Rankin表示,异常检测触发器与传统触发器不同,利用其潜在发现需开发全新数据分析技术,首批数据集对理解和改进未来触发器开发模型技术至关重要。
与此同时,更先进方法正在研发,包括实验本身和下一代触发器项目。该项目2024年1月启动,由欧洲核子研究中心(CERN)多部门与ATLAS和CMS实验合作开展,为期五年,主要由青年研究人员推动,旨在应对未来高亮度LHC挑战,LHC计划2030年运行。项目主要目标是从大幅增长数据量中提取更多物理信息,提高实验灵敏度,增加发现未知现象可能性。为此,将现代人工智能和机器学习技术与FPGA等专用硬件结合,借助hls4ml等工具将机器学习模型直接部署到触发电子设备,同时改进理论指导和分析工具研究罕见事件。
这些进展旨在确保即便在高亮度LHC极端数据速率下,也能识别潜在革命性信号,避免其被大量碰撞淹没。