ニュース詳細ニュース

すべての粒子衝突に対して行われる“スマート”な事象選択
-機械学習が、ATLAS実験とCMS実験のリアルタイム衝突フィルター(トリガー)を変革する-

(CERNのタイムリーなトピックスを厳選し、日本語訳でお届けいたします。)

LHCで次々と発生する膨大な粒子衝突事象に対処するには、超高速かつスマートな事象選別技術(ここでは、ハードウエアを使ったトリガー)の性能が鍵となる。高輝度LHC(HL-LHC)において、ATLASとCMS実験は2025年の全世界のインターネット通信量の25%に匹敵するデータ転送レートで、データ処理を行うと見込まれている。これらのデータ処理はすべてリアルタイムで行われ、複数段で構成されているイベント選別の初段に位置する。
LHCの4つの衝突点では毎秒数十億回の陽子・陽子衝突が起こる。発生するデータ量は極めて膨大で、すべてを保存することは不可能である。そこで、「トリガーシステム」と呼ばれる仕組みによって、データをリアルタイムでフィルタリング(選別)する必要がある。専用のアルゴリズムが、あらかじめ定義された特徴に基づいて、どの衝突事象(イベント)が物理的に興味深いかを推定し、約2万回に1回の割合で事象を読み出し、後の解析のために保存される仕組みになっている。
素粒子物理学の標準模型に潜むほころびや新現象の発見を目指して、LHC加速器を使ったCMS実験とATLAS実験の研究者たちは、より多くのデータをリアルタイムで活用できる、よりスマートで計算能力の高いトリガーシステムの開発を進めている。近年、AIや機械学習を基盤とする手法の導入によってトリガーの物理的な探索感度を向上させており、潜在的に興味深い事象と異常な事象を同定するための強力な新しいアプローチが切り拓かれている。
素粒子物理学者はかなり早い段階からニューラルネットワークを採用しており、1990年代からデータ解析に機械学習アルゴリズムを使用してきた。これまでは、主に検出器に残された粒子の痕跡(トラック)の同定や、背景事象を分類するための補助的なツールとして用いてきた。その効果として、データ解析の性能はLHCの稼働当時に想定していた水準を既に大幅に上回り、CMSやATLASは主要なプロセス(特にヒッグス粒子に関連するプロセス)を予想より遥かに早く観測できるようになった。
しかし、機械学習は単なる性能向上にとどまらず、未知の現象を発見するための全く新しいアプローチへの扉を開いている。その一例が「教師なし異常検出」である。この手法は、標準模型で予測される特定の粒子やプロセスをターゲットにするのではなく、データと理論の間のあらゆる種類の不一致を探索する。アルゴリズムはランダムに選ばれたLHC衝突データを使って学習され、検出器が観測する「標準的な」事象を習得する。これにより、物理学者はバイアスなく興味深い事象を抽出できるようになる。

「これは素粒子物理学にとって画期的な変化(ゲームチェンジャー)です。なぜなら、新しい現象がどのような姿をしているかをあらかじめ仮定することなく、LHCのデータ全体をくまなく探索できるようになるからです。」と、CMS実験のMaurizio Pierini氏は語る。「LHCが精密測定の時代へと移行し、新物理の兆候が潜んでいるかもしれない領域を徹底的に絞り込んでいくうえで、極めて重要なことです。」

しかしながら、この手法を最大限に活用するには、CMSやATLASのトリガーシステムによって事前に選択されたごく一部のデータに限定していては不十分である。真にバイアスのない異常検出を実現するには、トリガーレベルでアルゴリズムを適用する必要がある。これにより、解析段階に入る前に物理的に興味深い事象がトリガーによって除外されてしまうリスクを避けられる。しかし、これには大きな課題がある。トリガーシステムは新しい衝突が起こるたびに、すなわち毎秒4000万回(25ナノ秒ごとに1回)の頻度で判断を下さなければならない。これほどの超高速では、計算負荷の高い機械学習アルゴリズムを実行する時間はない。果たしてそうであったか?
2018年、CMSの研究者たちは、機械学習アルゴリズムをフィールド・プログラマブル・ゲート・アレイ(Field-Programmable Gate Arrays, FPGA)を制御するファームウェアに変換するオープンソースのツールを開発した。FPGAとは、イベント選択の第1段階である「レベル1トリガー」において、超高速な判断を行うためのカスタム制御電子回路である。その後、研究チームはアルゴリズムを圧縮し、性能を大幅に低下させることなくレベル1トリガーのハードウェアに実装する手法を開発した。
現在、ATLASとCMSではデータ収集の段階において、既にこのアプローチをレベル1トリガーに導入している。これにより研究者たちは、この新しいトリガー手法にもとづいたデータセットを初めて解析できるようになった。
「異常検出トリガーは、LHCの従来のトリガーとは大きく異なり、未知の発見に活用するには、全く新しいデータ解析手法を開発する必要があります。」と、ATLAS実験のDylan Rankin氏は語る。「ATLASとCMSで現在収集している最初のデータセットは、その具体的な方法を理解するうえで極めて重要です。また、そこから得られる知見は、将来のトリガー開発に向けたモデルや技術の向上にも不可欠です。」

一方、それぞれの実験グループ内でも、また“Next-Generation Triggers”プロジェクトの枠組み内でも、より高度なアプローチの開発が進んでいる。2024年1月にCERNの実験物理部門、理論物理部門、IT部門に加え、ATLASとCMSの共同研究として発足したこの5年計画のプロジェクトは、R&Dの中核を担っている。主に若手研究者によって推進されており、2030年に運転開始が予定されている高輝度LHCに向けた課題に取り組んでいる。主な目的は、飛躍的に増大するデータ量からより多くの物理情報を引き出すことであり、最も重要な衝突事象を効率的に選別しつつ背景事象(バックグラウンド)を排除することにある。
こうした技術革新は、実験の感度向上に不可欠であり、ひいては未知の現象を発見する可能性を高める鍵となる。そのために、最新のAI・機械学習手法をFPGAなどの専用ハードウェアと組み合わせ、さらに、機械学習モデルをトリガー電子回路へ直接実装するためのツールである“hls4ml”などを活用しつつ、理論面からのアプローチや、極めて稀な事象を研究するための解析ツールの改良も進めている。
これらの開発を一体化することで、高輝度LHCの極めて高いデータレートにおいても、革新的な可能性を秘めたシグナルを衝突の洪水の中に埋もれることなく、確実に捉えることを目指している。

関連リンク

CERN News Topic: Experiments(7 May, 2026): Smarter decisions at the speed of collisions (原文)