????近日,中國科學院高能物理研究所大川英希研究員團隊,與美國加州大學爾灣分校Daniel Whiteson教授、Pierre Baldi教授團隊和美國華盛頓大學徐士杰教授團隊合作,成功開發(fā)了新型機器學習算法,該算法顯著提升了在對撞機上測量頂夸克質(zhì)量的精度,尋找希格斯和新粒子的靈敏度。相關(guān)論文“Reconstruction of unstable heavy particles using deep symmetry-preserving attention networks”已于2024年4月30日發(fā)表在Nature Communications Physics雜志上(Commun Phys 7, 139 (2024))。
????在高能對撞機實驗中,重建重粒子(如頂夸克、希格斯粒子、W/Z玻色子等)的關(guān)鍵在于測量它們的衰變產(chǎn)物,如夸克會衰變或強子化形成一簇粒子,從而在探測器中形成噴注,而噴注的起源往往難以判斷。傳統(tǒng)的算法需要考慮末態(tài)粒子所有可能的排列組合及其系統(tǒng)誤差,隨著對撞機的能量、亮度的提升,噴注數(shù)量增加,可能的排列組合數(shù)量會呈指數(shù)級增長,這使得將信號來源正確分配給各個粒子成為一項重要的挑戰(zhàn)。
????為了解決這一問題,研究人員開發(fā)了一種被稱為“保持對稱性的注意力機制”(Symmetry Preserving Attention NETwork,簡稱SPA-NET)的機器學習算法。注意力機制是Transformer架構(gòu)的基礎(chǔ),以用于Chat-GPT而聞名。與常規(guī)注意力機制不同,這種算法除具備置換不變性外還能夠有效保持如兩體或三體衰變過程的對稱性。此外,這種算法的新功能還能處理各種類型的物理對象(如輕子、噴注、丟失的橫向動量),得益于Transformer架構(gòu)其能同時進行回歸分析和事件分類,提高了處理效率和準確性。
????利用該算法,研究人員在LHC的三個旗艦分析(尋找ttH(bb),頂夸克質(zhì)量測量,尋找假想重粒子Z’)中用簡化探測器模擬(Delphes)數(shù)據(jù)進行了測試。在LHC Run 2(3)數(shù)據(jù)統(tǒng)計中,SPA-NET的ttH和Z’信號靈敏度預(yù)計能達到3(5)σ,這是傳統(tǒng)方法無法比擬的。此外,在LHC Run 2數(shù)據(jù)統(tǒng)計中,使用該算法測量得到的頂夸克質(zhì)量的精度與傳統(tǒng)方法相比提高了15%。這些數(shù)據(jù)表明,相較于傳統(tǒng)方法和其它機器學習方法,SPA-NET顯著提高了測量精度和對新物理的靈敏度,是目前最高效、表現(xiàn)最好的多對象事件選擇方法。
????這種新的機器學習算法有望在更多的物理分析中應(yīng)用,為LHC和未來的對撞機物理研究提供創(chuàng)新方法。
圖1:保持對稱性的擴展注意力機制(SPA-NET)的架構(gòu)示意圖
圖2:區(qū)分ttH信號和本底事例的特征曲線(ROC curve)。
附件下載: