位于中國北京的高能物理研究所正在開拓量子計算和量子機器學習方面的創(chuàng)新方法,為其粒子物理研究開辟新的路徑。大川英希、李衛(wèi)東和曹俊對此進行了解讀。
*高能所高性能計算集群(上圖)是支持量子模擬器平臺QuIHEP的計算資源之一。
中國科學院下屬的高能物理研究所是中國最大的基礎科學實驗室。該實驗室主持著多個學科領域的研究計劃,涵蓋基本粒子物理、天體物理、以及規(guī)劃、設計和建設基于大型加速器的項目,包括2018年啟用的中國散裂中子源,以及預計于2025年投入運行的高能光源。
在過去的20年里,高能物理研究所的實驗基礎設施投資大幅增加。在這個背景下,對量子機器學習和量子計算技術的開發(fā)與應用有望推動高能所的研究項目,并在其中產(chǎn)生深遠影響。
大科學,量子解決方案
高能物理是“大科學”與“大數(shù)據(jù)”交叉的領域,探索新粒子和探究自然基本規(guī)律需要基于海量實驗數(shù)據(jù)。歐洲核子研究中心(CERN)的大型強子對撞機(LHC)在實驗運行期間產(chǎn)生的數(shù)據(jù)量達到了PB級(即10的15次方字節(jié)),所有這些數(shù)據(jù)必須依賴全球范圍內(nèi)聯(lián)網(wǎng)的分布式基礎設施,也就是格點計算,來進行處理和分析。
通過這種方式,LHC計算網(wǎng)格為數(shù)千名物理學家提供了接近實時的LHC數(shù)據(jù)訪問。這個復雜的計算網(wǎng)格對于2012年由CERN發(fā)布的希格斯玻色子重大發(fā)現(xiàn)以及其他進一步探索粒子物理標準模型的諸多進展至關重要。
然而,高能物理領域在存儲、分析和挖掘大數(shù)據(jù)方面即將迎來另一個轉(zhuǎn)折點。預計于2029年投入運行的高亮度大型強子對撞機(HL-LHC)將引發(fā)一場“計算危機”,因為該機器的積分亮度(與在給定時間內(nèi)發(fā)生的粒子碰撞數(shù)量成正比)將增加到LHC設計值的10倍,HL-LHC實驗產(chǎn)生的數(shù)據(jù)量也將相應增加。
在不遠的將來,我們將需要一個新的“計算基準”來應對HL-LHC激增的數(shù)據(jù)需求。這個基準將要求大規(guī)模采用圖形處理單元進行繁重的并行模擬、數(shù)據(jù)記錄和再處理任務,以及經(jīng)典機器學習的應用。與此同時,CERN也制定了中長期路線圖,通過歐洲核子研究中心量子技術倡議(QTI),將高能物理和量子技術社區(qū)聯(lián)系起來——也就是說CERN認為,隨著量子計算和量子網(wǎng)絡技術的應用,計算性能將再次迎來新的飛躍。
量子計算基礎
量子計算機,顧名思義,利用了量子力學的基本原理。經(jīng)典計算機依賴于二進制,每一位取值為0或1,與之類似,量子計算機利用量子比特,但它是0態(tài)和1態(tài)的疊加態(tài)。這種疊加態(tài),與量子糾纏(量子位之間的相關性)相結(jié)合,原則上使得量子計算機能夠比經(jīng)典計算機更快地執(zhí)行某些類型的計算,例如在量子化學和分子反應動力學等各個領域中應用的量子模擬。
盡管量子計算在科學和更廣泛經(jīng)濟領域的機會看起來引人注目,但仍處于早期的量子計算機卻面臨一個重要的工程難題,即它們對環(huán)境噪聲非常敏感。量子比特很容易受到干擾,例如可能會與地磁場、手機和WiFi網(wǎng)絡的雜散電磁場產(chǎn)生相互作用。與宇宙射線的相互作用、鄰近量子比特之間的干擾也可能帶來問題。
理想的解決方案是一種稱為錯誤糾正的策略,它涉及在多個量子比特之間存儲相同的信息。這樣當一個或多個量子比特受到噪聲影響時,系統(tǒng)能夠檢測并糾正這些錯誤。這些所謂的容錯量子計算機面臨的問題是它們需要大量的量子比特(數(shù)量達到百萬級),而這在當前小規(guī)模量子架構(gòu)中是不可能實現(xiàn)的。
與此相反,當今的“中等規(guī)模帶噪聲量子器件”(NISQ)計算機的設計者可以選擇接受噪聲效應,或者通過算法部分地修復錯誤,即在不增加量子比特數(shù)量的情況下進行錯誤抑制。已知有幾種算法能夠增強小規(guī)模量子計算機對噪聲的抵抗力,這意味著盡管當代量子計算機存在固有限制,但在特定高能物理應用中仍有可能看到“量子優(yōu)勢”。
高能所的一個研究方向聚焦于量子模擬,例如在格點量子色動力學(LQCD)中使用量子設備模擬量子系統(tǒng)時間演化。相關想法最初由理查德·費曼提出。標準模型描述了除了引力之外的所有基本粒子之間的基本相互作用,將電磁力、弱力和強力聯(lián)系在一起。這個模型包括兩組所謂的量子規(guī)范場理論:Glashow–Weinberg–Salam模型(提供了電磁力和弱力的統(tǒng)一描述),以及QCD(用于描述強力)。
通常情況下,量子規(guī)范場理論無法被解析求解,大多數(shù)實驗預測都來自于連續(xù)逼近的近似方法(也稱為微擾)。目前,高能所的科學家們正在研究在簡化條件下(例如,在降維的時空或利用有限群或其他代數(shù)方法)通過量子電路直接模擬規(guī)范場。這些方法與當前的NISQ計算機兼容,并為將來更完整地實現(xiàn)格點量子色動力學奠定基礎。
機器學習:量子實現(xiàn)
IHEP的另一個量子研究主題涉及量子機器學習。量子機器學習可以分為四種不同的研究路徑:CC、CQ、QC、QQ(其中C表示經(jīng)典;Q表示量子)。在每種情況下,第一個字母對應于數(shù)據(jù)類型,后面的字母對應于運行算法的計算機類型。例如,CC方案充分利用經(jīng)典數(shù)據(jù)和經(jīng)典計算機,盡管運行的是量子啟發(fā)算法。
*高能所的科學家認為,量子計算將有助于簡化HL-LHC等下一代粒子加速器的徑跡重建方法。上圖:大川英希(右)、鄒佳恒(站立)和黃曉忠(左)正在討論被稱為“中國第一臺實用量子計算機”的本源量子悟源計算機生成的重建粒子徑跡
然而,高能所追求的最有前景的應用案例涉及機器學習的CQ類別。在這類機器學習中,經(jīng)典數(shù)據(jù)在量子計算中被映射和訓練。這種做法的動機在于,通過充分利用龐大的希爾伯特空間、疊加和糾纏等量子力學的基本原理,量子計算機能夠更有效地從大規(guī)模數(shù)據(jù)集中學習,從而優(yōu)化所產(chǎn)生的機器學習方法。
為了探索量子優(yōu)勢的潛力,高能所的科學家目前正在使用量子機器學習來“重新發(fā)現(xiàn)”奇異粒子Zc(3900)。Zc(3900)是一種由夸克(質(zhì)子和中子的基本組成部分)組成的奇異亞原子粒子。它被認為是實驗觀察到的第一個四夸克態(tài),加深了我們對QCD的理解。該粒子于2013年由北京電子正負子對撞機(BEPCII)上的北京譜儀(BESIII)探測器發(fā)現(xiàn),同時也被日本KEK粒子物理實驗室的Belle實驗獨立觀測到。
*高能所的科學家們正在利用量子機器學習“重新發(fā)現(xiàn)”奇異粒子Zc(3900)。Zc(3900)于2013年由高能物理研究所北京正負電子對撞機的BESIII探測器(如上圖所示)發(fā)現(xiàn),它是實驗觀察到的第一個四夸克態(tài)亞原子粒子。
在這項研究中,研究團隊使用了所謂的量子支持向量機算法(經(jīng)典支持向量機算法的量子變種)。算法訓練所需的信號數(shù)據(jù)集使用Zc(3900)的模擬數(shù)據(jù)、本底數(shù)據(jù)集使用從BESIII真實數(shù)據(jù)中隨機挑選的事例。該團隊由高能所鄒佳恒領導,其中包括山東大學和濟南大學的同事。
通過量子機器學習的方法得到的結(jié)果與經(jīng)典機器學習得到的結(jié)果相比具有競爭力。需要特別說明的是,量子機器學習的研究過程中使用了更小的訓練數(shù)據(jù)集和更少的數(shù)據(jù)特征。為了展示量子計算方法得到的信號靈敏度更高,團隊正在進行更深入的研究。這項工作最終可能為未來實驗中發(fā)現(xiàn)新的奇異粒子指明方向。
QuIHEP量子模擬平臺
作為其雄心勃勃的量子研發(fā)計劃的延伸,高能所建立了QuIHEP量子計算模擬平臺,使科研人員和學生能夠開發(fā)和優(yōu)化用于高能物理研究的量子算法。
量子模擬器是經(jīng)典計算框架,試圖模擬量子計算機的行為。而量子模擬則利用實際的量子計算硬件來模擬量子系統(tǒng)的時間演化,比如高能物理研究所的格點量子色動力學研究。
QuIHEP提供了一個用戶友好且互動式的開發(fā)環(huán)境,利用現(xiàn)有的高性能計算集群可模擬多達約40個量子比特。該平臺提供了一個可用于用戶培訓和功能介紹的構(gòu)建界面(例如,直觀地演示了量子電路的構(gòu)建過程)。該開發(fā)環(huán)境基于Jupyter開源軟件,并集成了高能所的用戶驗證系統(tǒng)。
在不久的將來,QuIHEP將與中國境內(nèi)的分布式量子計算資源建立聯(lián)系,建立一個協(xié)調(diào)一致的研究基礎設施。其目標是支持產(chǎn)學研合作,推動量子科學與工程方面的培訓和應用研究。
附件下載: