高能所計算中心成立于1974年,第一臺計算機是當時國內(nèi)最大的48位國產(chǎn)DJS-8(320)計算機。1984年開始建設北京正負電子對撞機(Beijing Electron-Positron Collider, BEPC)和北京譜儀(Beijing Spectrum),計算中心在國內(nèi)率先引進了當時國際先進的DEC VAX-11/780計算機,并在隨后的幾年連續(xù)進口了5臺更為先進的DEC VAX計算機并組成了計算機集群。北京譜儀于1994年升級為BESII,計算技術也從大型機(mainframe)發(fā)展到RISC工作站機群系統(tǒng),計算中心也應計算技術的變化,先后購買了12臺HP工作站,組成了BESII的數(shù)據(jù)處理和分析環(huán)境。90年代后期,由于PC機和百兆/千兆以太網(wǎng)絡技術的不斷發(fā)展,特別是開放源碼的Linux操作系統(tǒng)出現(xiàn),并在互聯(lián)網(wǎng)技術的催生下,發(fā)展速度異常迅猛,很快進入實用階段。計算中心于1998年開始研究和建設PC Farm,從每一個實驗一個PC Farm到逐漸整合,形成了一個中心的計算環(huán)境。
目前本中心的計算集群是國內(nèi)最大的高能物理數(shù)據(jù)平臺,包括登錄集群、計算集群、監(jiān)控報警系統(tǒng)、作業(yè)調(diào)度系統(tǒng)、分布式文件系統(tǒng)集群、磁帶管理系統(tǒng)、備份系統(tǒng)等核心組件,全部是在開源軟件和二次開發(fā)的基礎上建設和實現(xiàn)?,F(xiàn)在系統(tǒng)包括20000 個 X86 架構CPU核,100張NVidia GPU V100卡, 80GB/s訪問帶寬的數(shù)據(jù)處理能力,以及服務于集群計算的20PB的全局共享磁盤存儲,服務于數(shù)據(jù)長期保存的20PB的磁帶存儲空間,年完成作業(yè)量超過4000萬個,平均計算時間超過9800萬小時,系統(tǒng)資源使用率達90%以上。除了面向高能物理的高吞吐率(HTC)數(shù)據(jù)密集型計算模式以外,系統(tǒng)還可以支持以格點QCD,分波分析,加速器模擬為代表的高性能計算(HPC),以及AI模型訓練,內(nèi)存計算,志愿計算等多種計算和應用模式。為了便于國際的合作和資源的共享,高能所計算中心還是一個WLGC(Wide LHC Computing Grid)的二級站點。中心數(shù)據(jù)處理平臺支持北京正負對撞機實驗產(chǎn)生的數(shù)據(jù),中日(China-Japan)和中意(China-Italy)宇宙線實驗,中美(China-U.S)大亞灣中微子實驗,以及位于瑞士日內(nèi)瓦CERN的大型強子實驗等的數(shù)據(jù)處理與分析。中心還為山東大學、中國科技大學、蘭州大學、北京航空航天大學等國內(nèi)高能物理研究機構提供遠程運維服務。未來中心將通過分級作業(yè)調(diào)度、數(shù)據(jù)聯(lián)盟、邊緣計算等技術,將這些分布式的計算資源整合成一個統(tǒng)一的高能物理計算平臺,將計算服務覆蓋到整個中國高能物理研究領域,提高領域整體的資源利用水平和管理水平。同時,我們還將根據(jù)高能所的戰(zhàn)略規(guī)劃,把服務拓展到射線科學計算、空間天文數(shù)據(jù)處理等新興的大科學計算領域,把計算中心建設成為一個多學科共享的支持多樣化科學應用的數(shù)據(jù)處理平臺。