“青年科技工作者園地”舉行第161次活動(dòng)
時(shí)間:2024年9月24日(本周二) 下午 2:30
地點(diǎn):二樓會(huì)議室(東莞同事和同學(xué)通過(guò)視頻)
主持人:張正德老師
ZOOM會(huì)議信息:83936709104/422157
報(bào)告人:苑新陽(yáng)
報(bào)告題目:基于大語(yǔ)言模型的開(kāi)源威脅情報(bào)獲取
報(bào)告簡(jiǎn)介:網(wǎng)絡(luò)安全威脅情報(bào)獲取是開(kāi)展安全防御工作中的關(guān)鍵任務(wù)。最近,大語(yǔ)言模型技術(shù)的進(jìn)步展現(xiàn)了其在自然語(yǔ)言處理和理解上的強(qiáng)大能力,同時(shí)也為威脅情報(bào)的獲取提供了一種新的思路。本報(bào)告提出了一種基于LLMs的威脅情報(bào)獲取方法,無(wú)需人工掃描工具或查詢相關(guān)的網(wǎng)站和平臺(tái)就能夠基于用戶需求自主獲取威脅情報(bào),節(jié)省了大量的時(shí)間和人力成本。進(jìn)一步的,為了解決大語(yǔ)言模型在處理威脅情報(bào)時(shí)存在的知識(shí)局限性和時(shí)效性障礙,我們結(jié)合思維鏈技術(shù)提出了一種框架,幫助大語(yǔ)言模型使用工具來(lái)獲取OSINT?;谏鲜隹蚣?,我們構(gòu)建了一個(gè)用于獲取開(kāi)源情報(bào)的Agent,它能夠?qū)⑦壿嬐评韱?wèn)題分解為多個(gè)步驟,并使用工具逐步解決。同時(shí),我們還開(kāi)發(fā)了供Agent動(dòng)態(tài)調(diào)用以解決問(wèn)題的工具箱。為了驗(yàn)證該框架的有效性,我們?cè)O(shè)計(jì)了一組測(cè)試數(shù)據(jù)集,并通過(guò)四個(gè)評(píng)估指標(biāo)測(cè)試Agent的性能。實(shí)驗(yàn)結(jié)果表明Agent在獲取OSINT時(shí)均取得了較高的準(zhǔn)確率,且在特定情報(bào)獲取問(wèn)題上的準(zhǔn)確率相比與其對(duì)應(yīng)的基座大語(yǔ)言模型取得了大幅度提升。
報(bào)告人:劉媛媛
報(bào)告題目:基于微調(diào)大模型的BESIII文獻(xiàn)知識(shí)抽取方法研究
報(bào)告簡(jiǎn)介:大型通用磁譜儀BESIII是高能物理領(lǐng)域的粒子物理大科學(xué)裝置,是世界上最先進(jìn)的研究粲物理的設(shè)施。研究賽博士科研智能體智能化完成BESIII實(shí)驗(yàn)相關(guān)的物理分析任務(wù)的過(guò)程中,還需重點(diǎn)解決大語(yǔ)言模型缺少BESIII實(shí)驗(yàn)知識(shí)而存在的幻覺(jué)現(xiàn)象。知識(shí)圖譜的事實(shí)性、時(shí)效性和邏輯嚴(yán)謹(jǐn)性使其成為大語(yǔ)言模型的絕佳能力補(bǔ)充。
此報(bào)告主要分享基于BESIII文獻(xiàn)進(jìn)行知識(shí)抽取構(gòu)建知識(shí)圖譜的方法。通過(guò)對(duì)BESIII文獻(xiàn)知識(shí)圖譜的知識(shí)建模,定義數(shù)據(jù)的關(guān)系框架;基于高能物理領(lǐng)域的高能·溪悟大語(yǔ)言模型進(jìn)行二次預(yù)訓(xùn)練和微調(diào),得到BESIII知識(shí)抽取大模型;針對(duì)不同的文檔內(nèi)容,兩階段完成知識(shí)抽取任務(wù),最后設(shè)計(jì)提示策略和自我增強(qiáng)階段,指導(dǎo)BESIII知識(shí)抽取大模型更有效地完成知識(shí)抽取任務(wù)。
知識(shí)抽取是構(gòu)建知識(shí)圖譜中的一大核心環(huán)節(jié),本方法能顯著提升知識(shí)抽取的高效性和準(zhǔn)確性,有利于加速知識(shí)圖譜構(gòu)建流程的持續(xù)迭代演進(jìn)。最終,將BESIII實(shí)驗(yàn)知識(shí)圖譜應(yīng)用至賽博士科研智能體,有望提升其物理分析邏輯推理能力和自我反思減少幻覺(jué)能力,從知識(shí)中發(fā)現(xiàn)規(guī)律,產(chǎn)生新認(rèn)知,加速科學(xué)發(fā)現(xiàn)。
附件下載: