近期,國(guó)防科技大學(xué)計(jì)算機(jī)學(xué)院在漏洞管理領(lǐng)域取得新進(jìn)展。團(tuán)隊(duì)面向企業(yè)和國(guó)家重點(diǎn)部門對(duì)高效漏洞管理的迫切需求,針對(duì)有限漏洞修復(fù)資源和不斷增加漏洞數(shù)量的突出矛盾,開展了漏洞優(yōu)先級(jí)技術(shù)研究,一項(xiàng)最新工作“基于指針網(wǎng)絡(luò)和深度強(qiáng)化學(xué)習(xí)的漏洞優(yōu)先級(jí)方法”被第13屆EAI數(shù)字取證與網(wǎng)絡(luò)犯罪國(guó)際會(huì)議ICDF2C 2022接收,該方法實(shí)現(xiàn)了對(duì)漏洞修復(fù)資源的優(yōu)化配置和實(shí)時(shí)推薦漏洞優(yōu)先級(jí)方案,突破了傳統(tǒng)優(yōu)化方法的性能瓶頸,能夠適應(yīng)大規(guī)模網(wǎng)絡(luò)和系統(tǒng)風(fēng)險(xiǎn)動(dòng)態(tài)變化。
ICDF2C是中國(guó)計(jì)算機(jī)學(xué)會(huì)推薦的網(wǎng)絡(luò)與信息安全C類國(guó)際會(huì)議。
題目
VPnet: A Vulnerability Prioritization Approach Using Pointer Network and Deep Reinforcement Learning
作者
Zhoushi Sheng, Bo Yu,Chen Liang, Yongyi Zhang
主要內(nèi)容
隨著信息技術(shù)蓬勃發(fā)展,互聯(lián)網(wǎng)資產(chǎn)數(shù)量與類型不斷豐富,與此同時(shí)網(wǎng)絡(luò)攻擊面不斷擴(kuò)展,漏洞數(shù)量爆發(fā)式增長(zhǎng),如何確定漏洞優(yōu)先級(jí)成為了高效漏洞管理的關(guān)鍵。然而傳統(tǒng)的漏洞管理主要依靠主觀的專家意見、靜態(tài)的漏洞嚴(yán)重性評(píng)分確定漏洞優(yōu)先級(jí),這樣的方式既缺乏聚焦真正的安全風(fēng)險(xiǎn),也缺少對(duì)有限漏洞修復(fù)資源的優(yōu)化配置,導(dǎo)致大量資源被消耗卻沒有帶來相應(yīng)的安全效益。如何在有限的修復(fù)資源條件下最大化降低系統(tǒng)整體風(fēng)險(xiǎn),并且適應(yīng)大規(guī)模場(chǎng)景和安全風(fēng)險(xiǎn)的動(dòng)態(tài)變化成為亟待解決的關(guān)鍵問題。
國(guó)防科技大學(xué)計(jì)算機(jī)學(xué)院的碩士研究生盛周石、梁晨、張永毅等人在國(guó)防科技大學(xué)研究員鐘求喜、副研究員喻波的聯(lián)合指導(dǎo)下,應(yīng)用人工智能技術(shù),提出了一種基于指針網(wǎng)絡(luò)和深度強(qiáng)化學(xué)習(xí)的漏洞優(yōu)先級(jí)方法–VPnet。如圖1所示,VPnet首先對(duì)目標(biāo)系統(tǒng)中的漏洞風(fēng)險(xiǎn)和修復(fù)成本進(jìn)行了量化估計(jì),并將這些特征轉(zhuǎn)化為標(biāo)準(zhǔn)的輸入矩陣,其中漏洞風(fēng)險(xiǎn)通過結(jié)合嚴(yán)重性、威脅、影響和資產(chǎn)重要性等因素進(jìn)行量化,修復(fù)成本則根據(jù)修復(fù)建議的難易程度對(duì)漏洞所需修復(fù)時(shí)間進(jìn)行估計(jì);然后設(shè)計(jì)了一種指針網(wǎng)絡(luò)作為漏洞優(yōu)先級(jí)方案的求解器,并提出了一種結(jié)合模仿學(xué)習(xí)與自主學(xué)習(xí)的深度強(qiáng)化學(xué)習(xí)算法來訓(xùn)練該網(wǎng)絡(luò)模型參數(shù)。與傳統(tǒng)優(yōu)化算法相比,VPnet將運(yùn)算負(fù)擔(dān)轉(zhuǎn)移到了線下的訓(xùn)練階段,而在應(yīng)用部署時(shí)能夠?qū)崿F(xiàn)實(shí)時(shí)推薦。
圖1 VPnet的系統(tǒng)架構(gòu)圖
指針網(wǎng)絡(luò)是VPnet的核心,其結(jié)構(gòu)如圖2所示,該網(wǎng)絡(luò)由編碼器和解碼器兩個(gè)子網(wǎng)絡(luò)組成:在編碼器網(wǎng)絡(luò)中,主要通過嵌入層和基于長(zhǎng)短記憶單元(LSTM)的循環(huán)神經(jīng)網(wǎng)絡(luò)對(duì)所有的漏洞信息進(jìn)行編碼;在解碼器網(wǎng)絡(luò)中,同樣采取循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行解碼,其關(guān)鍵是利用了指向機(jī)制依次優(yōu)先選擇漏洞進(jìn)行修復(fù),直到超出漏洞修復(fù)的總時(shí)間約束。指向機(jī)制在原理上是利用softmax函數(shù)計(jì)算出所有候選漏洞的概率分布,然后依概率選擇漏洞進(jìn)行修復(fù)。
圖2 指針網(wǎng)絡(luò)結(jié)構(gòu)圖
團(tuán)隊(duì)設(shè)置了不同規(guī)模的模擬場(chǎng)景和一個(gè)實(shí)際的測(cè)試場(chǎng)景對(duì)VPnet進(jìn)行測(cè)試,實(shí)驗(yàn)結(jié)果顯示,在不同規(guī)模的場(chǎng)景下,VPnet能夠在5秒鐘內(nèi)推薦出接近最優(yōu)的解決方案,與最優(yōu)結(jié)果的比率值均超過了95.8%;在一個(gè)實(shí)際的測(cè)試場(chǎng)景中,VPnet從候選的53個(gè)漏洞中推薦了9漏洞需優(yōu)先修補(bǔ),生成的方案相比于優(yōu)化前在降低總體風(fēng)險(xiǎn)方面提升了22.8%,且時(shí)間消耗僅需1.2秒。表明VPnet能夠?qū)崿F(xiàn)對(duì)漏洞修復(fù)資源的優(yōu)化配置,且能夠適應(yīng)不同規(guī)模場(chǎng)景和風(fēng)險(xiǎn)動(dòng)態(tài)變化的需求。
圖3 不同場(chǎng)景下模型的性能表現(xiàn)
表1 測(cè)試場(chǎng)景的關(guān)鍵指標(biāo)數(shù)據(jù)
來源:ipasslab