AI驅(qū)動安全,10年前就曾經(jīng)是一個熱門話題;23年在LLM的推動下,又重新掀起了一番熱潮。 回望過往,國內(nèi)網(wǎng)安行業(yè)曾經(jīng)在AI技術(shù)上全球領(lǐng)先,而如今我們看到確實另一個景象,就如CrowdStrike憑借AI能力構(gòu)建的終端防御能力已經(jīng)全方位超越傳統(tǒng)安全技術(shù),彼此之間已經(jīng)是質(zhì)的差別。
當(dāng)前LLM的浪潮,對于安全企業(yè)是機會也是陷阱。抓住機會就能夠脫穎而出,掉入陷阱就不僅浪費了資源,也是浪費了時間。結(jié)合過往的經(jīng)歷以及當(dāng)下領(lǐng)先公司的現(xiàn)狀,發(fā)現(xiàn)有兩類問題是投入AI技術(shù)方向是最容易出問題的地方:
下面就以Crowdstrike為例展開談?wù)剬@兩個問題的理解。
即使不考慮當(dāng)前大火的LLM,AI在網(wǎng)絡(luò)安全中的應(yīng)用場景已經(jīng)非常廣泛,可以說在網(wǎng)絡(luò)安全中的任何一個環(huán)節(jié),都可以利用AI來嘗試解決問題。下圖就是整合不同廠商、安全機構(gòu)形成的一個比較全的全景圖畫:
也就是說AI在網(wǎng)絡(luò)安全中的應(yīng)用場景,至少可以達到數(shù)十種之多。 數(shù)目雖然眾多,但是每個場景本身的價值不同、場景中已有技術(shù)存在的問題不同、AI可以解決的問題的程度也是不同的,需要基于這三個因素來衡量哪些是值得優(yōu)先投入的。
于很多人的直覺相反,Crowdstrike選擇的關(guān)鍵場景不是EDR、而是AV,也就是一般說的惡意軟件防御。從當(dāng)前看到的公開資料,可以認為CrowdStrike在AI領(lǐng)域的絕大多數(shù)投資以及技術(shù)進展,均來自于惡意軟件防御領(lǐng)域。下面從三個因素出發(fā)看看它為何會做這樣的選擇:
CrowdStrike正是因為做好了基于AI模型的惡意軟件防御,才能在大客戶市場和微軟這樣捆綁銷售的高手較量并且勝出,同樣可以在中小客戶市場去替代Mcafee、賽門鐵克、趨勢等傳統(tǒng)AV市場的龍頭。
大方向的正確是成功的前提,但還遠遠不夠。對于CrowdStrike而言,如何在AI技術(shù)的驅(qū)動下,真正取得遠超傳統(tǒng)AV廠商的安全效果是一個更大的挑戰(zhàn)。網(wǎng)絡(luò)安全中對AI有一定了解的人都知道,使用AI的方法存在多種挑戰(zhàn)需要解決,誤報率、漏報率和可解釋性是其中最關(guān)鍵的部分。
漏報/誤報問題
從本質(zhì)上講,誤報和漏報是一體的,在沒有足夠多維度信息做充分條件判斷時,就需要在誤報和漏報中間尋找平衡點;另一個問題在于攻擊者往往會發(fā)明新的攻擊技戰(zhàn)術(shù)方法,客戶的業(yè)務(wù)環(huán)境也可能隨著數(shù)字化進展而不斷變化,這也會造成檢測能力上的挑戰(zhàn)。Crowdstrike使用了數(shù)種方法來應(yīng)對挑戰(zhàn):
Crowdstrike 通過靜態(tài)+行為+上下文方式引入更多的分析維度;通過必要的人工運營介入保障少量、高質(zhì)量的訓(xùn)練數(shù)據(jù);并且通過威脅狩獵等專家手段不斷發(fā)現(xiàn)模型的不足之處,使其在AI對抗惡意軟件方向上遙遙領(lǐng)先于其他廠商。其公司總結(jié)其經(jīng)驗稱——CrowdStrike的重點不只是精選數(shù)據(jù)及訓(xùn)練最佳模型,而是創(chuàng)建收集數(shù)據(jù)并生成高質(zhì)量模型的流程,并以自動化方式執(zhí)行此操作 。
可解釋性
可解釋性上Crowdstrike的做法曾經(jīng)被多次分析過,它融合了幾種不同的解釋方法,以滿足各種檢出情況、各種相關(guān)人員的需要:
通過整合這三種可解釋性信息,其NGAV在可解釋性上不但不弱于傳統(tǒng)基于規(guī)則的AV廠商,而是極大程度的超出了。
綜上,CrowdStrike的成功更多是其從系統(tǒng)的角度去看待AI技術(shù),而不是單獨依賴AI做一個功能模塊,也沒有將AI模型開發(fā)等同與傳統(tǒng)的軟件功能開發(fā)。它更重視通過多種技術(shù)的融合達到更好的安全效果,更注重整體能力運營流程的搭建以及自動化,而這些是很多廠商容易忽視的地方。
上面的認識都是基于傳統(tǒng)AI技術(shù)的應(yīng)用形成的,并不涉及LLM領(lǐng)域。在過去一年中,已經(jīng)看到LLM在很多ToB應(yīng)用上也取得了明顯的進展:
網(wǎng)絡(luò)安全中LLM注定也要發(fā)揮重要作用,但當(dāng)前的進展看似都還不明顯。也許2024年能夠看到更多。其中關(guān)鍵的場景會在哪里——代碼理解能力帶來的惡意腳本分析能力?交互形式改變帶來的培訓(xùn)、使用成本降低?亦或是數(shù)據(jù)總結(jié)/標(biāo)記能力帶來的更自動化的數(shù)據(jù)分類分級…….
但無論如何,它應(yīng)該是一個普遍場景下的關(guān)鍵難點,同時詳細在具體解決問題我們依賴的也不僅僅是大模型技術(shù)本身。讓后續(xù)的發(fā)展來驗證這兩個關(guān)鍵點是否還依然有效吧。
來源:ZenMind