
美國AI頭部公司Anthropic日前宣布一項看似矛盾的決定,他們訓練出一款名為「神話」(Claude Mythos Preview)的前沿模型,其能力在軟體工程與網路安全領域已大幅超越頂尖人類的水平,但選擇不向公眾開放。取而代之的,是他們聯手亞馬遜、蘋果、谷歌、微軟、輝達、博通、思科、摩根大通、Linux基金會以及帕羅奧圖網路(Palo Alto Networks)等十二家機構,啟動「玻璃翼計畫」(Project Glasswing),讓這些同業在嚴格沙盒環境中使用該模型,專注掃描並修補全球關鍵軟體的漏洞。Anthropic還額外提供約四十家維護關鍵基礎設施的組織使用權限,並承諾投入高達1億美元的模型額度與400萬美元直接捐款給開放原始碼安全團體。
這個不向公眾開放的決定,並非模型不夠完熟,真實情況是,Anthropic在內部測試中發現,神話模型可以在不需人類深度引導情況下,自主挖掘出數千個在此之前從沒被發現的高嚴重度零日漏洞(zero-day vulnerabilities),涵蓋每一個主流作業系統和網頁瀏覽器,以及大量其他關鍵軟體。其中許多漏洞已潛伏十到二十七年之久,經歷過數百萬次人類與自動化測試,卻始終未被察覺。
官方列舉包括一個存在二十七年的OpenBSD SACK實作漏洞,可讓攻擊者僅透過網路連線就能在遠端癱瘓系統,另一個十六年歷史的FFmpeg H.264編解碼器漏洞,過去自動測試工具執行500萬次仍未發現,此外還有FreeBSD NFS伺服器與Linux核心的多個記憶體損壞漏洞,以及能串聯多個小漏洞達成瀏覽器沙盒逃脫(browser sandbox escape)的複雜攻擊鏈。Anthropic坦承,超過99%的這些漏洞,在發現當時仍無任何補救措施可供修復。
較令人驚訝的,是這款模型的「能力下放」效應。Anthropic官方文件指出,即便是未接受正式安全訓練的普通工程師,也能在一夜之間利用神話模型找出遠端程式碼執行漏洞,且在隔天獲得完整、可運作的攻擊方案。這意味著,原本只有極少數頂尖駭客才能掌握的複雜攻擊能力,現正被AI快速破解。過去,軟體漏洞之所以未釀成大禍,是因為發現難度極高,如今,AI不僅能大幅加速發現,還能自動生成利用程式碼,讓攻擊門檻急劇降低。
玻璃翼計畫的設計,正是為了在這波能力擴散前,為防禦方爭取時間。十二家啟動夥伴將在接下來九十天內分享首批掃描成果,後續數月乃至數年持續協作。Anthropic強調,這不是單一公司的公關秀,而是產業集體意識到,光靠自律已不足以應付之後的務實回應。當然,矽谷之中也有聲音質疑此舉帶有「恐懼行銷」色彩,認為若漏洞真的如此普遍,全人類恐怕需花數年而非100天就能全面修補,但多數觀察者則認為是負責任的行業標竿,特別是在神話模型被視為近AGI能力躍進的象徵之際。
對全球經濟而言,這一件事已非技術圈的內部事務,現代社會幾乎所有關鍵系統,銀行交易、醫療紀錄、能源調度、交通物流、企業客戶資料,都高度依賴聯網軟體,一旦這些基礎設施暴露在AI驅動的攻擊之下,後果將從個別勒索軟體事件,立即升級為系統性風險。網路保險市場可能面臨保費急漲,開放原始碼維護者(許多都由小團隊支撐)將承受前所未有的壓力,而企業資安支出,預計在未來數年會大幅攀升。更廣義地,這代表了AI已將網路空間推入「攻防雙AI」(AI-powered cyber arms race)的高強度類軍備競賽時代。此刻,矽谷業界普遍預估,半年內中國開源模型有可能追上同等水準,屆時風險只會加劇。
Anthropic創辦人達里奧(Dario Amodei)過去曾多次呼籲,AI發展速度已超越人類治理能力,這次行動可視為他理念的實踐,寧可延後商業化,也要先為防禦方建立優勢。可以理解,科技發展至此,網路安全的未來,勢必轉由AI定義,但人類這時的選擇,會是這場競賽決定輸贏的關鍵性一步。
作者為富瑜文教基金會執行長朱玉昌