交大友聲雜誌社

校友投稿

朱玉昌（EMBA 10e）：AI駭攻風險從Anthropic自律到科技巨頭集體防禦

2026-05-20

美國AI頭部公司Anthropic日前宣布一項看似矛盾的決定，他們訓練出一款名為「神話」（Claude Mythos Preview）的前沿模型，其能力在軟體工程與網路安全領域已大幅超越頂尖人類的水平，但選擇不向公眾開放。取而代之的，是他們聯手亞馬遜、蘋果、谷歌、微軟、輝達、博通、思科、摩根大通、Linux基金會以及帕羅奧圖網路（Palo Alto Networks）等十二家機構，啟動「玻璃翼計畫」（Project Glasswing），讓這些同業在嚴格沙盒環境中使用該模型，專注掃描並修補全球關鍵軟體的漏洞。Anthropic還額外提供約四十家維護關鍵基礎設施的組織使用權限，並承諾投入高達1億美元的模型額度與400萬美元直接捐款給開放原始碼安全團體。

這個不向公眾開放的決定，並非模型不夠完熟，真實情況是，Anthropic在內部測試中發現，神話模型可以在不需人類深度引導情況下，自主挖掘出數千個在此之前從沒被發現的高嚴重度零日漏洞（zero-day vulnerabilities），涵蓋每一個主流作業系統和網頁瀏覽器，以及大量其他關鍵軟體。其中許多漏洞已潛伏十到二十七年之久，經歷過數百萬次人類與自動化測試，卻始終未被察覺。

官方列舉包括一個存在二十七年的OpenBSD SACK實作漏洞，可讓攻擊者僅透過網路連線就能在遠端癱瘓系統，另一個十六年歷史的FFmpeg H.264編解碼器漏洞，過去自動測試工具執行500萬次仍未發現，此外還有FreeBSD NFS伺服器與Linux核心的多個記憶體損壞漏洞，以及能串聯多個小漏洞達成瀏覽器沙盒逃脫（browser sandbox escape）的複雜攻擊鏈。Anthropic坦承，超過99%的這些漏洞，在發現當時仍無任何補救措施可供修復。

較令人驚訝的，是這款模型的「能力下放」效應。Anthropic官方文件指出，即便是未接受正式安全訓練的普通工程師，也能在一夜之間利用神話模型找出遠端程式碼執行漏洞，且在隔天獲得完整、可運作的攻擊方案。這意味著，原本只有極少數頂尖駭客才能掌握的複雜攻擊能力，現正被AI快速破解。過去，軟體漏洞之所以未釀成大禍，是因為發現難度極高，如今，AI不僅能大幅加速發現，還能自動生成利用程式碼，讓攻擊門檻急劇降低。

玻璃翼計畫的設計，正是為了在這波能力擴散前，為防禦方爭取時間。十二家啟動夥伴將在接下來九十天內分享首批掃描成果，後續數月乃至數年持續協作。Anthropic強調，這不是單一公司的公關秀，而是產業集體意識到，光靠自律已不足以應付之後的務實回應。當然，矽谷之中也有聲音質疑此舉帶有「恐懼行銷」色彩，認為若漏洞真的如此普遍，全人類恐怕需花數年而非100天就能全面修補，但多數觀察者則認為是負責任的行業標竿，特別是在神話模型被視為近AGI能力躍進的象徵之際。

對全球經濟而言，這一件事已非技術圈的內部事務，現代社會幾乎所有關鍵系統，銀行交易、醫療紀錄、能源調度、交通物流、企業客戶資料，都高度依賴聯網軟體，一旦這些基礎設施暴露在AI驅動的攻擊之下，後果將從個別勒索軟體事件，立即升級為系統性風險。網路保險市場可能面臨保費急漲，開放原始碼維護者（許多都由小團隊支撐）將承受前所未有的壓力，而企業資安支出，預計在未來數年會大幅攀升。更廣義地，這代表了AI已將網路空間推入「攻防雙AI」（AI-powered cyber arms race）的高強度類軍備競賽時代。此刻，矽谷業界普遍預估，半年內中國開源模型有可能追上同等水準，屆時風險只會加劇。

Anthropic創辦人達里奧（Dario Amodei）過去曾多次呼籲，AI發展速度已超越人類治理能力，這次行動可視為他理念的實踐，寧可延後商業化，也要先為防禦方建立優勢。可以理解，科技發展至此，網路安全的未來，勢必轉由AI定義，但人類這時的選擇，會是這場競賽決定輸贏的關鍵性一步。

作者為富瑜文教基金會執行長朱玉昌

上一篇: 田銘莒（電工78）：五元數相除法練習