美國人工智能企業Anthropic日前發表報告,指控中國三間領先AI實驗室——DeepSeek、月之暗面(Moonshot AI)及MiniMax——以「工業級規模」非法提取其旗艦模型Claude的核心能力。三間企業合共建立逾24,000個虛假帳戶,發出超過1,600萬次查詢,系統性地蒸餾Claude在代理推理、工具使用及程式編寫等方面的差異化能力。事件在全球AI產業引起廣泛關注,亦為中美科技角力增添新的導火線。
「九頭蛇架構」繞過地域限制 三企業分工明確
Anthropic的報告詳細揭示了三間企業的攻擊手法。儘管Anthropic的服務條款禁止在中國境內進行商業存取,但三間企業透過所謂的「九頭蛇叢集」(Hydra Cluster)商業代理服務,利用數以萬計的虛假帳戶分散流量,繞過地域限制存取Claude的API介面。Anthropic指出,這些查詢的「數量、結構及焦點與正常使用模式截然不同,反映出有計劃的能力提取行為,而非合法使用」。
從各企業的操作規模來看,MiniMax的活動量最為龐大,產生逾1,300萬次交互,重點針對代理編碼、工具使用及系統協調能力。Moonshot AI錄得超過340萬次交互,專注於代理推理、電腦視覺及程式分析。DeepSeek的規模相對較小,約15萬次交互,但針對性極強,集中在基礎邏輯推理及安全對齊機制等核心領域。值得注意的是,當Anthropic在攻擊期間推出Claude的更新版本時,MiniMax在24小時內便將近半自動化流量重新導向至新系統,以捕捉最新的模型能力。
AI蒸餾攻擊成全球性挑戰 OpenAI及Google同受影響
在AI領域,「蒸餾」(Distillation)是指透過學習現有模型的輸出結果來訓練新模型的技術,而非使用原始訓練數據。Anthropic的指控並非孤例——此前OpenAI亦在今年2月初發出備忘錄,指控DeepSeek利用蒸餾技術複製其模型能力;Google亦披露曾識別並阻止針對Gemini推理能力的蒸餾攻擊,涉及逾10萬條提示。三大美國AI巨頭接連發出相似指控,反映蒸餾攻擊已成為全球AI產業面臨的系統性挑戰。
業界分析人士指出,蒸餾攻擊之所以受到重視,在於其可能從根本上改變AI競爭格局。透過大規模蒸餾前沿模型的能力,後發企業能以極低成本快速縮小與領先者的差距,而無需投入數十億美元的訓練成本。這不僅損害了原始開發者的知識產權和商業利益,更可能削弱美國在AI領域的技術優勢。
國家安全層面引發擔憂 出口管制成效受質疑
Anthropic在報告中明確將蒸餾攻擊與國家安全風險掛鈎。該公司警告,經非法蒸餾而成的模型可能缺乏必要的安全護欄,若被用於網絡攻擊、生物武器研發或大規模監控,將構成嚴重威脅。Anthropic更直指,蒸餾攻擊實質上繞過了美國的AI晶片出口管制,因為外國實驗室無需先進硬件便能從美國模型中提取前沿能力。
「在缺乏對這些攻擊的可見性的情況下,這些實驗室的快速進步被錯誤地視為出口管制無效的證據。實際上,這些進步在很大程度上依賴於從美國模型中提取的能力。」Anthropic在報告中如此表述。這一論點為正在進行的美國AI出口管制政策辯論提供了新的支持論據,預料將促使華盛頓進一步收緊相關限制。
Anthropic強化防禦 呼籲業界及政策制定者協調應對
為應對蒸餾攻擊威脅,Anthropic已部署多層防禦措施。包括建立專門的分類器和行為指紋系統,以識別API流量中的可疑蒸餾模式;加強教育帳戶、安全研究計劃及初創組織的驗證程序;以及實施增強型保護機制,降低模型輸出被用於非法蒸餾的效用。
Anthropic同時呼籲「AI產業、雲端服務供應商及政策制定者展開協調回應」,共同應對蒸餾攻擊的挑戰。對於香港而言,作為國際科技及金融中心,本港在AI治理、數據保護及知識產權保障方面的立場和政策,將在這場全球AI競爭中扮演日益重要的角色。隨著預算案宣布推動「AI+」戰略,如何在促進AI創新與防範技術盜竊之間取得平衡,將成為政策制定者面臨的重要課題。