AI變身頂級黑客?Claude被騙參與網絡攻擊,150GB政
外媒援引網絡安全研究人員報道稱,一名黑客利用Anthropic的AI聊天機器人Claude,對墨西哥政府機構發動了一系列攻擊,導致大量敏感的稅務和選民信息被盜。
以色列網絡安全初創公司Gambit Security在週三發佈的研究中表示,他們是在嘗試新的威脅狩獵技術、觀察黑客在線行爲時,發現了墨西哥政府系統遭入侵的情況。研究人員找到了關於正在進行或近期攻擊的公開證據,其中包括大量Claude對話內容,涉及入侵墨西哥政府計算機系統。
研究顯示,這名身份不明的Claude用戶使用西班牙語向聊天機器人下達指令,要求其扮演頂級黑客,尋找政府網絡中的漏洞,編寫用於利用這些漏洞的計算機腳本,並制定自動化竊取數據的方法。
研究人員稱,這一活動始於12月,持續了大約一個月。期間約150GB的墨西哥政府數據被竊取,其中包括與1.95億名納稅人記錄相關的文件,以及選民記錄、政府僱員憑證和民事登記檔案。
Gambit表示,黑客入侵了墨西哥聯邦稅務局和國家選舉機構,墨西哥的多個州政府以及墨西哥城的民事登記處和蒙特雷的供水機構也遭到入侵。
研究人員指出,在與這名不明用戶就墨西哥政府問題進行對話時,Claude最初曾警告其存在惡意意圖,但最終還是配合了攻擊者的要求,在政府計算機網絡上執行了數千條命令。
Anthropic的一名代表表示,公司已就Gambit的說法展開調查,中斷了相關活動,並封禁了涉事賬戶。該公司會將惡意活動的案例反饋給Claude用於學習,其最新的AI模型Claude Opus 4.6也加入了可用於干擾濫用行爲的探測機制。
該代表稱,在此次事件中,黑客不斷試探Claude,最終成功對其進行“越獄”,即繞過了安全防護。但即便在黑客行動展開期間,Claude有時仍會拒絕對方的要求。
據Gambit介紹,當Claude遇到問題或需要更多信息時,這名黑客轉而使用OpenAI的ChatGPT獲取額外建議,包括如何在計算機網絡中橫向移動、確定訪問特定系統所需的憑證,以及評估黑客行動被發現的可能性。
Gambit Security首席戰略官柯蒂斯·辛普森(Curtis Simpson)表示:“總體而言,它生成了數千份詳細報告,其中包含可直接執行的計劃,明確告訴人類操作者下一步該攻擊哪些內部目標以及使用哪些憑證。”
OpenAI表示,已識別到這名黑客試圖利用其模型從事違反使用政策的活動,並補充稱其工具拒絕配合這些嘗試。該公司在一份電子郵件聲明中表示:“我們已封禁該對手使用的賬戶,並感謝Gambit Security的溝通。”
研究人員進一步指出,墨西哥政府機構遭入侵是一個令人警惕趨勢的最新例證。在Anthropic和OpenAI押注於打造更復雜的AI編程工具、網絡安全公司將未來寄託於AI驅動的防禦手段的同時,網絡犯罪分子和網絡間諜也在不斷尋找利用該技術發動攻擊的新方式。
這些Claude對話顯示,爲了繞過其安全防護,攻擊者告訴該AI工具自己是在進行漏洞賞金計劃,即組織爲發現系統缺陷而提供的獎勵。許多公司和政府機構都會爲道德黑客提供漏洞賞金,有時會爲計算機漏洞的詳細信息支付數千美元。
黑客要求Claude對墨西哥聯邦稅務局進行滲透測試,這是一種旨在發現缺陷的授權網絡攻擊。然而,當攻擊者在請求中加入刪除日誌和命令歷史等規則時,Claude拒絕了。
隨後,黑客改變策略,停止來回對話,而是向AI工具提供了一份詳細的行動手冊。Gambit稱,這一做法成功繞過了Claude的防護機制,實現了“越獄”,並使攻擊得以繼續。
辛普森表示,黑客還向Claude詢問了其他可能獲取數據的機構,暗示部分攻擊可能是機會主義行爲,而非事先策劃。
他說:“他們試圖儘可能攻破每一個政府身份。他們會向Claude詢問,比如‘我還能在哪裏找到這些身份?我們還應該查看哪些系統?這些信息還存儲在什麼地方?’”