所有語言
分享
來源:財聯社
編輯 瀟湘
自從年內生成式人工智能熱潮興起以來,有關數據安全性的爭議就始終不斷。而據一家網絡安全公司的最新研究显示,微軟公司的人工智能研究團隊數月前就曾意外在軟件開發平台GitHub上泄露了大量私人數據,其中涵蓋了3萬多條微軟團隊的內部信息。
雲安全公司Wiz的一個團隊發現,微軟的研究團隊今年6月在GitHub上發布開源訓練數據時泄露了這些數據。這些雲託管數據是通過一個配置錯誤的鏈接泄露的。
根據Wiz的一篇博客文章,微軟的AI研究團隊原本在GitHub上發布了開源訓練數據,但由於SAS令牌的錯誤配置,其錯誤地配置為授予整個存儲賬戶的權限,而且還授予用戶完全控制權限——還不單單是只讀權限,這意味着他們可以刪除和覆蓋現有文件。
據Wiz稱,被泄露的總計38TB的數據中,包含了微軟兩名員工個人電腦上的磁盤備份,而這些備份中又包含了微軟服務的密碼、密鑰和來自359名微軟員工的3萬多條微軟團隊內部信息。
Wiz的研究人員表示,開放數據共享是AI訓練中的關鍵組成部分,但如果使用不當,共享大量數據也會使公司面臨極大的風險。
Wiz公司首席技術官兼聯合創始人Ami Luttwak指出,Wiz公司在6月份與微軟共享了這一情況,微軟很快就刪除了被暴露的數據。Wiz研究團隊是在互聯網上掃描配置錯誤的存儲器時發現這些數據緩存的。
對此,微軟發言人事後發表評論稱,“我們已經確認,沒有客戶數據被暴露,也沒有其他內部服務受到威脅。”
微軟在周一發表的一篇博文中表示,公司已調查並補救了一起涉及一名微軟員工的事件,該員工在公共GitHub存儲庫中向開源人工智能學習模型共享了一個URL。微軟表示,存儲賬戶中暴露的數據包括兩名前員工工作站配置文件的備份,以及這兩名前員工與同事的微軟團隊內部信息。