古风小说君子以泽,旷世神医,辰东全部小说

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營(yíng)銷(xiāo)解決方案

如何利用逆向把人工智能盜走

計(jì)算機(jī)科學(xué)中正迅速發(fā)展的機(jī)器學(xué)習(xí)領(lǐng)域，工程師們常將人工智能(AI)稱(chēng)作“黑箱”系統(tǒng)：一旦機(jī)器學(xué)習(xí)引擎經(jīng)由樣本數(shù)據(jù)集訓(xùn)練，用以執(zhí)行從面部識(shí)別到惡意軟件檢測(cè)等各種任務(wù)，它們便能接受詢(xún)問(wèn)——這是誰(shuí)的臉?這個(gè)App安全嗎?并能自行給出答案——無(wú)需任何人，甚至是其創(chuàng)造者的指導(dǎo)，自身內(nèi)部就完全理解了決策機(jī)制。

成都創(chuàng)新互聯(lián)2013年至今，是專(zhuān)業(yè)互聯(lián)網(wǎng)技術(shù)服務(wù)公司，擁有項(xiàng)目成都網(wǎng)站建設(shè)、網(wǎng)站建設(shè)網(wǎng)站策劃，項(xiàng)目實(shí)施與項(xiàng)目整合能力。我們以讓每一個(gè)夢(mèng)想脫穎而出為使命，1280元江達(dá)做網(wǎng)站,已為上家服務(wù),為江達(dá)各地企業(yè)和個(gè)人服務(wù),聯(lián)系電話:028-86922220

但研究人員逐漸證明，雖然這些機(jī)器學(xué)習(xí)引擎的內(nèi)部機(jī)制神秘莫測(cè)，它們也并非是完全隱秘的。事實(shí)上，研究人員已經(jīng)發(fā)現(xiàn)這些黑箱的內(nèi)容物可以被逆向，甚至完全復(fù)制——用某隊(duì)研究員的話說(shuō)就是“竊取”，逆向和復(fù)制方法還是用以創(chuàng)建這些系統(tǒng)的同一套。

9月初發(fā)表的一篇論文《通過(guò) Prediction API 盜取機(jī)器學(xué)習(xí)模型》中，來(lái)自康乃爾科技學(xué)院、瑞士洛桑理工學(xué)院(EPFL)、北卡羅萊納大學(xué)的一隊(duì)計(jì)算機(jī)科學(xué)家，詳細(xì)描述了他們是怎樣僅靠發(fā)問(wèn)和分析響應(yīng)，來(lái)逆向機(jī)器學(xué)習(xí)訓(xùn)練過(guò)的AI的。通過(guò)用目標(biāo)AI的輸出來(lái)訓(xùn)練他們自己的AI，這隊(duì)科學(xué)家可以產(chǎn)出能近100%預(yù)測(cè)被克隆AI響應(yīng)的軟件，有時(shí)候僅用幾千甚至幾百個(gè)查詢(xún)來(lái)訓(xùn)練就行了。

康乃爾科技學(xué)院教授阿里·祖爾說(shuō)：“拿到黑箱，通過(guò)這個(gè)窄小的接口，你就可以重建其內(nèi)部，逆向工程這個(gè)箱子。某些情況下，真能達(dá)到完美重現(xiàn)?！?/p>

拿下黑箱內(nèi)部

研究人員表示，該手法可被用于允許用戶上傳數(shù)據(jù)給機(jī)器學(xué)習(xí)引擎，并在線發(fā)布或共享結(jié)果模型的服務(wù)。亞馬遜、谷歌、微軟、BigML之類(lèi)的公司都有提供此類(lèi)服務(wù)，有時(shí)候是以按查詢(xún)付款的商業(yè)模式提供。研究人員將自己的方法稱(chēng)之為“萃取攻擊”，該方法能復(fù)制本應(yīng)專(zhuān)有的AI引擎，某些情況下甚至能重現(xiàn)當(dāng)初用以訓(xùn)練AI的敏感私有數(shù)據(jù)。進(jìn)入斯坦福大學(xué)之前忙于此AI盜取項(xiàng)目的EPFL研究員弗洛里安·特拉馬爾說(shuō)：“一旦你發(fā)現(xiàn)了其中模型，就不需要再為專(zhuān)利AI付費(fèi)了，還能獲取大量隱私泄露?！?/p>

其他情況下，該技術(shù)可能會(huì)讓黑客逆向并擊潰基于機(jī)器學(xué)習(xí)的安全系統(tǒng)，比如用來(lái)過(guò)濾垃圾郵件和惡意軟件的那些?！皫讉€(gè)小時(shí)的努力后，你就能萃取出一個(gè)AI模型，如果此模型被用于某個(gè)產(chǎn)品系統(tǒng)，那這個(gè)系統(tǒng)從此對(duì)你再無(wú)阻礙?！?/p>

研究人員的技術(shù)，基本上是通過(guò)機(jī)器學(xué)習(xí)自身來(lái)逆向機(jī)器學(xué)習(xí)軟件。簡(jiǎn)單舉例，機(jī)器學(xué)習(xí)訓(xùn)練的垃圾郵件過(guò)濾器，可以判定所給郵件是否垃圾郵件，它會(huì)給出一個(gè)“置信度值”，揭示其判斷的正確程度?；卮鹂杀幻枋鰹锳I決策閾值界限任一邊的點(diǎn)，置信度值顯示的就是這個(gè)點(diǎn)距離界限的遠(yuǎn)近。不斷用測(cè)試郵件嘗試過(guò)濾器，可以揭示出定義那條界限的精確線。該技術(shù)可被擴(kuò)展成更加復(fù)雜的多維模型，給出更為精準(zhǔn)的答案而非簡(jiǎn)單的“是/不是”回答。(甚至目標(biāo)機(jī)器學(xué)習(xí)引擎不提供置信度值的情況下，這手段都有效，只不過(guò)需要數(shù)十上百倍的查詢(xún)。)

盜取牛排熟度偏好預(yù)測(cè)器

研究人員在兩個(gè)服務(wù)上測(cè)試了他們的攻擊方法：亞馬遜的機(jī)器學(xué)習(xí)平臺(tái)，以及線上機(jī)器學(xué)習(xí)服務(wù)BigML。他們用一系列通用數(shù)據(jù)集逆向工程了基于這些平臺(tái)的AI模型。例如，在亞馬遜的平臺(tái)上，他們嘗試“盜取”一個(gè)基于人口統(tǒng)計(jì)學(xué)因素預(yù)測(cè)個(gè)人薪水的算法。該算法用到的人口統(tǒng)計(jì)學(xué)因素包括有聘用情況、婚姻狀況、信用評(píng)分等。亞馬遜平臺(tái)上另一個(gè)試圖基于手寫(xiě)數(shù)字圖片識(shí)別其中數(shù)字的算法，也在他們盜取目標(biāo)之列。人口統(tǒng)計(jì)學(xué)案例中，僅1485次查詢(xún)，就復(fù)制出了相差無(wú)幾的模型。數(shù)字識(shí)別案例甚至區(qū)區(qū)650次查詢(xún)就達(dá)成復(fù)制目的。

BigML服務(wù)上，基于人口統(tǒng)計(jì)學(xué)預(yù)測(cè)德國(guó)公民信用評(píng)分的一個(gè)算法，以及基于其他生活方式問(wèn)題答案預(yù)測(cè)人們牛排熟度偏好的另一個(gè)算法，是他們檢測(cè)其“萃取技術(shù)”的目標(biāo)。復(fù)制信用評(píng)分引擎花費(fèi)了1150次查詢(xún);拷貝牛排熟度偏好預(yù)測(cè)器，則用掉了超過(guò)4000次查詢(xún)。

尼古拉斯·帕佩諾特，賓夕法尼亞州立大學(xué)研究員，今年早些時(shí)候進(jìn)行了另一個(gè)機(jī)器學(xué)習(xí)逆向工程項(xiàng)目的研究。他說(shuō)，不是每個(gè)機(jī)器學(xué)習(xí)算法都能被簡(jiǎn)單重現(xiàn)。這篇最新AI盜取論文中的例子，重現(xiàn)的是相對(duì)簡(jiǎn)單的機(jī)器學(xué)習(xí)引擎。更復(fù)雜的引擎需要多得多的計(jì)算量，尤其是機(jī)器學(xué)習(xí)接口學(xué)會(huì)隱藏其置信度值的情況下?！叭绻麢C(jī)器學(xué)習(xí)平臺(tái)決定使用更大的模型，或者隱藏起置信度值，那么攻擊難度就大得多了。但這篇論文還是很有趣，因?yàn)樗麄儽┞冻霎?dāng)前機(jī)器學(xué)習(xí)服務(wù)的模型是如此淺陋，隨隨便便就能被萃取?！?/p>

在給《連線》雜志的一封電子郵件中，BigML預(yù)測(cè)應(yīng)用副總裁阿塔康·塞汀索依對(duì)該研究不慎重視。他寫(xiě)道：“這研究根本沒(méi)暴露出BigML的平臺(tái)有任何的安全或隱私威脅?！彼q稱(chēng)，雖然BigML確實(shí)允許用戶以按查詢(xún)付費(fèi)的方式共享黑箱AI引擎，但目前沒(méi)有任何用戶對(duì)他們共享的AI引擎收費(fèi)。他還贊同帕佩諾特的觀點(diǎn)，認(rèn)為BigML上托管的很多機(jī)器學(xué)習(xí)模型都過(guò)于復(fù)雜，無(wú)法逆向，而且對(duì)該服務(wù)上模型的任何盜取行為都是違法的。

亞馬遜拒絕了《連線》雜志的評(píng)論請(qǐng)求，但研究人員聯(lián)系該公司時(shí)，亞馬遜回復(fù)說(shuō)，因?yàn)閬嗰R遜沒(méi)有公開(kāi)其機(jī)器學(xué)習(xí)引擎，僅允許用戶在協(xié)作者間共享訪問(wèn)，他們AI盜取攻擊的風(fēng)險(xiǎn)是被減輕了的。換句話說(shuō)，該公司警告：注意你共享AI的對(duì)象。

從面部識(shí)別到面部重建

除了單純的AI盜取，研究人員的攻擊還能讓用于AI訓(xùn)練的敏感數(shù)據(jù)重建變得更加容易。去年年末發(fā)表的另一篇論文就表明，根據(jù)照片猜測(cè)人名的面部識(shí)別AI是可以被逆向的。該方法會(huì)向目標(biāo)AI不斷發(fā)送測(cè)試照片，微調(diào)這些照片，直到命中該機(jī)器學(xué)習(xí)引擎借以訓(xùn)練的照片，在研究人員的電腦從未實(shí)際見(jiàn)過(guò)的情況下重現(xiàn)出確切人臉圖像。通過(guò)在執(zhí)行面部重建技術(shù)之前進(jìn)行他們的AI盜取攻擊，研究人員在自己電腦上運(yùn)行的盜版AI上重建面部圖像，甚至比用原版AI引擎還快得多。盜版AI在10小時(shí)之內(nèi)就重建了40幅不同人臉，而原版AI需要16小時(shí)。

逆向工程機(jī)器學(xué)習(xí)引擎的想法，實(shí)際上，在AI研究圈子里已經(jīng)興起幾個(gè)月了。2月份，另一組研究人員就展示了大約80%準(zhǔn)確性的機(jī)器學(xué)習(xí)系統(tǒng)復(fù)制能力。即便在那個(gè)時(shí)候，他們就發(fā)現(xiàn)，通過(guò)在盜版系統(tǒng)上測(cè)試輸入，?？梢詫W(xué)到欺騙原版的方法。比如說(shuō)，他們將該技術(shù)應(yīng)用到數(shù)字或道路標(biāo)識(shí)識(shí)別AI引擎上時(shí)，能讓該引擎對(duì)84%~96%的測(cè)試用例做出錯(cuò)誤判斷。

這最新的機(jī)器學(xué)習(xí)引擎復(fù)制研究能讓該欺騙手法更加簡(jiǎn)單。而一旦機(jī)器學(xué)習(xí)被應(yīng)用于關(guān)鍵安全任務(wù)，比如自動(dòng)駕駛汽車(chē)或惡意軟件過(guò)濾，盜取并分析這些引擎的能力就會(huì)引發(fā)麻煩后果。無(wú)論是否黑箱，讓你的AI隱身都是明智的做法。

本文標(biāo)題：如何利用逆向把人工智能盜走
鏈接URL：http://www.fisionsoft.com.cn/article/cdhdsoc.html

新聞中心

其他資訊