欢乐颂第一季免费阅读,好看的言情小说

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案

在API中使用自定義層導(dǎo)致trainable_variables中的權(quán)重?zé)o法更新該怎么解決

這篇文章將為大家詳細講解有關(guān)在API中使用自定義層導(dǎo)致trainable_variables中的權(quán)重?zé)o法更新該怎么解決，文章內(nèi)容質(zhì)量較高，因此小編分享給大家做個參考，希望大家閱讀完這篇文章后對相關(guān)知識有一定的了解。

創(chuàng)新互聯(lián)專注為客戶提供全方位的互聯(lián)網(wǎng)綜合服務(wù)，包含不限于網(wǎng)站制作、網(wǎng)站設(shè)計、翁牛特網(wǎng)絡(luò)推廣、微信小程序開發(fā)、翁牛特網(wǎng)絡(luò)營銷、翁牛特企業(yè)策劃、翁牛特品牌公關(guān)、搜索引擎seo、人物專訪、企業(yè)宣傳片、企業(yè)代運營等，從售前售中售后，我們都將竭誠為您服務(wù)，您的肯定，是我們最大的嘉獎；創(chuàng)新互聯(lián)為所有大學(xué)生創(chuàng)業(yè)者提供翁牛特建站搭建服務(wù)，24小時服務(wù)熱線：18982081108，官方網(wǎng)址：www.cdcxhl.com

一位從事NLP工程師Gupta發(fā)現(xiàn)了TensorFlow存在的一個嚴(yán)重bug：

每個在自定義層中使用Keras函數(shù)式API的用戶都要注意了！使用用Keras的Functional API創(chuàng)建的權(quán)重，可能會丟失。

這一話題在Reddit機器學(xué)習(xí)板塊上被熱議，引起不少TensorFlow用戶共鳴。

在API中使用自定義層導(dǎo)致trainable_variables中的權(quán)重?zé)o法更新該怎么解決

具體來說，就是在API中使用自定義層，會導(dǎo)致trainable_variables中的權(quán)重?zé)o法更新。而且這些權(quán)重也不會放入non_trainable_variables中。

也就是說，原本需要訓(xùn)練的權(quán)重現(xiàn)在被凍結(jié)了。

讓這位工程師感到不滿的是，他大約一個月前在GitHub中把這個bug報告給谷歌，結(jié)果谷歌官方到現(xiàn)在還沒有修復(fù)。

解決辦法

如何檢驗自己的代碼是否會出現(xiàn)類似問題呢？請調(diào)用model.trainable_variables來檢測自己的模型：

for i, var in enumerate(model.trainable_variables):
    print(model.trainable_variables[i].name)

看看你所有的可變權(quán)重是否正確，如果權(quán)重缺失或者未發(fā)生變化，說明你也中招了。

Gupta還自己用Transformer庫創(chuàng)建模型的bug在Colab筆記本中復(fù)現(xiàn)了，有興趣的讀者可以前去觀看。

https://colab.research.google.com/gist/Santosh-Gupta/40c54e5b76e3f522fa78da6a248b6826/missingtrainablevarsinference_var.ipynb

對此問題，Gupta給出的一種解決方法是：改為使用Keras子類創(chuàng)建模型。改用此方法后，所有的權(quán)重都將出現(xiàn)在trainable_variables中。

為了絕對確保用函數(shù)式API和子類方法創(chuàng)建的模型完全相同，Gupta在每個Colab筆記本底部使用相同的輸入對它們進行了推理，模型的輸出完全相同。

但是，使用函數(shù)式API模型進行訓(xùn)練會將許多權(quán)重視為凍結(jié)，而且這些權(quán)重也沒有出現(xiàn)在non_trainable_variables中，因此無法為這些權(quán)重解凍。

為了檢查谷歌最近是否修復(fù)了該漏洞，Gupta還安裝了Nightly版的TF 2.3.0-rc1，保持框架處于最新狀態(tài)，但如今bug依然存在。

關(guān)于在API中使用自定義層導(dǎo)致trainable_variables中的權(quán)重?zé)o法更新該怎么解決就分享到這里了，希望以上內(nèi)容可以對大家有一定的幫助，可以學(xué)到更多知識。如果覺得文章不錯，可以把它分享出去讓更多的人看到。

標(biāo)題名稱：在API中使用自定義層導(dǎo)致trainable_variables中的權(quán)重?zé)o法更新該怎么解決
分享路徑：http://fisionsoft.com.cn/article/jepeid.html

新聞中心

其他資訊