新聞中心
概覽
要評(píng)估和改善模型,首先應(yīng)觀察它在不同數(shù)據(jù)集中的表現(xiàn)情況。根據(jù)來自每個(gè)數(shù)據(jù)集的指標(biāo),可以判斷出哪些更改對(duì)模型準(zhǔn)確性的影響最大。

創(chuàng)新互聯(lián)建站始終堅(jiān)持【策劃先行,效果至上】的經(jīng)營理念,通過多達(dá)10余年累計(jì)超上千家客戶的網(wǎng)站建設(shè)總結(jié)了一套系統(tǒng)有效的全網(wǎng)營銷推廣解決方案,現(xiàn)已廣泛運(yùn)用于各行各業(yè)的客戶,其中包括:成都水泥攪拌車等企業(yè),備受客戶贊揚(yáng)。
只通過單一指標(biāo)無法全面了解模型的表現(xiàn)。要改善你的模型,必須比較訓(xùn)練、驗(yàn)證和測試數(shù)據(jù)集的指標(biāo) (MLClassifierMetrics (英文) 或 MLRegressorMetrics (英文),具體取決于你的模型類型)。例如,“創(chuàng)建圖像分類器模型”一文中探討的準(zhǔn)確性是根據(jù)每個(gè)數(shù)據(jù)集的 classificationError (英文) 指標(biāo)而得出的。
在創(chuàng)建模型并加載測試數(shù)據(jù)后,還可通過編程方式訪問這些值:
print("Training Metrics\n", model.trainingMetrics)
print("Validation Metrics\n", model.validationMetrics)
let evaluationMetrics = model.evaluation(on: testData)
print("Evaluation Metrics\n", evaluationMetrics) 在這種情形中,你會(huì)看到幾個(gè)不同指標(biāo)的輸出,包括適用于分類器的 classificationError (英文)、precisionRecall (英文) 和 confusion (英文),以及適用于回歸元的 maximumError (英文) 和 rootMeanSquaredError (英文)。根據(jù)每個(gè)數(shù)據(jù)集的返回值來決定模型在哪些地方需要改進(jìn)。
提高模型的訓(xùn)練準(zhǔn)確性
如果模型的訓(xùn)練準(zhǔn)確性偏低,則表示當(dāng)前模型配置無法捕捉數(shù)據(jù)的復(fù)雜細(xì)節(jié)。
嘗試調(diào)整訓(xùn)練參數(shù)。在處理圖像數(shù)據(jù)時(shí),可以將 MLImageClassifierBuilder Playground UI 中的最大迭代數(shù) (默認(rèn)值為 10) 翻倍。
對(duì)于自然語言數(shù)據(jù),可以嘗試另一種底層算法 (請(qǐng)參閱 MLTextClassifier.ModelAlgorithmType (英文))。對(duì)于更常規(guī)的任務(wù),可以使用 MLClassifier (英文) (請(qǐng)參閱“支持的分類器類型”(英文)) 或 MLRegressor (英文) (請(qǐng)參閱“支持的回歸元類型”(英文)) 所確定類型之外的底層模型。
提高模型的驗(yàn)證準(zhǔn)確性
如果使用驗(yàn)證集得出的模型準(zhǔn)確性較低,或每次訓(xùn)練模型時(shí)準(zhǔn)確性高低起伏不定,則需要更多數(shù)據(jù)。你可以利用已收集的示例生成更多輸入數(shù)據(jù),這種方法稱為“數(shù)據(jù)增強(qiáng)”。對(duì)于圖像數(shù)據(jù),你可以結(jié)合使用裁剪、旋轉(zhuǎn)、模糊和曝光調(diào)整等操作,用一張圖像制作多個(gè)示例。
也有可能雖然你有大量數(shù)據(jù),但驗(yàn)證準(zhǔn)確性仍遠(yuǎn)遠(yuǎn)低于訓(xùn)練準(zhǔn)確性。在這種情況下,則表示模型“過擬合”,也就是說模型從訓(xùn)練集中學(xué)習(xí)到過多具體細(xì)節(jié),但這些細(xì)節(jié)通常不適用于其他示例。在這種情況下,你需要減少訓(xùn)練迭代的數(shù)量,防止模型從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)到過多內(nèi)容。
提高模型的評(píng)估準(zhǔn)確性
如果使用測試數(shù)據(jù)得出的模型準(zhǔn)確性低于訓(xùn)練或驗(yàn)證準(zhǔn)確性,通常表示訓(xùn)練模型所用的數(shù)據(jù)類別和用于評(píng)估的測試數(shù)據(jù)類別有明顯的差異。
例如,假設(shè)你使用多張室內(nèi)貓咪圖像來訓(xùn)練 MLImageClassifier (英文),但卻僅使用室外貓咪圖像來測試。由于光線、曝光和背景存在差異,因此測試數(shù)據(jù)不太可能會(huì)得出較好的結(jié)果。有些圖像差異似乎對(duì)人類而言十分明顯,但模型若沒有獲得充分的訓(xùn)練數(shù)據(jù),就無法解析這些差異。
為糾正這種情況,請(qǐng)?jiān)谟?xùn)練集中提供更多樣化的數(shù)據(jù)。一般而言,示例越多,表現(xiàn)越佳,但向模型展示與測試數(shù)據(jù)一樣多樣化的示例也同樣很重要。
分享文章:創(chuàng)新互聯(lián)IOS教程:提高模型準(zhǔn)確性
地址分享:http://fisionsoft.com.cn/article/cdjghso.html


咨詢
建站咨詢
