該篇paper解決了深度學習遇到的如上三個問題
該篇paper提出了一個兩階段的網路,即分割網路 + 決策網路。
分割網路要在高解析度的影象表面上檢查小的缺陷,需滿足兩個要求:
因此,在設計時,需要具有下取樣層,在比較深的層中使用尺寸大的折積核。
為什麼要提出這樣的決策網路?有什麼作用?
簡單的分割網路似乎沒有足夠的資訊來預測影象中缺陷的存在。
該篇paper中使用到的是工業界中電機轉向器的拍攝樣本集Kolektor
網路在四個設定組下進行評估:
五種精度的標註;
兩種損失函數 (均方誤差、交叉熵);
輸入影象是全尺寸(1408 x 512 px)還是半尺寸(704 x 256 px);
是否對輸入影象進行90°的旋轉。
實驗結果如下:
可見,paper提出的網路在如下:
1. 標註精度為Dilate = 5;
2. 交叉熵損失函數;
3. 全尺寸影象;
4. 不對影象進行90°旋轉。
設定,達到了最優的效能。
paper的作者把提出的網路與目前最常用的兩個分割網路(DeepLab v3+與U-Net)和用於缺陷檢測的商業軟體Cognex ViDi Suite進行了效能對比。如下效能指標皆在三個網路和商業軟體最優設定下進行評估:
結果如上圖所示:
paper提出的網路AP最高,達到了99.9%,漏檢個數與誤檢個數也最少。
如上圖所示,paper提出的網路,在僅有33個缺陷樣本的訓練下,AP能夠達到99.9%;在僅有5個缺陷樣本的訓練下,AP依舊能夠達到96.1%。超過了其它分割網路和商業軟體在同等設定下的效果,一定程度上解決了深度學習所需樣本數量大的問題。
如上圖所示:
paper提出的網路在對單張圖片進行檢測的平均準確度和時間上,都有著不錯的效果,如何能做到這樣的效果,也取決於上圖,可以看到,paper提出的網路所需的引數,遠少於另外兩種分割網路,因此在訓練以及檢測的過程中,花費的時間得到了很大程度的提升。