国产精品污污污在线观看,一本精品中文字幕在线

論文閱讀： Self-Training using Selection Network for Semi-supervised Learning

作者說明

基本信息

**1.標題：**Self-Training using Selection Network for Semi-supervised Learning

**2.作者：**Jisoo Jeong, Seungeui Lee, Nojun Kwak

**3.作者單位：**Seoul National University, Seoul, South Korea

**4.發(fā)表期刊/會議：**ICPRAM

**5.發(fā)表時間：**2020

**6.原文鏈接：**https://pdfs.semanticscholar.org/c204/77953fcd455943a24ff30035284246bcc6a2.pdf

Abstract

半監(jiān)督學習(Semi-supervised learning, SSL)是一種有效利用大量未標記數據來提高有限標記數據條件下性能的研究。大多數傳統(tǒng)的SSL方法都假設未標記數據的類包含在標記數據的類集中。此外，這些方法沒有對無用的未標記樣本進行分類，將所有未標記的數據都用于學習，不適合實際情況。在本文中，我們提出了一種稱為選擇性自訓練(selective self-training, SST)的SSL方法，它有選擇地決定是否在訓練過程中包含每個未標記的樣本。它被設計用于更實際的情況，即未標記數據的類與標記數據的類不同。對于標記樣本和未標記樣本共享同一類類別的傳統(tǒng)SSL問題，所提出的方法不僅性能可與其他傳統(tǒng)SSL算法相媲美，而且可以與其他SSL算法相結合。然傳統(tǒng)方法不能應用于新的SSL問題，但我們的方法沒有顯示出任何性能下降，即使未標記數據的類與標記數據的類不同。

1.Introduction

近年來，機器學習在各個領域取得了很多成功，精細的數據集被認為是最重要的因素之一(Everingham等人，2010;Krizhevsky等人，2012;Russakovsky等人，2015)。由于我們無法發(fā)現潛在的真實數據分布，我們需要大量的樣本來正確估計它(Nasrabadi，2007）. 然而，建立一個大數據集需要大量的時間、成本和人力(Chapelle et al.2009;Odena等人，2018)。

半監(jiān)督學習(Semi-supervised learning, SSL)是一種緩解數據收集和標注過程效率低的方法，它介于監(jiān)督學習和非監(jiān)督學習之間，因為在學習過程中同時使用了有標記和無標記的數據(Chapelle et al.， 2009;Odena等人，2018)。它可以使用大量的未標記數據從較少的標記數據有效地學習模型(Zhu, 2006)。因此，SSL的意義在以往的文獻中得到了廣泛的研究(Zhu et al.， 2003;Rosenberg等人，2005年;金瑪等，2014;Rasmus et al.， 2015;Odena, 2016;Akhmedova等人，2017年)。這些結果表明，在注釋數據量不足的情況下，SSL可能是一種有用的方法。

然而，最近有一項研究討論了傳統(tǒng)SSL方法的局限性(Odena等人，2018)。他們指出，傳統(tǒng)的SSL算法很難應用到實際應用中。特別是，傳統(tǒng)的方法假設所有的未標記數據都屬于訓練標記數據的一類。使用未標記樣本進行訓練，這些樣本的類分布與標記數據的類分布有顯著差異，可能會降低傳統(tǒng)SSL方法的性能。此外，無論何時有一組新的數據可用，都應該使用所有數據(包括out- class1數據)從頭開始訓練它們。

本文以分類任務為研究對象，提出了一種基于深度神經網絡的選擇性自訓練(selective self-training, SST)方法來解決上述問題。為了使學習能夠選擇未標記數據，我們提出了一種基于深度神經網絡的選擇網絡，該網絡決定是否添加每個樣本。與(Wang et al.， 2018)不同，SST并沒有直接使用分類結果進行數據選擇。此外，我們采用了一種集成方法，它類似于協(xié)同訓練方法(Blum and Mitchell, 1998)，利用多個分類器的輸出迭代地構建新的訓練數據集。在我們的例子中，我們不使用多個分類器，而是將時間集成方法應用于選擇網絡。對于每個未標記的實例，比較選擇網絡的兩個連續(xù)輸出，以保持我們的訓練數據干凈。

此外，我們還發(fā)現每個類的樣本數量之間的平衡對我們的網絡性能非常重要。我們建議一個簡單的啟發(fā)式方法來平衡在類中選擇的樣本數量。通過所提出的選擇方法，可以將可靠樣本添加到訓練集中，并排除包括類外數據在內的不確定樣本。該方法的主要貢獻可以總結如下：

對于傳統(tǒng)SSL問題，所提出的SST方法不僅與其他傳統(tǒng)SSL算法具有可比性，而且可以與其他算法相結合。
對于新的SSL問題，即使使用類外數據，提出的SST也沒有顯示任何性能下降。
SST要求的超參數少，易于實現。

為了證明我們提出的方法的有效性，首先，我們進行了SST與其他幾種最先進的SSL方法的分類誤差比較實驗(Laine和Aila, 2016;Tarvainen和Valpola, 2017;Luo et al.， 2017;Miyato et al.， 2017)在傳統(tǒng)SSL設置中。其次，我們提出了一個新的實驗設置，以調查我們的方法是否更適用于現實世界的情況。(Odena et al.， 2018)的實驗設置在類別內和類別外中取樣。在本文的實驗設置中，我們均勻地對所有類中的未標記實例進行采樣。我們使用三個公共基準數據集:CIFAR-10、CIFAR-100 (Krizhevsky and Hinton, 2009)和SVHN (Netzer et al.， 2011)來評估提出的SST的性能。

2.BACKGROUND

在這一部分中，我們介紹了我們的研究背景。首先，我們介紹一些自我訓練的方法(McLachlan, 1975;朱,2007;朱和戈德堡，2009)，這是我們工作的基礎。然后我們描述了基于一致性正則化的算法，如Π模型和時間集成(Laine和Aila, 2016)。

2.1 Self-training

自訓練方法長期以來被用于半監(jiān)督學習(McLachlan, 1975;Rosenberg等人，2005年;朱,2007;Zhu and Goldberg, 2009)。它是一種重采樣技術，根據置信度對未標記的訓練樣本進行重復標注，并使用所選的偽標簽數據對自身進行重訓練。這個過程可以形式化如下。(i)用標記數據訓練模型。(ii)用學習到的模型預測未標記數據。(iii)用標記的和選定的偽標簽數據對模型進行再訓練。重復最后兩個步驟。

然而，大多數的自訓練方法都假設有標簽的和無標簽的數據來自相同的分布。因此，在現實場景中，根據標簽數據的分布情況，一些可能性較低的實例不可避免地有被誤分類的可能。因此，這些錯誤的樣本明顯導致了下一個訓練步驟中更差的結果。為了解決這一問題，我們采用集成和平衡的方法來選擇可靠的樣本。

Deep Semi-Supervised Semantic Segmentation. 標注質量在技術性能中起著至關重要的作用。特別是在語義分割的任務中，標簽的開銷過大。例如，來自分割基準數據集Cityspaces[6]的一張分辨率為1024x2048的圖像，涉及超過1M的像素標簽，容易出現注釋錯誤，需要考慮像素模糊的問題。SSL非常適合手頭的任務，因為前面的方法依賴于一組很小的標簽。用于語義分割的深層SSL最近只在少數工作中進行了探索。

早期的技術依賴于GANs[12]原理。

[41]作者提出通過生成gan型合成圖像來擴大訓練集，以豐富特征空間，加強無標記樣本和有標記樣本之間的關系。Hung等人[17]提出一種基于GAN的預測概率圖與地面真值分割的區(qū)分技術。類似地，Mittal等人[31]提出了一個雙分支解決方案，包括:i)為輸入樣本生成每像素類標簽的GAN分支和ii)多標簽Mean Teacher[43]分支，以消除假陽性預測。

最近，[11]的作者將CutMix[48]擴展到語義分割的上下文中。在這篇論文中，作者應用了強增強的原理，包括Cutout，從圖像分類的發(fā)現。[36]的作者強調了基于特征、基于預測和隨機擾動之間的一致性。Ke等人的[20]使用了缺陷概率圖，并將雙學生[21]擴展到像素級任務。在[10]中提出了一種基于偽標簽的離線自訓練方案，增強了有標記集和無標記集之間的一致性。

2.2 Consistency Regularization

? Self-Training using Selection Network for Semi-supervised Learning_數據集

Self-Training using Selection Network for Semi-supervised Learning_數據集_02

3. METHOD

本文摘自：https://blog.51cto.com/u

Self-Training using Selection Network for Semi-supervised Learning2021-10-18 17:38:56