深度學(xué)習(xí)模型已經(jīng)成功地應(yīng)用于各種基于圖像的植物表型應(yīng)用,包括疾病檢測(cè)和分類。然而,有監(jiān)督的深度學(xué)習(xí)模型的成功部署需要大量的標(biāo)記數(shù)據(jù),由于固有的復(fù)雜性,這在植物科學(xué)(和大多數(shù)生物學(xué))領(lǐng)域是一個(gè)重大挑戰(zhàn)。具體來說,數(shù)據(jù)注釋是昂貴的、費(fèi)力的、耗時(shí)的,并且需要用于表型任務(wù)的領(lǐng)域?qū)I(yè)知識(shí),尤其是對(duì)于疾病。為了克服這一挑戰(zhàn),已經(jīng)提出了主動(dòng)學(xué)習(xí)算法來減少深度學(xué)習(xí)模型所需的標(biāo)記量,以實(shí)現(xiàn)良好的預(yù)測(cè)性能。
在大豆葉子上收集的九類數(shù)據(jù)(八類應(yīng)激數(shù)據(jù)和一類健康數(shù)據(jù)),其中包括第一個(gè)數(shù)據(jù)集
主動(dòng)學(xué)習(xí)方法通過使用采集函數(shù)自適應(yīng)地建議樣本進(jìn)行注釋來工作,以在固定標(biāo)記預(yù)算下實(shí)現(xiàn)最大(分類)性能。本文作者報(bào)告了四種不同的主動(dòng)學(xué)習(xí)方法的性能,(1)深度貝葉斯主動(dòng)學(xué)習(xí)(DBAL),(2)熵,(3)最小置信度,(4)核心集,基于傳統(tǒng)的隨機(jī)采樣標(biāo)注的兩種不同的基于圖像的分類數(shù)據(jù)集。
第二個(gè)數(shù)據(jù)集的九個(gè)類別包括八個(gè)雜草種類和一個(gè)無雜草類別(標(biāo)記為陰性)。從與相關(guān)的公開數(shù)據(jù)集中獲取的圖像(Olsen et al., 2019)
第一個(gè)圖像數(shù)據(jù)集由屬于八種不同大豆脅迫和健康類別的大豆 [Glycine max L. (Merr.)] 葉子組成,第二個(gè)圖像數(shù)據(jù)集由來自田間的九種不同雜草組成。對(duì)于固定的標(biāo)記預(yù)算,作者觀察到,對(duì)于兩個(gè)數(shù)據(jù)集,使用基于主動(dòng)學(xué)習(xí)的獲取策略的深度學(xué)習(xí)模型的分類性能優(yōu)于基于隨機(jī)采樣的獲取。數(shù)據(jù)注釋的主動(dòng)學(xué)習(xí)策略的集成可以幫助減輕植物科學(xué)應(yīng)用中的標(biāo)簽挑戰(zhàn),特別是在專用于注釋的資源有限的情況下。
來源:Wiley Online Library.How useful is active learning for image-based plant phenotyping?
Koushik Nagasubramanian, Talukder Jubery,Fateme Fotouhi Ardakani, Seyed Vahid Mirnezami, Asheesh K Singh, Arti Singh, Soumik Sarkar, Baskar Ganapathysubramanian.
https://acsess.onlinelibrary.wiley.com/doi/10.1002/ppj2.20020