Siao-Wu1, Chi Zhan1, Yu-Kun Lai2, Ming-Ming Cheng1, Jufeng Yang1∗
1Nankai University 2Cardiff Univerzitě
Abstrakt
Hmyzích škůdců jsou jedním z hlavních faktorů, které ovlivňují zemědělské výtěžek produktu., Přesné rozpoznání hmyzích škůdců usnadňuje včasná preventivní opatření, aby se zabránilo ekonomickým ztrátám. Stávající datové sady pro úkol vizuální klasifikace se však zaměřují především na běžné objekty,např. To omezuje použití výkonné technologie hlubokého učení na konkrétní oblasti, jako je zemědělská oblast. V tomto článku shromažďujeme rozsáhlou datovou sadu s názvem IP102 pro rozpoznávání hmyzích škůdců. Konkrétně obsahuje více než 75 000 obrázků patřících do 102 kategorií, které vykazují přirozenou distribuci s dlouhým ocasem., Kromě toho anotujeme asi 19 000 obrázků ohraničujícími boxy pro detekci objektů. Na IP102 má hierarchickou taxonomii a hmyzí škůdci, které postihují hlavně jeden konkrétní zemědělských produktů, které jsou seskupeny do stejné upper-level kategorie. Dále provádíme několik základních experimentů na datovém souboru IP102, včetně ručně vyráběných a hlubokých klasifikačních metod založených na funkcích. Experimentální výsledky ukazují, že tato datová sada má výzvy mezi a uvnitř třídy rozptylu a datové nerovnováhy., Věříme, že naše IP102 usnadní budoucí výzkum v oblasti praktické kontroly škůdců hmyzem, jemnozrnné vizuální klasifikace a nevyvážených učebních oborů. Datový soubor a předem vyškolené modely zveřejňujeme na https://github.com/xpwu95/IP102.
papír
zdůrazňuje
- největší veřejný datový soubor pro rozpoznávání hmyzích škůdců. Tato datová sada obsahuje 102 hmyzích škůdců, včetně 75,222 obrázků s štítky kategorií a 18,976 obrázků s ohraničujícími krabicemi.
- rozsáhlé experimenty na navrhovaném datovém souboru.,
motivace
- hmyzí škůdce je jedním z hlavních faktorů ovlivňujících výnos zemědělských produktů. Přesné rozpoznání hmyzích škůdců usnadňuje včasná preventivní opatření, aby se zabránilo ekonomickým ztrátám.
- stávající malé datové sady hmyzích škůdců nemohou dobře uspokojit požadavek hluboké technologie.
Statistiky navrhované IP102
Obrázek 1: Statistika navrhované IP102 dataset. a) hierarchický taxonomický systém. b) statistické informace.,
Výzvy navrhované IP102
Obrázek 2: Výzvy navrhované IP102 dataset. a) nevyvážené rozdělení. b) intra-& mezitřídní rozptyl.,