Xiaoping Wu1, Chi Zhan1, Yu-Kun Lai2, Ming-Ming Cheng1, Jufeng Yang1∗
1Nankai Universitetet 2Cardiff University
Abstrakt
Insekt skadedyr er en av de viktigste faktorene som påvirker landbruksprodukt avkastning., Nøyaktig anerkjennelse av insekt skadedyr forenkler rimelig forebyggende tiltak for å unngå økonomisk tap. Men den eksisterende datasett for visuell klassifisering oppgaven i hovedsak fokusere på vanlige objekter, for eksempel, blomster og dyr. Dette begrenser anvendelsen av kraftig dyp læring teknologi på bestemte domener som landbrukssektoren. I dette papiret, samler vi inn en stor-skala dataset som heter IP102 for insekt skadedyr anerkjennelse. Spesielt, den inneholder mer enn 75 000, med bilder som tilhører 102 kategorier, som viser en naturlig long-tailed distribusjon., I tillegg vil vi kommentere om 19,000 bilder med byksende bokser for objekt deteksjon. Den IP102 har en hierarkisk taksonomi og insekt skadedyr som hovedsakelig påvirker en bestemt landbruksprodukt er gruppert i samme øvre-level kategori. Videre, kan vi utføre flere baseline eksperimenter på IP102 dataset, inkludert håndlagde og dyp funksjon basert klassifisering-metoder. Eksperimentelle resultater viser at dette datasettet har utfordringer på inter – og intra-klasse varians og data ubalanse., Vi tror vår IP102 vil legge til rette for fremtidig forskning på praktiske insekt kontroll av skadedyr, finkornet visuell klassifisering, og ubalanserte læring felt. Vi gjør datasettet og pre-trente modeller offentlig tilgjengelig på https://github.com/xpwu95/IP102.
Papir
Høydepunkter
- Den største offentlige datasett for insekt skadedyr anerkjennelse. Dette datasettet inneholder 102 insekt skadedyr, inkludert 75,222 bilder med kategorien etiketter og 18,976 bilder med byksende bokser.
- Omfattende eksperimenter på den foreslåtte datasett.,
Motivasjon
- Insekt skadedyr er en av de viktigste faktorene som påvirker landbruksprodukt avkastning. Nøyaktig anerkjennelse av insekt skadedyr forenkler rimelig forebyggende tiltak for å unngå økonomisk tap.
- Eksisterende småskala insekt skadedyr datasett kan også tilfredsstille kravet til dyp teknologi.
Statistikk av den foreslåtte IP102
Figur 1: Statistikk av den foreslåtte IP102 dataset. (a) Hierarkisk taksonomiske system. (b) Statistisk informasjon.,
Utfordringer av den foreslåtte IP102
Figur 2: Utfordringer for den foreslåtte IP102 dataset. (en) Ubalansert fordeling. (b) Intra- & inter-klasse varians.,