Xiaoping Wu1, Chi Zhan1, Yu-Kun Lai2, Ming-Ming Cheng1, Jufeng Yang1∗
1Nankai Universitet 2Cardiff Universitet
Abstrakt
skadedyr er en af de vigtigste faktorer, der påvirker landbrugets produkt udbytte., Nøjagtig anerkendelse af skadedyr Letter rettidige forebyggende foranstaltninger for at undgå økonomiske tab. De eksisterende datasæt til den visuelle klassifikationsopgave fokuserer dog primært på fælles genstande, f.eks. blomster og hunde. Dette begrænser anvendelsen af kraftfuld dyb læringsteknologi på specifikke domæner som landbrugsområdet. I dette papir indsamler vi et stort datasæt ved navn IP102 til genkendelse af insekt skadedyr. Specifikt indeholder den mere end 75.000 billeder, der tilhører 102 kategorier, som udviser en naturlig lang-tailed distribution., Derudover kommenterer vi omkring 19.000 billeder med afgrænsningsbokse til objektdetektion. IP102 har en hierarkisk taksonomi, og de skadedyr, der hovedsageligt påvirker et specifikt landbrugsprodukt, er grupperet i samme kategori på øverste niveau. Desuden udfører vi flere baseline-eksperimenter på IP102-datasættet, herunder håndlavede og dybe funktionsbaserede klassificeringsmetoder. Eksperimentelle resultater viser, at dette datasæt har udfordringerne med Inter – og intra-klasse varians og data ubalance., Vi mener, at vores IP102 vil lette fremtidig forskning i praktisk insektskadedyrsbekæmpelse, finkornet visuel klassificering og ubalancerede læringsfelter. Vi gør datasættet og de forududdannede modeller offentligt tilgængelige på https://github.com/xpwu95/IP102.
papir
højdepunkter
- det største offentlige datasæt til genkendelse af insekt skadedyr. Dette datasæt indeholder 102 skadedyr, herunder 75,222 billeder med kategorietiketter og 18,976 billeder med afgrænsningsbokse.
- omfattende eksperimenter på det foreslåede datasæt.,
Motivation
- insekt skadedyr er en af de vigtigste faktorer, der påvirker udbyttet af landbrugsprodukter. Nøjagtig anerkendelse af skadedyr Letter rettidige forebyggende foranstaltninger for at undgå økonomiske tab.
- eksisterende småskala insekt skadedyr datasæt kan ikke godt opfylde kravet om dyb teknologi.
Statistik af den foreslåede IP102
Figur 1: Statistik af den foreslåede IP102 datasæt. a) hierarkisk taksonomisystem. b) statistiske oplysninger.,
Udfordringer af den foreslåede IP102
Figur 2: Udfordringer for den foreslåede IP102 datasæt. a) ubalanceret distribution. b)intra-& varians mellem klasser.,