Xiaoping Wu1, Chi Zhan1, Yu-Kun Lai2, Ming-Ming Cheng1, Jufeng Yang1∗
1Nankai Universitet 2Cardiff Universitet
Sammanfattning
skadeinsekter är en av de viktigaste faktorer som påverkar jordbruket produktens avkastning., Korrekt erkännande av skadeinsekter underlättar tidiga förebyggande åtgärder för att undvika ekonomiska förluster. De befintliga datauppsättningarna för den visuella klassificeringsuppgiften fokuserar dock främst på vanliga föremål, t.ex. blommor och hundar. Detta begränsar tillämpningen av kraftfull djup inlärningsteknik på specifika domäner som jordbruksområdet. I det här dokumentet samlar vi in en storskalig dataset som heter IP102 för insektspestigenkänning. Specifikt innehåller den mer än 75 000 bilder som tillhör 102 kategorier, som uppvisar en naturlig långstjärtad fördelning., Dessutom kommenterar vi cirka 19 000 bilder med kryssrutor för objektdetektering. IP102 har en hierarkisk taxonomi och skadeinsekter som huvudsakligen påverkar en specifik jordbruksprodukt är grupperade i samma kategori på övre nivå. Dessutom utför vi flera grundläggande experiment på IP102 dataset, inklusive handgjorda och djupa funktionsbaserade klassificeringsmetoder. Experimentella resultat visar att denna datauppsättning har utmaningarna med Inter – och intra-klass varians och data obalans., Vi tror att vår IP102 kommer att underlätta framtida forskning om praktisk insektsbekämpning, finkornig visuell klassificering och obalanserade inlärningsfält. Vi gör datauppsättningen och förutbildade modeller allmänt tillgängliga på https://github.com/xpwu95/IP102.
papper
belyser
- den största offentliga datauppsättningen för insektspestigenkänning. Denna dataset innehåller 102 skadeinsekter, inklusive 75,222 bilder med kategorietiketter och 18,976 bilder med bounding lådor.
- omfattande experiment på den föreslagna datauppsättningen.,
Motivation
- Insektspest är en av de viktigaste faktorerna som påverkar avkastningen på jordbruksprodukter. Korrekt erkännande av skadeinsekter underlättar tidiga förebyggande åtgärder för att undvika ekonomiska förluster.
- befintliga småskaliga insektspestdataset kan inte väl uppfylla kravet på djup teknik.
statistik för den föreslagna IP102
Figur 1: statistik för den föreslagna IP102-datauppsättningen. a) hierarkiskt taxonomisystem. B) statistiska uppgifter.,
utmaningar för den föreslagna IP102
Figur 2: utmaningar för den föreslagna IP102 datauppsättningen. a) obalanserad fördelning. (b) Inom & inter-klass variansen.,