Xiaoping Wu1, Chi Zhan1, Yu-Kun Lai2, Ming-Ming Cheng1, Jufeng Yang1∗
1Nankai University 2Cardiff University
Zusammenfassung
Insektenschädlinge sind einer der Hauptfaktoren, die den Ertrag landwirtschaftlicher Produkte beeinflussen., Die genaue Erkennung von Insektenschädlingen erleichtert rechtzeitige vorbeugende Maßnahmen, um wirtschaftliche Verluste zu vermeiden. Die vorhandenen Datensätze für die visuelle Klassifizierungsaufgabe konzentrieren sich jedoch hauptsächlich auf gemeinsame Objekte, z. B. Blumen und Hunde. Dies begrenzt die Anwendung leistungsfähiger Deep-Learning-Technologie auf bestimmte Bereiche wie den landwirtschaftlichen Bereich. In diesem Artikel sammeln wir einen groß angelegten Datensatz mit dem Namen IP102 zur Erkennung von Insektenschädlingen. Insbesondere enthält es mehr als 75.000 Bilder aus 102 Kategorien, die eine natürliche Langschwanzverteilung aufweisen., Darüber hinaus kommentieren wir etwa 19.000 Bilder mit Begrenzungsfeldern für die Objekterkennung. Die IP102 hat eine hierarchische Taxonomie und die Insektenschädlinge, die hauptsächlich ein bestimmtes landwirtschaftliches Produkt betreffen, werden in dieselbe obere Kategorie eingeteilt. Darüber hinaus führen wir mehrere Basisexperimente am IP102-Datensatz durch, einschließlich handgefertigter und Deep-Feature-basierter Klassifizierungsmethoden. Experimentelle Ergebnisse zeigen, dass das dataset hat die Herausforderungen der inter – und intra-class-Varianz und Daten Ungleichgewicht., Wir glauben, dass unser IP102 zukünftige Forschungen zur praktischen Schädlingsbekämpfung von Insekten, zur feinkörnigen visuellen Klassifizierung und zu unausgeglichenen Lernfeldern erleichtern wird. Wir stellen den Datensatz und die vortrainierten Modelle unter https://github.com/xpwu95/IP102öffentlich zur Verfügung.
Paper
Highlights
- Der größte öffentliche Datensatz zur Erkennung von Insekten. Dieser Datensatz enthält 102 Insektenschädlinge, darunter 75.222 Bilder mit Kategoriebezeichnungen und 18.976 Bilder mit Begrenzungsrahmen.
- Umfangreiche Experimente zum vorgeschlagenen Datensatz.,
<
- Insektenschädling ist einer der Hauptfaktoren, die den Ertrag landwirtschaftlicher Produkte beeinflussen. Die genaue Erkennung von Insektenschädlingen erleichtert rechtzeitige vorbeugende Maßnahmen, um wirtschaftliche Verluste zu vermeiden.
- Bestehende kleine Insektenschädlingsdatensätze können die Anforderungen der Deep-Technologie nicht gut erfüllen.
Statistiken des vorgeschlagenen IP102
Abbildung 1: Statistiken des vorgeschlagenen IP102-Datensatzes. (a) Hierarchisches Taxonomiesystem. (b) Statistische Informationen.,
Herausforderungen des vorgeschlagenen IP102
Abbildung 2: Herausforderungen des vorgeschlagenen IP102-Datensatzes. a) unausgewogene Verteilung. (b) Intra- & inter-Klasse Varianz.,