Hoe om plantsiektes op te spoor met behulp van masjienleer: 6 stappe
Hoe om plantsiektes op te spoor met behulp van masjienleer: 6 stappe
Anonim
Hoe om plantsiektes op te spoor met behulp van masjienleer
Hoe om plantsiektes op te spoor met behulp van masjienleer

Die proses om siek plante op te spoor en te herken, was nog altyd 'n handmatige en vervelige proses wat vereis dat mense die plantliggaam visueel inspekteer, wat dikwels tot 'n verkeerde diagnose kan lei. Daar word ook voorspel dat namate die globale weerpatrone weens klimaatsverandering begin wissel, gewassiektes waarskynlik erger en wydverspreid sal word. Daarom is dit belangrik om stelsels te ontwikkel wat gewasse vinnig en maklik ontleed en 'n spesifieke siekte identifiseer om verdere gewasskade te beperk.

In hierdie instruksies sal ons 'n masjienleerkonsep, bekend as 'oordragleer', ondersoek om beelde van siek rysplante te klassifiseer. Dieselfde metode kan hergebruik word vir enige ander beeldklassifikasieprobleem.

Stap 1: Tipes rys siektes

Tipes rys siektes
Tipes rys siektes

Rys is een van die gewildste stapelvoedselgewasse wat hoofsaaklik in Asië, Afrika en Suid -Amerika verbou word, maar is vatbaar vir 'n verskeidenheid plae en siektes. Fisiese eienskappe soos die verkleuring van blare kan gebruik word om verskeie siektes wat die rysgewas kan beïnvloed, te identifiseer. Byvoorbeeld, in die geval van Brown-Spot, 'n swamsiekte wat die beskermende omhulsel van die blare aantas, is die blare bedek met verskeie klein ovaalbruin kolle met grys middelpunte, terwyl die blare in die geval van Leaf-Blast bedek is met groter bruin letsels. Net so kan die blare wat deur die Rice Hispa -plaag geraak word, geïdentifiseer word deur die lang spoormerke wat op die oppervlak van die blaar ontwikkel.

Stap 2: Hoe het vorige metodes siektes opgespoor?

Hoe het vorige metodes siektes opgespoor?
Hoe het vorige metodes siektes opgespoor?

Vorige metodes om siek plantbeelde outomaties te klassifiseer, soos reëlgebaseerde klassifiseerders soos gebruik in [1], maak staat op 'n vaste stel reëls om die blaar in geaffekteerde en onaangeraakte streke te segmenteer. Sommige van die reëls om funksies te onttrek, behels die waarneming van die verandering in die gemiddelde en standaardafwyking tussen die kleur van die aangetaste en onaangeraakte streke. Reëls om vormkenmerke te onttrek, behels dat verskeie primitiewe vorms individueel bo -op die aangetaste gebied geplaas word en die vorm geïdentifiseer word wat die maksimum oppervlakte van die geaffekteerde gebied dek. Sodra die kenmerke uit die beelde gehaal is, word 'n stel vaste reëls gebruik om die beelde te klassifiseer, afhangende van die siekte wat die plant kan beïnvloed. Die grootste nadeel van so 'n klassifiseerder is dat dit verskeie vaste reëls vir elke siekte benodig, wat dit weer vatbaar kan maak vir raserige data. Bogenoemde beelde wys hoe 'n reëlgebaseerde besluitboom gebruik kan word om die beeld in twee streke te verdeel.

1. Santanu Phadikar et al., "Klassifikasie van rys siektes met behulp van funksieseleksie en reëlgenereringstegnieke," Computers and Electronics in Agriculture, vol. 90, Januarie 2013.

Stap 3: Oordragleer

Oordragleer
Oordragleer

Die beeldklassifikasietegniek wat in hierdie instruksies beskryf word, maak gebruik van die basiese struktuur van 'n CNN wat bestaan uit verskeie konvolusionele lae, 'n poollaag en 'n laaste volledig verbind laag. Die konvolusionele lae dien as 'n stel filters wat die hoëvlakkenmerke van die beeld onttrek. Max-pooling is een van die algemene metodes wat gebruik word om lae bymekaar te maak om die ruimtelike grootte van die onttrekte funksies te verminder, waardeur die berekeningskrag verminder word om die gewigte vir elke laag te bereken. Uiteindelik word die onttrekte data deur 'n volledig gekoppelde laag, saam met 'n softmax -aktiveringsfunksie, wat die klas van die beeld bepaal, deurgegee.

Maar die opleiding van pasgemaakte CNN's lewer dalk nie die gewenste resultate nie en kan 'n baie lang opleidingstyd hê.

Om die kenmerke van die opleidingsbeelde te leer, gebruik ons 'n metode genaamd Transfer Learning, waarin die 'boonste' lae van 'n vooraf opgeleide model verwyder word en vervang word met lae wat die funksies wat spesifiek is vir die opleidingsdatastel kan leer. Oordragleer verminder die opleidingstyd in vergelyking met modelle wat willekeurig geïnitialiseerde gewigte gebruik. Ons metode gebruik ses verskillende vooraf opgeleide modelle, naamlik AlexNet, GoogLeNet, ResNet-50, Inception-v3, ShuffleNet en MobileNet-v2.

Die beeld toon die GoogLeNet -argitektuur waar blou vir konvolusie lae gebruik word, rooi vir die samevoeging van lae, geel vir softmax lae en groen vir konkat lae. U kan hier meer leer oor die innerlike werking van 'n CNN.

Die rysiekte -datastel bestaan uit beelde van blare van gesonde en siek rysplante. Die beelde kan in vier verskillende klasse ingedeel word, naamlik Brown-Spot, Rice Hispa, Leaf-Blast en Healthy. Die datastel bestaan uit 2092 verskillende beelde met elke klas wat 523 beelde bevat. Elke prent bestaan uit 'n enkele gesonde of siek blaar wat op 'n wit agtergrond geplaas is.

Ons verdeel die beelddatastel in opleiding, validering en toetsing van beeldstelle. Om te veel aanpassings te voorkom, vergroot ons die opleidingsbeelde deur die opleidingsbeelde te skaal en om te draai om die totale aantal oefenmonsters te verhoog.

Die kode en afhanklikes is open source en kan hier gevind word: GitHub Code

Vir verskillende beeldklassifikasie -toepassings kan ons die opleidingsbeelddatastel eenvoudig verander.

Stap 4: Leer die model op

Opleiding van die model
Opleiding van die model
Opleiding van die model
Opleiding van die model
Opleiding van die model
Opleiding van die model

Afhangende van die geheuegrootte wat elke model benodig, word die vooraf opgeleide modelle in groter en kleiner modelle ingedeel. Die kleiner modelle verbruik minder as 15 MB en is dus beter geskik vir mobiele toepassings.

Onder die groter modelle het Inception-v3 die langste oefentyd van ongeveer 140 minute, terwyl AlexNet die kortste opleidingstyd van ongeveer 18 minute gehad het. Onder die kleiner mobiele-georiënteerde modelle het MobileNet-v2 die langste opleidingstyd van ongeveer 73 minute, terwyl ShuffleNet die kortste opleidingstyd van ongeveer 38 minute gehad het.

Stap 5: Toets die model

Toets die model
Toets die model
Toets die model
Toets die model
Toets die model
Toets die model

Onder die groter modelle het Inception-v3 die hoogste toets akkuraatheid van ongeveer 72,1%, terwyl AlexNet die laagste toets akkuraatheid van ongeveer 48,5% gehad het. Onder die kleiner mobiele-georiënteerde modelle het MobileNet-v2 die hoogste toets akkuraatheid van 62,5%, terwyl ShuffleNet die laagste toets akkuraatheid van 58,1% gehad het.

MobileNet-v2 het aansienlik goed presteer by die klassifikasie van beelde van bruinvlek, blaarblaas en gesonde blare, terwyl dit verskeie foutklassifikasies vir Rice Hispa gemaak het met 'n akkuraatheid van slegs 46,15%.

Inception-v3 toon soortgelyke klassifikasie resultate as MobileNet-v2.

Stap 6: Bykomende toetse

Bykomende toetse
Bykomende toetse
Bykomende toetse
Bykomende toetse

Die prent hierbo wys hoe die MobileNet-v2-model 'n beeld van 'n grasblaar teen 'n wit agtergrond as Rice Hispa verkeerd klassifiseer.

Ons het ook die akkuraatheid van MobileNet-v2 getoets op afgesnyde beelde van Rice Hispa waarin die wit agtergrond tot die minimum beperk is sodat die blaar 'n maksimum oppervlakte in die prent beslaan. Vir afgesnyde beelde van Rice Hispa het ons 'n akkuraatheid van ongeveer 80,81% waargeneem, dws vir gesnyde beelde van Rice Hispa het ons 'n beduidende toename in die klassifikasie -akkuraatheid by ongekapte toetsmonsters waargeneem. Daarom stel ons voor dat werklike implementerings van die opsporing van rysiekte met behulp van konvolusionele neurale netwerke die toetsbeelde moet sny om agtergrondgeraas te verwyder om die akkuraatheid te verbeter.