Translate

2021. január 6., szerda

Mesterséges intelligencia - igazi fajismeret? Avagy mire jók a növényhatározó alkalmazások

A fajok felismerése egy elsőre bonyolultnak tűnő mintázat-felismerési probléma: bizonyos vizuális (és nem csak vizuális) mintázatokat észlelve bizonyos fajhoz sorolunk egyedeket. Korunk egyik technológiai zászlóshajója a mesterséges intelligencia, azon belül is a gépi tanulás, amelynek lényege, hogy "tanuló adatokat" megadva a gép felismer törvényszerűségeket, amelyek alapján új adatokra vonatkozóan döntéseket tud hozni. Ha a tanuló adatok a fajok jellemzőit tartalmazzák (pl. róluk készült fotók vagy hangfelvételek), akkor a gép "megtanítható" a határozásra, az új adatokat a megtanított tudás alkalmazásával fogja besorolni. Az automatizált fajfelismerés tudományos potenciálja óriási az ökológiában (is), hiszen ha a kellő megbízhatósági szintet elérik az eszközök, akkor sokkal kisebb zavarással, sokkal kevesebb szubjektív tényezővel, kevesebb (vagy más jellegű) logisztikai korláttal több és standardizáltabb adatot lehet gyűjteni. Madártani felmérésnél például a felmérő jelenléte egy fontos zavaró tényező a madarak számára. Egyes fajok egy napnak csak korlátozott időszakában aktívak; ha éppen nem akkor vagyunk jelen, nem vesszük őket észre. Ha azonban kihelyezünk egy hangrekordert, amely folyamatosan veszi az élőhelyen megszólaló madárhangokat, majd azokat fel is ismeri, azzal a fenti problémákat kiküszöböltük. Ezt azonban még számos egyéb kihívás nehezíti, ld. ezt a review-cikket. (Létezik egyébként már "okostávcső" is a Swarovski jóvoltából, bár ennek a tudományos relevanciája még elhanyagolható.) A növények esetén meglátásom szerint egyelőre nem annyira a tudományos adatgyűjtés, inkább az ismeretterjesztés, az érdeklődők és a botanika határterületein dolgozók igényeinek kielégítése a cél. A gyakorlatban ez annyit tesz, hogy sok kiránduló, gazdálkodó, terepen dolgozó, de elmélyült botanikai ismeretekkel nem rendelkező ember szeretné, ha néha megmondaná valaki ennek vagy annak a virágnak, fának, gyümölcsnek a nevét. (Közvetetten, persze, citizen science formájában ez is hasznosulhat a tudományban.) Az efféle kérdésekre a választ sokan jelenleg is a Facebookon, valamelyik természetismereti csoportban találják meg, amitől már csak egy lépés lenne, ha egy megbízható alkalmazás automatikusan tudna válaszolni. Ezzel a céllal már számos okostelefonos alkalmazás beszerezhető - róluk lesz szó ebben a bejegyzésben.

Borzas nefelejcs (Myosotis ramosissima)

De mennyire is jók valójában ezek az alkalmazások? Hogyan használjuk őket tényleg okosan, mikor jelentenek igazi segítséget? Ennek eldöntésére végeztem egy tesztet. Kiválasztottam 20 növényfotómat, majd mindegyiket meghatároztattam okostelefonos applikációkkal. A fotók közelképek elmosott háttérrel, így a kérdéses növény mindegyiken kiemelkedik. A fajok Magyarországon honosak, mindegyik egyértelműen (bár nem egyformán könnyen) felismerhető a fotó alapján. Az összes fotó megtekinthető ezen az oldalon. A pontozás az alábbi rendszer szerint történt. 1 pont járt azért, ha az app a legvalószínűbb fajként helyes választ adott. 0.75 pont járt azért, ha a kérdezett faj az öt legvalószínűbb megoldás között szerepelt, de nem az első helyen. 0.5 pontot ért, ha a megoldások között közeli rokon fajok szerepeltek, de a kérdéses növény nem, vagy nem az öt legvalószínűbb lehetőség között volt a helyes válasz. 0.25 ponttal honoráltam, ha az app nem adott közeli találatot, de legalább a család szintjére szűkítette a megoldások körét (pl. ha a csillagpázsitnál felismerte, hogy pázsitfűféle). 0 pont járt az ennél pontatlanabb válaszért. Fontos megjegyeznem, hogy nem vagyok egy telefonguru, ezért nem annyira technikai szemléletű, inkább felhasználó-központú a vizsgálatom. Csak ingyenes verziókat teszteltem. A tesztelt applikációk betűrendben az alábbiak voltak, és rögtön írom is a tapasztalatokat.

Flora Incognita: Egyszerű, letisztult küllemű, logikus alkalmazás, amely megpróbálja követni a hagyományos határozás menetét. A határozás elején választanunk kell, hogy a kérdéses növény egy virágos lágyszárú vagy cserje, egy fa, egy fű- vagy sásféleség, vagy pedig egy haraszt. Utána az app megadott részekről kér fotót, pl. virágos lágyszárú/cserje esetén először a virágról felülről. Ha ennyiből nem ismeri fel, akkor újabb részletet kér a levélről, majd sikertelenség esetén egyet a virágról oldalról, aztán a termésről, és az egész növényről. Ha még így sem elég biztos a megoldás, akkor felkínál több alternatívát, amiket az egyezés erőssége szerint súlyoz, illetve van lehetőség új fajt bevinni is. Mivel nem készültem ennyi fotóval, minden növényt egyetlen fotóból kellett kitalálnia, ezért az eredmény az appra nézve hátrányos, de még így is 17,5 pontot ért el. A pusztai ternyére közönséges ternyét mondott, a nagy pacsirtafüvet más pacsirtafüveknek vélte, illetve a sokvirágú habszegfüvet a keresztesek között kereste. Rögtönöztem egy gyors kerti tesztet, ahol a kéréseknek megfelelő fotókat tudtam készíteni, így kitalálta a perzsa veronikát, a tyúkhúrt, sőt, az ugarpalástfű csíranövényét is. (Hozzá kell tennem, hogy növényfotózásra szinte alkalmatlan a telefonom.) Reklámmentes és teljesen ingyenes alkalmazás, melynek egyetlen hátrányaként esetleg az róható fel, hogy (egyelőre) csak európai fajok vannak benne. Jobban utánaolvasva kiderül, hogy a Flora Incognita az Ilmenaui Egyetem és a Max Planck Intézet közös projektje, amelyben az "okos" technológiát a botanikai kutatás szolgálatába állítva végeznek fejlesztéseket. A projekt keretében érdekes tudományos cikkek is szép számmal jelentek meg, pl. arról, hogy mely növényi részek a leginformatívabbak a fotóról történő határoztatáskor.

LeafSnap: A kép feltöltése vagy a fotózás után ki kell választanunk, hogy milyen növényi rész van a képen. Idegesítően sok a reklám, a fizetős prémium verzióban ezektől bizonyára mentesülünk. 17,75 ponttal zárt, ez a második legjobb eredmény.

NatureID: Csak fotóznunk kell mindenféle állítgatás nélkül, viszont egy nap csak korlátozott mennyiségű (talán 5) képet enged. A teszt első lefuttatása után néha újrateszteltem, és előfordult, hogy más eredményeket kaptam, ezek a pontszámon is változtattak. A végső táblázatom szerint 14,75 pontot ért el.

PictureThis: Fizetős alkalmazás, csak három képet lehetett ingyen határoztatni, azokon viszont aránylag jól szerepelt (a nehezebbeket töltöttem fel). Kár érte.

Plant Lens: Igen rövid tapasztalatra engedett szert tenni ez az alkalmazás. Az elején már gyanítottam, hogy nem lesz ez annyira ingyenes, mint ahogyan hirdetik. Miután elkérte az engedélyeket a kamerám és a tárhelyem használatához, bedobtam a csillagpázsit fotóját. A fancy külcsínnyel profi analízis hatását próbálta kelteni, aztán részben kicsillagozott betűkkel írta az eredményt, ígérve, hogy 3 napos ingyenes használat után évi 22 499 Ft-ért megmutatja az eredményt. Persze, a látszó betűkből kitaláltam, hogy a pirók ujjasmuharra gondolt. Kérem szépen, félrehatározni én ennél olcsóbban is tudok... A Plant Lens így 0 ponttal zárta a tesztet.

PlantNet: Nagyon egyszerű és felhasználóbarát, közben jól teljesítő alkalmazás. Csak fotózunk, megmondjuk, hogy milyen növényi részt ábrázol a kép, és jön a megfejtés. Reklámmal nem találkoztam, teljesen ingyenesnek és funkcionálisnak tűnik, és még a versenyt is megnyerte 18 pontjával.

PlantSnap: Bosszantóan sok reklámmal megtűzdelt alkalmazás. Egy nap leforgása alatt 10 határozást enged az ingyenes verzió. A feltöltött képen nekem kell bejelölnöm az informatív részt, még ha az nem is fér bele az ezt megjelölendő négyzet alakú fókuszba. 10-ből 7 pontot ért el, ami nem valami fényes, így pláne nem látok racionális indokot, ami miatt megérné ezzel foglaltatni eszközünk memóriáját.

Seek: Sok a nagyon pontatlan, bár emiatt mértéktartó határozás, pl. a nemes cickafarkról csak annyit sikerült elárulni, hogy kétszikű. Szerény 8,25 pontot gyűjtött be. Úgy látom, ez az iNaturalist természetbúvár közösség határozó appja, sok projekthez, kihíváshoz lehet csatlakozni. Lehet, hogy az adatgyűjtés szempontjából kedvezőnek találják, hogy az adatok inkább pontatlanok, mint tévesek.


Az eredmények

Google Lens: olvasói kérdés nyomán, utólag adtam hozzá, a táblázatban nem szerepel. A Google ingyenes fordított képkeresője, nagyon felhasználóbarát, de csak közepes eredményt, 15,75 pontot ért el. Érdekessége, hogy egyik képre sem kapott 0 pontot, de 1-es is aránylag ritkán - vagyis ritkán maradt teljesen tanácstalan, de a kisebb hibák, pontatlanságok gyakoriak.

Azt láthatjuk tehát, hogy a növényhatározó alkalmazások megbízhatósága eléggé tág határok között mozog, és a legjobb eredmény is "csak" 90%-os lett az általam alkalmazott pontrendszer szerint (amelyben nem tökéletes válasz is érhetett töredékpontot). Szintén van különbség hozzáférhetőség tekintetében. A versenyt a PlantNet nyerte, de őszintén szólva több lehetőséget látok a Flora Incognitában. Érdemes megjegyezni, hogy az applikációk megbízhatósága nagy mértékben függ a fotók minőségétől. A tesztemben ideálishoz közeli képeket használtam, de telefonnal ritkán sikerül ilyeneket készíteni, maguk a növények sincsenek mindig "tökéletes" állapotban.

A sokvirágú habszegfű (Silene multiflora) kemény diót jelentett az alkalmazásoknak

Sokatmondó az egyes fotók felismerési sikere is. A sokvirágú habszegfű fotójára csak a PictureThis kapott 0,75 pontot, a NatureID pedig 0,5-öt, így több 0-val az átlag 0,18 lett. A gyenge eredmény valószínűleg egyaránt köszönhető annak, hogy a fotón csak virágzat szerepelt, ami eléggé karcsú megjelenésű, fontos bélyege az elágazás módja, maguk a virágok kicsik, világosak, így összességében nem sok információt hordoznak, valamint annak, hogy a sokvirágú habszegfű egy keleties, euro-szibériai elterjedésű faj, és azokban az országokban hiányzik vagy nagyon ritka, ahonnan valószínűleg a tanuló adatok származnak. Átlagosan 0,5-0,5 pontnyi felismerés jött össze a délvidéki perjeszittyóra, a pusztai ternyére, a sárga palkára és a nagy pacsirtafűre. Mind a négy fajra igaz, hogy vannak nagyon hasonló, de jóval gyakoribb és elterjedtebb rokonaik, amelyektől apróbb bélyegek különböztetik meg, valamint amelyek mellett alulreprezentáltnak számíthatnak a tanuló fotók között. A legkönnyebben felismerhető fotóknak a vastövű imola (átlag 1 pont), mezei szarkaláb, a madárfészek-kosbor (0,96-0,96), az erdei szellőrózsa (0,89), a fehér gyíkfű (0,82) valamint a sóskaborbolya és a tavaszi sás (0,82-0,82) bizonyult. Az utóbbi faj jó eredménye meglepett, hiszen a sások nem tartoznak a könnyen határozható csoportok közé, igaz, a fotó kvázi-tökéletes volt, a tavaszi sás pedig egy könnyű faj a sások között. Mindemellett a sikeresen felismert fajok jellemzően karakteres megjelenésű, jól fotózható, elterjedt növények.

A vastövű imolát (Centraurea scabiosa s.lat.) minden alkalmazás kitalálta

Hogyan és mikor érdemes tehát használni a jelenleg rendelkezésre álló applikációkat? Azt gondolom, hogy a jól teljesítő alkalmazások arra mindenképpen alkalmasak, hogy puszta kíváncsiságát kielégítse egy laikus anélkül, hogy komoly utánajárásba kelljen kezdenie. Ha jó a fotó, és eleve olyan faj a kérdés, ami egy átlagos kirándulónak, gazdálkodónak megragadja a tekintetét, akkor eléggé megbízható lesz a válasz, ha meg becsúszik egy hiba, akkor sincs gond. Ha külföldre utazom és nem lesz növényhatározóm az adott országhoz, de lesz megfizethető net a telefonomon, akkor nagyon valószínű, hogy én is valamelyik appot hívom segítségül. Nehezebben fotózható növényeknél érdemes több kritikával szemlélni az eredményt, illetve érdemes mindig figyelni arra, ha az alkalmazás több alternatív megoldást kínál. Soha ne bízzunk annyira az eredményben, hogy az alapján fogyasszunk a növényből! Mindig emlékezzünk arra, hogy a határozó nem mindentudó, csak a meglévő tudásra építve próbálja automatizálni a szakértői döntést. "Felkészültsége" a tanuló adatsoron (vagyis a szakértők által ellenőrzött, meghatározott fotókon) és a tanulás módján múlik; ami ehhez képest újdonság (pl. nem ismert faj, szokatlan körülmények), ott a tévedés esélye megnő. Várható, hogy a gépies munkában, az állatok és növények "futószalagon" történő azonosításában a mesterséges intelligencia szerepe egyre nagyobb lesz a tudományban is. Gyanítom azonban, hogy a hús-vér szakértők még jó ideig elengedhetetlenek lesznek a váratlan, egyedi problémák megoldásában. Nem utolsó sorban az önálló felfedezések személyes örömét egyik applikáció sem pótolhatja, ami egy nagyon fontos szempont az oktatás-nevelés számára. Azt gondolom ugyanis, hogy az alkalmazás segítségével könnyen szerzett információ, a faji hovatartozás, amihez több alkalmazásnál további ismertetők is társulnak, nem feltétlenül kedvez a természet gyerekekkel való megismertetésének. Sem pszichológus, sem pedagógus nem vagyok, azt viszont tudni vélem, hogy a gyerekek számára a megismerés és egy témában való elmélyülés nem pusztán a száraz információ begyűjtését jelenti, hanem egy gyakorlatibb, tapasztalatibb érintkezést, élményszerzést, átélést. Feltételezem, hogy az a gyerek, aki végiglapozza a határozókulcsot, közben háromszor "eltéved" benne, a kezét közben összeszúrja a begyűjtött bogáncs, megérzi a határozó lapjai közé rakott, megszáradt növény illatát, feltűnik neki, ahogy a lepréselt növény virágai a lapok között termésbe értek, nos az a gyerek még akkor is többet fog tudni, ha nem árasztja el információval a telefonja.

Végezetül szóvá teszem azt a néhány hónapja érzett felháborodásomat, amikor megláttam, hogy az egyik "zöld" tematikában utazó online magazin azt a címet adta a cikkének, hogy "Bárki vérbeli természetbúvár lehet egy mobillal", majd a folytatásban a "korábban bevált, ám lassú és körülményes" növény- és állathatározó könyvek korszerű alternatívájaként mutatott be három okostelefonos fajfelismerő applikációt (szerepeltek a tesztben is). Arról lehet vitatkozni, hogy mi a vérbeli természetbúvárság definíciója, és el lehetne intézni annyival, hogy ez a cikk nem nekem szól, és hogy milyen jól terjed a tudás a világban az efféle appok által, meg hogy miért baj az, ha Egyszerű Béláné Gizike rosszul határozza meg a kikapált egyéves veronikákat. Mindezt értem. Amit azonban borzasztóan károsnak, valójában tudományellenesnek tartok, az annak a tévképzetnek a terjesztése, amit a cikk címe sugall: hogy nem kell itt utánajárni, nem kell megkérdezni a szakértőt, aki egész életét erre szánta, nem kell lehajolni-begyűjteni-nagyítózni-kidobni-visszamenni-megintmegnézni, nem kell érte harcolni, mert csak egy bökés a képernyőre, és már dobja is ki a magasságos app a fajnevet. Aztán szelfi a zöldben, fotó instára, és meg is vagyunk, minek ezzel annyit vacakolni?! Nem, kérem, ezek tudományos kérdések! Lehet, hogy Egyszerű Béláné Gizikének mindegy, milyen veronikát kapált ki, és a világnak is mindegy, hogy Gizike tudja-e a pontos fajnevet, de meggyőződésem, hogy mindenkinek jobb, ha még Gizike is tudja, hogy az egyéves veronikák határozása során legalább 5-10 faj szóba jöhet, és akik ezeket megbízhatóan felismerik, netán magukat a fajokat is tudják kritikusan szemlélni, azok tudását nem adták ingyen. Nélkülük aztán Gizike bökdöshetné a képernyőt... Nagy szerencse, amikor egyes appokban visszaköszön ez a kritikus szemlélet, és szemmel láthatóan a fejlesztők is igyekeznek megóvni a felhasználót a hamis bizonyosságtól több alternatív megoldás felkínálásával. Kezeljük tehát helyén az eszközöket, és becsüljük meg a valódi tudást - amíg létezik!

2 megjegyzés:

  1. Én legtöbbet az iNaturalist-ot használom. Én azt vettem észre ennél az algoritmusnál, hogy a feltöltött fotók alapján dolgozik és minél több jó fotó van az adatbázisban annál pontosabb. De a fő probléma szerintem ezeknél a rendszereknél, hogyha egy adott bélyeget kellene a határozáshoz akkor azt nem biztos hogy tudja, mert nem szerepel a fotókon, vagy csak a fotók egy részén, pl csészelevél alakja, szőrözöttsége, stb. De a nemzetséget azért elég határozottan megmondja ez a rendszer. Lehet egy jó fejlesztési irány lenne, hogyha pl. felismeri a nemzetséget a program akkor kérne, hogy az adott határozásban fontos részét fotózza le az ember, pl.: szár, levél, virág hátulja, stb.

    VálaszTörlés
    Válaszok
    1. Köszönöm a hozzászólást! A Flora Incognitában pont az tetszik, hogy specifikusan rákérdez részletekre, ha nem talál elég magas fokú egyezést. Azt gondolom, hogy összességében eléggé kevés olyan fajcsoport van Közép-Európában, ahol virág felülről és oldalról, levél felülről, termés és habitusfotó ne lenne elég a határozáshoz. Ahol mindez kevés, azok már valóban szakértőt igénylő, szövevényes taxonómiájú csoportok, pl. szedrek, pitypangok, kakukkfüvek, rózsák, palástfüvek, pimpók egyes alakkörei...

      Törlés