Translate

2018. január 27., szombat

Az első mérföldkő: összeálltak az adatok

Így fest a cönológiai adattábla első néhány sora a Juice szoftverben...

... illetve a traites táblázat az R-ben

A lengyel kollégák együttműködésével a napokban sikerült elérni a Polonez projektem első harmadára kitűzött mérföldkövét, az elemzéshez szükséges adatok összerendezését. A közel 20.000 cönológiai felvétel alkotta minta lekérésével már az ősszel végeztünk, a keményebb dió a növényi traiteket és a rendszertani helyzetet tartalmazó rész precíz és dokumentált összeállítása volt. A táblázat 2010 fajra vonatkozóan tartalmaz jellegadatokat a CLO-PLA és a LEDA adatbázisokból, továbbá rendszertani adatokat a Catalogue of Life szerint. A munka legnehezebb (és talán legunalmasabb) részét a különböző adatbázisok által követett nevezéktanok egységesítése jelentette. Ezután következett egy félig-meddig automatizált fázis, amelyben a forrásadatbázisok rekordjainak fajonkénti és traitenkénti robusztus (vagyis a kiugró értékeket "intelligensen" felismerő és mellőző) átlagolása, kvalitatív változók esetén többnyire a módusz kiválasztása történt. A traitadatok minőségellenőrzése, a "gyanús" rekordok azonosítása folyamatosan történik - sajnos nem lehetünk teljesen biztosak abban, hogy a változatos forrásokból összegyűjtött, adatbázisokból átvett jellegadatok reálisak és egymással tökéletesen összehasonlíthatóak, de bízunk benne, hogy ha gondosan járunk el, akkor a hiba mértéke jelentősen kisebb, mint a keresett, biológiai mintázat. Cseppet sem meglepően nem minden faj minden traitjéről van adatunk. Az adathiányok pótlására a rendszertani információn és a traitek közti korreláción alapuló BHPMF módszert fogjuk kipróbálni hamarosan.

Nincsenek megjegyzések:

Megjegyzés küldése