 |
Így fest a cönológiai adattábla első néhány sora a Juice szoftverben... |
 |
... illetve a traites táblázat az R-ben |
A lengyel kollégák együttműködésével a napokban sikerült elérni a Polonez projektem első harmadára kitűzött mérföldkövét, az elemzéshez szükséges adatok összerendezését. A közel 20.000 cönológiai felvétel alkotta minta lekérésével már az ősszel végeztünk, a keményebb dió a növényi traiteket és a rendszertani helyzetet tartalmazó rész precíz és dokumentált összeállítása volt. A táblázat 2010 fajra vonatkozóan tartalmaz jellegadatokat a
CLO-PLA és a
LEDA adatbázisokból, továbbá rendszertani adatokat a
Catalogue of Life szerint. A munka legnehezebb (és talán legunalmasabb) részét a különböző adatbázisok által követett nevezéktanok egységesítése jelentette. Ezután következett egy félig-meddig automatizált fázis, amelyben a forrásadatbázisok rekordjainak fajonkénti és traitenkénti robusztus (vagyis a kiugró értékeket "intelligensen" felismerő és mellőző) átlagolása, kvalitatív változók esetén többnyire a módusz kiválasztása történt. A traitadatok minőségellenőrzése, a "gyanús" rekordok azonosítása folyamatosan történik - sajnos nem lehetünk teljesen biztosak abban, hogy a változatos forrásokból összegyűjtött, adatbázisokból átvett jellegadatok reálisak és egymással tökéletesen összehasonlíthatóak, de bízunk benne, hogy ha gondosan járunk el, akkor a hiba mértéke jelentősen kisebb, mint a keresett, biológiai mintázat. Cseppet sem meglepően nem minden faj minden traitjéről van adatunk. Az adathiányok pótlására a rendszertani információn és a traitek közti korreláción alapuló
BHPMF módszert fogjuk kipróbálni hamarosan.
Nincsenek megjegyzések:
Megjegyzés küldése