Translate

2017. október 31., kedd

Adatbányászat indul!

Már egy hónapja Wroclawban tartózkodom, és a költözéssel és munkahelyváltással járó adminisztrációs hercehurca után a kutatással is végre van időm foglalkozni. Egyelőre a vizsgálatokhoz szükséges adatok elérhetőségének ellenőrzése, az adatok lekérése, rendezése zajlik. Mint korábban írtam, a projektem célja kettős: a lengyel gyepvegetáció jellegalapú numerikus osztályozása, valamint a funkcionális diverzitás és redundancia durvaléptékű mintázatainak felderítése. Ehhez háromféle adatra van szükség: fajkompozíciós adatokra (cönológiai felvételekre), növényi jellegek adataira, illetve környezeti háttéradatokra. Az alábbiakban bemutatom a legfontosabb forrásaimul szolgáló adatbázisokat.


A lengyel vegetációs adatbázis

Ez az adatbázis a Lengyelország területén készített cönológiai mintákat foglalja magában. 2007-ben a Wroclawi Egyetemen létesítették, 2016-ra a digitalizált felvételek száma elérte a 85 000-et. Az adatok nagy része (~40%) száraz, üde és nedves gyepekből származik, de magas (25-25% körüli) az erdőket és cserjéseket, valamint az antropogén növényzetet reprezentáló felvételek aránya is. A kvadrátméretek a tudományterület sajátosságainak és történetének megfelelően változók, de ~90%-ban ismertek. A borításértékek kódolása túlnyomó többségben Braun-Blanquet skálán, ritkábban százalékos skálán, elhanyagolható arányban egyéb módokon történt. A fajneveket az Euro+Med PlantBase nómenklatúrájának megfelelően egységesítették. A felvételek kb. egyharmadánál a moha- és zuzmófajokat is rögzítették. A felvételek többsége 1960 és 2010 között készült, nagyrészt publikált tanulmányokból származik, de publikálatlan adatokat is tartalmaz. A cönológiai felvételekhez igen magas arányban társulnak jó minőségű háttéradatok. A felvételek majdnem 80%-ának max. 10 km-es hibájú pontossággal ismert a lokalitása, ami alapján klimatikus, talajtani és kőzettani változók értékeit is társították hozzájuk. Az adatbázist a TurboVeg szoftverrel tárolják és kezelik, ennek megfelelően lehet különböző formátumokba exportálni. A hozzáférés az adatbázis-kezelők, Zygmunt Kacki és Grzegorz Swacha személyes megkeresése útján lehetséges. További statisztikák és elérhetőségek olvashatók az adatbázis GIVD-oldalán. (A GIVD, Global Index of Vegetation-Plot Databases, a cönológiai adatbázisok nemzetközi meta-adatbázisa, lehetővé teszi a különböző regionális adatbázisok közti böngészést.) Az adatbázis új honlapja jelenleg fejlesztés alatt áll.


LEDA növényijelleg-adatbázis

A LEDA a növények fennmaradásához, regenerációjához és szaporodásához szükséges jellegek ('traitek') adatbázisa. Földrajzi lefedettségét tekintve Északnyugat-Európára koncentrál, de hasonló flórájú országokban is hasznos lehet. 2002-ben létesítették az oldenburgi egyetemen, azóta folyamatosan bővül. Az adatbázis egyedi vagy csoportosított mérési rekordokból áll. Egy rekord számos mezőt tartalmaz, beleértve a mért növény faját, a mért jelleget, a mérés pontos módját, a mérések számát, a vizsgált egyedek számát, több mérés esetén azok szórását, a mérési hibát, a mérés helyét, idejét, a vizsgált növény élőhelyét, környezeti hátterét, irodalmi adat esetén pedig a pontos hivatkozást. A LEDA-nak van egy saját standardja is, amit az új méréseknél alkalmaznak, az adatrekordok mégis igen heterogének a módszertan tekintetében, például hogy a levélterületet a levél rehidrálásával vagy anélkül mérték. Összesen mintegy 18 jellegről és kb. 3000 fajról tartalmaz adatokat, sajnos ezek teljessége jellegenként és fajonként is változó. Az információ publikus, a LEDA honlapjáról traitenként lehet őket letölteni TXT formátumba.


CLO-PLA növényijelleg-adatbázis

Ez a platform a közép-európai fajok klonális és vegetatív jellegeinek összegyűjtésére hivatott. Az első formája 2002-re datálható, tavaly vált elérhetővé a harmadik verzió. Jelenleg több mint 2900 fajról és 29 traitről tartalmaz adatokat. A jellegadatok terepi méréseken és megfigyeléseken, irodalmi közléseken és botanikai illusztrációkon alapulnak, illusztrációkat maga az adatbázis is tartalmaz. A kezelője Jitka Klimešová és Leoš Klimeš, illetve a Cseh Tudományos Akadémia Botanikai Intézete (Třeboň). A felépítése hasonló a LEDA-hoz. Az adatokat a honlapon egy webshophoz hasonló funkcióval kell ingyen "megvásárolnunk", majd emailben kapjuk meg őket automatikusan TXT formátumban, de böngészhetjük őket a honlapon is. A CLO-PLA honlap itt érhető el, s nem rég jelent meg 'data paper'-ük az Ecology-ban.

Képernyőfelvétel a CLO-PLA oldaláról


BiolFlor

A német flóra sokszempontú adatbázisa, amelyben az "igazi" funkcionális jellegek közül csak néhány fontosabb kapott helyet, viszont olyan változók is szerepelnek benne, mint a fajok honossági státusza (megtelepedés ideje), kromoszómaszáma, filogenetikai leszármazása, virágzási ideje, szaporodási sajátosságai, terjedési módja, ökológiai stratégiája, indikátorszámai, élőhelypreferenciája, bolygatástűrése vagy földrajzi elterjedtsége - szinte minden, amit fontosnak gondolhatunk, ha növényfajokról beszélünk. Nem kevesebb, mint 3609 fajról és 57 jellemzőről tartalmaz valamilyen adatot, a rekordok száma összesen 226840. Az adatbázis valóban lenyűgözően sokrétű és részletes, ám azokat a traiteket pont nem tartalmazza, amik nekem most a legfontosabbak, így csak másodlagos szerep jut neki a kutatásomban. A honlapja itt érhető el, az adatok online eléréséhez is meg kell vásárolnunk a CD-n kiadott verziót 25 euróért.


Worldclim

Globális, georeferált klímaadatbázis, tulajdonképpen térinformatikai rétegekként fogható fel. Az adatok alapját a meteorológiai mérőállomások havi átlagértékeiből képzett interpolációk adják. Különböző felbontásokban kérhető le, a legfinomabb felbontás 1 km-es. Különböző időszakokra számolt interpolációk és predikciók lehívására is van lehetőség. A választható változók magukban foglalják az egyszerű éghajlati mutatók (csapadék, napsugárzás, szélerő, napsugárzás...) mellett az ezekből képzett, ún. bioklimatikus változókat, amelyeket elterjedten használnak fajok terjedésének modellezésére. Ingyenesen elérhető az interneten. A bioklimatikus változók az R szoftver dismo csomagjának biovars függvényével is könnyen lekérhetők. Fontos linkek: Worldclim honlap, bioklimatikus változók, Hijmans et al. (2005) cikke az adatbázisról.

1 megjegyzés: