Translate

2017. szeptember 21., csütörtök

26th Congress of the 'European Vegetation Survey'

Szeptember 13. és 16. között Bilbaóban rendezték a 'European Vegetation Survey' mozgalom éves találkozóját. Az EVS a Nemzetközi Vegetációtudományi Társaság (IAVS) egy munkacsoportja, amely a növényzeti változatosság leírása, főleg a növényzet osztályozása iránt érdeklődő kutatókat fogja össze. A találkozó honlapja itt érhető el. A konferencián az alábbi előadást tartottam:

Joint optimization of cluster number and abundance transformation for obtaining stable vegetation classifications
Lengyel A, Landucci F, Mucina L, Tsakalos J & Botta-Dukát Z

The choice of abundance transformation and the number of clusters are among the most important methodological decisions influencing the outcomes of vegetation classifications. The optimal number of clusters is routinely sought for by calculating cluster validity indices (e.g. Optimclass, average silhouette) for classifications of different number of clusters. In contrast, there are very few examples in the literature when the optimal abundance weighting is selected on the basis of evaluating classifications made by systematically changing the data transformation function. Here we present a protocol for finding the combination of abundance transformation function and cluster number which results in the most stable, that now we deem the ‘best’, classification. We show how the optimal values of these two variables co-vary, and how different decisions on any of them can change the classification patterns.
We used real data sets representing Hungarian grasslands, European wetlands and Australian kwongan vegetation, as well as simulated data for testing relationships between abundance weighting, number of clusters and stability. We classified the data sets with changing cluster number and exponent of the power transformation in all possible combinations using the partitioning around medoids non-hierarchical method. The stability of classifications was assessed by mean Goodman & Kruskal’s lambda. The stability values are plotted on a heat map where the horizontal and the vertical axes are defined by the exponent and the cluster number, respectively, and the color intensity of the cells reflect the stability obtained by the actual combination of parameter values. Thus, the most stable classification can be found at the most intensively colored cell. The relationship between optimal values for the exponent and the number of clusters varied significantly among data sets. In cases of data sets with uneven abundance distribution of species within plots, very different numbers of clusters proved optimal when low and high weight were given to the most dominant species. In contrast, when species abundances varied less, the optimal number of clusters changed little along different values of the exponent. Nevertheless, classifications with the same number of clusters but different abundance transformation can reflect significantly different biological processes. The mean Goodman & Kruskal’s lambda successfully identified the optimal number of clusters for most simulated data sets.

Az előadásban egy új eljárást javasoltam az adattranszformáció mikéntje és a csoportszám legjobb osztályozáshoz vezető kombinációjának megtalálására. A diasor letölthető innen. A témáról bírálat alatt áll egy cikkünk - remélem, hamarosan megjelenik, és akkor megoszthatom a részleteket.

A konferencián három kirándulási útvonal közül választhattak a résztvevők, én a Monte Bucierót és a Noja melletti tengerpartot magában foglaló programot választottam. Az eső miatt sajnos inkább a telefonommal, mint a fényképezőgépemmet fotóztam, ez a minőségen sajnos meglátszik.

Monte Buciero

Épp csak megkezdtük a kapaszkodást a hegyre, és ez a látvány fogadott

Magyaltölgy (Quercus ilex), a hegy reliktum erdeinek uralkodó fafaja

Polypodium cambricum

Magyaltölgyes bokorerdő

A kilátás fentről 1 ...

... 2

Asplenium onopteris 



Noja

Tengerparti-liliom (Pancratium maritimum)

Tengeri kömény (Crithmum maritimum)

Tengerparti sziklák, a Crithmum tipikus élőhelye

Asplenium marinum egy tengerparti rom falán

Ulex gallii

Tengerparti iringó (Eryngium maritimum)

Tengerparti fenyér

Juncus acutus
 
Halimione portulacoides

Sós mocsár a folyótorkolatban

Inula crithmoides


A konferenciarészvételt a GINOP 2.3.3-15-2016-00019 projekt finanszírozta.

2017. szeptember 20., szerda

Nomen est omen - Polonez ösztöndíj indul

A közelmúltban nyertem egy egyéves kutatói állást a Polonez 3 nevű ösztöndíj-pályázaton. A Polonez a lengyel Nemzeti Tudományos Központ és az EU H2020 Marie Skłodowska-Curie Akciója által közösen finanszírozott kutatástámogatási program, amelyben 12 vagy 24 hónapos posztdoktori ösztöndíjakra lehet pályázni egy lengyelországi fogadóintézménnyel együtt. Az ösztöndíj paraméterei tudtommal nagyjából megegyeznek a Marie Curie ösztöndíjakéval, egyedül a lengyelországi kutatási és tartózkodási helyszín az extra kikötés.



A fogadóintézményem a Wroclawi Egyetem, ahol a Zygmunt Kacki vezette Vegetációökológiai Tanszék csapatával fogok dolgozni. A projektem célja a lengyelországi gyepi növényzet funkcionális diverzitásának többszempontú vizsgálata a lengyel vegetációs adatbázis alapján. Két fontosabb csapásirányt fogunk követni. Az első célunk, hogy elkészítsük a lengyel gyepek jellegalapú osztályozását a fajalapú osztályozásoknál már bevett numerikus módszerek segítségével, illetve módosításával. A második cél, hogy megvizsgáljuk, hogyan változik a funkcionális diverzitás és a redundancia különböző gyeptípusok között, valamint különböző környezeti grádiensek mentén. Ezek azért fontos kérdések, mert a jelenlegi ismereteink szerint a növényzet funkcionális tulajdonságai, vagyis az, hogy mit csinálnak, hogyan élnek, milyen anyag- és energiaforgalmi folyamatokban vesznek részt a növények, kulcsfontosságú a természet által kínált és az emberiség által felhasznált javak fenntartása érdekében. A pályázatom publikus összefoglalója itt olvasható. A kutatásunk aktuális állásáról rendszeresen be fogok számolni ezen a blogon is. A lengyel-magyar történelmi jóviszonyt, valamint a vezetéknevemnek való megfelelést erősítő projekt hivatalos kezdési dátuma 2017. október 1.



2017. szeptember 6., szerda

A béta-diverzitás felbontása fajszám-különbség és fajcsere komponensekre

A diverzitásról írt bejegyzéseimben eddig csak egyedi közösségen belüli sokféleségről, vagyis az alfa-diverzitásról volt szó. Létezik azonban a diverzitásnak olyan értelmezése is, amely nem egy tetszőlegesen lehatárolt közösség belső sokféleségét hivatott kifejezni, hanem a közösségek egymás közti változatosságát - ezt hívják béta-diverzitásnak. Gamma-diverzitás alatt pedig a sok közösség összevonása során kapott belső, "összegzett" sokféleséget értjük. Mondok egy példát. Van 10 tavunk, amelyekben különböző halfajok élnek. Az átlagos tavon belüli fajszám a tórendszerre jellemző alfa-diverzitás, míg a 10 tóban összesen előforduló fajok száma a gamma-diverzitás. A béta-diverzitás intuitíve valahogy úgy értelmezhető, hogy a tavaink fajösszetétele (tehát nem a fajszáma!) mennyire változatos - ennek formalizált kifejezése azonban korántsem olyan egyértelmű, mint a fajszámé. Az egyik megközelítés szerint a béta-diverzitás a gamma- és az alfa-diverzitás hányadosa. A béta = gamma/alfa képlet szerint a béta-diverzitás azt fejezi ki, hogy hányféle közösség alkotja a statisztikai sokaságot, vagyis hányféle fajkombináció (vagy közösség) fordul elő a tórendszerben. Ezt hívják a diverzitás multiplikatív felbontásának, mivel a béta és az alfa szorzata adja a gammát. Ezzel szemben az additív megközelítés szerint a béta-diverzitás a gamma és az alfa különbsége: béta = gamma - alfa, alfa + béta = gamma. Itt a béta-diverzitás annak a mértéke, hogy egy átlagos lokális közösség hány fajjal gazdagodik, ha kiegészül a többi lokális közösséggel: átlagosan mennyivel több faj van az összes lokális közösségben együttvéve, mint egyetlenegyben? A béta-diverzitás kifejezésére e két nevezetes képleten kívül számtalan javaslat született, olyannyira, hogy az elmúlt néhány évben több szintéziscikket is írtak a rendszerbe foglalásukról, ld. Tuomisto (2010a2010b), Anderson et al. (2011).

A béta-diverzitást a lokális közösségek páronkénti különbözőségének kiszámolásával is számszerűsíthetjük. Vegyünk egy egyszerű szimilaritási mérőszámot, pl. a Jaccard indexet: SJaccard = a/(a+b+c), ahol az a a két összehasonlítandó közösségben egyaránt előforduló fajok száma, a b és a c pedig a csak az első, illetve csak a második közösségben előforduló fajok száma. Könnyen belátható, hogy a nevezőben az a+b+c a két közösségben előforduló fajok száma, amit n-el szoktak jelölni (tehát n=a+b+c), vagyis egyfajta gamma diverzitás, míg az alfa diverzitás a két közösség fajszámának átlaga: ((a+b)+(a+c))/2. A Jaccard index a hasonlóságot fejezi ki, ezért disszimilaritássá kell alakítanunk ahhoz, hogy a közösségek közti diverzitást fejezze ki: DJaccard = 1-SJaccard = 1-a/n.
Két közösség különbözőségéről azonban ez a képlet még keveset árul el, hiszen csak annyit mond, hogy az egyesített fajlistájukból mennyi az olyan faj, amely csak az egyik közösségben fordul elő. Az alábbi példákban olyan közösségpárokat mutatok, amelyek disszimilaritása azonos, de mégis nagy mértékben különböző mintázatok rejlenek e szám mögött.

Első példa - a két közösség különbözőségét a fajcsere okozza

Az első esetben az 1. és a 2. közösség fajszáma azonos, és van 2 faj, amely mindkettőben előfordul, míg van 2-2, amely csak az elsőben vagy csak a másodikban. A disszimilaritás értéke DJaccard=1-2/(2+2+2)=0.667. A közösségek 4-4 fajából tehát 2-2 lecserélődik: ezt hívják a fajcsere (turnover, species replacement) jelenségének. A közösségek közti fajcsere jelensége általában akkor figyelhető meg, ha a közösségek más-más élőhelytípusokat reprezentálnak, ezért más-más élőhelyigényű fajok népesítik be őket, vagy ha bizonyos fajok biotikus interakciók (pl. kompetíció) miatt nem tudnak együtt élni, ezért "kerülik" egymást. A közösségek hasonló (azonos) fajszáma azonban arra utal, hogy hasonló mértékben kolonizálhatóak az élőhelyek, a fajok megtelepedéséhez szükséges idő rendelkezésre állt, az élőhelyek eltartóképessége is hasonló.

Második példa - a két közösség különbözősége a fajszám-különbségnek köszönhető

A második esetben a 2. közösség fajai közül 2 ("A" és "B" fajok) alkotja a 1. közösséget is, emellett van 4 olyan faj ("C"-től "F"-ig), amely csak a 2.-ban fordul elő, mindeközben az 1. közösségnek nincs "saját" faja. A két közösség közti különbséget tehát kizárólag a fajszámkülönbség (richness difference) jelenti, fajcserével nem kell számolnunk. Amikor a fajszegényebb közösség a fajgazdagabb közösség részhalmaza (vagy más szavakkal: a ritkább fajok ott fordulnak elő, ahol a gyakoribbak már jelen vannak), akkor az egymásbaágyazottság (nestedness) jelenségével van dolgunk. Az egymásbaágyazottság akkor jelentkezik, ha a közösségek egy elszegényedési vagy betelepülési grádiens mentén helyezkednek el, de azonos fajkészletből "táplálkoznak". Pl. ha azonos fajösszetételű, fajgazdag közösségeket különböző erősségű bolygatásnak teszünk ki, akkor az erősebben bolygatott közösségekből az érzékenyebb fajok eltűnnek, csak a zavarástűrők maradnak, alacsonyabb fajszámot produkálva. A másik jellegzetes példa, amikor az élőhelyfoltok kolonizálására eltérő idő állt rendelkezésre. A régóta elfoglalható foltokba már sok fajnak volt ideje megérkezni, míg az újabb foltokat csak a leghatékonyabban terjedő fajok kolonizálták, ezért még fajszegényebbek. Így a fajgazdag közösségeknek a fajszegények részhalmazát képezik. Számoljuk ki a disszimilaritást a második példára is: DJaccard=1-2/(2+0+4)=0.667 - csak úgy, mint az első példánál, a magyarázat mégis egészen más.

Az utóbbi években legalább két megközelítés látott napvilágot azzal a céllal, hogy a béta-diverzitást felbontsa fajszám-különbség (illetve nestedness) és fajcsere okozta komponensekre. Az egyiket Andrés Baselga (2010) javasolta, a másikat Podani János és Schmera Dénes (2011). Én most az utóbbival foglalkozom, mert nekem az a szimpatikusabb, de Legendre (2014) kiváló cikkéből mindkét módszercsalád megérthető, az előnyeikkel, hátrányaikkal, és a lehetséges további felhasználásaikkal együtt. Érdemes még megemlítenem Baselga bejegyzését a Methods in Ecology & Evolution folyóirat blogján, amelyben a saját rendszere szerint magyarázza el a béta-diverzitás felbontását.

A Podani & Schmera-féle módszer (nem bonyolult) teljes algebrai levezetésétől most eltekintek, csak a lényegre szorítkozom. A relatív fajszám-különbség kifejezhető az alábbi módon:

Drel = |b-c|/n

A relatív fajcsere pedig így:

Rrel = 2*min(b,c)/n

Vegyük észre, hogy a fajszám-különbség (Drel), a fajcsere (Rrel) és a hasonlóság (SJaccard) összege 1, emiatt:

Drel+Rrel+SJaccard = 1

A fajcsere és a fajszám-különbség összege pedig a disszimilaritással, vagyis a béta-diverzitással egyenlő:

béta = 1-SJaccard = Rrel+Drel

Podani és Schmera kiválóan vették észre, hogy a fajszám-különbség, a fajcsere és a hasonlóság közös skálája egy nagyon szemléletes ábrázolási módra nyújt lehetőséget, amit szimplex ábrának hívnak. Ez egy olyan háromdimenziós koordinátarendszer, amelyen belül a pontok csak egy egyenlő oldalú háromszögön belülre eshetnek. A koordinátatengelyek (a szimplexek) a háromszög oldalfelező merőlegesei (egyúttal szögfelezői), és minden tengelynek a hozzá tartozó oldal felezőpontjában van a 0 értéke, a vele szemben lévő csúcsban pedig az 1-es értéke. Egy adott pontot a tengelyekre merőlegesen levetítve kapjuk meg a koordinátákat, amelyek összege mindig 1. A háromszög súlypontjában a koordináták értéke 1/3 mindhárom tengelyre, egy csúcsban mindig 1 az egyik tengelyre és 0 a másik kettőre. Ha egy pont egy oldalra esik, akkor egy koordinátája mindig 0, a másik kettő pedig attól függ, hogy mennyire közel van a két szomszédos csúcshoz. Ha a háromszög csúcsait a hasonlóság, a fajszám-különbség és a fajcsere relatív hozzájárulásának mértékének tekintjük, akkor a közösségek párjai közt kiszámolt értékek szemléltethetők a szimplex ábrán. Több párt egyszerre is ábrázolhatunk, így pontfelhőt kapunk, amelyen azonnal látjuk, hogy milyen relációk jellemzőek az összehasonlított párok közt. Például ha van 10 mintánk egy élőhelytípusból, majd minden lehetséges párosításra kiszámoljuk az S, D és R értékeket, akkor a pontfelhő elhelyezkedéséből következtethetünk, hogy a mintaelemek között mekkora a hasonlóság, a fajszám-különbség és a fajcsere átlagos értéke, és ezek fontos információt jelentenek az élőhelytípus belső változatosságáról.

Az SDR szimplex ábra komponensei
A kép forrása: Herczeg & Horváth (2015) Link


Mutatok néhány példát:

Barro Colorado erdőfelmérés adatsor
A Barro Colorado-sziget a Panama-csatornában található, mesterséges sziget, a világ egyik legintenzívebben kutatott trópusi területe. 1923 óta áll védelem alatt. Az 1980-as években egy 50 hektáros erdődinamikai mintaterületet létesítettek, amiben hektáronként feljegyezték a faegyedeket. Az adatmátrix 50 mintavételi kvadrátot és 225 fajt tartalmaz, és a vegan R-csomagból érhető el. Forrás: Condit et al. (2002).
A BCI adatsor szimplex diagramja

Az ábrán minden pont egy kvadrát-pár közti szimilaritás, fajcsere és fajszám-különbség értékét mutatja. A pontfelhő a fajszám-különbséget jelentő D csúcstól messze van, ehelyett az R (fajcsere) és S (szimilaritás) közti oldalhoz közel helyezkedik el. Ez arra utal, hogy az esőerdei kvadrátok fajszám tekintetében hasonlóak, de közepes mértékű fajcsere megfigyelhető közöttük. A pontok elég kis területen helyezkednek el, ami arra utal, hogy a kvadrátpárok közti eltérések hasonló típusúak és hasonló mértékűek.

Dűne adatsor
Hollandiai tengerparti dűnék kaszált és legeltetett gyepi vegetációja, 20 kvadrátban 30 fajjal. Forrás: Jongman et al. (1987). A vegan csomagból elérhető.

Első ránézésre szembetűnő, hogy a pontok itt sokkal nagyobb területen helyezkednek el, ami arra utal, hogy a kvadrátpárok közt sokkal változatosabbak a viszonyok: a fajszámkülönbség lehet kicsi vagy közepes, a fajcsere mértéke lehet kicsi és nagy is, a szimilaritás is lehet kicsi és nagy.


Páncélosatkák
Egy 2.5 m × 10 méteres területről vett 70 talajmintából származó 35 páncélosatka-faj előfordulási adatai. Forrás: Borcard et al. (1994). Elérhető szintén a veganon keresztül.


Valami hasonlót látunk, mint az előző esetben: a pontok szinte az egész háromszög területén előfordulnak, a tiszta fajszám-különbség, fajcsere és hasonlóság állapotait (vagyis a csúcsok közvetlen közelét) kivéve.

Északi-középhegységi mezofil gyepek
Legelt, kaszált és nem rég felhagyott mezofil gyepek az Északi-középhegység különböző részeiről. 55 kvadrátban 269 faj, saját, publikálatlan adatsor.



A pontok szóródása jóval kisebb, mint az előző kettő példában, de nagyobb, mint a Barro Colorado adatsor esetén. A pontok többsége a D-től és az S-től távol, az R-hez közelebb helyezkedik el. Ez arra utal, hogy a kvadrátok fajszáma mérsékelten variál (D értéke alacsony), és a fajcsere a domináns jelenség a kvadrátpárok között, noha teljes fajcserére itt sem látunk példát, ami azt jelenti, hogy nincs olyan kvadrátpár, aminek ne lenne legalább egy közös faja.

További érdekes példák láthatók valódi és szimulált adatsorokkal Podani és Schmera cikkében, továbbá fontos speciális eseteket (pl. a nestedness "szigorú" és "nem szigorú" értelmezése) is tárgyalnak a Szerzők - érdemes elolvasni.

A módszerhez írtam egy R kódot, amely a nem rég megjelent cikkünk függelékében érhető el. Kérem, hogy aki használja a szkriptet, hivatkozzon az alábbi cikkre: