Translate

A következő címkéjű bejegyzések mutatása: modellezés. Összes bejegyzés megjelenítése
A következő címkéjű bejegyzések mutatása: modellezés. Összes bejegyzés megjelenítése

2017. december 19., kedd

"Te hiszel a statisztikában?"

A fenti kérdést egy másik tanszéken dolgozó kolléga szegezte nekem múltkor, az első találkozásunkkor. De vajon igaz, hogy a statisztika hit kérdése? Hogy lehet benne hinni, meg nem hinni, de mintha nem lenne igazán logikus érv mellette? Hogy a statisztika egyfajta vallás, a statisztikusok pedig voltaképpen sámánok, akik különféle csodaszereket kínálgatnak az olyan "jól bevált" eszközök helyett, mint a tapasztalati tudás, az intuíció vagy a híres "józan paraszti ész"?

Erről szó sincs. Valójában minden kutató, aki sokaságokat hasonlít össze, jóslatokba bocsátkozik egy folyamat kimeneteléről, összefüggések erősségéről nyilatkozik, röviden: kvantitatív jellegű kérdéseket feszeget, szükségszerűen statisztikát használ, tulajdonképpen modellez. Csak nem feltétlenül számítógépen, hanem fejben. Sőt, minden ember modellez. Ha megkérdezik, hogy az "A" zöldségesnél nagyobbak a dinnyék, vagy a "B"-nél, akkor a kínálatra ránézve, mérés nélkül is arra gondolunk, hogy mekkora lehet az átlag az egyik és a másik zöldségesnél, és az átlag körül mennyire szórnak az egyes dinnyék (mennyire térnek el az átlagtól az egyes darabok), mekkora az átfedés a kettő között. Ugyanez történik a t-próbánál, több zöldséges esetén az ANOVA-nál. Ha fontos kérdés, hogy "jelentősen" nagyobbak a dinnyék A-nál, mint B-nél, akkor kell egy referenciaérték, amely a "jelentős" és a "nem jelentős" közti különbség határvonala. Ez a referencia sokféleképpen kitűzhető, de a leggyakoribb eset, hogy ha nagyobb (persze, mennyivel?) a különbség két zöldséges között, mint hogyha a dinnyéket véletlenszerűen osztottuk volna szét közöttük, akkor a különbség "jelentős" ("szignifikáns"). De ennél többet is megtudhatunk a zöldségesek dinnyeforgalmazásáról, ha figyelembe vesszük, mondjuk azt, hogy igaz, hogy az "A"-nál kisebbek a dinnyék, viszont az régebb óta van nyitva, tehát lehet, hogy az "A"-ból a vásárlók már elvitték a nagyokat, ez okozza a különbséget. Erre szépen fel lehet írni egy modellt: a vásárlók egységnyi idő alatt n dinnyét vesznek meg, a dinnye megvásárlási valószínűsége a méretével arányos, "A" zöldséges t1 ideje van nyitva, "B" zöldséges t2 ideje, t1>t2, feltételezzük, hogy nyitáskor nem volt köztük semmi más különbség. Amit meg akarunk jósolni vagy magyarázni, az a dinnyék átlagos mérete közötti különbség a zöldségesek között. Ha a modellünk helyes, akkor a modell kimenete (egy jósolt vagy valószínűsített dinnyeméret-eltérés "A" és "B" átlaga között) jól közelíti a valóságot, ha nem helyes, akkor távol áll attól. Vegyük észre, hogy ezt fejben pontosan így csináljuk a faék egyszerűségű, hétköznapi kérdésekben, csak annyira természetes számunkra, hogy nem tudatosul bennünk, hogy modellezünk! A modellezés (és úgy általában, a statisztika) nem más, mint a gondolkodásunk formalizálása, mások számára egyértelművé tétele egy közös nyelv, a matematika segítségével. A modell egy feltételezés egy jelenség hátterében álló mechanizmusról. Egy hipotézis, amit elfogadhatok, ha az adatok alátámasztják, és elvethetek, ha nem támasztják alá eléggé. A modell megalkotásához kulcsfontosságú a vizsgált jelenség (pl. a szóban forgó zöldségesek) beható ismerete. És itt van a tapasztalati tudás szerepe: tudni kell, hogy egyáltalán mely tényezőkkel érdemes számolni. Van-e egyáltalán esély arra, hogy a beszállító kiléte, a nyitvatartási idő vagy a vasárlói preferencia magyarázza meg a két zöldséges közti különbséget, és nem a névválasztásuk, az eladó külleme vagy a szakmai múltja? A tapasztalati tudás és a modellezés tehát kéz a kézben jár. Az előbbi nélkül nem lehet értelmes modelleket gyártani, értelmes modellek azonban szükségesek a jelenségek mechanizmusának megértéséhez és az előrejelzéshez. Az, aki "nem hisz" a statisztikában, valójában nem tudja használni. Természetesen nem kell minden kutatónak statisztika-gurunak lenni, de aki kvantitatív kérdéseket feszeget, az lehetőleg annyira sajátítsa el a statisztika nyelvét, hogy a hipotézisét meg tudja fogalmazni, le tudja írni a vizsgálat változóit és objektumait, majd az elemzést egy hozzáértőre bízva az eredményeket tudja értelmezni. Fontos tudni, hogy a statisztikai módszerek eszközök, amik nem válaszolják meg helyettünk a problémáinkat, ahogy a kalapács sem veri be magától a szöget. Tudni kell jól kérdezni, a kérdéshez megfelelő módszert kell választani, és az eredményeket helyesen kell értelmezni - legalább 1-1 személynek a kutatás résztvevői közül.

A statisztika nem csak azok számára tűnik fel a mágia szerepében, akik szkeptikus tartózkodással viseltetnek iránta, hanem azok számára is, akik hajlamosak az elemzések eredményeit abszolutizálni. Ők nem kívülállóként, hanem követőként viszonyulnak a valláshoz. Ennek a tünete, amikor elfeledkeznek a statisztikai módszerek korlátairól. Egy valós biológiai kérdés megválaszolására gyakran több alternatív módszer kínálkozik, némelyek egyformán indokolható választásnak tűnnek, de mégis eltérő eredményt adnak. A kutató szubjektív döntése, hogy melyik módszert választja, de ennek a döntésnek hatása lesz az eredményre, így a belőle levont következtetésre is. A statisztikai elemzések eredménye tehát módszerfüggő. Ha a kutatási kérdésünket minél több különböző módszerrel próbáljuk megválaszolni, akkor árnyaltabb képet kapunk az adatsorunkról, illetve a vizsgált jelenségről, a téves következtetés esélyét pedig csökkentjük. Különösen hatékonyan járhatunk el, ha a módszerünket kis lépésekben változtatjuk, és figyeljük, hogy ez milyen változást okoz az eredményekben. Ez történik például akkor, amikor egy osztályozási probléma esetén növekvő csoportszámú klasszifikációkat gyártunk, és figyeljük, hogy az egyre finomabb felbontás milyen mintázatokat fed fel az adatsorunkból. Vagy amikor bonyolult kiindulási modellből lépésről lépésre kihagyjuk a jelentéktelen hatású tényezőket, míg el nem jutunk addig, hogy a modellünk már csak a valóban fontos változókat tartalmazza. Gyakran maga a minta is magán hordoz olyan sajátosságokat, amelyek miatt nem tudható pontosan, hogy az eredmények mennyire általánosíthatók. Pl. vajon ugyanazt a jelenséget mérem-e, ha egy kiskunsági homokpusztagyepen és egy mátrai hegyi réten vizsgálom a fajgazdagság és a biomassza összefüggését? A konklúziónk soha nem választható el teljesen sem a mintától, sem az alkalmazott módszerektől.

Ne felejtsük el tehát, hogy a statisztikai módszerek eszközök. Nem lehet velük csodát tenni, nem oldanak meg helyettünk problémákat intelligens módon, nem találják ki a gondolatainkat, de kellő hozzáértés birtokában eredményesen alkalmazhatók hipotézisek formális tesztelésére, kvantitatív mintázatok felfedésére.
A fenti témában ajánlom Juhász-Nagy Páltól a Beszélgetések az ökológiáról című könyvet.

2016. szeptember 17., szombat

Gondolatok a fajgazdagságról

"Varietas delectat", avagy "a változatosság gyönyörködtet", szól az idézet Cicerótól, amely tömören kifejezi a sokféleség, a változatosság, a gazdagság iránti ösztönös csodálatunkat és igényünket. Az élővilágban megfigyelhető sokféleség (diverzitás) leírása és okainak felfedése a biológiai tudományok egyik legfontosabb tárgya volt mindig is, de a puszta kíváncsiság kielégítése mellett a XX. század óta tapasztalt biodiverzitási krízis, vagyis az élő természet sokféleségének drasztikus csökkenése mint sürgető és elhárítandó veszély is motiválja a kutatókat. Az esetek többségében igaznak tekinthető, hogy minél diverzebb egy ökoszisztéma, hosszútávon annál megbízhatóbb forrása a társadalom számára hasznosíthlató természeti javaknak (Hooper et al. 2005). Például egy fajgazdag rét összességében több hasznot jelenthet egy falu számára, mint egy fajszegény, ha figyelembe vesszük a széna minőségét, a réten szedhető gyógynövényeket, a talaj víz- és tápanyagforgalmában játszott szerepét, az esztétikumot, stb. Nem csoda hát, hogy az ökológusok egy jelentős részét foglalkoztatják a fajgazdagság változatosságával kapcsolatos kérdések, mint például: mi az oka, hogy egyik közösség vagy élőhely sok, a másik kevés fajnak ad otthont? Mi magyarázza egyes élőhelyek kiugróan magas fajgazdagságát? Hogyan és miért változik a sokféleség valamely környezeti vagy zavarási grádiens mentén?

A cserjék, facsoportok jelenléte növeli a gyepek fajgazdagságát (Cserhát)

A Fehér-Kárpátok félszáraz gyepjei a világ legfajgazdagabb növényközösségei közé tartoznak. Wilson és mtsai. (2012) cikke szerint ebben a vegetációban több "fajgazdagsági világrekordot" is detektáltak szűk térléptékben: 40 négyzetcentiméteres mintaterületen 13, 0,25 nm-en 44, 16 nm-en 105, 25 nm-en 116, 49 nm-en 131 fajt is kimutattak rajtuk (sőt, azóta újabb rekordokat jegyeztek fel ugyanott, ld. Chytrý és mtsai. 2015). A 2012-es tartui IAVS szimpóziumon hallottam Milan Chytrý "Species-rich grasslands in Central Europe: search for the causes of the world record species richness" című előadását, melynek tartalma nem sokkal később cikkben is megjelent (Michalcová és mtsai. 2014). A többségükben cseh kutatók arra vonatkozó hipotéziseket teszteltek, hogy mi okozza a szokatlanul sok növényfaj kis területen való együttélését. Lehetségesnek látták, hogy táji szinten (nagyobb térléptékben) olyan magas a gyepi fajok száma, hogy a lokális (kis léptékű) közösségekbe is sok jut be. Ez nem más, mint a fajkészlet-hipotézis tesztelése. Egy közösség fajkészletét azok a fajok alkotják, amelyek potenciálisan képesek benne megtelepedni, függetlenül attól, hogy valójában jelen vannak-e benne vagy sem. A fajkészlet-hipotézis azt feltételezi, hogy a lokális közösségek faji összetétele és fajgazdagsága attól függ, hogy mennyi és milyen, azonos élőhelyen élő fajok vannak jelen tágabb térléptékben ("regionálisan"), hiszen az új fajok betelepedése csak a környező hasonló közösségekből történhet. (A témában ajánlom Cornell & Harrison (2014) cikkét.) Szintén potenciális magyarázatnak látták azt, hogy a kiemelkedő fajszám a térség többi élőhelyének jellemzője, és az érintkező vegetációtípusokból olyan sok faj képes bejutni a gyepekbe, hogy valójában a nem gyepi fajok emelik magasra a gyepek fajszámát. Ez a feltevés a térbeli tömeghatás szerepét hangsúlyozza: a környező vegetációtípusok annyira fajgazdagok, hogy több faj forráspopulációjaként szolgálnak a (többé-kevésbé véletlenszerű) gyepi megtelepedéseikhez. A harmadik lehetséges magyarázat a sziget-biogeográfia elméletén (MacArthur & Wilson 1967) nyugszik, amely kimondja, hogy a nagyobb szigetek (nem csak geográfiai, hanem élőhelyszigetekre is érvényes) több faj fenntartását teszik lehetővé, köszönhetően annak, hogy minden faj állománya nagyobb egyedszámot tud elérni, amelyeket így kevésbé veszélyeztetik a véletlenszerű kihalást okozó események. Ebből az következik, hogy ha a tágabb térségben nagyobb a gyepek területe, akkor több gyepi faj hosszútávú fennmaradása lehetséges. A fajok a gyepterületen belül bárhová eljuthatnak, ha erre elegendő idő áll rendelkezésre, vagyis ha a gyep elég sokáig változatlanul fennmarad. A negyedik hipotézisük a táji heterogenitással magyarázta a fajgazdagságot: mozaikos tájban a különböző élőhelyfoltokat preferáló, onnan térben korlátozottan terjedő populációkból könnyebben kolonizálják az egyéb folttípusokat a fajok, mint egy homogén tájban. Mindezek mellett különböző környezeti változó értékeit és eloszlását is vizsgálták a területen, ugyanis ismert, hogy a szélsőséges környezeti jelenségek és kezelési módok egyes fajok kihalásához vezetnek, míg a mérsékeltebb, időben enyhén fluktuáló hatások segítenek a különböző igényű fajok együttélésének fenntartásában. A további részletek ismertetése nélkül a kutatás nagyon tanulságos eredményének tartom, hogy a szerzők nem tudtak megjelölni olyan tényezőt, amely egymagában megmagyarázta volna a rendkívüli fajgazdagságot. A gyepi élőhelyek nagy területe, a környezeti szélsőségek hiánya, a mozaikos tájszerkezet és a régóta tartó extenzív gyepgazdálkodás együttesen járultak hozzá ahhoz, hogy a Fehér-Kárpátok gyepjein ennyi növényfaj él együtt kis térléptékben. Ennek kapcsán négy dologról szeretnék ejteni néhány gondolatot:

(1) Ha nem számolunk a fajképződés jelenségével*, akkor úgy tűnik, a fajgazdagságot nem "csinálják", hanem "megengedik" egyes tényezők, vagyis nem okai vannak, hanem feltételei. A különbség árnyalatnyi, de a kutatási kérdésről való gondolkodásunkat és a módszerválasztásunkat befolyásolhatja. Az ok és a feltétel különbségét könnyen beláthatjuk, ha a Liebig-féle minimum elvre gondolunk. Ez azt mondja ki, hogy a növekedést mindig az a tényező korlátozza, amely a szükségletekhez képest a legkisebb mértékben van jelen. Vagyis, ha egy növényfaj 5 és 6 közötti pH-jú talajon és 7 és 8 °C éves átlaghőmérsékleten érzi jól magát, akkor hiába lesz a talaj kémhatása 5,4 pH, ha az átlag hőmérséklet 5 °C, akkor nem fog tudni szaporodni. Minden egyes faj számára megvannak azok a tényezők, amelyek az adott helyen való megtelepedését és fennmaradását lehetővé teszik (feltételek!). Ezek a tényezők nem csak a környezeti változók optimális értékeit, hanem a megtelepedést és a többi fajjal való együttélést biztosító körülményeket is magukban foglalják (ld. később). Ha ezek közül egy nem teljesül, akkor a faj nem lesz jelen az adott helyen, hiába teljesül a többi. A fajszám sok-sok ilyen feltételrendszer szuperpozíciója, vagyis annak az összege, ahány faj esetében teljesül minden feltétel. Amikor diverzitáskülönbséget akarunk megmagyarázni, például összehasonlítjuk két terület fajgazdagságát, akkor végig kell előtte gondolnunk azokat a körülményeket, amelyek alakítják a területek fajszámát. Az, hogy az egyik terület fajszáma "szignifikánsan" különbözik a másiktól, mert ezt dobta ki egy kétmintás t-teszt, nem rendelkezik sok biológiai vonatkozással, ha nem tisztáztuk előtte, mit várunk a fajgazdagságot alakító mechanizmusok ismeretében, vagy ha a különbség kimutatását nem követi az okok felfedésére tett próbálkozás. A fajkészlet mérete, a jellemző környezeti szűrők, a terület biogeográfiája, a mintavételi sajátosságok ismeretében jogosan várjuk-e, hogy ugyanakkora legyen a két terület fajszáma? Melyek azok a mechanizmusok, amelyek fajszámot alakító hatására kíváncsiak vagyunk, és melyeket szeretnénk eltüntetni valamilyen adattranszformációval, hogy ne zavarják a többi hatás vizsgálatát? Nem ugyanazzal a biológiai jelentéssel bír, ha az egyik közösségben a 10 fajos fajkészletből mind jelen van, vagy ha a lehetséges 100 fajból van jelen 10. Szintén másképp kell gondolkodnunk, ha az egyik terület tízszer akkora, mint a másik. A korszerű ökológia abba az irányba halad, hogy az általunk vizsgált rendszert befolyásoló mechanizmusok ismeretében építsünk modelleket, amelyek predikcióit a tapasztalati adatokkal összevetve következtessünk a mechanizmusok valódi szerepére. Ebben a szellemben számos jó cikk és könyv érhető el. Megemlíteném a magyar szerzők által írt Pásztor L., Botta-Dukát Z., Magyar G., Czárán T., Meszéna G.: "Theory-based Ecology: A Darwinian approach" című egyetemi tankönyvet. A közösségszerveződésben általános és alapvető folyamatokat Vellend (2010) vette sorra.

*Ha a fajgazdagság-különbség kialakulásában a fajképződés is jelentős szerepet játszik, akkor szemantikailag helyesebbnek tűnik okokról, mint feltételekről beszélni. Például ha van két terület, az egyiken az élőlények jobban ki vannak téve valamilyen mutációs faktornak, amely a genetikai állomány gyorsabb változását eredményezi, akkor azon nagyobb mérvű lesz a fajképződés, mint a másikon, és ezért a fajszámban is lehet különbség. Itt véleményem szerint inkább "okozza" valami a fajszámkülönbséget, mint "megengedi".


(2) Ha a fajszámnak nem okai, hanem feltételei vannak, akkor minél több a feltétel és minél kiegyenlítettebb a hatásuk, annál nehezebb őket kimutatni a hagyományos regressziós, varianciamagyarázó és korrelációs módszerekkel. Mutatok egy szimulációs példát. Van 100 közösségünk, amelyek fajkészletét ugyanaz a 100 faj alkotja, a fajok előfordulását K környezeti változó szabja meg. Igen ám, de minden faj csak K egy részhalmazára, P db változóra érzékeny. Minden változó minden közösségben 0 és 1 között felvesz egy értéket. Egy faj adott közösségben való előfordulása úgy dől el, hogy a számára fontos változók az adott közösségben milyen értéket vesznek fel. Egész pontosan a fontos változók értékeinek a minimuma az a valószínűség, hogy a faj előfordul (vö. Liebig-féle minimumtörvény). Hogy valóban megjelenik-e a faj, azt a véletlen dönti el a fentebbi minimum alapján megadott valószínűség szerint. A szimulációba beépíthető egy olyan elem is, hogy ha a legkisebb mennyiségben jelenlévő változó egy bizonyos határérték alá esik, akkor a faj automatikusan hiányzik, de ez nem sokat változtat a lényegen, csak skálázási kérdés. Jelen esetben legyen 0,3 ez a határérték: vagyis, bármely fontos változó értéke 0,3 alatti, a szóban forgó faj hiányzik az adott közösségben. Miután minden közösségre kiszámoltuk a jelen lévő fajok körét, kiszámoljuk a fajszámokat közösségenként. Mivel a fajszám most véges, elosztjuk a fajszámokat a fajkészlet méretével, így megkapjuk a tapasztalati fajszám és a fajkészlet arányát - nevezzük relatív fajszámnak. Ezután építünk egy általánosított lineáris modellt (GLM), amelyben a függő változó a relatív fajszám, a magyarázó változók pedig a K db környezeti változó. Mivel a relatív fajszám egy arány, és számolunk a lehetséges túlszóródással (overdispersion), a GLM eloszlását kvázi-binomiálisra állítjuk. Végül megnézzük, hogy mely környezeti változóknak lesz "szignifikáns" hatása. K és P értékei változtatva többször újrafuttatjuk a szimulációt. A szimulációhoz használt R szkript megtalálható itt.
Ha K = 1 és P = 1, vagyis egyetlen környezeti változó van, akkor annak erősen szignifikáns a hatása.

Ha egyetlen környezeti változóra reagál az összes faj, akkor a szoros az összefüggés a változó értékei és a fajszám között

Minél jobban emelkedik K és P (vagyis minél több a környezeti változó, és minél többre reagálnak a fajok), annál gyengébbnek mutatkozik a változók hatása. Ha a változók száma 20, de minden faj csak egyre reagál, már akkor sem szignifikáns minden változó! Az eredmény akkor is ez, ha a változók hatását külön-külön teszteljük, tehát a korrelációik nem kavarnak bele.

Ha sok környezeti változó van és a fajok nem ugyanazokra reagálnak, akkor az egyes változók hatása nehezen kimutatható


glm(formula = SP ~ Kmat, family = quasibinomial)

Deviance Residuals: 
      Min         1Q     Median         3Q        Max  
-0.187403  -0.050824  -0.007331   0.043638   0.187568  

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) -2.00257    0.14063 -14.240  < 2e-16 ***
Kmat1        0.44263    0.06477   6.834 1.55e-09 ***
Kmat2        0.28016    0.06526   4.293 4.96e-05 ***
Kmat3        0.04149    0.05948   0.698 0.487478    
Kmat4        0.08629    0.06203   1.391 0.168087    
Kmat5        0.42971    0.06026   7.131 4.19e-10 ***
Kmat6        0.27100    0.05390   5.028 3.03e-06 ***
Kmat7        0.26243    0.05913   4.438 2.91e-05 ***
Kmat8        0.14400    0.05708   2.523 0.013660 *  
Kmat9        0.27764    0.06280   4.421 3.10e-05 ***
Kmat10       0.12264    0.05469   2.242 0.027740 *  
Kmat11       0.40040    0.06664   6.008 5.45e-08 ***
Kmat12       0.14633    0.05821   2.514 0.013979 *  
Kmat13      -0.01322    0.05632  -0.235 0.814998    
Kmat14       0.32394    0.05951   5.443 5.72e-07 ***
Kmat15       0.16883    0.06063   2.785 0.006703 ** 
Kmat16       0.08642    0.06101   1.417 0.160506    
Kmat17       0.23433    0.06482   3.615 0.000527 ***
Kmat18       0.12415    0.07598   1.634 0.106251    
Kmat19       0.19938    0.06085   3.276 0.001563 ** 
Kmat20      -0.05382    0.06118  -0.880 0.381610    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for quasibinomial family taken to be 0.006027996)

    Null deviance: 2.50718  on 99  degrees of freedom
Residual deviance: 0.47771  on 79  degrees of freedom
AIC: NA

Number of Fisher Scoring iterations: 3

Nyilván sok volt a leegyszerűsítés a szimulációban, és egyébként is vizsgálati helyzete válogatja, de 20 potenciális környezeti változó nem irreálisan sok a természetben, és egynél jóval többre reagál minden faj. Ez nem meglepetés annak, aki találkozott már hasonló problémával, de mégis akadnak kutatások, amikor láthatóan nem veszik figyelembe.


(3) Ha a fajképződés lehetőségétől eltekintünk, akkor a fentiek összhangban vannak azzal a fogalmi és logikai rendszerrel, amelyet Juhász-Nagy Pál (1935-1993) 30 éve alkotott meg az "Egy operatív ökológia hiánya, szükséglete és feladatai" című könyvében. JNP szerint az ökológia centrális hipotézise [CH], hogy "bárhol, bármikor, bármilyen populáció a természetben bármilyen mennyiségben megtalálható". Ez nyilvánvalóan hamis (ezt nevezi JNP centrális ténynek [CT]), és az ökológia centrális problémája [CP], hogy "ha a [CH] hamis, akkor adott objektumra adott kikötésekkel milyen mértékben hamis és miért hamis?". A [CH] a fajkészlet-elmélet fogalmait kölcsönvéve azt jelenti, hogy az összes létező faj a világon az összes létező lokális közösség fajkészletéhez hozzátartozik, ugyanis potenciálisan előfordulhat benne. A [CP] pedig azokra a mechanizmusokra kérdez rá, amelyek a [CH]-t addig-addig szigorítják újabb és újabb megkötések hozzáadásával, míg egy el nem utasítható nullhipotézisig nem jutunk. Vagyis: addig-addig kell szűrnünk a kezdeti "pán-fajkészletet", amíg el nem jutunk a fajok egy olyan köréhez, aminél már nem tudjuk jobban közelíteni a közösség tényleges fajösszetételét. A szűrésnek a fajok előfordulását befolyásoló tényezők figyelembevételével kell történnie. Például: egy bükki rét fajkészletének meghatározásakor számolnunk kell azzal, hogy olyan fajnak minimális esélye van benne megtelepedni, amelynek a rá jellemző terjedési távolságon belül nincs szaporodó állománya. Hiába fordul elő egy faj a Kárpátok hegyi rétjein azonos tengerszint feletti magasságban, ha nem jó a terjedőképessége, akkor nincs esélye kolonizálni egy bükki élőhelyet. Így, első körben, azokat a fajokat kizárhatnánk, amelyeknek nincs a Bükk hegységben szaporodó állománya. Ezzel beépítettünk egy szűrőt a nullmodellünkbe: a terjedés korlátozottságát. Ha ettől a nullhipotézis igazzá válna, akkor a réten a környező élőhelyek fajai véletlenszerűen jelennének meg. Minden bizonnyal azonban tovább kell finomítanunk a modellünket egy újabb szűrővel: lehetne ez egy niche-felosztás szerinti szűrő, amely kiiktatná azokat a fajokat, amelyek alapvetően nem fordulnak elő egyes környezeti háttérváltozók olyan értékei által jellemzett gyepekben, mint amivel foglalkoztunk. Nem valószínű például, hogy egy nedves réten szárazsághoz adaptálódott, sziklagyepi fajt találjunk. Ha a megfelelő módon kiválogattuk a környezeti preferenciájukban "odaillő" fajokat, de az új nullhipotézisünk által formalizált modell sem illeszkedik elég jól az adatokra, akkor előfordulhat, hogy a fajok közti kapcsolatokat is figyelembe kellene vennünk. Például előfordulhat, hogy a gyepet uraló fűfaj kiszorítja a hozzá hasonló egyéb füveket, de jól megtűri az alacsonyan kúszó, indás valódi kétszikűeket és a hagymás-gumós egyszikűeket, a fajspecifikus parazitanövénye pedig egyenesen ragaszkodik hozzá... A szűrők működéséről ilyen fokú leegyszerűsítéssel írni nyilván fényévekkel könnyebb, mint egy valós kutatási helyzetben matematikailag kezelhető formába önteni őket. A társulási szabályok vizsgálatának és a szűrők működésének tudtommal első megfogalmazója Keddy (1992) volt, azóta a téma irodalma hatalmas és gyorsan bővül, a közösségi ökológia egyik legdivatosabb irányzatáról van szó, én is írtam már erről egy cikkünk kapcsán.
Ebben a pontban több szó esett a fajösszetételről, mint a fajgazdagságról. Azonos fajgazdagságú közösségek lehetnek teljesen más fajkompozíciójúak. A fajgazdagság mégis gyakran szorosan összefügg a fajkompozícióval, tipikusan szűk térléptékben, ahol a fajok közti interakciók megszabják, hogy milyen fajok  képesek együtt élni. Például ha a fajkészletet csupa hasonló faj alkotja, akkor szűk térléptékben csak kevés tud együtt élni a köztük fellépő kompetitív kizárás miatt. De ha a fajkészletben egymástól különböző, eltérő forrásokat használó fajok vannak, akkor azok közül több is tartósan együtt élhet, hiszen nem versengenek egymással. 


(4) A nagy fajgazdagság gyakran azt mutatja, hogy bizonyos szűrők a szokottnál kevésbé korlátozzák a fajok előfordulását, "nem működnek". A fajszegény szituációk, fajhiányok, legalább olyan érdekesek, mint a kiemelkedő fajgazdagságú élőhelyek, mert azok mutatják a centrális hipotézistől való eltérést. A hiányzó fajok vizsgálata az elmúlt években vált divatos kutatási témává, elsősorban a tartui egyetem kutatóinak munkássága révén. Ők vezették be a sötét diverzitás ('dark diversity', DD) fogalmát, ami alatt azokat a fajokat értik, amelyeknek ott kéne lenniük egy közösségben, tagjai a közösség fajkészletének, de valami miatt még sincsenek jelen. (Rengeteg cikkük jelent meg a témában, de kezdésnek ezt a blogbejegyzést érdemesebb elolvasni mindnél.) Persze, azt, hogy minek kéne ott lenni, miközben nincs ott, eléggé nehéz meghatározni... A DD mint elmélet számomra is nagyon tetszetős, de a módszertanát még kiforratlannak tartom.


A fentiekben természetesen nem a fajgazdagság megőrzésének fontossága ellen írtam. A fajok védelmének, minél több faj megőrzésének és a fajgazdag közösségek megóvásának és helyreállításának továbbra is a konzerváció elsődleges feladatának kell lennie. Remélem, hogy a fajszegénység és a fajhiányok megítéléséről megosztott gondolataim ezeket a célokat is segíteni fogják.

2015. április 18., szombat

A 'distance decay' jelenség a közösségi ökológiában I.

Akik magyar nyelven próbálnak korszerű, természettudományos ismereteket közzétenni, könnyen találkozhatnak azzal a nehézséggel, hogy egy idegen, rendszerint angol nyelvű, nemzetközi szakirodalomban közismert szakkifejezés nehezen ültethető át magyar nyelvre a kifejezés jelentéstartalmának, frappánsságának és használhatóságának megőrzésével, bármennyire egyszerű jelentéssel bírjon is. Éppen ez a helyzet a 'distance decay' nevű fogalommal.

A blogom nyilvánosságát megragadva javaslatokat várok arra, hogy milyen magyar nevet lehetne adni ennek a jelenségnek. Az angolban 'distance' = távolság, 'decay' =hanyatlás, rothadás. A javaslatokat hozzászólásként vagy a jobb oldali menüben a kapcsolatfelvételi űrlapon várom.

A 'distance decay' (mostantól DD-nek rövidítem - ha már nem magyar a szó, legalább legyen rövid) egy földrajzi kifejezés, amely egy teljesen triviális megfigyelésben gyökerezik, amit Tobler (1970) után a geográfia első törvényének is hívnak: "minden mindennel kapcsolatban áll, de az egymáshoz közeli dolgok erősebben, mint a távoliak". Ez tulajdonképpen a térbeli autokorreláció definíciója. Nem tudom, van-e olyan földrajzi térbeli mintázat, amire ne lehetne találni olyan térbeli és időbeli vizsgálati léptéket, amelyben a fenti kijelentés teljesül - szerintem nincs. A jelenséget a fizikában tulajdonképpen az általános tömegvonzás törvénye írta le elsőként, s a gravitációs modellek más tudományterületeken is analógiaként szolgáltak a távolság függvényében gyengülő interakciók leírására. Éppen így definiálhatnánk a DD-t: a növekvő távolsággal gyengülő interakció közti függvénykapcsolat. A DD jelenséget általánossága miatt az élet legkülönbözőbb területein sikerült felismerni. DD-t mutat például az utazások gyakorisága az út hosszának (vagyis az úticél távolságának) függvényében, a koraszülöttek életben maradási valószínűsége a legközelebbi egészségügyi ellátóhelytől való távolság függvényében és a kereskedelmi kapcsolatok erőssége a földrajzi távolság függvényében.

Utazások száma adott távolságú célpontra
forrás: Peeters & Landré, Sustainability 2012, http://www.mdpi.com/2071-1050/4/1/42/htm
Különböző bolttípusok vásárlóinak száma a lakóhelyük távolsága szerint
forrás: http://lewishistoricalsociety.com/wiki2011/tiki-read_article.php?articleId=9


A térbeli autokorreláció ökológiai mintázatokban játszott fontos szerepét a XX. század utolsó évtizedeiben fogalmazták meg (Legendre & Fortin 1989, Legendre 1993), noha implicit módon már jóval korábban felismerték (pl. MacArthur & Wilson 1967). A közösségi ökológia terén pedig Nekola és White (1999) cikkéhez köthetjük a DD leírását, amely szerint a közösségek (most: adott területen előforduló fajok összessége) közti hasonlóság csökken a köztük lévő távolság növekedésével.

Egy jellemző distance decay ábra a közösségi ökológia területéről: az x-tengelyen a közösségek földrajzi távolságai, az y-tengelyen a közösségek hasonlóságai, a pontok az összehasonlított közösségpárokat jelölik
forrás: Dexter et al., PNAS 2012, http://www.pnas.org/content/109/20/7787/F1.expansion.html

A tapasztalat általában megerősíti azt a megfigyelést, hogy egy adott közösségtől minél messzebbre megyünk, átlagosan annál kevésbé várható, hogy hasonló fajösszetételű közösséget találjunk. Az azonban nagyon gyakran nem egyértelmű, hogy a hasonlóság csökkenésének mi az oka, illetve a különböző lehetséges okok milyen mértében járulnak ehhez hozzá. Amit tudunk, hogy a közösségek térbeli mintázata levezethető az egyes fajokéból (Morlon et al. 2008, Nekola & McGill 2014).

DD jelenség magyarázatához két modell lehet segítségünkre: a (1) niche-modell és a (2) korlátozott terjedési modell. A niche-modellben azt feltételezzük, hogy a vizsgált tájat különböző adottságú foltok alkotják, a foltok valamilyen léptékben térben aggregáltak (vagyis a környezetnek van térbeli autokorrelációja), a fajok élőhelyigényükben különböznek, valamint bármely nekik megfelelő élőhelyfoltban előfordulhatnak, terjedésüket egyedül az élőhely alkalmatlan mivolta korlátozhatja. Ebben az esetben tehát a közösség DD-je egy "külső" tényező, a környezeti DD lenyomata. A korlátozott terjedési modellben ezzel szemben azt feltételezzük, hogy a táj homogén a fajok megtelepedése szempontjából, a fajok élőhelyigénye nem különbözik, viszont terjedésük időben és térben korlátozott: új megtelepedések a régi megtelepedések közelében várhatóak, a teljes területen való elterjedéshez pedig hosszú időre van szükség. Eszerint a DD egy "belső" tényezőnek, a fajok korlátozott terjedőképességének köszönhető.
A valóságban rendszerint mindkét mechanizmus, tehát a niche-folyamatok és a korlátozott terjedés is felelős a tapasztalt összefüggés kialakulásáért. A DD jelenség tehát az alábbi tényezőkből vezethető le:
- a vizsgált területen a környezet heterogenitása, vagyis a területen az élőhelyfoltok különbözőségének mértéke: ez szabja meg, hogy az egyes fajok mennyi megtelepedésre alkalmas foltot találnak a területen, hiszen ha egy területen nagyon különböző élőhelyfoltok vannak, akkor azokon nagyon különböző élőhelyigényű fajok tudnak előfordulni, viszont minden élőhelyen talán egyik faj sem fordul elő.
- a vizsgált terület tájstruktúrája, vagyis az élőhelyfoltok térbeli mintázata: ezt fogja tükrözni a közösségek térbeli mintázata, amennyiben a terjedés azt lehetővé teszi.
- a fajok niche-szélessége, vagyis az, hogy mennyire ragaszkodnak egy bizonyos élőhelytípushoz (mennyire generalisták vagy specialisták): a generalista fajok többféle élőhelyen is előfordulnak, így a térbeli mintázatukat nem annyira az élőhelyfoltok térbeli struktúrája, hanem a terjedési potenciáljuk határozza meg. A specialista fajok egy adott élőhelytípushoz ragaszkodnak, és jó terjedőképesség esetén pontosan követik annak foltosságát.
- a fajok terjedőképessége: minél jobban terjed egy faj, annál inkább a megfelelő élőhelyek térbeli mintázatát követi, míg a rosszul terjedő fajok nem jutnak el minden potenciálisan megfelelő foltba, vagy nem maradnak fenn ott hosszú távon. (Pl. egy hím madárnak nem elég eljutni egy élőhelyre a faj tartós megtelepedéséhez, mert ehhez kell egy tojó is...)
A DD-re ható tényezőkkel Nekola & White (1999) és Soininen et al. (2007) is foglalkoznak, mindkét cikkben megfogalmaznak általánosságokat arról, hogy mely tényezők eredményeznek "meredek", "erős", csökkenést a hasonlóságban, vagy nagyfokú térbeli strukturáltságot. Később bemutatom, hogy a DD milyen sokféle mérőszámmal írható le, amelyek mind a csökkenés mértékének kifejezésére szolgálnak, de valójában nem egészen ugyanazt fejezik ki, és nem is függetlenek egymástól. Emiatt igyekszem óvatosan fogalmazni azzal kapcsolatban, hogy egyes tényezők hogyan hatnak a várható DD-re.

A változatos domborzatú, magashegységi tájban a közösségek hasonlósága kis távolságon belül is hirtelen lecsökkenhet

A niche-modell reális magyarázatot nyújt a DD-re, ha:
- a környezeti (a fajok szempontjából) heterogén, vagyis a fajok specialisták,
- a környezeti háttérváltozók térben autokorreláltak,
- a fajok jól (csaknem korlátlanul) terjednek.

A korlátozott terjedési modell ad jó magyarázatot, ha:
- a környezet (a fajok szempontjából) homogén, vagyis a fajok generalisták,
- a háttérváltozók nem autokorreláltak (ez részben a homogenitásból is fakadhat),
- a fajok rosszul terjednek.

Nincs jelentős DD, ha:
- a környezet (a fajok szempontjából) homogén vagy heterogén, de akkor a változók a vizsgált léptékben nem autokorreláltak,
- a fajok jól terjednek.

A kis holdruta (Botrychium lunaria) jól terjedő, de specialista faj


Hogy konkrét esetekben a fenti szempontok hogyan teljesülnek, az az adott vizsgálat módszertani döntéseitől is függ, mindenek előtt a mintavételi egységek méretétől és a mintavételezett terület nagyságától. Ugyanaz a vizsgálati objektum teljesen más DD-t mutathat, ha eltérő térléptékben vizsgáljuk. Pl. ha Magyarország növényzetét vizsgáljuk, más térbeli mintázatok tűnnek fel, ha a mintavételi egységeink 1 m2-esek és ha 1 km2-esek. Általánosságban igaz, hogy minél nagyobb a mintavételi egység és a mintavételezett terület, annál valószínűbb, hogy erős DD összefüggést kapunk.

Ennyi elmélet után jogosan merül fel a kérdés: mire jó ez az egész? A válasz(om): az, hogy valamilyen élő közösség, pl. egy terület növényzete, milyen térbeli változatossággal (béta diverzitással) rendelkezik, alapvető kérdés a természetet leíró, ökológiai kutatásokban. Az erről szerzett ismeretek pedig fontosak lehetnek természetvédelmi értékek minősítése, veszélyek felmérése, területek védelme szempontjából. Például ha egy területről kimutattuk, hogy a rajta élő fajok terjedőképessége alacsony, akkor a természetvédelmi kezeléseknek kiemelt figyelmet kell fordítaniuk arra, hogy a fajok potenciális élőhelyei között ökológiai folyosókat tartsanak fenn, valamint fokozottan kell ügyelniük a lokális kihalások elkerülésére. A béta diverzitás térbeli elemzése szintén hozzásegít olyan alapvető biológiai folyamatok megértéséhez, mint a fajképződés, a klímaváltozások alkalmával történő flóra- és faunavándorlások és a biológiai inváziók. Hogy a gyakorlati célok számára is fontos információk birtokába technikailag hogyan juthatunk a DD modellek segítségével, egy későbbi bejegyzésben fogom leírni.