Translate

A következő címkéjű bejegyzések mutatása: osztályozás. Összes bejegyzés megjelenítése
A következő címkéjű bejegyzések mutatása: osztályozás. Összes bejegyzés megjelenítése

2021. február 19., péntek

Megjelent a REMOS osztályozási módszerről szóló cikkünk a JVS-ben

2019 novemberében írtam arról, hogy kitaláltunk egy új osztályozási módszert, amelynek a REMOS (REallocation of Misclassified Objects based on Silhouette width) nevet adtuk. A módszerről most csak annyit írnék, hogy ezzel meglévő (akár véletlenszerű) osztályozásokon lehet javítani azáltal, hogy a "félreosztályozott" elemeket lépésenként átpakolgatjuk egy megfelelőbbnek tűnő csoportba. A jóság kritériuma pedig az adott objektum sziluett indexe. A módszert először preprintként közöltük le, hogy azonnal használhassuk és hivatkozhassuk a lengyel gyepek jellegalapú osztályozásához. Közben benyújtottuk a Journal of Vegetation Science-be is közlésre, s némi átalakítás után most végre el is fogadták. A cikkben a REMOS két verzióját egy hasonló elven működő, OPTSIL nevű módszerrel vetjük össze. A bírálati idő kicsit hosszúra nyúlt, mert nehezen talált a szerkesztő bírálót a viszonylag szűk és elméleti témájú cikkhez (azt írta, 11 visszautasított felkérés után vállalta el valaki), de cserébe mi gyorsan javítottunk mindent, így összességében az átlagosnak mondható, egy év körüli átfutás jött ki. A cikk nyílt hozzáférésű, és a 123997 azonosítójú OTKA PD projektem első cikke.


A REMOS mindkét verziója sokkal gyorsabb az OPTSIL-nél


Lengyel, A, Roberts, DW, Botta‐Dukát, Z. 2021. Comparison of silhouette‐based reallocation methods for vegetation classification. Journal of Vegetation Science; 32:e12984. https://doi.org/10.1111/jvs.12984

Abstract

Aims: Vegetation classification seeks to partition the variability of vegetation into relatively homogeneous but distinct types. There are many ways to evaluate, and potentially improve, such a partitioning. One effective approach involves calculating silhouette widths which measure the goodness‐of‐fit of plots to their cluster. We introduce a new iterative reallocation clustering method — Reallocation of Misclassified Objects based on Silhouette width (REMOS) — and compare its performance with an existing algorithm — OPTimizing SILhouette widths (OPTSIL). REMOS reallocates misclassified objects to their nearest‐neighbour cluster iteratively. Of its two variants, REMOS1 reallocates only the object with the lowest silhouette width, while REMOS2 reallocates all objects with negative silhouette width in each iteration. We test how REMOS1, REMOS2 and OPTSIL perform in terms of: (a) cluster homogeneity and separation; (b) the number of diagnostic species; and (c) runtime.

Methods: We classified simulated data with the flexible‐beta algorithm for values of beta from −1 to 0. These classifications were subsequently optimized by REMOS1, REMOS2 and OPTSIL and compared for mean silhouette widths, misclassification rate, and runtime. We classified three vegetation data sets from two to ten clusters, optimized all outcomes with the three reallocation methods, and compared their mean silhouette widths, misclassification rate, and number of diagnostic species.

Results: OPTSIL achieved the highest mean silhouette width across the majority of the data sets. REMOS achieved zero or negligible misclassifications, outperforming OPTSIL on this criterion. REMOS algorithms were typically more than an order of magnitude faster to calculate than OPTSIL. There was no clear difference between REMOS and OPTSIL in the number of diagnostic species.

Conclusions: REMOS algorithms may be preferable to OPTSIL when: (a) the primary objective is to reduce the number of negative silhouette widths in a classification, as opposed to maximizing mean silhouette width; or (b) when the time efficiency of the algorithm is important.

2019. november 15., péntek

REMOS - új módszer a numerikus osztályozásban

A numerikus osztályozás számos tudományterületen az alapvető statisztikai módszerek közé tartozik. A növényzeti típusok reprodukálható, objektív kritériumok alapján történő elkülönítése kapcsán én is rendszeresen írok róla. A legtöbb klasszifikációs módszer jellemzője, hogy akkor is adnak eredményt (vagyis csoportokat), ha a mintának nincs különösebb struktúrája. Emiatt az objektumok (mintavételi egységek, megfigyelések, felvételek, fajlisták... amiket osztályozunk) csoportjainak létrehozása mellett ugyanennyire fontos, hogy teszteljük, tényleg jók-e a csoportok. Ez a "jóság" temérdek kritérium szerint mérhető, Vendramin és társai (2010) például 40 módszert tekintenek át a review cikkükben. Azonban ha tudjuk, hogy a célunk egy olyan osztályozás elérése, amelyre majd egy ilyen, ún. validitási index alapján azt mondjuk, hogy ez egy "jó osztályozás", akkor miért nem keressük célirányosan már az osztályozás létrehozásakor azt a megoldást, amelynek a lehető legmagasabb a validitási indexe? A megközelítés teljesen valid, ahogyan Roberts (2015) cikkében is láthatjuk: két módszert is bemutat, amelyek valamilyen kezdeti (akár random, de inkább valami más klaszterező módszerrel legyártott) osztályozásból kiindulva addig-addig pakolgatják az objektumokat egyik csoportból a másikba, amíg az adott validitási index a lehető legmagasabb értéket el nem éri. Roberts módszerei ezt úgy érik el, hogy megvizsgálnak minden egyes lehetséges áthelyezést, majd végül azt az egyet hajtják végre, amely a legnagyobb növekedést okozza a validitási index értékében. Az egyik módszer neve OPTSIL, és a sziluett nevű indexet optimalizálja. Botta-Dukát Zoltánnal nem rég írtunk egy preprintet a sziluett index általánosításáról, amellyel különféle alakú clusterekre válik érzékennyé a módszer (azóta elfogadták az Ecology and Evolution lapban, hamarosan meg kéne jelennie). A sziluettben az a jó, hogy minden egyes objektumra ad egy értéket, ami kifejezi, hogy mennyire illik abba a csoportba, amelyikbe került, az alapján, hogy milyen átlagos távolságra (a távolságok az objektumok közti különbözőséget fejezik ki) van a csoport többi tagjától, illetve a legközelebbi másik csoport tagjaitól. Az index -1 és +1 közötti értékeket vehet fel. Ha az értéke pozitív, akkor az objektum jó helyen van, mert közelebb van a csoportja többi tagjához, mint a szomszédos csoport tagjaihoz. Ha 0 (vagy ahhoz nagyon közeli), akkor az objektum átmeneti helyzetű, ha negatív, akkor "félreosztályozott", egy másik csoport tagjaira jobban hasonlít, mint azokra, amelyekkel egy csoportba sorolták. Értelemszerűen minél kevesebb a félreosztályozott objektum, annál jobb egy osztályozás. Vegetációosztályozások "szakértői" ellenőrzésekor és értékelésekor is gyakori, hogy viszonylag szubjektív módon kijelentjük, hogy egyik vagy másik felvétel "rossz" helyen van abban a csoportban, ahová a numerikus módszer tette, néha felül is bíráljuk ezt a besorolást. Mivel a sziluett index alkalmas arra, hogy a félreosztályozott objektumokat objektív módon azonosítsa, semmi nem gátol meg minket abban, hogy csináljunk egy olyan módszert, amely egy meglévő osztályozást a félreosztályozott felvételek átsorolgatásával, iteratív módon javít egészen addig, amíg minden objektum a helyére nem kerül.
Ezt csináltuk meg, először csak Botta-Dukát Zoltánnal, amiből írtunk egy preprintet, amit felraktunk a bioRxiv szerverre. Az új módszernek a REMOS (REallocation of Misclassified Objects based on Silhouette width) nevet adtuk. A kéziratot elküldtem Dave Robertsnek, aki fontos elemzésekkel és gondolatokkal egészítette ki a munkákat, így a preprintet (immár hárman) újraírtuk. A javított verzió itt olvasható, a módszer R kódja az elektronikus függelékben, az összefoglalót alább bemásolom. Közben a kézirat bírálat alatt is áll egy folyóiratban.
A REMOS-nak két verziója áll rendelkezésre. A REMOS1 mindig csak a legalacsonyabb sziluett értékű félreosztályozott objektumot rakja át a szomszédos csoportba, míg a REMOS2 az összes félreosztályozottat. Az áthelyezés után újraszámolják az összes objektumra a sziluetteket, és ha vannak félreosztályozott objektumok, akkor jön a következő áthelyezés, majd megint újraszámolás, megint áthelyezés, és így tovább addig, amíg el nem fogynak a negatív sziluett értékek. Fontos látni, hogy a REMOS alapvetően nem ellenőrzi az áthelyezések hatását az osztályozás egészére, szemben az OPTSIL-el. A REMOS csak azt tartja szem előtt, hogy az egyedi felvételek a helyükre kerüljenek, így inkább "lokális" perspektívájú, míg az OPTSIL "globális" kritérium szerint dolgozik. (Tapasztalatom szerint a gyakorlatban jobban szeretjük azokat az osztályozásokat, ahol minden objektum a helyén van, mint azokat, amelyekben átlagosan jó helyen van minden.) Mindkét REMOS verzió képes ciklusokba kerülni. Ez azt jelenti, hogy ismétlődően ide-oda pakolgatják az objektumokat a csoportok között, de mindig marad félreosztályozott, nem érnek soha a dolog végére. Ilyenkor az algoritmus automatikusan megáll és azt a megoldást fogadja el végsőként, amely a legkevesebb félreosztályozottat tartalmazza. Ha ebben egyenlőség van, akkor az lesz a végső, amely esetén a negatív sziluettek abszolút összege (az osztályozás "hibája") a legkisebb.

A félreosztályozott objektumok arányának (Misclassification rate) változása különböző béta-flexibilis osztályozással, különböző béta értékkel készített osztályozásokból indítva optimalizálás nélkül (Initial), illetve REMOS1, REMOS2 és OPTSIL módszerekkel történő optimalizálás után


A preprintben különböző adatsorokon és különböző kiindulási osztályozásokkal hasonlítottuk össze a REMOS-t és az OPTSIL-t. Az összehasonlítás kritériuma a végső osztályozás átlagos sziluett értéke, a negatív sziluettű objektumok aránya, valamint a diagnosztikus fajok száma volt. Emellett megnéztük a két módszer által igényelt futási időt is. Amikor már eleve "jó" osztályozásból indultunk ki, mindkét módszer jól teljesített, hasonlóan magas átlagos sziluettű és kevés félreosztályozott objektumot tartalmazó megoldásokat adott. Nyilván az átlagos sziluett tekintetében az OPTSIL, a félreosztályozottak arányát nézve a REMOS volt kicsivel jobb, de mivel ez a két dolog erősen összefügg, elhanyagolható volt a különbség. Amikor azonban a kiindulási osztályozás elég rossz volt, akár véletlenszerű, akkor a REMOS sokkal jobb volt, mint az OPTSIL, mindkét fenti kritérium tekintetében. Ez annak volt köszönhető, hogy az OPTSIL az iteráció során gyakran hamar "megrekedt" lokális optimumokban. A REMOS1 és a REMOS2 között ha volt különbség, akkor mindig az előbbi javára billent a mérleg. A fenti elemzéseket szimulált adatsorokon végeztük. Valós elemzési helyzeteket eljátszva, amikor "jó" osztályozásokból indultunk ki, a diagnosztikus fajok számában nem láttunk szisztematikus különbséget, hol az egyik, hol a másik módszer tűnt jobbnak. Nagy különbség volt azonban a futási időben. A REMOS nagyságrendekkel gyorsabb volt. Pl. míg egy 300 objektumot tartalmazó adatsoron "jó" osztályozásból indítva a REMOS1 századmásodpercek alatt futott le, az OPTSIL esetén ehhez kb. 10 másodperc kellett. Nyilván 10 másodperce mindenkinek van, de a tesztünk végletesen egyszerű volt. A valóságban ezres-tízezres adatsorok és "rosszabb" osztályozások is szerepelhetnek majd, ott pedig az OPTSIL (Dave tapasztalatai alapján) akár napokig vagy hetekig is futhat, míg a REMOS2 percek, a REMOS1 órák alatt is végezhet.
A javaslatunk szerint az OPTSIL akkor jó megoldás, ha (1) kimondottan az átlagos sziluettet akarjuk optimalizálni; (2) van időnk megvárni a programot. Minden más esetben a REMOS a jobb választás.


Abstract
Aims: To introduce REMOS, a new iterative reallocation method (with two variants) for vegetation classification, and to compare its performance with OPTSIL. We test (1) how effectively REMOS and OPTSIL maximize mean silhouette width and minimize the number of negative silhouette widths when run on classifications with different structure; (2) how these three methods differ in runtime with different sample sizes; and (3) if classifications by the three reallocation methods differ in the number of diagnostic species, a surrogate for interpretability.
Study area: Simulation; example data sets from grasslands in Hungary and forests in Wyoming and Utah, USA.
Methods: We classified random subsets of simulated data with the flexible-beta algorithm for different values of beta.  These classifications were subsequently optimized by REMOS and OPTSIL and compared for mean silhouette widths and proportion of negative silhouette widths. Then, we classified three vegetation data sets of different sizes from two to ten clusters, optimized them with the reallocation methods, and compared their runtimes, mean silhouette widths, numbers of negative silhouette widths, and the number of diagnostic species. 
Results: In terms of mean silhouette width, OPTSIL performed the best when the initial classifications already had high mean silhouette width. REMOS algorithms had slightly lower mean silhouette width than what was maximally achievable with OPTSIL but their efficiency was consistent across different initial classifications; thus REMOS was significantly superior to OPTSIL when the initial classification had low mean silhouette width. REMOS resulted in zero or a negligible number of negative silhouette widths across all classifications. OPTSIL performed similarly when the initial classification was effective but could not reach as low proportion of misclassified objects when the initial classification was inefficient. REMOS algorithms were typically more than an order of magnitude faster to calculate than OPTSIL. There was no clear difference between REMOS and OPTSIL in the number of diagnostic species.
Conclusions: REMOS algorithms may be preferable to OPTSIL when (1) the primary objective is to reduce or eliminate negative silhouette widths in a classification, (2) the initial classification has low mean silhouette width, or (3) when the time efficiency of the algorithm is important because of the size of the data set or the high number of clusters.

2019. február 12., kedd

Új szintézis a közép- és kelet-európai sztyepprétekről

A különféle szárazgyepek változatossága igen kedvelt téma az európai cönológusok számára, nem meglepő, hogy gyakran újraértékeli valaki a korábbi vizsgálatok eredményeit. Egy frissen megjelent cikkben, amiben társszerzőként szerepelek, a közép- és kelet-európai sztyepprétek szintézisét kíséreltük meg. Emlékeztetőül, főként középmagas vagy magas füvű gyepekről van szó, amelyek leginkább a közép- és kelet-európai erdőssztyepp zónához kötődnek. Félszáraz gyepeknek is hívjuk őket, utalva arra, hogy nem szélsőségesen vízhiányos, csak "aránylag száraz" élőhelyekről van szó. Erdősebb vidékeken gyakran másodlagosan jöttek létre, míg keletebbre klímazonális gyepet is alkotnak, de a megkülönböztetés nem tökéletes. A szüntaxonómiai rendszerben a félszáraz gyepeket a Brachypodietalia pinnati (="Brometalia erecti" érvénytelen név) rend foglalja magában, azon belül Közép-Európában megkülönböztetjük az atlantikusabb Mesobromion erecti (="Bromion erecti"), a szubkontinentális Cirsio-Brachypodion, a Balkánon a Scorzonerion villosae és a Chrysopogono-Danthonion alpinae, Kelet-Európában pedig több további asszociációcsoportot.

Polygalo-Brachypodietum sztyepprét a Kelet-Cserhátban

Jelen kutatás legfőbb érdemének tartom, hogy egy eddig példátlanul nagy, a Rajnától az Ural hegységig terjedő területre érvényesen igyekszik összefoglalni a vegetációtípus változatosságát és tisztázni a szüntaxonómiáját. A szüntaxonok definiálásánál a biogeográfiai kapcsolatok nagy szerepet kaptak. Emögött az az elmélet búvik meg, hogy a legutóbbi jégkorszak után a melegkedvelő sztyeppi fajok csak lassan kolonizálták vissza a potenciális élőhelyeiket, illetve ez a folyamat még mindig tart. Ennek köszönhetően délről észak felé csökken a sztyepprétek fajgazdagsága, az északabbi típusok gyakran "negatívan karakterizáltak", vagyis inkább bizonyos fajok hiányával jellemezhetők. A társulásfelosztás tehát úgy lett meghatározva, hogy a társulások az újrakolonizálás fokát (is) tükrözzék. A cikkben elfogadottnak vett szüntaxonokhoz formális definíciókat is közlünk.

A Colchico-Festucetum rupicolae markáns társulásnak bizonyult a Cirsio-Brachypodionon belül

Egy ekkora térléptékű áttekintés mindig kemény feladat, nekem is tört már bele a bicskám ilyenbe. Ezúttal sem alkottunk tökéletest. A biogeográfiai megközelítés miatt az asszociációk eléggé elnagyolt egységek, tényleg csak nullhipotézisekként értékelendők, amelyek megmondják, hogy adott földrajzi területen az abiotikus környezet főbb komponenseit figyelembe véve valószínűleg melyik társulást kéne találnunk. Részben ennek köszönhető, hogy a cikk több ponton ellent mond az általam vezetett, hasonló témájú, de a magyar országhatáron belül maradó cikknek (Lengyel et al. 2016). Az új feldolgozás például nem igazít el kielégítően a dunántúli sudár rozsnokos gyepek változatosságát illetően, továbbá a Polygalo-Brachypodietumra hasonlító, de pontusi fajokat nem tartalmazó gyepek kezelése sem megnyugtató. Emiatt a hazai félszáraz gyepekkel kapcsolatban (szerénytelenség ide vagy oda) még mindig a 2016-ban megjelent cikkünket ajánlom, és csak néhány részletkérdésben látom jogosnak a Willner et al. (2019) által javasolt változtatásokat. Az egyik a Lengyel et al. (2016) által leírt Colchico-Festucetum rupicolae átsorolása a Cirsio-Brachypodionba (ez már bennem is felmerült korábban, de nem mertem meglépni). Indokolhatónak látom még a Trifolio-Brachypodietum beolvasztását a Brachypodio-Molinietumba, legalább is egy ilyen földrajzi dimenziójú feldolgozásban. Hangsúlyozom, ez a Magyarországon belüli megállapításokra igaz, és bizonyos szempontból természetes az, hogy minél általánosabb érvényű igazságokat keresünk, annál jobban meggyűlik a bajunk a specifikus esetekkel, lokális jelenségekkel.

Bőven van még kutatnivaló, például a kisalföldi sudár rozsnokos rétsztyeppeken

Amint látható, maradtak bőven nyitott kérdések, vitatható pontok. Az elemzés gyengéje még, hogy (részben technikai okokból) a szubjektivitás szerepe nagy volt, így az elkülönített egységek statisztikailag rigorózusabb felülvizsgálatát meghagytuk a jövő kutatóinak. Mégis azt gondolom, jó kiindulási alapot jelent a cikk, akár megerősítjük, akár elvetjük a hipotéziseit.




Abstract
European semi-dry grasslands are among the most species-rich vegetation types in the northern hemisphere and form an important part of the habitat mosaics in the forest-steppe zone. However, there is no comprehensive evaluation of the variation in their composition and the phytosociological classification of these grasslands. For the syntaxonomic revision, we used a dataset of 34,173 vegetation plot records (relevés) from central and eastern Europe, which were assigned to the class Festuco-Brometea using the diagnostic species listed in the EuroVegChecklist. To determine the diagnostic species of the orders, we used a TWINSPAN classification of the whole dataset. Of the total dataset, 15, 449 relevés were assigned to the order Brachypodietalia pinnati, which corresponds to semi-dry grasslands. This subset was again classified using TWINSPAN. Formal definitions of the following alliances were established: Mesobromion erecti, Cirsio-Brachypodion pinnati (incl. Fragario-Trifolion montani, Agrostio-Avenulion schellianae, Scabioso ochroleucae-Poion angustifoliae and Adonido vernalis-Stipion tirsae), Scorzonerion villosae and Chrysopogono-Danthonion. Another alliance, Armerion elongatae (= Koelerio-Phleion phleoidis p.p.), is transitional towards the class Koelerio-Corynephoretea and its status needs further evaluation. We also established formal definitions of all of the associations of Mesobromion and Cirsio-Brachypodion within the area studied. Associations were identified using (i) a TWINSPAN classification of the whole order, (ii) TWINSPAN classifications of regionally restricted data sets (usually all Brachypodietalia plots in one country) and (iii) existing national classification schemes. All formal definitions were written in the expert system language of the JUICE program. To obtain a more complete picture of the floristic similarities and gradients, we performed a DCA ordination of the associations. Our results revealed that meadow steppes in the forest-steppe zone in eastern Europe are very similar to semi-dry grasslands in central Europe.

Keywords: Brachypodietalia pinnati, Cirsio-Brachypodion, Festuco-Brometea, meadow steppe, Mesobromion, semi-dry grassland, syntaxonomy, vegetation classification

2018. október 4., csütörtök

Új preprint kézirat az osztályozások validációjáról

A többváltozós osztályozó módszereket rendkívül elterjedten használják, legyen szó vegetációs felvételek, génexpressziós profilok, pszichológiai karakterek vagy talajminták csoportosításáról, hiszen logikailag minden esetben ugyanaz történik: a több jellemzővel leírt objektumokat csoportokba rendezzük úgy, hogy a hasonló objektumok azonos csoportba kerüljenek. Az osztályozás igen fontos lépése, amelyről szerencsére talán egyre kevesebben feledkeznek el, a validáció, vagyis az osztályozás "jóságának" utólagos megítélése. Rengeteg validációs módszer létezik, mind egy kicsit más kritériumok alapján minősíti az objektumok csoportosítását. Az egyik legelterjedtebb validációs index a sziluett index ('silhouette width'), amely minden egyes objektumra megadja, hogy mennyire jól illik a csoportjába. Az értéke -1 és +1 között változik, minél nagyobb, annál jobban illik a csoportba az adott objektum. A 0-hoz közeli értékek kétes besorolást jelentenek, a pozitív értékek jelölik a megfelelően besorolt objektumokat. Ezzel azonosíthatók a csoportok tipikus, átmeneti és kiugró (félreosztályozott) elemei, továbbá az objektumok értékeit csoportonként vagy az egész osztályozásra átlagolva a csoportok, illetve az osztályozás jóságának mutatóit is megkaphatjuk. A sziluett index a hasonló belső variabilitású és kompakt, szférikus alakú csoportokat tekinti jónak, ami nem mindig előnyös, hiszen valós adatsorok esetén a gyakorlati szempontból jól értelmezhető csoportok más alakokat is felvehetnek a változók többdimenziós terében. Munkánkban a sziluett index egy általánosított formuláját mutatjuk be, amelynek szabályozható a kompaktság iránti érzékenysége, így megfelelő beállításokkal elnyújtott alakú csoportokat is jónak fogadhat el.

A sziluett index "viselkedése" különböző beállításokkal három elnyújott csoport esetén. A p paramétert változtatjuk az általánosított formulánkban, a keresztek az objektumok két változó (vízszintes és függőleges tengely) dimenziójában, a bekarikázottakat az index félreosztályozottnak tekinti. MR a félreosztályozottnak tekintett objektumok aránya, MSW az áltagos sziluett index. A p=1 eset a "hagyományos" sziluett index. Látható, hogy a csoportok szélső objektumait, a pontok 11%-át félreosztályozottnak tekinti, míg alacsonyabb p értékekkel ez nem történik meg.

A cikk jelenleg bírálat alatt áll egy folyóiratban, de a szerzői kéziratot már feltöltöttem a bioRxiv nevű preprint szerverre. A preprint publikálás lényege, hogy a felfedezések gyakorlatilag azonnal, még a folyóiratok szakmai bírálata előtt nyilvánossá és hivatkozhatóvá válnak, így megspóroljuk azt a több hónapot, vagy akár évet, ami egy cikk első beküldése és a nyilvános megjelenés között eltelik. A preprint kéziratok szabadon kommentelhetők, folyamatosan javíthatók, viszont utólag nem törölhetők.

A kézirat elérhetősége és összefoglalója:


Abstract
Cluster analysis plays vital role in pattern recognition in several fields of science. Silhouette width is a widely used measure for assessing the fit of individual objects in the classification, as well as the quality of clusters and the entire classification. This index uses two clustering criteria, compactness (average within-cluster distances) and separation (average between-cluster distances), which implies that spherical cluster shapes are preferred over others - a property that can be seen as a disadvantage in the presence of clusters with high internal heterogeneity, which is common in real situations. We suggest a generalization of the silhouette width using the generalized mean. By changing the p parameter of the generalized mean between −∞ and +∞, several specific summary statistics, including the minimum, maximum, the arithmetic, harmonic, and geometric means, can be reproduced. Implementing the generalized mean in the calculation of silhouette width allows for changing the sensitivity of the index to compactness vs. connectedness. With higher sensitivity to connectedness instead of compactness the preference of silhouette width towards spherical clusters is expected to reduce. We test the performance of the generalized silhouette width on artificial data sets and on the Iris data set. We examine how classifications with different numbers of clusters prepared by single linkage, group average, and complete linkage algorithms are evaluated, if p is set to different values. When p was negative, well separated clusters achieved high silhouette widths despite their elongated or circular shapes. Positive values of p increased the importance of compactness, hence the preference towards spherical clusters became even more detectable. With low p, single linkage clustering was deemed the most efficient clustering method, while with higher parameter values the performance of group average and complete linkage seemed better. The generalized silhouette width is a promising tool for assessing clustering quality. It allows for adjusting the contribution of compactness and connectedness criteria to the index value, thus avoiding underestimation of clustering efficiency in the presence of clusters with high internal heterogeneity.

2018. május 31., csütörtök

27th Congress of the European Vegetation Survey

Május 23. és 26. között rendezték a 27. EVS kongresszust, amely a vegetációosztályozással és a vegetációtípusok védelmével foglalkozó kutatók éves találkozója. A konferenciasorozat korábbi eseményeiről már írtam itt és itt. A helyszín ezúttal éppen Wroclaw volt, és a szervezői/előkészítői munkában is némi részt vállaltam. Annál kisebb ez a rész, hogy öndicséretnek minősüljön leírnom, hogy az egyik legjobban megszervezett konferencia volt az idei a sorozatban azok közül, amelyre ellátogattam.  Minden flottul ment, a konferenciacsomag 20x-os lupét és speciális kivitelű édességeket rejtett, a péntek esti konferenciavacsorát pedig az Oderán hajózva töltöttük. :) Ezúton is gratulálok a kollégáimnak, akik mindent megtettek azért, hogy sikerüljön.



A 'Classification and Database Management II' szekcióban előadásban számoltam be a Polonez projektes kutatásom első eredményeiről, az előadás absztraktja alább olvasható.

Lengyel, A., Swacha, G. & Kącki, Z.: Trait-based numerical classification of Molinio-Arrhenatheretea grasslands in Poland

Descriptive vegetation science has witnessed a rapid progress in the last decades due to the improvement of broad-scale electronic databases. Most synthetic works aimed at delimiting vegetation types on the basis of numerical analysis of species composition of sample plots. Such classifications are often supposed to serve as a multi-purpose reference of habitat types, since the diversity and composition of natural communities are known to determine general ecosystem properties. However, it has been recognised that focusing on species composition may fail to reveal certain patterns of vegetation that are strongly linked with the functioning of ecosystems. Instead of the taxonomic identities of species, their functional traits could offer more relevant information. Functional classifications are expected to have more general validity than species-based classifications because often the same traits respond to the same environmental gradients in very different places of the world due to convergent evolution. In contrast, species are dispersal-limited, thus their local abundances are informative only within their respective distributional limits. Our aim was to classify managed herbaceous vegetation on deep soils and temperate climate of Molinio-Arrhenatheretea syntaxonomical class in Poland on the basis of phytosociological relevés, plant trait data, and using numerical methods.
19995 vegetation plots representing all major grassland types of Poland were retrieved from the Polish Vegetation Database, from which a narrower subset of cca. 6000 Molinio-Arrhenatheretea relevés were resampled. Records of specific leaf area, canopy height, seed mass, clonality and bud bank were obtained from the LEDA and CLO-PLA databases. Between-plot dissimilarities were expressed by Rao functional dissimilarity index. The dissimilarity matrix was passed to principal coordinates ordination, and its most important axes were classified by Ward’s method. Although, this classification did not reproduce the hierarchy of the syntaxonomical categories at a coarse scale, at finer resolutions the main subtypes of Molinio-Arrhenatheretea were differentiated: mesic and wet hay meadows and pastures, marshes and wet grasslands rich in sedges, tall-forb vegetation, and trampled grasslands. After the first promising results, more subtle differences between types in individual traits are subject to further research.



Egy további előadás társszerzőjeként is szerepeltem:

Willner W., Roleček J., Dengler J., Chytrý M., Janišová M., Lengyel A., Aćić S., Becker T., Demina O., Jandt U., Kącki Z., Krstivojević-Čuk M., Korolyuk A., Kuzemko A., Kropf M., Lebedeva M., Semenishchenkov Y., Šilc U., Stančić Z., Staudinger M., Poluyanovm A., Vassilev K. & Yamalov S.: Syntaxonomic revision of the semi-dry grasslands of Central and Eastern Europe

The Eurasian semi-dry grasslands are among the most species-rich and most valuable habitat types of the northern hemisphere. For our syntaxonomic revision, we used a dataset of 34,173 plot records which were assigned to the class Festuco-Brometea by the EuroVegChecklist expert system. In the first step, we classified the dataset into orders and alliances. As starting point, a TWINSPAN classification of the whole dataset was done and the diagnostic species of the main clusters (first and second division level) were determined. The plots were re-assigned using formal definitions of the orders, and then the subset of the order Brometalia erecti (=Brachypodietalia pinnati), corresponding to all semi-dry grasslands of the study area, was classified again. On the basis of this second TWINSPAN classification, formal definitions of the alliances were established. We distinguished the following alliances: Bromion erecti s.str. (=Mesobromion), Cirsio-Brachypodion pinnati (incl. Fragario-Trifolion montani, Agrostio-Avenulion schellianae, Scabioso ochroleucae-Poion angustifoliae, Adonido vernalis-Stipion tirsae), Scorzonerion villosae and Chrysopogono-Danthonion. The fifth alliance “Koelerio-Phleion phleoidis” is transitional towards the class Koelerio-Corynephoretea and its status needs further study.
We also established formal definitions of all associations of the Bromion erecti and Cirsio-Brachypodion pinnati within the study area. The other alliances were not further classified in the present study. Associations were identified using (i) the TWINSPAN classification of the whole order, (ii) TWINSPAN classifications of regionally restricted data sets (typically all Brometalia plots of one country) and (iii) existing national classification schemes. All formal definitions were written in the expert system language of the JUICE program.



Összesen kb. 180 résztvevő érkezett, ha jól emlékszem, kb. 20 országból. A konferencia programját és absztraktjait tartalmazó weboldal itt érhető el.

2018. január 22., hétfő

Az adattranszformáció és a csoportszám megválasztásának hatása az osztályozás jóságára - új cikk a Journal of Vegetation Science-ben

A numerikus vegetáció-osztályozás során meghozott módszertani döntések meghatározzák, hogy milyen eredményt kapunk az elemzés végén, és abból milyen következtetéseket vonunk le. Online már elérhető az a cikkünk a Journal of Vegetation Science folyóiratban, amelyben azt mutatjuk be, hogyan változik az osztályozások stabilitása, ha az abundancia-transzformáció módját és a csoportszámot változtatjuk. A jelenség illusztrálására különböző valós és szimulált adatsorokat használtunk. A módszertani döntések és a stabilitás összefüggését kétdimenziós "hőtérképeken" mutatjuk be, ahol az abundancia-transzformáció egy paramétere jelenti az egyik, a csoportszám a másik tengelyt, a kettő metszetében lévő cellák színe pedig a stabilitás mértékét. A legstabilabb osztályozást adó csoportszám változhat az adattranszformáció módjával, és ez elsősorban monodomináns felvételek alkotta vegetációtípusokban (pl. mocsári növényzetben) várható. Ha egyformán indokolható választásnak tartunk többféle adattranszformációs módszert és/vagy csoportszámot, akkor érdemes e két döntés minden értelmes kombinációjában lefuttatni az osztályozást, és valamilyen erre való (validitási) indexszel kiválasztani a legjobbat. Az elemzés R kódja elérhető a cikk mellékleteként, és remélhetőleg hamarosan a Juice szoftverben is helyet kap.

A mocsári adatsorunk esetén minél nagyobb súlyt kaptak a tömegességbeli különbségek, annál magasabb volt az osztályozások stabilitása, és annál magasabb volt a legstabilabb osztályozás csoportszáma


Abstract
Question: Is it possible to determine which combination of cluster number and taxon abundance transformation would produce the most effective classification of vegetation data? What is the effect of changing cluster number and taxon abundance weighting (applied simultaneously) on the stability and biological interpretation of vegetation classifications?
Locality: Europe, Western Australia, simulated data.
Methods: Real data sets representing Hungarian submontane grasslands, European wetlands, and Western Australian kwongan vegetation, as well as simulated data sets were used. The data sets were classified using the partitioning around medoids method. We generated classification solutions by gradually changing the transformation exponent applied to the species projected covers and the number of clusters. The effectiveness of each classification was assessed by a stability index. This index is based on bootstrap resampling of the original data set with subsequent elimination of duplicates. The vegetation types delimited by the most stable classification were compared with other classifications obtained at local maxima of the stability values. The effect of changing the transformation power exponent on the number of clusters, indexed according to their stability, was evaluated.
Results: The optimal number of clusters varied with the power exponent in all cases, both with real and simulated data sets. With the real data sets, optimal cluster numbers obtained with different data transformations recovered interpretable biological patterns. Using the simulated data, the optima of stability values identified the simulated number of clusters correctly in most cases.
Conclusions: With changing the settings of data transformation and the number of clusters, classifications of different stability can be produced. Highly stable classifications can be obtained from different settings for cluster number and data transformation. Despite similarly high stability, such classifications may reveal contrasting biological patterns, thus suggesting different interpretations. We suggest testing a wide range of available combinations to find the parameters resulting in the most effective classifications.


2017. november 20., hétfő

Meghívó a "27th Congress of the European Vegetation Survey" konferenciára

A European Vegetation Survey program éves találkozóiról már többször írtam, legutóbb éppen 2 hónapja a 2017-es bilbaói konferenciáról. Az EVS kongresszus (eleinte 'workshop' néven futott, az utóbbi években jött divatba a 'congress') a kontinens vegetációjának leírásával, főleg osztályozásával foglalkozó kutatók éves találkozója. Az előadások és poszterek jellemzően egy-egy terület vegetációtípusaival, vegetációtérképezésével, szüntaxonok numerikus revíziójával, Natura2000 élőhelytípusok lehatárolásával, definiálásával, veszélyeztetett vegetációtípusokkal, a növényzet időbeli változásával, invazív fajok alkotta növényzettel, növényzeti adatbázisokkal, a témát érintő statisztikai problémákkal és szoftverefejlesztésekkel foglalkoznak. Általában 150-250 résztvevő szokott érkezni, különféle európai, ritkábban Európán kívüli országokból. A közelmúltbeli alkalmakon magyarok változó, de kb. 5-10 résztvevővel képviseltették magukat. 2018-ban éppen a mostani munkahelyemen, a Wroclawi Egyetemen fogják rendezni, és a helyi szervezőbizottságnak én is tagja leszek. A pontos dátum: 2018. május 23-26.

forrás: http://evs2018wroclaw.uni.wroc.pl

A találkozó fő témáját ezúttal egy évforduló adja. 1928-ban jelent meg a cönológia és vegetációosztályozás egy alapműve a tudományterület atyjától, Josias Braun-Blanquet-tól. A konferencián szeretnénk azzal foglalkozni, hogy az eltelt 90 év alatt milyen utat járt be a növényzet leírásának tudománya, milyen kérdések, elméletek, módszerek, eszközök jelentek meg, maradtak fenn vagy tűntek el, s milyen irányban képzelhető el a tudományterület jövője. Ezen a fő témán belül az alábbi résztémákkal szeretnénk foglalkozni specifikusabban:
- durvaléptékű vizsgálatok sajátosságai, avagy a kutatás skálájának kiterjesztése földrajzi, időbeli és környezeti dimenziók mentén;
- a növényközösségek válasza a kezelés megváltozására;
- adventív fajok szerepe a növényzet átalakulásában;
- Natura2000-es élőhelyek ismerete és védelme;
- az elméleti ökológia és a vegetációskutatás kapcsolata;
- adatbázis-kezelés.

A témákat azok elismert szakértői fogják felvezetni plenáris előadások formájában, majd lesznek hagyományos konferenciaszekciók rövidebb előadásokkal, valamint poszterek is. Az egyik napon konferenciakirándulásokat szervezünk, a résztvevők három lehetséges helyszín közül választhatnak: (1) Stołowe Nemzeti Park, (2) Kaczawskie vulkanikus hegyvidék, (3) az Odra (Odera) folyó völgye. A Stołowe-hegységben nem rég jártam én is, íme néhány fotó kedvcsinálóul:





További részletek a helyszínről, a határidőkről, a részvételi díjakról és minden egyébről olvashatók a kongresszus honlapján. Mindenkit szeretettel várunk!

2017. szeptember 21., csütörtök

26th Congress of the 'European Vegetation Survey'

Szeptember 13. és 16. között Bilbaóban rendezték a 'European Vegetation Survey' mozgalom éves találkozóját. Az EVS a Nemzetközi Vegetációtudományi Társaság (IAVS) egy munkacsoportja, amely a növényzeti változatosság leírása, főleg a növényzet osztályozása iránt érdeklődő kutatókat fogja össze. A találkozó honlapja itt érhető el. A konferencián az alábbi előadást tartottam:

Joint optimization of cluster number and abundance transformation for obtaining stable vegetation classifications
Lengyel A, Landucci F, Mucina L, Tsakalos J & Botta-Dukát Z

The choice of abundance transformation and the number of clusters are among the most important methodological decisions influencing the outcomes of vegetation classifications. The optimal number of clusters is routinely sought for by calculating cluster validity indices (e.g. Optimclass, average silhouette) for classifications of different number of clusters. In contrast, there are very few examples in the literature when the optimal abundance weighting is selected on the basis of evaluating classifications made by systematically changing the data transformation function. Here we present a protocol for finding the combination of abundance transformation function and cluster number which results in the most stable, that now we deem the ‘best’, classification. We show how the optimal values of these two variables co-vary, and how different decisions on any of them can change the classification patterns.
We used real data sets representing Hungarian grasslands, European wetlands and Australian kwongan vegetation, as well as simulated data for testing relationships between abundance weighting, number of clusters and stability. We classified the data sets with changing cluster number and exponent of the power transformation in all possible combinations using the partitioning around medoids non-hierarchical method. The stability of classifications was assessed by mean Goodman & Kruskal’s lambda. The stability values are plotted on a heat map where the horizontal and the vertical axes are defined by the exponent and the cluster number, respectively, and the color intensity of the cells reflect the stability obtained by the actual combination of parameter values. Thus, the most stable classification can be found at the most intensively colored cell. The relationship between optimal values for the exponent and the number of clusters varied significantly among data sets. In cases of data sets with uneven abundance distribution of species within plots, very different numbers of clusters proved optimal when low and high weight were given to the most dominant species. In contrast, when species abundances varied less, the optimal number of clusters changed little along different values of the exponent. Nevertheless, classifications with the same number of clusters but different abundance transformation can reflect significantly different biological processes. The mean Goodman & Kruskal’s lambda successfully identified the optimal number of clusters for most simulated data sets.

Az előadásban egy új eljárást javasoltam az adattranszformáció mikéntje és a csoportszám legjobb osztályozáshoz vezető kombinációjának megtalálására. A diasor letölthető innen. A témáról bírálat alatt áll egy cikkünk - remélem, hamarosan megjelenik, és akkor megoszthatom a részleteket.

A konferencián három kirándulási útvonal közül választhattak a résztvevők, én a Monte Bucierót és a Noja melletti tengerpartot magában foglaló programot választottam. Az eső miatt sajnos inkább a telefonommal, mint a fényképezőgépemmet fotóztam, ez a minőségen sajnos meglátszik.

Monte Buciero

Épp csak megkezdtük a kapaszkodást a hegyre, és ez a látvány fogadott

Magyaltölgy (Quercus ilex), a hegy reliktum erdeinek uralkodó fafaja

Polypodium cambricum

Magyaltölgyes bokorerdő

A kilátás fentről 1 ...

... 2

Asplenium onopteris 



Noja

Tengerparti-liliom (Pancratium maritimum)

Tengeri kömény (Crithmum maritimum)

Tengerparti sziklák, a Crithmum tipikus élőhelye

Asplenium marinum egy tengerparti rom falán

Ulex gallii

Tengerparti iringó (Eryngium maritimum)

Tengerparti fenyér

Juncus acutus
 
Halimione portulacoides

Sós mocsár a folyótorkolatban

Inula crithmoides


A konferenciarészvételt a GINOP 2.3.3-15-2016-00019 projekt finanszírozta.

2016. június 17., péntek

Magyarországi mezofil és félszáraz gyepek osztályozása - új cikk a Preslia folyóiratban

Megjelent a hazai mezofil és félszáraz gyepek osztályozását taglaló cikkünk a Preslia folyóiratban. Ez a tanulmány képezte tartalmilag a doktori értekezésem harmadik részét, de mivel azt korábban le kellett adnom, egyes eredmények már csak a cikkbe kerülhettek be.

Szúnyoglábú bibircsvirág (Gymnadenia conopsea) egy bükki hegyi réten

Numerikus osztályozást végeztünk egy hazai üde és félszáraz gyepi felvételeket tartalmazó adatbázison, majd az elkülönített felvételcsoportokat ismert növénytársulásokkal próbáltuk azonosítani. Az elemzés módszertana természetesen ennél - sőt, a numerikus szüntaxonómiai kutatások átlagánál is - lényegesen bonyolultabb. Az első látásra talán hókuszpókusznak tűnő műveletsort nem statisztikai macsóságunk, hanem a szükség hívta elő belőlünk: az elemzés során sokszor tapasztaltuk, hogy a minta, a közismertebb módszerek és a cönológiai szemléletmód sajátosságainak (nem ritkán korlátainak) köszönhetően az előzetes eredmények nem adtak adekvát választ a kutatási kérdéseinkre. A mintánk további bővítése több évi terepmunkát igényelt volna, a szemléletmód pedig egy tudományterületen belül maradva viszonylag kötött, így a módszereket kellett olyan módon megválogatnunk és összekombinálnunk, hogy értelmes növényzeti mintázatokat fedjenek fel. Három olyan megoldást alkalmaztunk, amit eddig viszonylag ritkán láttunk numerikus szüntaxonómiai tanulmányokban:
- nem-hierarchikus osztályozó módszert választottunk hierarchikus helyett, mert az előbbiek általában jobban elváló csoportokat határolnak le. A csoportokat ezt követően kevésbé formális úton illesztettük a szüntaxonómiai rendszer hierarchikájához;
- egy finom felbontású, 60 csoportos osztályozás készítettünk, mert bíztunk abban, hogy ez a ritka, kevés felvétellel reprezentált típusokat is kimutatja, míg a gyakori típusokat több csoport is képviselheti;
- a típusok közti átmeneti helyzetű, nem egyértelmű besorolású felvételeket egy statisztikai mérőszám segítségével azonosítottuk, s kizártuk a csoportok értékeléséből, ezzel mesterségesen tettük egyértelműbbé a típusok elválását (természetesen erről a diszkusszió során megemlékeztünk).
Ezek a megoldások csak a mi felfogásunkat tükrözik a problémákról, alternatív megközelítések lehetségesek (mi több, kipróbálandók).

Az alábbi rendszert javasoljuk a vizsgált vegetációtípusok osztályozására:

Arrhenatheretalia Tüxen 1931 asszociációrend: mezofil gyepek
1. Arrhenatherion elatioris Koch 1926 asszociációcsoport: mezofil kaszálók
1.1. Ranunculo bulbosi-Arrhenatheretum elatioris Ellmauer 1993: ez egy kevésbé tápanyagigényes, átmeneti szárazságot is tűrő fajok által jellemzett kaszálóréti társulás
1.2. Tanaceto vulgaris-Arrhenatheretum elatioris Fischer ex Ellmauer 1993: ez a félruderális franciaperjés, sok gyommal, kevés "igazi" mezofil réti fajjal
1.3. Pastinaco sativae-Arrhenatheretum elatioris (Knapp 1954) Passarge 1964: ez a "tipikus" franciaperjés, sok generalista réti fajjal, ld. ebben a bejegyzésben is
1.4. Filipendulo vulgaris-Arrhenatheretum elatioris Hundt et Hübl ex Ellmauer 1995: változó vízellátottságú, tápanyagban aránylag szegény, szubatlanikus elterjedésű kaszálórét
1.5. Anthoxantho odorati-Festucetum pratensis Borhidi 2012: az előzőhöz hasonló karakterű fajok alkotta, de északi-középhegységi ("kárpátiasabb") elterjedésű társulás
1.6. Diantho deltoidis-Arrhenatheretum elatioris (Máthé et Kovács 1960) Lengyel 2016: sovány gyepi, erdőszegély és félszáraz gyepi elemeket tartalmazó, franciaperje uralta hegyi kaszáló
1.7. Ranunculo repentis-Alopecuretum pratensis Ellmauer 1993: a mocsárrétek felé átmenetet mutató, jó víz- és tápanyagellátottságú kaszálórét

2. Cynosurion cristati Tüxen 1947 asszociációcsoport: mezofil legelők
2.1. Colchico autumnalis-Festucetum rupicolae Lengyel, Csiky, Dénes et Király 2016: változó vízellátottságú, de nyárra többnyire kiszáradó, extenzív legelő; új társulásként írtuk le
2.2. Anthoxantho odorati-Festucetum pseudovinae Juhász-Nagy 1957: mint a fenti, de kontinentálisabb elterjedésű
2.3. Alopecuro pratensis-Festucetum pseudovinae Juhász-Nagy 1957: ingadozó vízellátottságú, tömörödött talajú, sokat taposott legelő
2.4. Cynosuro cristati-Lolietum perennis Br.-Bl. et De Leeuw 1936: üde vagy nedves talajú, tápanyagban gazdag, intenzív legelő

Brometalia erecti Br.-Bl. 1936 asszociációrend: Félszáraz gyepek
1. Cirsio pannonicae-Brachypodion pinnati Hadač et Klika 1944: szubkontinentális félszáraz gyepek
1.1. Brachypodio pinnati-Molinietum arundinaceae Klika 1939: kárpáti üde-félszáraz (átmeneti) kaszálók
1.2. Filipendulo vulgaris-Brometum erecti Hundt et Hübl ex Willner 2013: szubatlanti üde-félszáraz (átmeneti) kaszálók
1.3. Sanguisorbo minoris-Brometum erecti Illyés, Bauer et Botta-Dukát 2009: pannon mészkedvelő félszáraz sudár rozsnokos gyepek
1.4. Polygalo majoris-Brachypodietum pinnati Wagner 1941: pontuszi-pannon fajokban gazdag, dombsági, félszáraz, szálkaperjés gyepek
1.5. Euphorbio pannonicae-Brachypodietum pinnati Horváth 2010: szubkontinentális és pannon, félszáraz löszgyep
1.6. Trifolio medii-Brachypodietum pinnati Illyés, Bauer et Botta-Dukát 2009: hegyvidéki, félszáraz, szálkaperjés és fogtekercses gyep

A sudár rozsnok uralta üde-félszáraz átmeneti gyepeket az Ausztriából nem rég leírt
Filipendulo vulgaris-Brometum erecti társulással azonosítottuk

Kimutattunk több olyan társulást, amelyet a szomszédos országokban már jeleztek, de nálunk nem. Két új társulásnevet is javasoltunk, ezek közül a Diantho-Arrhenatheretum bevezetését egy korábbi szubasszociáció asszociációszintre emelése indokolta, a Colchico-Festucetum rupicolae névvel pedig egy ismert, de érvényes leírással nem rendelkező típust jelöltünk meg. Egyes korábban Magyarországról jelzett szüntaxonok előfordulását nem tudtuk megerősíteni.

Bevezettük a Colchico autumnalis-Festucetum rupicolae társulásnevet
A gyepek cönológiájában jártasabb Olvasó számára feltűnhet, hogy a fenti rendszerrel inkább a több, de homogén, mint a kevesebb, de nagy belső változatosságú, robusztus társulás elkülönítése mellett döntöttünk. Ennek az egyik (igazán prózai) oka, hogy a statisztikai elemzések eredményeit az irodalmi és a terepi tapasztalatainkkal összevetve inkább ezt a mintázatot láttuk kirajzolódni. A másik, kissé filozófiaibb ok, hogy a vizsgált gyepek változatosságát folytonosnak látjuk, és ebben a kontinuumban a társulásleírások inkább "tájékozódási pontokként" szolgálnak, mintsem valóban élesen lehatárolható egységek definícióiként. Ezzel elismerjük, hogy léteznek olyan állományok, amelyek az általunk megadott leírásokkal nem azonosíthatóak, hanem gyakran átmeneti bélyegeket hordoznak két, vagy akár több társulás között. Az ilyen állományok besorolásáról mindig az adott vizsgálat céljainak megfelelően kell dönteni.

A nyugat-dunántúli őszi vérfüves üde kaszálókat nem tudtuk társulásszinten azonosítani

A vizsgálat nem elhanyagolható eredményének tartom, hogy a lehetőségeinkhez mérten részletesen körülírtunk olyan típusokat is, amelyeket nem tudtunk megfeleltetni egy társulással sem. Ezek között egyesek elterjedtnek mondhatók (pl. a veres csenkesz, illatos borjúpázsit és cérnatippan uralta domb- és hegyvidéki rétek), míg mások lokális előfordulásúak (pl. az őszi vérfüves kaszálók a Nyugat-Dunántúlon). A javasolt rendszer tehát nem végleges (talán soha, egyetlen osztályozás sem lesz az); kiegészítésekre és felülvizsgálatokra szorul. Reményeim szerint ezzel új kutatásoknak ad alapot, amelyek fokozatosan eltüntetik a fehér foltokat a hazai gyepi diverzitás térképéről. Nagy örömömre szolgálna, ha a gyeptársulások korszerű leíró vizsgálata más kutatóknak vagy hallgatóknak is felkeltené az érdeklődését. Ideális M.Sc. szakdolgozati vagy doktori téma lehet egy-egy vegetációtípus egy tájegységen belüli, vagy akár az egész országban mutatott változatosságának a korszerű feldolgozása. (Néhány példa ilyesmi doktori értekezésekre: Illyés 2010, Bauer 2012Schmidt 2013.) Igény esetén a segítségemet vagy az adataimat is fel tudom ajánlani együttműködés céljára.

Remélem továbbá, hogy a tanulmányunkkal méltó emléket állítottunk a közös munkát elindító, majd tragikus balesetet szenvedő kollégánknak, Illyés Eszternek.

A cikk a Preslia honlapján előfizetés fejében érhető el, de személyes megkeresésem esetén bárkinek elküldhetem. (Az elektronikus függelék ingyenesen is letölthető.)


Lengyel A., Illyés E., Bauer N., Csiky J., Király G., Purger D. & Botta-Dukát Z. (2016): Classification and syntaxonomical revision of mesic and semi-dry grasslands in Hungary. – Preslia 88: 201–228.


Abstract
Mesic and semi-dry grasslands are among the most valuable and species-rich anthropogenic habitats in Hungary. In contrast to the high respect with which they are regarded by conservationists, the diversity of this vegetation and its syntaxonomy were neglected for a long time. In this paper we present the first country-level synthesis and syntaxonomical review of this vegetation based on the numerical classification of the Arrhenatheretalia order, and an update of Brometalia erecti. After careful data selection and resampling, we classified 1204 relevés to 60 clusters. Clusters representing the same association were merged on the basis of a minimum spanning tree and expert assessment of their species composition. Species composition, geographical distribution and environmental background of each mesic and semi-dry grassland association are discussed. The relationships of associations were also examined by ordination. Evaluation of clusters and associations were based only on those relevés that were unambiguously classified. We recognized 11 associations in the Arrhenatheretalia order in two alliances. In the Arrhenatherion alliance, several new association names are adopted from the literature of other countries, and a new one is proposed. According to our concept, Arrhenatherion includes Ranunculo-Alopecuretum, a meso-hygrophilous type; Filipendulo-Arrhenatheretum and Anthoxantho-Festucetum pratensis, which are typical for meadows of fluctuating soil water level but have a different geographic distribution; PastinacoArrhenatheretum, that is a widespread mesic meadow with many generalist species; Ranunculo bulbosi-Arrhenatheretum containing drought-tolerant and less nutrient-demanding species; Tanaceto-Arrhenatheretum, a semi-ruderal type; and Diantho-Arrhenatheretum, that harbours many species of montane meadows. In the Cynosurion, four associations are distinguished. Cynosuro-Lolietum is an intensively grazed type on nutrient-rich, mesic or moist soil in humid climates; Alopecuro-Festucetum pseudovinae is also a heavily grazed type, but in areas with a more continental climate and on packed soil. Anthoxantho-Festucetum pseudovinae and Colchico-Festucetum rupicolae are lowland mesic pastures that contain some xerophilous species, however, they differ in grazing intensity and regional species pool. Two associations of Cirsio-Brachypodion transitional towards more mesic types are detected for the first time in Hungary: Filipendulo-Brometum with sub-Atlantic distribution and Brachypodio-Molinietum with a more montane and Carpathian distribution. We also recognized Sanguisorbo-Brometum, that is a common semi-dry grassland type on rocky soils in Transdanubia; Polygalo-Brachypodietum, a colline type with many Pontic species; Trifolio-Brachypodietum, an association of more forested and montane landscapes, and Euphorbio-Brachypodietum, the semi-dry grassland type of Pannonian loess regions. We concluded it is unlikely that Phyteumo-Trisetion and Bromion erecti occur in Hungary.

Keywords: ArrhenatheretaliaBrometalia erectiCarpathian Basin, classification, clustering, meadow, Hungary, phytosociology, syntaxonomy