Nichthierarchische Klassifikation von Standorten und deren Visualisierung in einem GIS

Hubert Röder, Martin Döllerer, Hans-Dietrich Quednau

Lehrbereich für Forstliche Biometrie und Angewandte Informatik, Forstwissenschaftliche Fakultät der LMU München

Am Hochanger 13, 85354 Freising

Erschienen in:

1) Internationale Biometrische Gesellschaft, Deutsche Region, Tagungsberichte der AG Ökologie, Heft 9. 22-32, 1998

2) http://www.forst.uni-muenchen.de/publ/quednau/roedoelque.html

Die vorliegende Arbeit ist Teil des von der DFG geförderten Projekts Qu 87/1-2 "Strukturanalyse und Visualisierung forstökologischer Daten mit Hilfe der Formalen Begriffsanalyse"

Summary: The Formal Concept Analysis (e.g. WILLE 1982, 1984) is applied to site and phytosociological data (EWALD 1997). By using conceptual scales, the investigated factors are expressed clearly and comprehensively for the researcher, without putting up with an uncertain loss of information. The significant relations between the plants and the site factors are used to reduce the data set and enable the rating of the environmental properties of the sites by the plants. The natural "fuzzyness" in the appearance of the plants is taken into consideration by the use of multiple significance tests. The structure of the relations in the conceptual lattice allows to classify the total amount of investigated sites according to plant(group)s in a nonhierarchical manner and to predict the environmental factors of groups of sites only by knowledge of the appearing plants. It is also possible to define environmental gradients and their effects on the appearance of the plants. The results of the formal concept analysis are visualized interactively in a GIS by connecting the used software. So the results of the analysis can be evaluated in thematic maps of a geographic information system and may be useful in practice.

Zusammenfassung: Mit der Formalen Begriffsanalyse (u. a. WILLE 1982, 1984) wird ein standorts- und vegetationskundlicher Datensatz (EWALD 1997) untersucht. Durch die Verwendung begrifflicher Skalen werden die erhobenen Standortsausprägungen für den Bearbeiter der Daten transparent und nachvollziehbar formuliert, ohne daß dafür ein nicht kalkulierbarer Informationsverlust in Kauf genommen werden muß. Durch die signifikanten Beziehungen zwischen den angezeigten Pflanzenarten und den Standortsausprägungen werden die Daten reduziert und die standörtliche Beurteilung der Aufnahmen nur durch die in ihnen vorkommenden Pflanzenarten möglich. Dabei werden die in der Natur vorliegenden Unschärfen beim Vorkommen der Pflanzenarten in den Aufnahmen durch die Verwendung von multiplen Signifikanztests berücksichtigt. Die Struktur der Beziehungen im Begriffsverband ermöglicht es, den gesamten erhobenen standörtlichen Raum nach Pflanzen(gruppen) nichthierarchisch zu klassifizieren und die standörtlichen Eigenschaften der entsprechenden Aufnahmekollektive vorherzusagen. Außerdem können standörtliche Gradienten und deren Auswirkungen auf das Vorkommen der Pflanzen beurteilt werden. Durch die Verknüpfung der verwendeten Software werden die Analyseergebnisse der Formalen Begriffsanalyse interaktiv am Bildschirm in einem GIS dargestellt. Dadurch stehen die Analyseergebnisse in thematischen Karten eines geographischen Informationssystems auch direkt für die Evaluierung und den praktischen Einsatz zu Verfügung.

1. Einleitung Die Explorative Datenanalyse basiert zur Zeit hauptsächlich auf numerischen Methoden, die immer komplexer werden, je unüberschaubarer die zu analysierenden Daten sind. Von WILLE (1982, 1984) wurde mit der Formalen Begriffsanalyse eine Methode entwickelt, die komplexe Zusammenhänge auf angemessene Weise transparent und verstehbar machen kann. (Eine zusammenfassende Darstellung findet sich in WILLE UND ZICKWOLFF 1994) Als Anwendungsbeispiel im forstlichen Bereich wird die Formale Begriffsanalyse zur Strukturanalyse standorts- und vegetationskundlicher Daten verwendet. Erste Ergebnisse dieses Vorgehens finden sich bei RÖDER (1996). In der vorliegenden Arbeit wird insbesondere die praktische Anwendbarkeit dieser Ergebnisse in der Standortserkundung aufgezeigt. Außerdem werden die verwendeten Programme der Formalen Begriffsanalyse ANACONDA und TOSCANA mit einem GIS verknüpft, wobei auch auf die programmiertechnische Realisierung eingegangen wird.

6. Diskussion Die Forderung nach einer nichthierarchischen Gliederung von Standorten und ihrer bezeichnenden Pflanzenarten leitet sich von der Vorstellung von vernetzten Systemen ab, in denen lokal stabile Zust„nde existieren. Um diesem Ziel ein Stück näher zu kommen, wurde ein neues Verfahren entwickelt, um die begrifflichen Skalen der kardinalen - und auch der kategorialen - Variablen zu vereinfachen. Durch multiple Signifikanztests wird sichergestellt, daß nur solche Standortsausprägungen in der weiteren Analyse verwendet werden, die auch in der Realität signifikant mit Pflanzenarten vergesellschaftet sind. Durch dieses Vorgehen werden sowohl die vorliegenden Standortsparameter als auch die Pflanzenarten bei der Beschreibung der lokal stabilen Systemzustände berücksichtigt. Der Informationsverlust, der durch diese Reskalierung und die Zusammenfassung von Wertebereichen in Kauf genommen wird, ist somit im Rahmen der eingestellten Irrtumswahrscheinlichkeit inhaltlich begründet. Zudem bleibt dieses Verfahren der begrifflichen Skalierung für den Bearbeiter der Daten bei jedem Analyseschritt transparent und nachvollziehbar.
Ein weiterer Vorteil der Verknüpfung der Standortsparameter und Pflanzendaten über Signifikanztests besteht darin, daß im entstehenden Formalen Kontext unscharfe Zuordnungen vorgenommen werden. So muß eine Pflanzenart, die signifikant einer Standortsausprägung zugeordnet wird, nicht exakt in jeder Aufnahme mit dieser Standortsausprägung vorkommen. Dazu reicht die Ablehnung der Hypothese auf einem vorgegebenenen Signifikanzniveau, daß die Pflanze von dieser Standortsausprägung stochastisch unabhängig ist. Auch dies wird den Verhältnissen in der Realität gerecht, in der immer damit gerechnet werden muß, daß Pflanzen zufällig auf Standorten wachsen, mit denen sie nicht vergesellschaftet sind.
Im zusammenfassenden Klassifikations- und Ordinationsschema (Abb. 3) sind alle durch Pflanzen signifikant angezeigten Standortsparameter enthalten. Dabei wird durch die Art der Herleitung des zugrundeliegenden Formalen Kontextes sichergestellt, daß das multiple Signifikanzniveau eingehalten wird. Unter Beachtung der Regeln zum Lesen von Begriffsverbänden können die dargestellten Begriffe als Standortstypen interpretiert werden, die sich nichthierarchisch gliedern. Damit ergibt sich ein System von ökologischen Artengruppen, die innerhalb der Grenzen des Untersuchungsgebietes zur Typisierung von Standorten verwendet werden können, wobei der Bezug zu den Standortsausprägungen immer nachvollziehbar ist. Dieser Bezug läßt sich bei der Übertragung der Klassifikation durch die gewonnenen ökologischen Artengruppen oder den Standortsausprägungen in thematische Karten darstellen und überprüfen.
Die gleichzeitge Verarbeitung von Standortsparametern und Pflanzenarten unter Berücksichtigung von Unschärfen und die Darstellung in einem nichthierarchischen Verband stellen in der angewandten Geobotanik eine zukunftsweisende Neuerung dar.

Die Vollversion dieses Artikels können Sie im PostScript-Format oder im PDF-Format beziehen.