CATMA

Aus MARJORIE-WIKI
Wechseln zu: Navigation, Suche
CATMA
Erscheinungsjahr 2009
Aktuelle Version 4.2
Betriebssystem MAC OS X, Windows
Programmier­sprache Java
Kategorie Textanalyse
Lizenz GNU GPL
http://www.catma.de

CATMA (Computer Aided Textual Markup & Analysis) ist eine browserbasierte Software zur computergestützten Textanalyse, die seit 2008 an der Universität Hamburg entwickelt wird.

Funktionalität[Bearbeiten]

CATMA bietet Geisteswissenschaftlern, Studierenden und anderen an Textanalyse interessierten Parteien eine Reihe hilfreicher Funktionen für ihre Forschung. Die Software besteht aus drei Komponenten, zwischen denen der Nutzer oder die Nutzerin nahtlos wechseln kann.[1]

  • Der CATMA Tagger bietet die Möglichkeit, einen Text mittels strukturierter Annotationen anzureichern. Für die Annotation können in CATMA individuelle Kategorien erstellt werden, die zur Auszeichnung von Textpassagen genutzt werden.
  • Der CATMA Analyzer unterstützt die Analyse des Datenmaterials durch die Möglichkeit, Abfragen auf dem Text und den Annotationen auszuführen. Hier stehen der Nutzerin oder dem Nutzer mit der Kollokations- und der Distributionsanalyse zwei vorgefertigte Analysemethoden zur Verfügung. Zusätzlich können individuelle, komplexe Abfragen gestellt werden.
  • Der CATMA Visualizer bietet basale Visualisierungsoptionen der Daten. Unterstützte Darstellungsoptionen sind momentan die Visualisierung als Graph, als Small Multiples und als DoubleTree.[2]

Zusätzlich besteht seit CATMAs Implementierung als Webanwendung die Möglichkeit, Text- und Analysedaten mit anderen Nutzern zu teilen und die Textanalyse nach Belieben kollaborativ durchzuführen.[3]

Aktuell wird im Rahmen des BMBF-geförderten Projekts heureCLÉA an der Entwicklung eines neuen CATMA-Moduls gearbeitet, das automatische Annotationsvorschläge für narrative Phänomene in Texten generiert.[4] Die Implementierung des Moduls wird voraussichtlich im letzten Quartal 2015 stattfinden.

Geschichte[Bearbeiten]

Das Programm basiert auf der Idee einer Reimplementation des unter Computerphilologen sehr beliebten TACT (Text Analysis Computing Tools).[5] TACT wurde zwischen 1986 und 1989 an der Universität von Toronto, Kanada von John Bradley und anderen für MS-DOS entwickelt.[6] Die Arbeit an CATMA startete 2008 an der Universität Hamburg – die erste Version wurde 2009 veröffentlicht[7] – und wird seitdem stetig fortgeführt. CATMA erweitert die aus dem Bereich der Textanalyse übernommene Funktionalität TACTs um die Möglichkeit der flexiblen Annotation.

Bis Version 3.2 war CATMA ausschließlich als Desktop-Anwendung nutzbar. Seit Version 4.0 arbeitet CATMA browserbasiert, wodurch ein flexiblerer Zugriff und kollaborative Arbeit ermöglicht werden.[8] Die Arbeit an CATMA 4.0 im Rahmen des Projekts CLÉA (Collaborative Literature Exploration & Annotation) wurde von Google gefördert.[9]

Philosophie[Bearbeiten]

Bei der Entwicklung von CATMA stehen besonders zwei Faktoren im Vordergrund. Zum einen soll CATMA Nutzerinnen und Nutzern mit wenig technischem Vorwissen als intuitiv bedienbares und nutzerfreundliches Werkzeug dienen. Dies wird durch durch zahlreiche Funktionen gewährleistet, beispielsweise durch die übersichtliche grafische Benutzeroberfläche, durch Direkthilfefunktionen und durch die innovative Komponente des Query Builders, der die intuitive Konstruktion komplexer Abfragen ermöglicht. Zum anderen ist CATMA eng an geisteswissenschaftlichen Bedarfen orientiert. So kann CATMA durch die Möglichkeit, individuelle Analysekategorien zu erstellen, an viele verschiedene Forschungsinteressen angepasst werden. Außerdem wird durch den einfachen Wechsel zwischen den drei Komponenten Tagger, Analyzer und Visualizer die in der geisteswissenschaftlichen Textarbeit übliche hermeneutische Arbeitsweise imitiert.[10]

Technologie[Bearbeiten]

CATMA ist in Java entwickelt und unter der GPL-Version 3 veröffentlicht. Es nutzt das Vaadin Framework für die Client-Server-Kommunikation und zur Generierung von HTML/CSS/Javascript für die GUI.

Für erleichterten Datenaustausch mit anderen Programmen bietet CATMA die Möglichkeit eines TEI-Exports des nutzergenerierten Markups. Um die Flexibilität der Analysekategorien für die Annotation zu gewährleisten, nutzt CATMA Feature Structures. Standoff Markup ermöglicht überlappende und mehrfache Annotationen.[11]

Literatur[Bearbeiten]

  • Jan Christoph Meister: Computerphilologie vs. 'Digital Text Studies'. In: Christine Grond-Riegler, Wolfgang Straub (Hrsg.): Literatur und Digitalisierung. Berlin/Boston: de Gruyter 2013, S. 267-296.
  • Jan Christoph Meister: Toward a Computational Narratology. In: Maristella Agosti, Francesca Tomasi (Hrsg.): Collaborative Research Practices and Shared Infrastructures for Humanities Computing. 2nd Aiucd Annual Conference, Aiucd 2013. Padua, Italien, 11.-12. Dezember 2013. Proceedings of Revised Papers; Padua 2014, S. 17-38.

Weblinks[Bearbeiten]

Einzelnachweise[Bearbeiten]

  1. Hochspringen http://catma.de/functionality.
  2. Hochspringen http://www.sfs.uni-tuebingen.de/~cculy/software/DoubleTreeJS/
  3. Hochspringen http://catma.de/clea.
  4. Hochspringen http://heureclea.de/.
  5. Hochspringen http://projects.chass.utoronto.ca/tact/.
  6. Hochspringen Jan Christoph Meister: Toward a Computational Narratology. In: Maristella Agosti, Francesca Tomasi (Hrsg.): Collaborative Research Practices and Shared Infrastructures for Humanities Computing. 2nd Aiucd Annual Conference, Aiucd 2013. Padua, Italien, 11.-12. Dezember 2013. Proceedings of Revised Papers; Padua 2014, S. 27-28.
  7. Hochspringen http://catma.de/versions
  8. Hochspringen http://catma.de/versions.
  9. Hochspringen Jan Christoph Meister: Computerphilologie vs. 'Digital Text Studies'. In: Christine Grond-Riegler, Wolfgang Straub (Hrsg.): Literatur und Digitalisierung. Berlin/Boston: de Gruyter 2013, S. 291.
  10. Hochspringen Jan Christoph Meister: Computerphilologie vs. 'Digital Text Studies'. In: Christine Grond-Riegler Wolfgang Straub (Hrsg.): Literatur und Digitalisierung. Berlin/Boston: de Gruyter 2013, S. 280.
  11. Hochspringen http://catma.de/technology.
Info Sign.svg Dieser Wikipedia-Artikel wurde, gemäß GFDL, CC-by-sa mit der kompletten History importiert.