Zum Inhalt springen
Freemium Low-Code 🇩🇪 Deutschsprachig 🇪🇺 EU-Server Geprüft: Mai 2026

Transkribus

READ-COOP SCE (Innsbruck, Österreich)

4/5
Tool öffnen

Spezialisierte HTR-Plattform (Handwritten Text Recognition) für historische und moderne Handschriften. Hervorgegangen aus EU-Forschungsprojekten der Universität Innsbruck, heute betrieben von der europäischen Genossenschaft READ-COOP SCE, Daten liegen auf eigenen Servern in Österreich, voll DSGVO-konform.

Kosten: 50 Credits/Monat kostenlos (~50 Seiten HTR), Individual ab ca. 9 €/Monat, Scholar/Education vergünstigt für Forschung, Organisation/Pro auf Anfrage. Zusätzliche Credits per Pack ab ca. 18 €.

Kategorien

Stärken

  • HTR-Modelle mit hoher Genauigkeit auch für Kurrent, Sütterlin und frühneuzeitliche Handschriften
  • Hosting in Österreich auf eigenen Servern, keine Big-Tech-Cloud, voll DSGVO-konform
  • Europäische Genossenschaft (SCE) mit 250+ Mitgliedern statt VC-getriebener Konzern
  • Eigene Modelle trainierbar (Field Models), Plattform lernt deine Hausschrift
  • Großer öffentlicher Modell-Katalog für Deutsch, Latein, Französisch und viele historische Sprachen
  • Kostenloser Einstieg mit 50 Credits pro Monat ohne Kreditkarte

Einschränkungen

  • Kein Allround-OCR, für reine Druckschrift sind Tesseract oder Document AI günstiger und schneller
  • Lernkurve: Layout-Analyse, Modellauswahl und Korrekturworkflow muss man lernen
  • Modell-Training braucht 5.000+ transkribierte Wörter Trainingsdaten
  • Credit-Modell wird bei Massendigitalisierung (>10.000 Seiten) schnell teuer ohne Org-Vertrag
  • Web-App-Performance bei sehr großen Dokumentensammlungen begrenzt

Passt gut zu

Archive, Bibliotheken und Museen Historische Forschung und Editionsprojekte Genealogie und Familienforschung Pharma- und Forschungsarchive (Laborbücher) Kanzleien mit historischen Aktenbeständen

Wann ja, wann nein

Wann ja

  • Du digitalisierst handgeschriebene Bestände, Kirchenbücher, Akten, Laborbücher, Tagebücher
  • Du brauchst zwingend EU-Hosting und DSGVO-Konformität
  • Du arbeitest in Forschung, Archiv oder Bibliothek mit deutschsprachigen Quellen
  • Du willst eigene Modelle auf eine spezifische Hausschrift oder einen Schreiber trainieren

Wann nein

  • Du verarbeitest nur moderne Druckdokumente, Tesseract oder Document AI sind passender
  • Du brauchst strukturierte Datenextraktion aus Formularen (Rechnungen, Verträge), ABBYY oder Azure Document Intelligence sind dafür gebaut
  • Du willst eine schlüsselfertige On-Premise-Lösung ohne Cloud, Transkribus ist Cloud-only
  • Du brauchst Echtzeit-OCR im Massenbetrieb mit SLA, Hyperscaler haben hier mehr Skalierung

Kurzfazit

Transkribus ist die Referenz für handgeschriebene Texterkennung im deutschsprachigen Raum, und eines der wenigen ernstzunehmenden europäischen KI-Produkte mit echtem akademischen Pedigree. Hervorgegangen aus EU-Forschungsprojekten der Universität Innsbruck wird die Plattform heute von der Genossenschaft READ-COOP SCE betrieben, mit Servern in Österreich. Für Archive, historische Forschung, Genealogie und alle, die Kurrent, Sütterlin oder frühneuzeitliche Handschriften lesbar machen müssen, gibt es keine bessere Lösung. Wer dagegen nur Druckdokumente oder Formulare verarbeitet, ist mit klassischem OCR oder Hyperscaler-Diensten besser bedient.

Für wen ist Transkribus?

Archive, Bibliotheken und Museen: Das Kernpublikum. Transkribus wurde von und für Gedächtnisinstitutionen gebaut. Für Bestände vom 16. bis 20. Jahrhundert, Akten, Briefe, Protokolle, Kirchenbücher, gibt es einen großen Katalog vortrainierter Public Models und eine Community, die diese Modelle ständig erweitert.

Historische Forschung und Editionsprojekte: Editionswissenschaft, Quellenarbeit, Korpusprojekte. Die Plattform unterstützt strukturierte Transkription mit Tags, Layout-Annotationen und TEI-XML-Export, das ist der Workflow, den die DFG und vergleichbare Förderer für ediorische Vorhaben erwarten.

Genealogen und Familienforscher: Ahnenforschung scheitert oft an unleserlichen Kirchenbüchern und Standesamtsregistern. Mit den vortrainierten Modellen für Kurrent und Sütterlin macht Transkribus Bestände zugänglich, an denen Laien sonst verzweifeln.

Pharma-, Universitäts- und Industriearchive: Historische Laborbücher, Patientenakten, Konstruktionsmappen, überall wo handschriftliche Bestände digitalisiert werden müssen, mit DSGVO-Anforderungen wegen Personenbezug, ist Transkribus die saubere Wahl.

Kanzleien und Notariate mit Altbeständen: Erbschaftsangelegenheiten, alte Verträge, Grundbuchauszüge in Sütterlin oder Kurrent, Transkribus liefert eine durchsuchbare Volltextversion, die mit klassischem OCR unmöglich wäre.

Weniger geeignet für: Allgemeine Büro-OCR (Rechnungen, moderne Verträge), Anwender ohne jeden Bezug zu historischen Quellen, Massendigitalisierung mit Echtzeitanforderung und Servicelevel-Verträgen.

Preise im Detail

PlanPreisWas du bekommst
Free / Trial0 €50 Credits/Monat (~50 Seiten HTR), Zugang zu allen Public Models, Basis-Workflow ohne Kreditkarte
Individualab ca. 9 €/MonatGrößeres monatliches Credit-Kontingent, Single-User, Web-App-Vollzugriff
Scholar / EducationvergünstigtReduzierte Konditionen für akademische Forschung, Studierende und Lehrende
Organisation / Proauf AnfrageMehrnutzer-Zugriff, höhere Credit-Volumen, AVV, Modell-Training-Support, ggf. eigene Field Models
Credit-Paketeab ca. 18 €Nachkauf zusätzlicher Credits unabhängig vom Abo

Einordnung: Das Credit-Modell ist ungewöhnlich, aber fair: Eine Seite Handschrift-Erkennung kostet typischerweise einen Credit, Layout-Analyse oder Modell-Training werden separat berechnet. Für Hobby-Genealogen und kleine Forschungsprojekte reicht der Free-Plan oft monatelang. Für ein größeres Editionsprojekt (10.000+ Seiten) ist ein Org-Vertrag mit Volumenrabatt unverzichtbar, und realistisch günstiger als der Personalaufwand für manuelle Transkription. Die exakten Preisstaffeln änderen sich gelegentlich; vor Vertragsabschluss immer aktuelle Konditionen direkt bei READ-COOP SCE prüfen.

Stärken im Detail

Erkennungsqualität für historische Handschriften ist Weltspitze. Für gut leserliche Kurrent oder Sütterlin liegen die Erkennungsraten der Public Models je nach Schreiber typischerweise bei 90–98 %, ein Wert, den klassisches OCR (Tesseract, ABBYY) für Handschrift schlicht nicht erreicht, weil die zugrundeliegenden Architekturen (CNN + Sequence-to-Sequence) speziell für variable Handschriften trainiert wurden.

Echtes EU-Hosting auf eigenen Servern. Transkribus läuft nicht auf AWS Frankfurt oder Azure Europe, sondern auf Servern, die READ-COOP SCE in Österreich selbst betreibt. Das eliminiert die Schrems-II-Problematik, die bei US-Hyperscalern weiter ungeklärt ist. Für öffentliche Auftraggeber, kirchliche Archive und Forschungsinstitutionen ist das oft der entscheidende Faktor.

Genossenschaftsmodell statt VC-Druck. READ-COOP SCE ist eine Societas Cooperativa Europaea mit aktuell über 250 Mitgliedern, Universitäten, Archiven, Bibliotheken, Privatpersonen. Das Geschäftsmodell zielt auf Kostendeckung und nachhaltige Weiterentwicklung, nicht auf Exit. Wer auf Transkribus aufbaut, muss nicht fürchten, dass das Tool nach der nächsten Finanzierungsrunde umgebaut, verkauft oder eingestellt wird.

Eigene Modelle trainierbar. Wer eine spezifische Hausschrift hat, eine Schreiberhand in einem Archivbestand, ein bestimmtes Notariat, kann mit Transkribus Learn ein eigenes “Field Model” trainieren. Mit 5.000–15.000 transkribierten Wörtern Trainingsmaterial erreicht man Erkennungsraten, die für die jeweilige Hand deutlich über den Public Models liegen.

Strukturierte Exporte für die wissenschaftliche Edition. PAGE-XML, ALTO-XML, TEI-XML und PDF mit eingebettetem Text-Layer sind direkt nutzbar, egal ob für Faksimile-Editionen, Suchmaschinenintegration oder Repository-Ingest in Fedora/Islandora.

Schwächen ehrlich betrachtet

Keine Lösung für reines Druckschrift-OCR. Wer eine moderne PDF mit gedrucktem Text in durchsuchbaren Volltext umwandeln will, ist mit Tesseract (kostenlos, lokal) oder Google Document AI (skalierbar) deutlich besser bedient. Transkribus ist auf HTR optimiert, bei reinem Druck zahlt man für eine Spezialfähigkeit, die man nicht braucht.

Lernkurve ist real. Layout-Analyse, Region-Erkennung, Baseline-Korrektur, Modellauswahl, Trainingsdatenkuration, Transkribus ist mächtig, aber kein 1-Klick-Tool. Für Erstanwender lohnt sich das offizielle Online-Tutorial oder ein Workshop. Wer ohne Anleitung startet und mit dem ersten Ergebnis unzufrieden ist, gibt oft zu früh auf.

Credit-Modell ist bei Massendigitalisierung undurchsichtig. Solange du als Forscher hunderte Seiten verarbeitest, ist das Modell nachvollziehbar. Bei Großprojekten mit 100.000+ Seiten brauchst du verlässliche Volumenkalkulation und einen Rahmenvertrag, und die exakten Konditionen sind nur über direkte Anfrage zu bekommen, was Beschaffungsprozesse verlangsamt.

Cloud-only, keine On-Premise-Variante. Auch wenn die Cloud in Österreich steht: Manche öffentlichen Auftraggeber (Bundesarchive, Geheimschutz-Akten) dürfen Daten gar nicht extern verarbeiten lassen. Für diese Fälle gibt es keine Transkribus-On-Prem-Edition, was die Lösung von vornherein ausschließt.

Modell-Training kostet Vorarbeit. Ein eigenes Field Model zu trainieren bedeutet, mehrere tausend Wörter manuell transkribiert in den Goldstandard zu bringen. Wer den Aufwand unterschätzt, ist enttäuscht. Realistisch sind 20–60 Stunden Vorarbeit für ein produktives Custom Model.

Alternativen im Vergleich

Wenn du……nimm stattdessen
Reine Druckschrift offline und lokal verarbeiten willstTesseract OCR
Strukturierte Daten aus Formularen, Rechnungen, Verträgen extrahierstABBYY FlexiCapture
Hyperscaler-Skalierung mit hohem Durchsatz auf Druckdokumenten brauchstGoogle Document AI
Bereits in der Microsoft-Welt arbeitest und Office-Integration willstAzure Document Intelligence

Transkribus ist kein Allround-OCR, und genau das ist seine Stärke. Für historische und moderne Handschriften gibt es im deutschsprachigen Raum schlicht keine ernsthafte Alternative auf gleichem Qualitätsniveau. Wer beides braucht (Druck und Handschrift), kombiniert Transkribus für die Handschriften-Bestände mit einem klassischen OCR-Tool für den Rest.

So steigst du ein

Schritt 1: Registriere dich auf transkribus.org, du bekommst sofort 50 Credits ohne Kreditkarte. Lade ein paar Beispielseiten deines Bestands hoch (gute Scans, mindestens 300 dpi, Graustufen oder Farbe). Wähle die automatische Layout-Analyse und ein passendes Public Model, für Deutsch z.B. ein “German Kurrent”- oder “Transkribus Print Multi-Language”-Modell.

Schritt 2: Lass die Erkennung laufen und prüfe die Ergebnisse Seite für Seite. Korrigiere die ersten 5–10 Seiten manuell, so bekommst du ein Gefühl für die Qualität und siehst, ob das Modell für deinen Bestand geeignet ist. Wenn die Erkennungsrate konstant unter 80 % liegt, ist entweder die Scan-Qualität zu schlecht oder die Hand zu untypisch, dann lohnt sich Modell-Training.

Schritt 3: Bei größeren Projekten: Plane Modell-Training ein. Sammle 5.000–15.000 sauber transkribierte Wörter aus deinem Bestand, definiere ein eigenes Trainings-Set in Transkribus Learn und starte das Training. Das resultierende Field Model wird in der Regel 5–15 Prozentpunkte besser erkennen als das beste Public Model, und macht den Unterschied zwischen brauchbar und produktiv.

Ein konkretes Beispiel

Ein Stadtarchiv in Norddeutschland digitalisiert seine Ratsprotokolle aus dem 18. und 19. Jahrhundert, rund 40.000 Seiten in deutscher Kurrentschrift, geschrieben von wechselnden Schreibern. Manuelle Transkription wäre ein Mehrjahresprojekt. Mit Transkribus läuft die Erstverarbeitung über das Public Model “German Kurrent XVIII–XIX” mit etwa 88 % Erkennungsrate. Anschließend trainiert eine Mitarbeiterin in 30 Stunden ein eigenes Modell auf zwei der häufigsten Schreiberhände, Erkennung steigt auf 95 %. Der Volltext landet als ALTO-XML im Archivportal und wird über das DFG-Viewer-Plugin durchsuchbar. Aus einem unzugänglichen Bestand werden nutzbare Forschungsdaten, bei einem Bruchteil der Personalkosten einer manuellen Erschließung.

DSGVO & Datenschutz

  • Datenhosting: Eigene Server in Österreich, betrieben von READ-COOP SCE, keine Big-Tech-Cloud-Abhängigkeit
  • Rechtsform: Europäische Genossenschaft (Societas Cooperativa Europaea, SCE) mit Sitz in Innsbruck, über 250 Mitglieder weltweit
  • Datennutzung: Hochgeladene Dokumente werden für die Texterkennung verarbeitet und im Nutzeraccount gespeichert. Nutzer entscheiden selbst, ob sie ihre Modelle und Daten der Community zur Verfügung stellen.
  • Auftragsverarbeitung: AVV nach Art. 28 DSGVO für institutionelle Kunden verfügbar, vor Aufnahme von personenbezogenen Beständen (Patientenakten, Personenstandsregister neueren Datums) zwingend abschließen.
  • Empfehlung für Unternehmen und Institutionen: Für historische Bestände ohne lebende Personenbezüge unkritisch. Bei Beständen mit Personendaten (Standesamtsregister bis ~120 Jahre, Krankenakten, Personalakten) gilt DSGVO voll, AVV abschließen, Zweckbindung dokumentieren, Aufbewahrungsfristen prüfen.
  • Open Source und Forschung: READ-COOP fördert eine offene Modell-Kultur, viele trainierte Modelle sind öffentlich nutzbar, was die Plattform als Wissens-Commons stärkt.

Gut kombiniert mit

  • Tesseract OCR, für moderne Druckschrift-Bestände, die zusammen mit Handschriften-Beständen aus dem gleichen Archiv kommen. Tesseract läuft lokal und kostenlos, Transkribus übernimmt die HTR-Anteile.
  • ChatGPT, zur sprachlichen Modernisierung und Zusammenfassung historischer Texte nach der Erkennung. Frühneuhochdeutsch oder Kanzlei-Deutsch des 18. Jahrhunderts wird damit für heutige Leser erschließbar.
  • DeepL, wenn historische Bestände in mehreren Sprachen vorliegen (Latein, Französisch, Niederländisch). Transkribus erkennt den Text, DeepL übersetzt das Ergebnis hochwertig.

Unser Testurteil

Transkribus verdient 4 von 5 Sternen. Für die spezifische Aufgabe der historischen Handschrifterkennung ist es konkurrenzlos, Erkennungsqualität auf Forschungsniveau, voll DSGVO-konformes EU-Hosting, ein nachhaltiges Genossenschaftsmodell statt VC-Druck. Den fünften Stern verlieren wir, weil die Plattform für eine breite KMU-Leserschaft eine sehr enge Nische bedient: Wer keine handgeschriebenen Bestände hat, profitiert nicht. Außerdem ist die Lernkurve real, das Credit-Modell bei Massendigitalisierung erklärungsbedürftig und es gibt keine On-Premise-Variante. Für Archive, historische Forschung und Genealogie ist Transkribus dennoch die klare Empfehlung, und ein leuchtendes Beispiel dafür, dass europäische KI-Infrastruktur funktioniert, wenn sie kooperativ und community-getrieben aufgebaut wird.

Was wir bemerkt haben

  • 2019, Aus dem EU-Forschungsprojekt READ wurde die Genossenschaft READ-COOP SCE ausgegründet. Die Plattform wechselte vom kostenlosen Forschungstool in ein nachhaltiges, beitragsfinanziertes Modell, das hat sicher manche Hobby-Nutzer verärgert, war aber notwendig für die Weiterentwicklung.
  • 2021–2022, Umstieg vom desktopbasierten “Expert Client” auf die reine Web-App. Wer den alten Java-Client gewohnt war, musste umlernen, die Web-Variante ist heute aber funktional gleichwertig und für neue Nutzer der einzige Weg.
  • 2024–2025, Stetig wachsender Katalog an Public Models für nicht-deutsche historische Handschriften (Latein, Französisch, Italienisch, frühe slawische Schriften). Damit wird Transkribus zunehmend zur europäischen Standardplattform für historische HTR jenseits des deutschen Sprachraums.
  • Mai 2026, READ-COOP bestätigt weiterhin: Daten werden auf eigenen Servern in Österreich verarbeitet, voll DSGVO-konform, keine Big-Tech-Cloud-Abhängigkeit. Das ist im KI-Tool-Markt eine Seltenheit und sollte bei Auswahlentscheidungen explizit gewichtet werden.

Diesen Inhalt teilen:

Empfohlen in 2 Use Cases

Empfohlen für diese Branchen

Arthur Atlas

KI-Analyst

So entsteht diese Bewertung

Diese Seite bewerten wir redaktionell, mit kräftiger Unterstützung von Arthur Atlas, unserem KI-Analysten. Er prüft Bewertungen nach und markiert veraltete Angaben, sobald sich der Markt dreht. Unsere Angaben stammen überwiegend aus öffentlich zugänglichen Quellen wie Anbieter-Website, Doku und Preislisten. Preise und Funktionen können sich ändern.

Hinweis: Diese Angaben können veraltet oder fehlerhaft sein. Prüfe im Zweifel immer direkt auf der Website des Anbieters.

Preise geändert, Feature veraltet oder etwas fehlt?

Wir freuen uns über Hinweise und Ergänzungen.

Feedback geben

Du arbeitest bei READ-COOP SCE (Innsbruck, Österreich)?

Gib uns einen Testzugang, dann schauen wir tiefer rein und ergänzen die Bewertung aus erster Hand.

Testzugang anbieten

Nicht sicher, ob Transkribus zu euch passt?

Wir helfen bei der Tool-Auswahl und begleiten die Einführung in euren Arbeitsalltag, unverbindlich und kostenlos im Erstgespräch.

Erstgespräch anfragen
Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–4 Themen, du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar