OpenAlex
OurResearch (gemeinnützig, Vancouver/USA)
Offene wissenschaftliche Datenbank mit über 270 Millionen Publikationen, 90 Millionen Autoren und 100.000 Quellen, Nachfolger des eingestellten Microsoft Academic Graph. KI-gestützte Topic-Klassifikation, REST-API und Bulk-Snapshots machen OpenAlex zur ernsthaften Alternative zu Scopus und Web of Science, wenn man bereit ist, programmatisch zu arbeiten.
Kosten: API kostenlos bis 1 USD Tagesnutzung mit API-Key (ca. 10.000 Listen-Calls oder 1.000 Suchen/Tag); darüber hinaus nutzungsbasierte Abrechnung (Listen 0,0001 USD, Search 0,001 USD, PDF 0,01 USD pro Call). OpenAlex Premium für Institutionen auf Anfrage (höhere Limits, SLAs, Snapshot-Lieferung).
Kategorien
Stärken
- Über 270 Mio. Publikationen, 90 Mio. Autoren, 100.000+ Zeitschriften und Konferenzen, eine der vollständigsten offenen Forschungsdatenbanken
- ML-basierte Topic-Klassifikation auf vier Ebenen (Domain → Field → Subfield → Topic), automatisch für jeden Eintrag
- REST-API mit großzügigem Free-Tier (1 USD/Tag, ca. 10.000 Listen-Calls oder 1.000 Suchen)
- Vollständige Bulk-Snapshots in S3 für Forschende mit eigenem Cluster
- CC0-Lizenz auf die Daten, keine Lizenzgebühren, keine Nutzungsbeschränkungen für Wiederveröffentlichung
- Unpaywall-Integration zeigt, welche Publikationen Open Access verfügbar sind
- Aktive Weiterentwicklung durch OurResearch (Nonprofit), gefördert u. a. von NIH und Arcadia Fund
Einschränkungen
- Reines Daten-Backend, die Web-Oberfläche ist minimal und nicht für End-Recherche optimiert
- Erfordert Python/REST-Kenntnisse oder ein vorgeschaltetes Tool (Inciteful, Research Rabbit) für sinnvolle Nutzung
- Zitationsdaten weniger tief und weniger gepflegt als bei Scopus oder Web of Science
- Kein deutschsprachiger Support, keine deutsche UI
- Daten-Hosting in den USA (AWS, primär us-east), kein EU-Endpunkt
- Seit 2025 ist die Nutzung über das tägliche Free-Kontingent hinaus kostenpflichtig, keine vollständig kostenlose Nutzung mehr für High-Volume-Anwendungen
Passt gut zu
Wann ja, wann nein
Wann ja
- Du brauchst große Mengen wissenschaftlicher Metadaten programmatisch, etwa für ein Literaturreview, eine Bibliometrie-Studie oder ein ML-Trainingsset
- Deine Institution hat keine Scopus- oder Web-of-Science-Lizenz, du brauchst aber strukturierte Publikationsdaten
- Du arbeitest Open-Science-orientiert und willst Daten weiterveröffentlichen können (CC0)
- Du baust eigene Recherche- oder Forschungs-Mapping-Tools auf
Wann nein
- Du suchst eine Web-Oberfläche zum Stöbern und Lesen wie Google Scholar oder Semantic Scholar
- Du brauchst tiefe Zitations-Citationsanalysen (CitedReferences, h-Index-Berechnungen), Scopus und WoS sind dort weiterhin vorn
- Du arbeitest mit hochsensiblen Daten und brauchst EU-Hosting
- Du hast keine Programmierkenntnisse und kein Tool-Layer dazwischen
Kurzfazit
OpenAlex ist die wichtigste offene Forschungsdatenbank, seit Microsoft 2021 sein Academic Graph eingestellt hat. Über 270 Millionen Publikationen, automatische Topic-Klassifikation per ML-Modell, CC0-lizenzierte Daten, das ist eine Infrastruktur, die kommerziellen Anbietern wie Scopus und Web of Science in vielen Bereichen mindestens ebenbürtig ist. Allerdings: OpenAlex ist primär ein Daten-Backend, kein Recherche-Tool für Menschen. Wer ohne Python-Skript oder vorgeschalteten Frontend-Layer arbeiten will, sollte zu Google Scholar oder Semantic Scholar greifen. Seit 2025 ist die Nutzung über 1 USD/Tag hinaus zudem kostenpflichtig, das ändert nichts an der wissenschaftlichen Mission, beendet aber die „komplett kostenlos für alle”-Phase.
Für wen ist OpenAlex?
Forschende mit Bibliometrie-Bedarf: Wer wissen will, wie sich ein Forschungsfeld in den letzten zehn Jahren entwickelt hat, welche Autoren das Feld dominieren oder wie sich Themen-Cluster verschieben, bekommt mit OpenAlex die rohen Metadaten, und mit Python und ein paar Stunden Arbeit Antworten, für die institutionelle Bibliometrie-Abteilungen Wochen brauchen.
Doktoranden und Master-Studierende: Für Literaturreviews mit klar abgegrenztem Thema („alle Publikationen zu Perowskit-Solarzellen seit 2018”) ist OpenAlex unschlagbar, 5.000 strukturierte Treffer in Minuten, alle mit Topics, DOI, OA-Status, Affiliationen. Voraussetzung: ein bisschen Python oder ein Tool wie Inciteful, das OpenAlex im Hintergrund nutzt.
Forschungsförderer und Wissenschaftsmanager: OpenAlex liefert die Datengrundlage, um Förderprogramme nach ihrem Output zu bewerten, welche geförderten Projekte führten zu welchen Publikationen, welche Institutionen ziehen die meisten Drittmittel-Publikationen, wo entstehen Kollaborationen. Funder-Daten sind als eigene Entität abrufbar.
ML- und KI-Forschung: Wer ein Sprachmodell auf wissenschaftliche Texte trainieren oder Embeddings für Paper bauen will, braucht große, sauber strukturierte Korpora. OpenAlex liefert die Metadaten und Abstracts mit CC0-Lizenz, keine Rechtegrauzone, kein „darf das Modell das?”.
Bibliothekare und Open-Access-Stellen: Über die Unpaywall-Integration zeigt OpenAlex, welche Publikationen einer Institution legal frei verfügbar sind. Kombiniert mit der Affiliation-API ist das eine direkte Datenquelle für OA-Monitoring-Berichte.
Weniger geeignet für: Wer ohne Programmierung auskommen will, wer ein klassisches Recherche-Frontend mit Volltext-Vorschau braucht oder wer für eine Promotion das offizielle Zitations-Ranking eines Verlags zitieren muss, dort gelten Scopus oder Web of Science weiterhin als institutioneller Standard.
Preise im Detail
| Plan | Preis | Was du bekommst |
|---|---|---|
| Ohne API-Key | 0,01 USD/Tag | Minimal-Kontingent für Tests, sehr stark gedrosselt; primär für Browser-Klicks gedacht |
| Mit kostenlosem API-Key | 1 USD/Tag frei | Ca. 10.000 Listen-Calls oder 1.000 Suchen oder 100 PDF-Downloads pro Tag; ausreichend für Einzelnutzer und kleinere Projekte |
| Pay-as-you-go | Ab 1 USD/Tag | Listen 0,0001 USD/Call, Search 0,001 USD/Call, PDF-Download 0,01 USD/Call; einzelne Entity-Lookups bleiben kostenlos |
| OpenAlex Premium | Auf Anfrage | Höhere Limits, garantierte SLAs, dedizierter Snapshot-Zugang, Support-Vertrag, Zielgruppe: Bibliotheken, Forschungseinrichtungen, kommerzielle Anbieter |
| Bulk-Snapshot | Kostenlos (CC0) | Vollständiger Datenbestand als komprimierte JSONL-Dateien über AWS S3, für eigene Cluster und Offline-Analyse |
Einordnung: Für 95 % aller Forschungs-Use-Cases reicht das kostenlose API-Key-Kontingent mit 1 USD Tagesnutzung problemlos aus, eine Master-Arbeit oder ein Literaturreview verbraucht selten mehr als ein paar tausend Calls. Wer einen Forschungs-Korpus für ein ML-Modell baut oder ein Bibliometrie-Dashboard betreibt, sollte direkt auf den Bulk-Snapshot schauen, der ist nach wie vor CC0 und kostenfrei. Pay-as-you-go ist günstig genug (ein Tag voller intensiver API-Nutzung kostet einstellige Dollarbeträge), aber die Umstellung von „komplett kostenlos” auf das aktuelle Modell hat in der Community 2024/25 Diskussionen ausgelöst. OpenAlex Premium ist für institutionelle Kunden mit echten SLA-Anforderungen gedacht, kein Tool für Einzelforschende.
Stärken im Detail
Vollständigkeit, die ihresgleichen sucht. Mit über 270 Millionen Publikationen, 90 Millionen Autoren und 100.000 Quellen ist OpenAlex die mit Abstand größte offene Forschungsdatenbank. Zum Vergleich: Scopus liegt bei rund 90 Mio. Records, Web of Science bei etwa 100 Mio., OpenAlex deckt also nicht nur den klassischen Kanon ab, sondern auch graue Literatur, Preprints aus arXiv und bioRxiv, Repositorien und institutionelle Server. Das ist gleichzeitig Stärke (Vollständigkeit) und Schwäche (mehr Rauschen).
ML-gestützte Topic-Klassifikation. Jede Publikation wird automatisch in eine vierstufige Topic-Hierarchie eingeordnet (Domain → Field → Subfield → Topic, insgesamt rund 4.500 Topics). Das funktioniert über ein Embedding-Modell, das Titel, Abstract und Quelle auswertet. Für Forschungsfeld-Analysen ist das ein echter Hebel, du kannst direkt nach „Topic: Perovskite Solar Cells” filtern, statt mit Stichwortsuche zu hantieren. Das ehemalige /concepts-Endpoint wurde 2024 abgelöst.
REST-API, die hält, was sie verspricht. Die API ist sauber dokumentiert, JSON-basiert, mit Filtern, Pagination (Cursor- und Offset-basiert), Group-By-Operationen und Volltextsuche. Wer schon einmal mit der Scopus-API gearbeitet hat, kommt sich vor wie im Schlaraffenland, keine SOAP-Reste, kein Verlags-Quotensystem, keine Lizenz-Bottlenecks.
Bulk-Snapshot als unterschätzte Goldmine. Die kompletten Datenbestände werden täglich aktualisiert als komprimierte JSONL-Dateien in AWS S3 bereitgestellt, frei zugänglich, CC0. Wer ein Forschungs-Mapping-Tool baut, ein ML-Modell trainiert oder einen institutionellen Forschungsbericht erstellt, lädt sich den Snapshot herunter (rund 300 GB komprimiert) und arbeitet offline. Das ist eine Großzügigkeit, die kommerzielle Anbieter nicht bieten.
CC0-Lizenz auf die Metadaten. Daten dürfen frei verwendet, weiterverarbeitet und sogar weiterveröffentlicht werden. Das ist wissenschaftspolitisch ein Meilenstein, und macht OpenAlex zur Standard-Quelle für Open-Science-Initiativen, EU-geförderte Projekte und Datenschnittstellen in Wissenschaftsportalen.
Unpaywall-Integration für OA-Status. Da OurResearch auch Unpaywall betreibt, ist die Information „ist diese Publikation Open Access verfügbar?” in OpenAlex direkt mitgeliefert, inklusive Best-OA-URL. Für Bibliotheken und Open-Access-Beauftragte ist das die wichtigste Einzelinformation überhaupt.
Schwächen ehrlich betrachtet
Keine Recherche-Oberfläche im klassischen Sinn. Die Web-Oberfläche unter openalex.org ist eher ein Showroom als ein Recherche-Tool. Wer ohne Code stöbern will, ist mit Google Scholar oder Semantic Scholar deutlich besser bedient. OpenAlex ist Infrastruktur für andere Tools, nicht selbst eines.
Zitationsdaten sind ein offenes Problem. OpenAlex zählt zitierende Werke, aber die Tiefe und Pflege ist nicht auf dem Niveau von Scopus oder Web of Science. Bei älteren Publikationen, geisteswissenschaftlichen Quellen oder nicht-englischen Werken fehlen Citation-Verknüpfungen häufiger. Wer h-Index-Berechnungen für eine Berufung oder Habilitation braucht, sollte das nicht ausschließlich auf OpenAlex stützen.
Autoren-Disambiguierung ist nicht perfekt. Bei häufigen Namen („Wei Wang”, „Maria Schmidt”) werden Publikationen gelegentlich falschen Autoren-IDs zugeordnet oder eine Person hat mehrere konkurrierende IDs. ORCID-Integration hilft, ist aber nicht flächendeckend. Bei Karriere-Analysen einer einzelnen Person muss man genau hinsehen.
Pricing-Umstellung 2024/25. Was viele Nutzer überraschte: Anfang 2025 hat OpenAlex ein nutzungsbasiertes Modell eingeführt. Für die meisten Einzelnutzer bleibt es kostenlos (1 USD Tagesnutzung reicht weit), aber kommerzielle Massen-Crawler und große Forschungstools haben ihre Kosten-Kalkulation umstellen müssen. Die Mission („offene Daten”) bleibt, das Modell „komplett kostenlos für alle, immer” gilt nicht mehr.
Datenhosting in den USA. Die API läuft auf AWS in den USA, kein EU-Endpunkt verfügbar. Für die Daten selbst ist das wenig kritisch (sie sind ohnehin offen), für institutionelle Compliance-Prüfungen aber relevant, eine deutsche Bibliothek, die die OpenAlex-API in ein Recherche-Frontend einbindet, muss das in der Datenschutzerklärung adressieren.
Englisch dominiert massiv. Wie bei allen globalen Forschungsdatenbanken sind englischsprachige Publikationen klar überrepräsentiert. Für rein deutschsprachige Geisteswissenschaft oder regionale Fachliteratur ist die Abdeckung dünner, hier sind nationale Datenbanken (z. B. die Deutsche Nationalbibliothek, Fachportale) weiterhin notwendig.
Kein Volltext. OpenAlex liefert Metadaten, keine Volltexte. Wer auf Volltexte angewiesen ist, kombiniert OpenAlex mit der Unpaywall-URL oder einem institutionellen Zugang. Für Volltext-Analysen ist zusätzliche Pipeline-Arbeit nötig.
Alternativen im Vergleich
| Wenn du… | …nimm stattdessen |
|---|---|
| Eine Web-Oberfläche zum stöbernden Recherchieren brauchst | |
| Wissenschaftliche Texte zu einem Thema KI-gestützt zusammenfassen willst | |
| Eine kuratierte, kommerziell gepflegte Datenbank mit Tiefen-Zitationen brauchst | |
| Mit allgemeiner Web-Recherche und Quellen arbeiten willst | |
| Eigene Dokumente parallel zur Recherche analysieren willst |
Erwähnenswert ohne eigene Tool-Seite: Inciteful und Research Rabbit (beide nutzen OpenAlex im Hintergrund als Datenquelle und bieten eine grafische Oberfläche für Citation-Mapping), Lens.org (kostenlos für nicht-kommerzielle Nutzung, mit Patentdaten), Dimensions (kommerziell, breitere Funder-Daten) und CORE (Volltexte aus Repositorien). OpenAlex ist nicht das Tool für End-Nutzer, sondern die Infrastruktur unter den Tools für End-Nutzer. Wer das nicht trennt, wird enttäuscht, wer es trennt, gewinnt enorme Flexibilität.
So steigst du ein
Schritt 1: Lege auf openalex.org/settings/api einen kostenlosen API-Key an. Ohne Key bekommst du nur 0,01 USD Tagesnutzung, mit Key 100-mal so viel. Der Key wird als Query-Parameter (api_key=...) übergeben.
Schritt 2: Mach den ersten API-Aufruf in Python (oder mit curl). Ein typisches Beispiel:
import requests
r = requests.get(
"https://api.openalex.org/works",
params={"search": "perovskite solar cells", "filter": "publication_year:2020-2025", "api_key": "DEIN_KEY"}
)
print(r.json()["meta"]["count"]) # Anzahl Treffer
Pagination läuft über cursor=* für tiefe Result-Sets bis 10.000 Treffer. Group-By-Operationen (group_by=publication_year) liefern dir direkt aggregierte Statistiken, extrem hilfreich für Bibliometrie.
Schritt 3: Für größere Projekte schaltest du auf den Bulk-Snapshot in S3 um. Die Anleitung steht in der OpenAlex-Doku unter „Snapshot Access”. Ein einzelner Snapshot ist rund 300 GB komprimiert, entpackt deutlich größer, du brauchst lokalen Speicher, eine Cloud-VM oder ein Forschungs-Cluster. Für reproduzierbare Bibliometrie-Studien ist das der Goldstandard, weil sich der Stand zu einem festen Datum einfrieren lässt.
Schritt 4 (optional): Wenn du nicht selbst programmieren willst, nutze ein vorgeschaltetes Tool wie Inciteful oder Research Rabbit. Beide bauen visuelle Citation-Maps direkt auf OpenAlex-Daten auf, du bekommst eine grafische Oberfläche, OpenAlex liefert die Daten im Hintergrund.
Ein konkretes Beispiel
Eine Doktorandin der Materialwissenschaften an der TU München schreibt ein systematisches Literaturreview zu „machine learning für Perowskit-Solarzellen” (2018–2025). Statt manuell in Scopus zu suchen (Lizenzzugang über die Uni, aber Export auf 2.000 Treffer pro Suchanfrage gedeckelt), schreibt sie ein 30-Zeilen-Python-Skript gegen die OpenAlex-API. Sie filtert auf den Topic „Perovskite Solar Cells”, schneidet auf die letzten sieben Jahre, holt Affiliationen und Topics, exportiert nach Pandas. Ergebnis: 4.700 Publikationen mit allen Metadaten in 12 Minuten, Topic-Verteilung als Heatmap nach Erscheinungsjahr, Top-20-Autoren mit Institutionszuordnung, Co-Autorenschafts-Netzwerk als Graph. Was zuvor zwei Wochen manuelle Arbeit gewesen wäre, ist Grundlage eines methodisch sauber dokumentierten Reviews. Kosten: 0 USD (innerhalb der 1 USD/Tag-Grenze). Anschließend wertet sie die zitierte Literatur mit
DSGVO & Datenschutz
- Datenhosting: USA (AWS, primär us-east-1). Kein EU-Endpunkt verfügbar. Anbieter ist OurResearch (USA), gemeinnützige Organisation.
- Datennutzung: OpenAlex sammelt API-Nutzungsdaten zur Abrechnung und Missbrauchsprävention. Die abgefragten Daten selbst sind öffentliche Forschungsmetadaten (kein personenbezogener Inhalt in den Queries selbst, sofern du keine sensitiven Suchbegriffe verwendest).
- Auftragsverarbeitung (AVV): Standardmäßig nicht angeboten, die Datenbank ist offen, die Daten sind CC0. Für institutionelle Premium-Verträge ist eine vertragliche Regelung verhandelbar.
- Account-Daten: API-Key wird mit E-Mail-Adresse verknüpft. Account-Löschung über die Settings möglich.
- Empfehlung für Unternehmen und Bibliotheken: Wenn die OpenAlex-API in ein eigenes Recherche-Frontend eingebaut wird, sollte die Datenschutzerklärung den Drittanbieter benennen. Für nicht-personenbezogene Forschungsdaten-Abfragen ist OpenAlex datenschutzrechtlich unkritisch, die Daten kommen ohnehin aus offenen Quellen. Für sensible Anwendungen (Patient*innen-Daten, klinische Studien) eignet sich OpenAlex nur als Metadaten-Quelle, nicht als Plattform für die Datenverarbeitung selbst.
Gut kombiniert mit
, Elicit liest die OpenAlex-Treffer einzeln durch und extrahiert Findings, Methoden und Einschränkungen. So entsteht aus einer Trefferliste eine inhaltliche Tabelle, ohne dass du jedes Paper selbst öffnen musst. , die für ein Review ausgewählten 20–50 zentralen Papers werden in NotebookLM hochgeladen und dort kuratiert befragt. OpenAlex liefert die Identifikation, NotebookLM die Tiefe. , für die schriftliche Synthese: Claude kann lange OpenAlex-Output-Tabellen sauber zu Argumentationsketten und Reviewteilen verarbeiten, mit konsistenter Zitation der Quellen.
Unser Testurteil
OpenAlex verdient 4 von 5 Sternen. Als Daten-Infrastruktur ist es ohne ernsthafte Konkurrenz im offenen Bereich, die Kombination aus 270 Mio. Publikationen, ML-gestützter Topic-Klassifikation, CC0-Lizenz und Bulk-Snapshot ist beispiellos. Der fünfte Stern bleibt aus drei Gründen aus: Die Web-Oberfläche ist für Endnutzer unbrauchbar (was Absicht ist, aber die Zielgruppe verengt), Zitationsdaten sind nicht auf Scopus-Niveau, und die Umstellung auf nutzungsbasierte Bezahlung 2025 hat zwar die Mission nicht beschädigt, aber die Marketing-Geschichte „komplett kostenlos für immer” ist Vergangenheit. Für Forschende, Bibliometriker, Bibliotheken und Tool-Bauer bleibt OpenAlex die wichtigste offene Forschungsdaten-Quelle, die es derzeit gibt, wer mit Daten arbeiten kann, sollte es kennen.
Was wir bemerkt haben
- 2022, OpenAlex wurde von OurResearch (gleiches Team wie Unpaywall) als Nachfolger des im Dezember 2021 eingestellten Microsoft Academic Graph gestartet. Innerhalb von zwei Jahren wurde es zur Referenz für offene Forschungsmetadaten, und Microsoft-Academic-Migrationen liefen praktisch fast alle dorthin.
- 2024, Das alte
/concepts-Endpoint wurde durch das neue/topics-Endpoint mit ML-gestützter vierstufiger Hierarchie (rund 4.500 Topics) abgelöst. Migration war für viele bestehende Nutzer notwendig, die alte Concepts-Hierarchie blieb noch eine Weile parallel verfügbar. - Anfang 2025, Einführung des nutzungsbasierten Pricing-Modells (1 USD/Tag frei mit API-Key, darüber Pay-as-you-go). Für die Einzelnutzer-Community überwiegend tolerabel (das Free-Kontingent reicht für die meisten Use Cases), für kommerzielle Wiederveröffentlicher und Massen-Crawler ein deutlicher Kostenfaktor. Hintergrund: Nachhaltige Finanzierung der Infrastruktur, bisher trug OurResearch die Server-Kosten praktisch allein.
- 2025, Die OpenAlex-Bulk-Snapshots wurden auf JSONL-Format mit täglicher Aktualisierung umgestellt; die ältere Parquet-Variante ist nicht mehr Standard. Wer eigene Pipelines betreibt, musste die Ingest-Logik anpassen.
- 2026, OpenAlex Premium wurde als institutionelles Angebot stärker positioniert (SLAs, höhere Limits, dedizierter Support). Die Liste der zahlenden Premium-Kunden wächst stetig, ein realistisches Geschäftsmodell für ein Nonprofit, das parallel die offene API kostenlos halten will.
Diesen Inhalt teilen:
Empfohlen in 1 Use Cases
Forschung & Entwicklung
Empfohlen für diese Branchen
Arthur Atlas
KI-Analyst
So entsteht diese Bewertung
Diese Seite bewerten wir redaktionell, mit kräftiger Unterstützung von Arthur Atlas, unserem KI-Analysten. Er prüft Bewertungen nach und markiert veraltete Angaben, sobald sich der Markt dreht. Unsere Angaben stammen überwiegend aus öffentlich zugänglichen Quellen wie Anbieter-Website, Doku und Preislisten. Preise und Funktionen können sich ändern.
Hinweis: Diese Angaben können veraltet oder fehlerhaft sein. Prüfe im Zweifel immer direkt auf der Website des Anbieters.
Preise geändert, Feature veraltet oder etwas fehlt?
Wir freuen uns über Hinweise und Ergänzungen.
Du arbeitest bei OurResearch (gemeinnützig, Vancouver/USA)?
Gib uns einen Testzugang, dann schauen wir tiefer rein und ergänzen die Bewertung aus erster Hand.
Nicht sicher, ob OpenAlex zu euch passt?
Wir helfen bei der Tool-Auswahl und begleiten die Einführung in euren Arbeitsalltag, unverbindlich und kostenlos im Erstgespräch.