Der Copernico-Maschinenraum
Copernico greift auf eine Vielzahl von Datenbanken zurück, um seine Daten möglichst nachhaltig, strukturiert und standardbasiert zu kuratieren. Dazu wurden auch eigene Datenbanken und Eingabemasken entwickelt.
Viele Webseiten werden heute mithilfe von Content-Management-Systemen (CMS) gepflegt – zu den bekanntesten Anwendungen gehören hier etwa Wordpress, Drupal oder Typo3. Auch Copernico nutzt ein solches System (Drupal), allerdings werden die Inhalte nicht direkt hier, sondern eigens dafür vorgesehenen Spezialdatenbanken gepflegt.
Unsere Datenbanken
Alle Portalinhalte werden in Datenbanken der Software digiCULT.web der digiCULT.Verbund eG erfasst, die insbesondere im Museumsbereich genutzt wird und etwa auch hinter großen Portalen wie „Sammlungsgut aus kolonialen Kontexten“, Dehio OME, „Menora – 900 Jahre Jüdisches Leben in Thüringen“ oder Rheinische Geschichte steht. Für die verschiedenen Inhaltstypen – Themenbeiträge, Ausstellungen, Projekte usw. – wurden seit 2019 eigene Erfassungsmasken entwickelt, die auf den Basisklassen des CIDOC CRM aufbauen. Übergabeformat ist das im Kulturerbebereich etablierte XML-Schema LIDO (Lightweight Information Describing Objects), das per OAI-Schnittstelle an das Content Management System des Portals übergeben wird.
In digiCULT.web greifen verschiedene Datenbanken ineinander. Damit beispielsweise ein Themenbeitrag im Portal erscheinen kann, reicht es nicht aus, lediglich die Erfassungsmaske für Thementexte zu befüllen. Personen und Einrichtungen, die in der Verschlagwortung oder in den Literaturangaben verwendet werden sollen, ebenso wie Bildmedien oder Literaturtitel, werden jeweils in eigenen Datenbanken erfasst. Der Vorteil besteht darin, dass einmal angelegte Datensätze – etwa zu Personen oder Aufsätzen – auch für weitere Beiträge genutzt werden können. Auf diese Weise entstehen langfristig umfangreiche Sammlungen von Personen und Organisationen, Bildmaterial und verwendeter Literatur. Vier Jahre nach dem Launch des Portals umfasst die Literaturdatenbank beispielsweise 2.713 Datensätze, die Medienverwaltung sogar 4.970 Datensätze.
Ein Themenbeitrag im Portal setzt sich darüber hinaus aus verschiedenen Datensätzen der Thementext-Datenbank zusammen. Mindestens werden zwei Datensätze benötigt, die intern miteinander verknüpft sind, nämlich ein Thementext-Datensatz, in dem der jeweilige Beitrag verwaltet wird, und ein Datensatz, in dem die Biographie der Person, die als Autor:in angezeigt werden soll, gepflegt wird. Nehmen wir als Beispiel den einführenden Beitrag „Jüdische Geschichte im östlichen Europa: Das 19. Jahrhundert“ von Anke Hilbrenner, der sich aus dem Datensatz des Beitrags und dem Biographie-Datensatz zusammensetzt.
Von Datenfeldern, kontrollierten Vokabularen und unserem Thesaurus
Ein Blick auf die Datenmaske eines solchen Themenbeitrags zeigt, dass sie eine Vielzahl an Feldern umfasst. Viele davon sind keine Freitextfelder, in die beliebig Text eingegeben werden kann, sondern Auswahllisten. Diese speisen sich aus sogenannten kontrollierten Vokabularen, Wertelisten, einer Ortsdatenbank sowie aus einem eigens für Copernico entwickelten Thesaurus. Der Begriff „kontrolliert“ verweist dabei bereits auf den Zweck dieses Vorgehens: Ziel ist es, Fehlerquellen und inhaltliche Beliebigkeit bei der Befüllung unserer Datenbanken so weit wie möglich auszuschließen.
Ein Beispiel dafür ist das Feld „Thementexttyp“. Hier wird festgelegt, ob es sich bei einem Beitrag etwa um eine Einführung, einen Hintergrundartikel, ein Interview oder eine Bildergalerie handelt. Ohne eine solche kontrollierte Liste könnten leicht unterschiedliche Varianten wie „Einführungstext“, „Einführung“ oder „einführender Text“ eingetragen werden. Dies würde die einheitliche Struktur der Daten unterlaufen und die Suche im Portal entsprechend erschweren.
Unsere kontrollierten Vokabulare, unser Thesaurus und unsere Ortsdatenbank werden in der Software digiCULT.xTree verwaltet, die ebenfalls von der digiCULT.Verbund eG bereitgestellt wird. Es handelt sich dabei um eine webbasierte
n Datenbank, in der ortsunabhängig und kollaborativ gearbeitet werden kann.
Insbesondere erfolgt unsere Verschlagwortung mithilfe unseres Information-Retrieval-Thesaurus. Entscheidend ist hier der Aspekt des Information Retrievals – das bedeutet, dass unsere Vokabulare mit Blick auf die Suche im Portal und im World Wide Web aufgebaut werden, sprich: Wir möchten, dass die Inhalte auf Copernico bestmöglich gefunden werden können. Und Spoiler: Es funktioniert!
Auch für den „Historischen Thesaurus“ gilt: Er strukturiert und kontrolliert unsere Arbeit, da wir dort nicht beliebige Schlagwörter eintragen können. Jeder neue Eintrag erfordert zunächst eine sorgfältige Recherche und inhaltliche Abwägung: Ist der Sachbegriff, mit dem ein Artikel verschlagwortet werden soll, tatsächlich passend und eindeutig? Wird die von uns gewählte Bezeichnung so verwendet und bestimmbar, wird der Inhalt des Beitrags präzise erfasst. Dabei orientieren wir uns auchan anderen Vokabularen, vor allem etablierten Normdateien, wie etwa der Gemeinsamen Normdatei (GND) der Deutschen Nationalbibliothek (DNB).
Seit März 2026 ist der Thesaurus erstmals auch über einen eigenen Viewer navigierbar. Dadurch gibt es eine weitere Möglichkeit, die Inhalte des Portals zu recherchieren: Mit einem bestimmten Sachbegriff verknüpft Copernico-Inhalte sind hier auf einen Blick sichtbar und aufrufbar.
Qualitätssicherung durch das Stage-System
Nachdem ein Beitrag in unsere Datenbanken eingepflegt und verschlagwortet wurde, wird er nicht unmittelbar veröffentlicht. Dem Portal Copernico ist ein sogenanntes Stage-System vorgeschaltet. Es entspricht in Aufbau und Erscheinungsbild dem Live-Portal, ist jedoch nicht öffentlich zugänglich.
In dieser geschützten Umgebung prüfen wir insbesondere, ob die in den Datenbanken angelegte Zuordnung von Bild und Text stimmig ist. Außerdem erhalten die jeweiligen Autor:innen über einen passwortgeschützten Zugang die Möglichkeit, ihren zuvor begutachteten und lektorierten Beitrag ein letztes Mal zu überprüfen. In dieser Phase fallen häufig noch kleinere Unstimmigkeiten auf – etwa fehlerhafte Bildunterschriften, fehlende Leerzeichen oder Tippfehler.
Auch die Herausgeber:innenteams, die einen Themenschwerpunkt verantworten, nutzen das Stage-System. Sie können dort beurteilen, wie der Schwerpunkt insgesamt wirkt: ob das geplante Titelbild – das sogenannte Moodbild – passend ist, ob die Anordnung der Beiträge schlüssig erscheint und schließlich noch einmal einen abschließenden Blick auf alle Texte werfen.
Vor der Veröffentlichung eines neuen Themenschwerpunkts übertragen wir die im Stage-System festgelegte Anordnung in das Backend von Copernico. Die Zusammenstellung von Beiträgen – etwa hier für den Themenschwerpunkt „Jüdisches Leben“ – stellt sich beispielsweise in folgender Struktur dar.
Gemeinsam mit unserer Agentur Outermedia haben wir beim Aufbau von Copernico verschiedene Layouts entwickelt, die wir seither schrittweise optimieren und erweitern. In der hier gezeigten Zusammenstellung werden die Beiträge beispielsweise in einer dreispaltigen Galerieansicht präsentiert. Im Frontend sieht dies dann folgendermaßen aus:
Der Blick in den Maschinenraum von Copernico zeigt, wie viele ineinandergreifende Arbeitsschritte, technische Strukturen und redaktionelle Entscheidungen notwendig sind, damit Inhalte im Portal in dieser Form sichtbar werden. Vieles davon bleibt für die Nutzer:innen bewusst unsichtbar. Doch gerade diese sorgfältig aufgebauten Prozesse – von kontrollierten Vokabularen über vernetzte Datenbanken bis hin zu mehrstufigen Prüfverfahren – sorgen dafür, dass die Inhalte zuverlässig, konsistent und langfristig nutzbar sind. Der Maschinenraum ist damit kein Selbstzweck, sondern die Grundlage dafür, dass Copernico als wissenschaftlich fundiertes, nachhaltiges und benutzerfreundliches Portal funktionieren kann.











