Digitale Bibliotheken für Kinder

Schon frühzeitig entdecken viele Kinder die Welt des Internets, haben Smartphones und finden „normale“ Bücher langweilig. Daraus entwickelte sich die Idee Kinderbücher online anzubieten. Die Digitale Kinderbibliothek, Children’s Books Online oder die International Children’s Digital Library haben dies in die Tat umgesetzt. Das Ziel des Ganzen soll laut der International Children’s Digital Library sein:

„The mission of the International Children’s Digital Library Foundation (ICDL Foundation) is to support the world’s children in becoming effective members of the global community – who exhibit tolerance and respect for diverse cultures, languages and ideas — by making the best in children’s literature available online free of charge. The Foundation pursues its vision by building a digital library of outstanding children’s books from around the world and supporting communities of children and adults in exploring and using this literature through innovative technology designed in close partnership with children for children.”

Ob diese Zielsetzung eingehalten wird und wie sich im Allgemeinen die Anbieter von digitaler Kinderliteratur präsentieren, wird in der vorliegenden Arbeit erörtert.

Weiterlesen

Digitale Bibliothek Braunschweig

Bei meiner Recherche zum Thema „Digitale Bibliotheken bin ich darauf gestoßen, dass es auch in Braunschweig einen eigenen Publikationsserver der Technische Universität Braunschweig gibt. Dieser steht seit 2009 (Version 2.0), auf Basis der Open-Source Lösung „MyCoRe zur Verfügung. Aktuell umfasst der Bestand insgesamt 14541 Dokumente (Stand 25.04.2016) und protokolliert über 12 Millionen Zugriffe pro Jahr.

In der Digitalen Bibliothek können Wissenschaftler der TU Braunschweig bspw. ihre Dissertationen, Artikel, Videos oder Lehrmaterialien elektronisch publizieren. Außerdem findet man Folgendes: „[…] Jahrbücher und Abhandlungen der Braunschweigischen Wissenschaftlichen Gesellschaft (BWG), Brunsvicensien (gefördert von der Stiftung Braunschweigischer Kulturbesitz), Historische pharmazeutische Literatur (gefördert von der DFG), Digitale Bildersammlungen, Historische Kinderbücher, Vorlesungsverzeichnisse und Matrikelbücher“. Unter folgendem Link finden sich weitere Informationen und eine Übersicht der Schwerpunktsammlungen.

Weiterlesen

OCR für gebrochene Schriften

Fraktur ist eine Druckschrift, die lange Zeit als schön galt – heute eher als schwer zu lesen. Sie wurde früher in mehreren Ländern standardmäßig verwendet, in Deutschland bis 1941. Wenn man Bücher aus dieser Zeit in eine digitale Bibliothek einstellen möchte, hat man ein besonderes Problem: die Schrifterkennung!

Standard-OCR-Programme können meist keine Fraktur-Schrift erkennen; die verwendeten Schrifttypen entsprechen keiner modernen Computerschrift. Hinzu kommen weitere Stolpersteine, die das Alter der Bücher mit sich bringt, z.B. das Fehlen einer einheitlichen Regelung der Schreibweise von Wörtern oder Schäden am Papier.
Diejenigen Programme, die eine Frakturerkennung anbieten wollen, sind entweder technisch unausgereift oder sehr teuer. Zumindest waren sie das bis vor kurzem.

In letzter Zeit gab es mehrere Versuche, eine Open Source Software zur Frakturerkennung zu entwickeln. Diese Bemühungen gehen oft in eine gute Richtung und einige lassen sich professionell anwenden.
Die wohl bekannteste Software ist Tesseract. Es arbeitet schnell und es existieren gute Anleitungen dafür. Der Tesseract-Code wird von vielen OCR-Programmen genutzt.
Eine weitere Software mit teilweise noch besseren Ergebnissen ist OCRopus. Die Nutzung ist allerdings noch nicht so komfortabel, an einer guten Benutzeroberfläche wird gearbeitet.

Digitalisierung – Was tun, wenn der Startschuss fällt?

Wenn sich eine Institution zur Digitalisierung ihrer Bestände entschließt, soll das sicher nicht bröckchenweise geschehen. Ansprechpartner für Massendigitalisierungen können hier Digitalisierungszentren sein, wie das DDZ, das Dresdner Digitalisierungszentrum an der SLUB,  Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden. Unter anderem beteiligt sich das DDZ an der Entwicklung von Robotertechnologien und Open Source-Softwarelösungen und koordiniert die sächsischen Beiträge zur Europäischen und Deutschen Digitalen Bibliothek.

Einen sehr anschaulichen Beitrag der Bayerischen Staatsbibliothek (BSB) zur Praxis der Massendigitalisierung findet Ihr hier Massendigitalisierung und konservatorische Anforderungen.

Bücher online lesen auf PaperC

PaperC ist eine E-Book-Bibliothek mit ca. 350.000 Lehr- und Fachbüchern, aber auch Belletristik. 10% eines jeden E-Books können – auf diversen Endgeräten wie PC, Tablet oder Smartphone – kostenlos probegelesen werden. Nutzer haben die Möglichkeit, online Stellen zu markieren, annotieren und auszudrucken.
Wer das Buch vollständig nutzen möchte, kann es kaufen oder für einige Monate „ausleihen“. Momentan wird auch an einem Flatratemodell gearbeitet.

Das Internet archivieren …?

„Weitere Empfehlungen“ des Artikels über das Ende der Sondersammelgebiete (http://www.faz.net/aktuell/feuilleton/forschung-und-lehre/deutsche-forschungsgemeinschaft-reformiert-sondersammelgebiete-13524599.html?printPagedArticle=true)  … „Netz-Gedächtnis der Menschheit lagert in einer Kirche“. [ http://www.faz.net/aktuell/feuilleton/medien/digitale-bibliothek-internet-archive-13614849.html – Beide Artikel sehr interessant!]

Die „Wayback Machine“ des Internet Archive kannte ich schon länger und habe sie gelegentlich auch genutzt, meist um festzustellen, dass der Zeitpunkt, der mich interessiert hätte, natürlich gerade nicht abgebildet war.

Nicht bekannt war mir bis jetzt, dass das Internet Archive noch sehr, sehr viel mehr sichert bzw. sammelt als nur Abbilder von der Yahoo-Startseite von 1996 (obwohl es auch spannend ist, zu sehen, wie sich das Internet entwickelt hat).

Neben der Sicherung von Webseiten werden auch Texte bzw. Bücher, Filme, Audio- und Bilddateien sowie Spiele (Konsolen- und Arkadespiele) gesichert. bzw. aus anderen Quellen gesammelt.

Das Internet Archive ist im US-Bundesstaat Kalifornien als Bibliothek anerkannt und Mitglied der American Library Association.

Absolut gelungen finde ich die erweiterte Suche, die einem wirklich viele Möglichkeiten bietet, unter anderem die Ausgabe von Suchergebnissen im XML- oder CSV-Format:  https://archive.org/advancedsearch.php?

Die schiere Masse an Inhalten überfordert mich im Moment, allerdings greife ich persönlich da jetzt auf den Artikel über die Sondersammelgebiete zurück: „Was künftig relevant sein wird, wissen wir nicht.“

Am faszinierendsten ist für mich gerade die Sammlung der Software. Nicht nur, dass die Software von uralten Automaten-, Konsolen- oder Computerspielen „gerettet“ ist, ein großer Teil der Software ist sogar direkt auf der Archive-Website im Emulator spielbar 🙂 Auf geht’s, mit „Indiana Jones and the last Crusade“ bin ich 1997 nämlich nicht fertig geworden …

[Katja Rother]