Im Rahmen des von Swissuniversities geförderten Projekts «Exploring Collections as Data» haben Christiane Sibille (Digital Scholarship Services), Agnieszka Ilnicka und Tarun Chadha (Scientific IT-Services, Scientific Computing & Data Co-Analysis) einen Kurs entwickelt, der sich an Personen richtet, die mit digitalen Methoden und historischen Texten arbeiten wollen, aber noch wenig Programmiererfahrung haben.
Eine Gruppe von Studierenden, Doktorierenden und Personen aus dem GLAM-Bereich setzte sich in den vergangenen Wochen nun an sechs Tagen intensiv mit den Grundlagen der Programmiersprache Python und den Möglichkeiten des Natural Language Processing auseinander. Dazu gehörte unter anderem die Extraktion von Texten aus Scans, die Arbeit mit grossen Textmengen in Tabellen, Named Entity Recognition und erste Anwendungsbeispiele im Bereich Machine Learning. In den – teilweise durchaus kniffligen – Übungen wurde auch Material aus den digitalisierten Beständen der ETH-Bibliothek verwendet.
Der Kurs versteht sich in mehrfacher Hinsicht als Multiplikator: Die Teilnehmenden erlernen neue digitale Methoden, die sie dann auf die vielfältigen retro-digitalisierten Bestände der ETH-Bibliothek anwenden können. Auf diese Weise können neue User-Gruppen erschlossen und die Position der ETH-Bibliothek als Kompetenzhub und Partnerin für die Nutzung von Collections as Data gestärkt werden.
Die erste Runde des Kurses war ein voller Erfolg: Innerhalb von wenigen Tagen waren die 15 Plätze ausgebucht und die Evaluationsergebnisse zeigen, dass die Teilnehmenden den Kurs sehr geschätzt haben: Alle Teilnehmenden würden ihn weiterempfehlen. Daher überlegen wir derzeit zusammen mit den SIS, die den Kurs durchführen, wie wir das Angebot auch in Zukunft fortsetzen können und haben mit den Planungen für eine zweite Runde im nächsten Jahr begonnen.
Schreibe einen Kommentar