Auszug von historischen Stellenanzeigen - zum Teil mit Farbe hinterlegt
Im Trainingslauf lernen die Computer, Jobinserate in historischen Zeitungen aus dem Archiv der Österreichischen Nationalbibliothek zu identifizieren und in Textform auszuwerten. © Jörn Kleinert/Universität Graz

Eine englische Lady möchte gerne in die Sommerfrische nach Baden oder Ischl mitgenommen werden. Im Gegenzug würde sie dort einem Familienmitglied zwei Stunden vormittags Englischunterricht erteilen. Dieses aus heutiger Sicht etwas ungewöhnliche Zeitungsinserat aus dem Jahr 1870 ist ein winziges Puzzleteil des Forschungsprojekts „Die Entstehung des ausdifferenzierten Arbeitsmarktes“ im interdisziplinären Netzwerk „Human Factor in Digital Transformation“ der Universität Graz.

„In der Essenz ist ein Arbeitsmarkt das Matching, also die erfolgreiche Verknüpfung von offenen Stellen mit Arbeitssuchenden. Wir versuchen, mittels maschinengestützter optischer Zeichenerkennung seine Entwicklung ab der Mitte des 19. Jahrhunderts anhand von Stellenanzeigen in deutschsprachigen österreichischen Zeitungen zu verfolgen“, erklärt der Projektleiter Jörn Kleinert. Der Wissenschaftsfonds FWF unterstützt das Forschungsprojekt, insbesondere die Entwicklung der „digitalen Augen“, und zwar in Kooperation mit der historischen Zeitungsdatenbank ANNO der Österreichischen Nationalbibliothek.

Das Inserat im Buchstabensalat

Acht Millionen digitalisierte Zeitungsseiten – vom „Arbeiterwille“ bis zur „Wiener Zeitung“ – mit unzähligen individuellen Jobangeboten und -gesuchen stünden im ANNO-Archiv zur Auswahl. Wenn man denn die grafisch gestalteten Inserate darin automatisiert aufspüren und in Textform auswerten könnte. Die erste technische Herausforderung, um dieses Ziel zu erreichen, bestand für das Forscherteam darin, passendes und korrektes Übungsmaterial für einen lernenden Optical-Character-Recognition-Algorithmus (OCR) zusammenzustellen. Er soll ganz unterschiedlich gestaltete Stellenanzeigen zuverlässig erkennen und in maschinenlesbare Textdateien übersetzen.

Word-Cloud aus Berufsbezeichnungen
Die Wort-Cloud ist aus allen handgeprüften Anzeigen gebildet. Aus jedem Jahr und jeder Zeitung wurde mindestens eine zufällig ausgewählte Anzeige aus dem gesamten Untersuchungszeitraum (1850–1950) berücksichtigt. "Fl" ist die Abkürzung für die Währung Gulden. © Jörn Kleinert/Universität Graz

Auf dem Weg dahin gab es viele Stolpersteine zu überwinden, um keine sinnentstellten Texte zu generieren. Stellenanzeigen sind kurz, oft nur stichwortartig statt in ganzen Sätzen, über die Jahre und in verschiedenen Medien immer anders gestaltet, um möglichst sichtbar zu sein. Die Größe, Schrifttypen wie Fraktur, aber auch Initiale oder Versalien sowie Zahlen können sehr unterschiedlich aussehen.

Fünfunddreißig verschiedene digitalisierte Zeitungen und Zeitschriften aus dem ANNO-Archiv der ÖNB wurden ausgewählt, um daraus den Trainingsdatensatz zu erstellen. Das Sample wurde zufällig unter anderem nach Papierart, Layout, Seite und Erscheinungsjahr gestreut: „Das OCR-Programm und die künstliche Intelligenz dahinter müssen an ganz unterschiedlichen Bildern lernen, um entsprechend genau und robust zu arbeiten. Der finale Trainingsdatensatz muss korrekt sein – daher haben wir uns im Team alle mehrfach und viele Stunden an der Prüfung beteiligt. Nur so können wir sichergehen, dass wir mit dem gleichen Prozedere das Archiv scannen und verarbeiten können“, so der Volkswirt. Im Zuge dessen ist Kleinert auch auf das Inserat der „englischen Lady“ gestoßen.

Teil der Forschungsarbeit war zudem, mögliche Bias in den Daten ausfindig zu machen und geeignete Texterkennungs- und Verarbeitungsmechanismen zu vergleichen. Das händisch nachkorrigierte und geprüfte Set über hundert Jahre umfasst etwa 12.500 Stellenanzeigen. Zusätzlich wurden die Stellenanzeigen in der zweiten Aprilwoche für 1870 und 1927 quer durch das Zeitungsangebot ausgewertet. Beide Datensätze mit diesem Goldstandard werden von der ÖNB der Forschungscommunity zur Verfügung gestellt. Zum Abschluss des Projekts rechnet das Team mit etwa 1,3 Millionen Stellenanzeigen, die in ein maschinenlesbares Format überführt werden konnten.

Wie entsteht ein ausdifferenzierter Arbeitsmarkt?

Volkswirt Jörn Kleinert ist neben der technischen Entwicklungsarbeit des Datensatzes natürlich an der Entstehungsgeschichte des Arbeitsmarktes in Österreich interessiert. 1870 gab es rund 100 verschiedene Berufe. Viele Menschen arbeiteten in der Landwirtschaft und legten dort Hand an, wo es nötig war. Heute nennen wir das „Learning by doing“. Anfang 2022 listete die Europäische Klassifizierung für Fähigkeiten/ Kompetenzen, Qualifikationen und Berufe (ESCO) 3700 einzigartige Berufe auf, die sich durch die Kombination von etwa 13.000 verschiedenen Fähigkeiten ergeben.

„Vor 175 Jahren gab es noch kein staatliches Arbeitsamt, diese entstanden zur Jahrhundertwende. Der Arbeitsmarkt wurde auf der Mikroebene durch die Initiative vieler Akteurinnen und Akteure geschaffen“, sagt Kleinert. Ein Teil davon waren Gebote und Gesuche in Form von Stellenanzeigen in der Zeitung, die auf gut Glück in die Welt gesetzt wurden. Dabei mischten auch Arbeitgeber und Gewerkschaften mit. Es gab zudem private Vermittlungsagenturen, viele mit zweifelhaftem Ruf, und die sogenannte „Umschau“: Arbeitswillige wurden montagmorgens in Produktionswerken vorstellig und suchten eine bezahlte Beschäftigung für eine Woche. Ihre Eignung und Neigung zeigten sich erst vor Ort, die Arbeitsverhältnisse waren oft nicht langfristig.

Anzeige von Johann Strauss, der einen Klarinettisten sucht aus dem Jahr 1870

 

Der Walzerkönig sucht Klarinettisten
 

Das Forschungsprojekt hat unter anderem eine Job-Annonce von Johann Strauss, dessen 200. Geburtstag heuer gefeiert wird, aus dem Jahr 1870 zutage gefördert.

Vom Individuum zum Markt

Was Kleinert und seine Kolleg:innen im interdisziplinären Netzwerk „Human Factor in Digital Transformation“ begonnen haben und sie sicher noch lange beschäftigen wird, ist die vertiefte inhaltliche Analyse der Texte: von der Stimmung und den Verhandlungsspielräumen bis zur Bandbreite der Berufsbilder und der Bezahlung. Für manche dieser Parameter wurden bereits kleine Auswertungsprogramme entwickelt.

Ab 1880 finanzierten sich Zeitungen vor allem über Annoncen – entsprechend stark wurden diese gepusht. Kleinert betrachtet also nicht bloß eine Datenquelle, sondern eine Datenbonanza für qualitative Forschung. In den geprüften Inseratentexten fand der Volkswirt zum einen viel Verhandlungsspielraum bei den Angeboten, um Interessierte und Qualifizierte anzulocken, andererseits ganz auf die Person zugeschnittene Gesuche, wo jemand montag- und mittwochnachmittags etwas anbieten kann. Berufsbilder, die es 1870 noch nicht, 1927 aber sehr wohl gab, waren die Typistin mit Stenokenntnissen, der Bautechniker und der Elektrotechniker. Nicht so häufig, aber eine echte Neuerung ohne Vorläufer unter anderer Bezeichnung war 1927 der Zahntechniker.

Jörn Kleinert interessiert, „wie wir aus einer Welt, in der es kaum Berufe gab, zur heute ausdifferenzierten Situation von Angebot und Nachfrage nach Arbeit gekommen sind. Wir produzieren heute etwa fünfzigmal mehr als unsere Vorfahr:innen vor 200 Jahren. Wie geht das? Können wir mehr, oder ist es eher so, dass wir in kleinen Feldern, sehr spezialisiert so viel mehr können?“

Diese unterschiedlichen Kenntnisse und Fähigkeiten müssen durch Job-Matching zusammengebracht werden und da kommt der Arbeitsmarkt ins Spiel. Das Herz von Volkswirt:innen, Historiker:innen und Soziolog:innen sieht Jörn Kleinert angesichts der potenziell auswertbaren Informationen, um den Wandel der Arbeitswelt zu dokumentieren und zu analysieren, jedenfalls höherschlagen. Künstliche Intelligenz kann hier technische Unterstützung geben: „Wenn wir genau wissen, wie wir sie nutzen, kann sie uns helfen – doch ohne uns kann die Maschine gar nichts.“

Zur Person

Jörn Kleinert ist Volkswirt mit einer Spezialisierung auf internationale Ökonomik. Nach Stationen in Kiel und Tübingen ist er seit 2010 Professor an der Universität Graz. Er beschäftigt sich mit Heterogenität und Differenzierung als Quellen wirtschaftlicher Entwicklung. Das Grundlagenprojekt „Die Entstehung des ausdifferenzierten Arbeitsmarktes“ (2022–2025) wird vom Wissenschaftsfonds FWF mit rund 400.000 Euro gefördert.

Publikationen & Beiträge

Adam R., Venglarova K., Vogeler G.: Exploring Historical Labor Markets: Computational Approaches to Job Title Extraction, hal-04869347 2025 (Preprint)

Venglarova K., Adam R., Mölzer W. et al.: Who Advertises in Newspapers? Data Criticism in Mining Historical Job Ads, Computational Humanities Research Conference, Dänemark 2024 (PDF)

Kleinert J., Mölzer W.: The Emergence of the Austrian Labor Market, Universität Graz 2024 (PDF)