06 | Freitag, 10.05.2024

Inhalte

Um moderne KI-Systeme zu entwickeln, die auf Machine Learning oder Deep Learning basieren, sind große Mengen von Daten notwendig. Diese können manchmal mit wenigen vorbereitenden Schritten direkt in verarbeitende Prozesse gegeben werden. In der Regel ist aber eine inhaltliche Kuratierung und technische Aufbereitung notwendig, damit Algorithmen mit den Daten etwas anfangen können.

In dieser und den folgenden Sitzungen soll es daher darum gehen, typische Tätigkeiten der Datenaufbereitung praktisch nachzuvollziehen. Zum einen, um die technischen Aspekte dieses Prozessschritts kennenzulernen, zum anderen, um Arbeitssituationen einschätzen zu können, in denen aktuelle KI-Systeme im globalen Wettbewerb entwickelt werden.

AI for Good

Während bisher noch unklar ist, welchen Beitrag generative KI-Systeme wie ChatGPT und Stable Diffusion zum Wohl der Menschheit leisten, gibt es zahlreiche technische Ansätze und Systeme, die für gute Zwecke eingesetzt werden können. Ein Beispiel haben Sie mit Flora Incognita schon in den vergangenen Sitzungen kennengelernt. Hier war es das Training von Maschinen mit zahlreichen Fotos von Pflanzen, um d daraus eine App zum Bestimmen unbekannter Gewächse zu entwickeln.

Das Projekt VFRAME des Künstlers und Aktivisten Adam Harvey taugt als weiteres Positivbeispiel für den Einsatz von KI-Systemen zum Wohle der Menschheit. Hier sammeln Menschen Fotos von Streubombenmunition in Kriegsgebieten, um daraus eine App zu entwickeln, die gefährliche Fragmente und Blindgänger im freien Feld entdecken hilft.

Der Maschine zeigen, was wichtig ist

Damit beide Systeme, Flora Incognita und VFRAME, funktionieren, müssen zunächst Menschen Bildermaterial annotieren bzw. labeln. Später kann dieser Vorgang wiederum von Maschinen unterstützt oder ganz übernommen werden. Menschen sind dabei je nach Bildmaterial auch mental belastenden Situationen ausgesetzt, wenn es bspw. um die Annotation und Kuratierung von herabwürdigenden oder brutalen Inhalten geht. Das Ziel mag ein automatisierter Filter sein, der zukünftig solche Darstellungen zurückhält, um Nutzer*innen nicht zu schädigen. Auf dem Weg dahin sind andere Menschen aber wiedeurm einer starken psychischen Belastung ausgesetzt. Ein Dilemma?

Ziele

  • Sie gestalten Unterrichtssituationen, in denen Lernende den Arbeitsprozess der Datenannotation praktisch nachvollziehen können.
  • Sie nutzen exemplarisch die Software Label Studio, um Bilddaten zu annotieren und für maschinelle Lernprozesse aufzubereiten.
  • Sie installieren ein virtual environment in Python.
  • Sie installieren Label Studio als lokale Python-Anwendung.

Aufträge zur kommenden Sitzung

Fotografieren: Daten sammeln

  1. Machen Sie Fotos der folgenden Gegenstände, damit wir damit in den folgenden Sitzungen ein Deep-Learning-Modell nachtrainieren können: Teelöffel, Buch, Lampe, Flaschenöffner, .Tasche, Schuh, Türklingelschild (anonymisisert).
    Machen Sie, wenn möglich, Fotos von verschiedenen Exemplaren der genannten Gegenstände und am besten noch aus verschiedenen Blickwinkeln. Je mehr Material und je diverser die Darstellungen, umso besser könnte später unser Modell werden.
  2. Fotografieren Sie außerdem noch das Teelicht, das Sie in der vergangenen Sitzung bekommen haben und die Minze, die Sie seit der ersten Sitzung hegen und pflegen.
  3. Speichern Sie die Bilder in der folgenden Ordnerstruktur (Schreibweise beachten!):
     1├── Bildsammlung
     2│   ├── Buch
     3│   ├── Flaschenoeffner
     4│   ├── Lampe
     5│   ├── Minze
     6│   ├── Schuh
     7│   ├── Tasche
     8│   ├── Teelicht
     9│   ├── Teeloeffel
    10│   └── Tuerklingel
    
  4. Komprimieren Sie den Ordner Bildsammlung als ZIP-Archiv.
  5. Laden Sie das ZIP-Archiv auf den Nextcloud-Server, der in Mattermost geteilt wurde.

Daten annotieren: Label Studio

In der vergangenen Sitzung haben Sie schon die Software Label Studio unter Python installiert.

  1. Spielen Sie mit Label Studio herum und finden Sie selbst heraus, wie es funktioniert. Auf der Website des Projekts gibt es viel Material zum Einstieg.

Lesen: Arbeitsbedingungen im KI-Geschäft kennen

  1. Suchen Sie sich einen Artikel aus dieser Zotero-Sammlung heraus, die journalistische und wissenschaftliche Beiträge zu Arbeitsbedingungen im KI-Sektor enthält (SDG 8: Menschenwürdige Arbeit und Wirtschaftswachstum).
  2. Schreiben Sie eine Zusammenfassung des Artikels in Quartz, wobei Sie sich an wissenschaftliche Standards halten.
  3. Beenden Sie Ihren Beitrag mit einer persönlichen Stellungnahme zum geschilderten Problem. Untermauern Sie Ihre Aussagen mit Belegen.

Video: Das Stilwell-Gehirn

Der YouTuber Michael Stevens hat mit ca. 100 Menschen auf einem Football-Feld nachgestellt, wie ein künstliches neuronales Netz funktioniert. Große Unterhaltung.
Hier geht’s zum Video

Abgabetermin

Der Auftrag ist bis zum Donnerstag, 16.05.2024, zu erledigen.

Abgabe

Wir sichten Ihre Ergebnisse gemeinsam beim nächsten Sitzungstermin.

Weiter