Willkommen, Professor Fanny Yang
Fanny Yang ist seit Anfang Januar 2020 offiziell als Tenure-Track-Assistenzprofessorin für Informatik am Departement Informatik der ETH Zürich tätig. In diesem kurzen Interview stellt sie sich vor.
Frau Professor Yang, willkommen an der ETH! Was sind Ihre aktuellen Forschungsinteressen?
Im Allgemeinen bin ich daran interessiert, genaue und zuverlässige Modelle des maschinellen Lernens zu verstehen und zu entwickeln. Zu diesem Zweck habe ich zwei ineinandergreifende Forschungsschwerpunkte. Zum einen möchte ich die theoretische Leistung moderner Machine-Learning-Algorithmen besser verstehen und herausfinden, wie ihre (robuste) Generalisierungsleistung verbessert werden kann. Was sind beispielsweise die grundlegenden Bedingungen für den Daten- und Modellraum, unter denen die Interpolation einen konsistenten Estimator liefert? Und wann ist eine Regularisierung sinnvoll und notwendig? Die klassische Lern- und Optimierungstheorie reicht nicht aus, um diverse empirische Beobachtungen im Deep Learning zu erklären. Obwohl in den letzten Jahren einige Fortschritte in diesem Bereich erzielt wurden, sind wir noch weit davon entfernt, ein vollständiges Bild zu haben.
Angesichts der realen Anwendungsmöglichkeiten möchte ich einen Aspekt besonders untersuchen, der über die traditionellen Leistungsindikatoren für Schätzungen und Vorhersagen hinausgeht: Wie beeinflussen Verzerrungen in Datensätzen die Lernalgorithmen? Verwenden Lernverfahren beispielsweise inhärent unterscheidende Merkmale von Tierarten oder Symptome von Krankheiten, um diese voneinander zu unterscheiden, oder nutzen sie falsche Korrelationen in den Trainingsdaten aus, die in den Testdaten möglicherweise nicht vorhanden sind? Wie können wir Letzteres verhindern oder aufdecken? Können wir dem Modelloutput Informationen hinzufügen, die Aufschluss darüber geben, wie das Modell seine Vorhersagen macht und inwiefern man ihm vertrauen kann? Ich freue mich darauf, all diese Fragen und mehr hier an der ETH zu erforschen!
Welche Auswirkungen hat Ihre Forschung auf die Gesellschaft?
Wie oben beschrieben, bin ich leidenschaftlich bemüht, Datenwissenschaftlern (nachweislich) zuverlässige und praktische Modelle für maschinelles Lernen zur Verfügung zu stellen, die sie in der Praxis anwenden können. Um diese Modelle verlässlich zu machen, ist ein gewisses Mass an Bestimmtheit und an Erklärungen für die Modellvorhersagen erforderlich. Wenn ein Algorithmus beispielsweise ein neues medizinisches Bild nicht klassifizieren kann, weil er den Patiententyp und das bildgebende Gerät während des Trainings nicht angetroffen hat, sollte er zumindest eine Warnung ausgeben, die auf seine Unsicherheit hinweist. Dies ist auch für Situationen wichtig, in denen die Sicherheit eine Rolle spielt. Wenn zum Beispiel ein selbstfahrendes Auto vor einem bisher nie gesehenen Szenario steht und unsicher ist, ob es die richtige Entscheidung treffen kann, sollte es um menschliches Eingreifen bitten. Gleichzeitig sollen die entwickelten Algorithmen bei Beispielen, die den Trainingsdaten ähnlich sind, zuverlässig funktionieren. Meine Forschung befasst sich sowohl theoretisch als auch praktisch mit diesen Fragen und kann daher für eine Vielzahl von Anwendungen in verschiedenen Bereichen nützlich sein.
Wo haben Sie gearbeitet, bevor Sie an die ETH kamen?
Bevor ich an das D-INFK kam, war ich Postdoc an den Departementen für Statistik und Informatik der Stanford University und am Institut für theoretische Studien der ETH Zürich. Davor promovierte ich an der UC Berkeley.
Welche Lehrveranstaltungen werden Sie an der ETH unterrichten?
Mein erster Kurs wird sich mit theoretischen Garantien für maschinelles Lernen befassen. Er richtet sich an Studierende, die daran interessiert sind, statistische und rechnerische Konvergenzraten von Lernalgorithmen zu beweisen. Ich hoffe, dass die Studierenden nach diesem Kurs problemlos in die theoretische Forschung im Bereich des maschinellen Lernens einsteigen können.
Was sind Ihre ersten Eindrücke von der Schweiz und der ETH?
Zürich ist eine wunderbare Stadt für eine Berg- und Musikliebhaberin wie mich, und ich freue mich sehr darauf, die Schweiz in den nächsten Jahren weiter zu erkunden. Ich fühle mich auch von den Schweizerinnen und Schweizern sehr willkommen geheissen, obwohl ich Schweizerdeutsch noch nicht bezwungen habe. Meine Kollegen an der ETH haben mich beim Start sehr unterstützt, und ich freue mich darauf, Teil dieser grossartigen Gemeinschaft von Forschenden und Wissenschaftlern zu sein.
Welchen Rat würden Sie Studierenden geben, die gerade erst in die Informatik einsteigen?
Die Informatik ist ein enormes Gebiet, mit vielen faszinierenden und aktiven Themenbereichen. Studierende, die sich für maschinelles Lernen und Datenwissenschaft interessieren, möchte ich dazu ermutigen, sich sowohl mit den theoretischen Grundlagen des maschinellen Lernens als auch mit den Anwendungsbereichen, die sie begeistern, gut vertraut zu machen. Ein solides theoretisches Fundament ist entscheidend, um zu verstehen, wann und warum Lernalgorithmen gut funktionieren. Und die Kenntnis der praktischen Herausforderungen hilft, Probleme mit hoher gesellschaftlicher Relevanz zu identifizieren und zu lösen.