Das ist Marina, SSRF-Studentin aus Serbien
Marina Draskovic kam von der University of Novi Sad, Serbien, zu uns und verbrachte ihr Student Summer Research Fellowship (SSRF) im Team von Professor Friedemann Mattern. Dort half sie bei der Entwicklung einer App, welche die Ermüdbarkeit bei Patienten mit Multipler Sklerose misst.
Marina, was war das Ziel deines Forschungsprojekts?
In der Distributed Systems Group half ich mit bei der Entwicklung einer Android-Applikation, die es Multiple-Sklerose-Patienten ermöglicht, ihre Ermüdbarkeit zu messen. Unser Ziel war es, allen Multiple-Sklerose-Patienten, auch solchen mit körperlichen Einschränkungen, einen einfachen Zugang zur App zu ermöglichen. Durch die Implementierung von Spracherkennung in die App, können körperlich eingeschränkte Patienten die App mit ihrer Stimme steuern. In meinem Forschungsprojekt habe ich mich auf einen bestimmten Aspekt der Spracherkennung konzentriert.
Welches war das zentralste Problem, das du lösen musstest?
Spracherkennung ist die Fähigkeit einer Maschine, Wörter in gesprochener Sprache zu identifizieren und in ein Format zu konvertieren, das eine Maschine lesen kann. Die Spracherkennungsleistung wird durch Genauigkeit und Geschwindigkeit gemessen. Eine Vielzahl von Faktoren kann die Erkennungsleistung beeinflussen und im unglücklichsten Fall zu Ungenauigkeiten führen. Zu diesen Faktoren gehören Tonhöhe, Lautstärke und Hintergrundgeräusche. So können beispielsweise Hintergrundgespräche oder andere Umgebungsgeräusche zu Verwechslungen und Fehlern bei der Transkription führen. Auch wenn Wörter gemurmelt oder unklar voneinander abgegrenzt werden, kann dies zu einer fehlerhaften Spracherkennung führen. Weiter kann ein sehr starker Akzent, der vom System nicht unterstützt wird, die Spracherkennung verzerren. In meinem spezifischen Projekt konzentrierte ich mich auf die Optimierung der Genauigkeit der Spracherkennungsfähigkeit der App.
«Es macht mir grosse Freude, über ein Problem nachzudenken und zu versuchen, meine eigene Lösung zu erarbeiten.»Marina Draskovic, SSRF-Studentin 2019
Wie bist du deine Forschungsfrage angegangen?
Ich testete verschiedene Ansätze der Spracherkennung: zum einen die kontinuierliche Erkennung, die in Echtzeit stattfindet, und zum anderen das Post-Processing, also die Analyse von zuvor aufgezeichneten Audio-Chunks. Ausserdem habe ich versucht, bestehende Spracherkennungsbibliotheken zu verwenden sowie meine eigene Bibliothek zu erstellen. Zum Schluss habe ich die Ergebnisse zwischen verschiedenen Ansätzen verglichen. Es stellte sich heraus, dass im Rahmen dieser App die Analyse von voraufgezeichneten Audio-Chunks und die Verwendung mehrerer bestehender Bibliotheken zusammen die genauesten Ergebnisse lieferten.
Hat dir das Arbeiten in der Forschung gefallen? Könntest du dir vorstellen eine Forschungskarriere zu verfolgen?
Das Forschen hat mir sehr gut gefallen. Da dies mein erstes Forschungsprojekt war, gab es Momente, in denen ich mich überfordert fühlte – aber das gehört zur Forschung. Ich werde definitiv weiterhin Forschung betreiben, da ich plane, mein Studium fortzusetzen. Es macht mir grosse Freude, über ein Problem nachzudenken und zu versuchen, meine eigene Lösung zu erarbeiten. Ich glaube jedoch, dass ich irgendwann in der Zukunft in der Industrie arbeiten werde.
Welche drei Dinge haben dir an deinen beiden Sommermonaten an der ETH am besten gefallen?
Zuerst einmal gefiel mir die Atmosphäre in meinem Labor und am ganzen Institut: Meine Kollegen waren sehr herzlich, offen und freundlich zu mir. Zweitens schätze ich es sehr, dass meine Mentoren – Professor Mattern und Liliana Barrios – mir die Möglichkeit gaben, meine eigenen Forschungsideen auszuprobieren, während sie mich dabei betreuten und begleiteten. Und drittens waren die Veranstaltungen, die für mich und meine SSRF-Peers organisiert wurden, ganz toll und gaben uns einen tieferen Einblick in die Forschung, die Informatik, die ETH und die Schweiz.