Maschinelles Lernen (ML) ist derzeit wohl das heißeste Gebiet von Quantitative Finance. Allerdings wird es oft gründlich missverstanden.
Zunächst ist vielen gar nicht bewusst, worum es sich bei ML tatsächlich handelt. Der Begriff beschwört Bilder von intelligenten Robotern herauf, die über große Datenmengen nachgrübeln, um damit neue Trading-Strategien zu entdecken, die dann getestet und modifiziert werden – und das alles ohne menschliche Beteiligung. Einige esoterische ML-Ansätze sehen tatsächlich so aus. Genetische Algorithmen können sich beispielsweise selbst modifizieren und so ihre Performance verbessern…
Allerdings wird unter ML weitaus mehr verstanden. Andere Einsatzgebiete des ML verfolgen eher einen herkömmlichen Ansatz. Manche Leute subsummieren sogar klassische statistische Ansätze wie lineare Regression unter ML. Die älteren Ansätze erfordern aber eine genaue Überprüfung des Lernprozesses. Immer noch bedarf es eines menschlichen Wesens, welches die Zinsvariablen und die dazugehörigen Gleichungen vorgibt. Der Maschine obliegt kaum mehr, als ein paar wenige Parameter zu finden.
Vielleicht halten Sie ML auch für eine neue Innovation – was allerdings nicht zutrifft. Viele ML-Ansätze sind schon seit Jahrzehnten bekannt. Der vermeintlich neue Ansatz von neuralen Netzwerken geht beispielsweise auf die 50er Jahre zurück. Wo sich ML auf traditionelle Statistik stützt, reichen die Ansätze noch weiter zurück. So wurde lineare Regression bereits im 19. Jahrhundert entdeckt.
Erst zwei neue Trends haben ML ins Rampenlicht gerückt: Zunächst steht Datenanalysten heute einfach viel mehr Rechenleistung zur Verfügung als früher. Dies liegt teilweise am mooreschen Gesetz, wonach die Leistung individueller Chips weiterhin exponentiell wächst. Teilweise liegt dies aber auch am Cloud Computing, wodurch ML-Experten Zugriff auf viel leistungsfähigere Rechenzentren als ihren eigenen Computer oder Server-Cluster haben. Als Folge davon sind heute viel anspruchsvollere ML-Ansätze als früher möglich.
Der dritte Grund liegt in der Verfügbarkeit großer Datenmengen. Es gibt einfach mehr Daten, mit denen ML jonglieren kann. Weiter gibt es einen beträchtlichen Zuwachs an alternativen Daten wie die Posts in den sozialen Medien, die theoretisch Rückschlüsse auf die Laune der Konsumenten oder die Performance einzelner Aktien erlauben. Doch selbst der ausgeklügeltste ML-Ansatz findet keine Verbindungen, wo keine sind. Noch schlimmer ist die Gefahr, dass vermeintliche Muster erkannt werden, die gar nicht da sind oder in der Zukunft nicht fortbestehen. Mit diesem Problem haben sämtliche Ansätze zu kämpfen, die aus historischen Daten auf die Zukunft schließen wollen. Besonders verheerend wirkt es sich auf komplizierte ML-Strategien aus. Und wo ML tatsächlich existierende Zusammenhänge entdeckt, hätten diese mit wesentlich einfacheren Instrumenten gefunden werden können.
Auch die alternativen Daten werden womöglich nicht die in sie gesetzten Hoffnungen erfüllen. Denn die Kausalitätskette von der Datenquelle bis hin zu den Assetpreisen sind reichlich schwach, falls sie überhaupt existieren. Die meisten alternativen Daten stehen schon seit einiger Zeit zur Verfügung und die ML-Ansätze benötigen sehr lange Datenreihen um vergleichbar schwache Effekte zur erschließen.
Vielversprechender scheint der anhaltende Streit zwischen der Ausführung von Trades auf der Buy-Side und den Hochfrequenz-Eigenhändlern zu sein, die sie aufgreifen. Hier können beide Seiten ML nutzen, um aus großen Datensätzen Kursdaten zu ermitteln und ihre Strategien entsprechend zu modifizieren.
Ironischerweise sind die wirklichen Erfolgsgeschichten des ML weit entfernt von der hochbezahlten Welt der Front Offices der Banken und Hedgefonds. Vielmehr finden sie sich in der weitaus weniger glamourösen Welt des Retailbankings. ML ist beispielsweise recht gut darin, die Wahrscheinlichkeit zu errechnen, dass Kreditkarten- oder Hypothekenkunden ihren Zahlungsverpflichtungen nicht nachkommen.
In diesen Bereichen gibt es große und gut etablierte Datensätze, die für ML geeignet sind. Darüber hinaus scheint das Verhalten einzelner Menschen leichter vorhersagbar zu sein als die Interaktionen der Menschen auf den Finanzmärkten. Wer einen Job in ML sucht, sollte sich wohl am besten hier umsehen.
Robert Carver hat früher das Geschäft mit festverzinslichen Wertpapieren beim quantitativ ausgerichteten Hedgefonds AHL geleitet und ist Autor von „Systematic Trading“ und „Smart Portfolios.“