Bleiben Sie mit kostenlosen Updates auf dem Laufenden
Melden Sie sich einfach an Künstliche Intelligenz myFT Digest – direkt in Ihren Posteingang geliefert.
Bei seiner letzten Telefonkonferenz als CEO des Gensequenzierungsunternehmens Illumina tat Francis deSouza sein Bestes, positiv zu bleiben.
Eine umstrittene 8-Milliarden-Dollar-Übernahme des Krebsfrüherkennungsunternehmens Grail hatte eine Kampagne des aktivistischen Investors Carl Icahn, Kämpfe mit Wettbewerbsbehörden auf beiden Seiten des Atlantiks und Kritik seitens der Gründungsdirektoren von Grail ausgelöst.
DeSouza sagte Analysten, dass das Drama nur „einen sehr kleinen Teil des Unternehmens“ betreffe.
Aber jedes Mal, wenn er nach dem Gral gefragt wurde, kam es laut Speech Craft Analytics, das künstliche Intelligenz zur Analyse von Audioaufnahmen nutzt, zu Veränderungen in seiner Sprechgeschwindigkeit, Tonhöhe und Lautstärke. Es gab auch eine Zunahme von Füllwörtern wie „ähm“ und „ah“ und sogar ein hörbares Schlucken.
Laut David Pope, Chefdatenwissenschaftler bei Speech Craft Analytics, „verrät die Kombination Anzeichen von Angst und Anspannung, insbesondere wenn man sich mit diesem sensiblen Thema befasst“.
DeSouza trat weniger als zwei Monate später zurück.
Die Idee, dass Audioaufnahmen Hinweise auf die wahren Gefühle von Führungskräften geben könnten, hat die Aufmerksamkeit einiger der größten Investoren der Welt erregt.
Viele Fonds nutzen bereits Algorithmen, um Transkripte von Gewinngesprächen und Unternehmenspräsentationen zu durchsuchen, um Signale aus der Wortwahl von Führungskräften zu gewinnen – ein Bereich, der als „Natural Language Processing“ oder NLP bekannt ist. Jetzt versuchen sie, in der Art und Weise, wie diese Worte gesprochen werden, weitere Botschaften zu finden.
„Die Idee ist, dass Audio mehr erfasst als nur das, was im Text steht“, sagte Mike Chen, Leiter der alternativen Alpha-Forschung beim Vermögensverwalter Robeco. „Selbst wenn Sie über eine hochentwickelte Semantikmaschine verfügen, erfasst diese nur Semantik.“
Zögern und Füllwörter werden in Transkripten häufig weggelassen, und die KI kann auch einige „Mikrozittern“ auffangen, die für das menschliche Ohr nicht wahrnehmbar sind.
Robeco, das algorithmisch gesteuerte Fonds im Wert von über 80 Milliarden US-Dollar verwaltet und damit zu den größten Quants gehört, hat Anfang des Jahres damit begonnen, durch KI erfasste Audiosignale in seine Strategien aufzunehmen. Chen sagte, dies habe zu einer Steigerung der Rendite geführt und er erwarte, dass weitere Investoren diesem Beispiel folgen würden.
Der Einsatz von Audio stellt eine neue Ebene im Katz-und-Maus-Spiel zwischen Fondsmanagern und Führungskräften dar.
„Wir haben einen enormen Wert aus Transkripten festgestellt“, sagte Yin Luo, Leiter der quantitativen Forschung bei Wolfe Research. „Das Problem, das für uns und viele andere entstanden ist, besteht darin, dass die allgemeine Stimmung immer positiver wird. . .[because]Die Unternehmensleitung weiß, dass ihre Botschaften analysiert werden.“
Mehrere Forschungsarbeiten haben herausgefunden, dass Präsentationen seit dem Aufkommen von NLP immer positiver geworden sind, da Unternehmen ihre Sprache anpassen, um die Algorithmen zu manipulieren.
In einem von Luo Anfang des Jahres mitverfassten Artikel wurde festgestellt, dass die Kombination von traditionellem NLP mit Audioanalyse eine wirksame Methode zur Differenzierung zwischen Unternehmen darstellt, da ihre Einreichungen zunehmend „standardisiert“ werden.
Obwohl die Kosten gesunken sind, kann der Ansatz immer noch relativ teuer sein. Robeco investierte drei Jahre lang in eine neue Technologieinfrastruktur, bevor überhaupt mit der Integration der Audioanalyse begonnen wurde.
Bevor Chen zu Robeco kam, versuchte er jahrelang, Audio zu nutzen, stellte jedoch fest, dass die Technologie nicht weit genug fortgeschritten war. Und obwohl sich die verfügbaren Erkenntnisse verbessert haben, gibt es immer noch Einschränkungen.
Um zu vermeiden, dass voreilige Schlussfolgerungen auf der Grundlage unterschiedlicher Persönlichkeiten gezogen werden – manche Führungskräfte sind möglicherweise von Natur aus überschwänglicher als andere –, ist die zuverlässigste Analyse der Vergleich verschiedener Reden derselben Person über einen längeren Zeitraum hinweg. Aber das kann es schwieriger machen, die Leistung einer neuen Führungskraft zu beurteilen – gerade in einer Zeit, in der Einsicht besonders nützlich wäre.
„Eine Einschränkung selbst im NLP besteht darin, dass ein CEO-Wechsel die Gesamtstimmung durcheinander bringt [analysis]“, sagte eine Führungskraft eines Unternehmens, das NLP-Analysen anbietet. „Dieser Störeffekt muss mit der Stimme stärker sein.“
Entwickler müssen außerdem vermeiden, ihre eigenen Vorurteile in Algorithmen einzubringen, die auf Audio basieren, da Unterschiede wie Geschlecht, Klasse oder Rasse offensichtlicher sein können als im Text.
„Wir sind sehr vorsichtig, um sicherzustellen, dass die bewussten Vorurteile, die uns bewusst sind, nicht eindringen, aber es könnte dennoch unbewusste Vorurteile geben“, sagte Chen. „Ein großes und vielfältiges Forschungsteam bei Robeco zu haben, hilft.“
Algorithmen können zu irreführenden Ergebnissen führen, wenn sie versuchen, jemanden zu analysieren, der in einer Nicht-Muttersprache spricht, und eine Interpretation, die in einer Sprache funktioniert, funktioniert möglicherweise nicht in einer anderen.
Gerade als Unternehmen versuchten, sich auf die Textanalyse umzustellen, prognostizierte Pope, dass Investor-Relations-Teams damit beginnen würden, Führungskräfte darin zu schulen, den Stimmton und andere Verhaltensweisen zu überwachen, die in Transkripten übersehen werden. Die Sprachanalyse hat Schwierigkeiten mit ausgebildeten Schauspielern, die überzeugend in der Rolle bleiben können, aber das nachzubilden ist für Führungskräfte möglicherweise leichter gesagt als getan.
„Nur sehr wenige von uns sind gut darin, ihre Stimme zu modulieren“, sagte er. „Für uns ist es viel einfacher, unsere Worte sorgfältig zu wählen. Das haben wir von klein auf gelernt, um nicht in Schwierigkeiten zu geraten.“