Europäische KI-Start-ups rennen um die Verbesserung der Sprachkenntnisse von Chatbots

1680679819 Europaeische KI Start ups rennen um die Verbesserung der Sprachkenntnisse von Chatbots


Europäische Start-ups versuchen, ein Problem beliebter Chatbots mit künstlicher Intelligenz zu lösen: die Qualität der Antworten in anderen Sprachen als Englisch.

Das in Helsinki ansässige Silo AI wird am Mittwoch eine Initiative starten, um zum Aufbau neuer großer Sprachmodelle beizutragen, die generativen KI-Produkten wie ChatGPT von OpenAI und Bard von Google in europäischen Sprachen wie Schwedisch, Isländisch, Norwegisch und Dänisch zugrunde liegen.

Das finnische Unternehmen schließt sich anderen Gruppen an, die daran arbeiten, die Technologie hinter Chatbots zu verbessern, die realistische Antworten auf schriftliche Eingabeaufforderungen mit Sprachen wie Deutsch, Hebräisch und Arabisch geben.

Die Schritte kommen, als Unternehmen auf der ganzen Welt beginnen, KI-Software einzuführen, die von Microsoft-unterstützten OpenAI und Google entwickelt wurde, was Kritiker dazu veranlasst, Bedenken hinsichtlich einer übermäßigen Abhängigkeit von einer leistungsstarken, geschlossenen Technologie zu äußern, die von einer kleinen Gruppe von hauptsächlich US-Teilnehmern entwickelt wurde.

„Eine europäische Initiative muss . . . Wissen aus einer europäischen Perspektive erfassen und wir können kontrollieren, welche Art von Daten darin eingespeist werden“, sagte Peter Sarlin, Geschäftsführer von Silo AI.

Googles Bard funktioniert derzeit nur auf Englisch. ChatGPT von OpenAI unterstützt Dutzende von Sprachen, darunter europäische Sprachen, Hindi, Farsi und andere. Laut denjenigen, die es ausgiebig getestet haben, ist es jedoch nicht in allen Sprachen gleich genau.

Silo AI versucht, das Problem zu lösen, indem es ein Team erfahrener KI-Akademiker aus ganz Europa zusammenstellt. Sie werden skandinavischsprachige Modelle auf dem leistungsstärksten Supercomputer des Kontinents bauen, trainieren und betreiben LUMIdas sich in Finnland befindet und für die Ausführung von generativer KI-Software modifiziert wurde.

Die Initiative des neuen Teams, bekannt als SiloGen, plant, im Laufe der Zeit auf weitere Sprachen ausgeweitet zu werden.

Das Problem ist jedoch nicht rein sprachlich. Die Schaffung von Modellen in Europa kann sicherstellen, dass die Qualität der für das Training verwendeten Daten für die Kultur und Ethik von Ländern außerhalb der USA repräsentativ ist, auch in Bezug auf den Datenschutz, sagte Sarlin.

Das Modell von Silo AI wird ebenfalls Open Source sein, was bedeutet, dass es von jedem, der es einsetzen möchte, analysiert und angepasst werden kann. Dies steht im Gegensatz zu den geschlossenen Modellen von OpenAI und Google, mit denen Unternehmen möglicherweise zögern, ihre vertraulichen oder proprietären Daten zu teilen.

Andere europäische Bemühungen umfassen OpenGPT-X und LEAM, beides von Deutschland geführte Initiativen zur Entwicklung von Open-Source-Sprachmodellen. Die Modelle von OpenGPT-X werden in Zusammenarbeit mit dem deutschen KI-Startup Aleph Alpha gebaut.

Bei seiner Einführung im vergangenen Jahr warnte die Gruppe hinter OpenGPT-X, dass der fehlende Zugang zu Details von Modellen wie GPT-4 Europas „digitale Souveränität und Marktunabhängigkeit“ in der KI bedroht, was das Wachstum europäischer Unternehmen und Forschung behindern könnte.

Marco Trombetti, Geschäftsführer des italienischen digitalen Übersetzungsunternehmens Translated, sagte, führende Chatbots seien so programmiert worden, dass sie ihre besten Ergebnisse auf Englisch liefern, was „gegenüber dem Rest der Welt nicht fair“ sei.

Um dem entgegenzuwirken, hat sein Unternehmen ein Live-Übersetzungstool für ChatGPT entwickelt, das in 60 Sprachen funktioniert und darauf abzielt, die Antworten des Tools zu verbessern.

„In Bezug auf die Technologie ist es für die nicht-englischsprachige Welt wie ein Sprung von fünf Jahren zurück, was effektiv eine Welt der zwei Geschwindigkeiten schafft“, sagte Trombetti über die aktuellen generativen KI-Tools.

Solche Bedenken werden nicht nur in Europa geäußert. Die israelische Innovationsbehörde gab 7,5 Mio. Shk (etwa 2,1 Mio. USD) für die Gründung der Association of Natural Language Processing aus. Die Gruppe versucht, die „schlechte und unzureichende Qualität der hebräischen und arabischen Spracherkennung in verschiedenen Arten von Computersystemen umzukehren“, sagte Dror Bin, ihr Vorstandsvorsitzender.

Bin sagte, dass angesichts der begrenzten Mittel für die KI-Forschung in arabischsprachigen Ländern und relativ wenigen Hebräischsprachigen auf der Welt befürchtet wird, dass sie zurückbleiben werden, wenn KI-Produkte in kommerzielle Anwendungen wie Microsoft Office und Google Workspace integriert werden.

„Die Qualität des Verstehens und Erkennens menschlicher Sprache auf Hebräisch und Arabisch ist geringer und stellt ein Hindernis für die Realisierung und Anwendung fortschrittlicher Dienste dar“, fügte er hinzu.

Zusätzliche Berichterstattung von John Thornhill



ttn-de-58

Schreibe einen Kommentar