Home Reisen OpenAI-Sprachmodus verzögert – Sky kommt noch nicht aufs Telefon

OpenAI-Sprachmodus verzögert – Sky kommt noch nicht aufs Telefon

9
0

Der OpenAI Voice Mode soll im Herbst für ein breiteres Publikum veröffentlicht werden.

Einen Monat nachdem ChatGPT eine Stimme bekommen hat, die zu seinem meist intelligenten Verstand passt, hat OpenAI angekündigt, dass sich der Sprachmodus verzögern wird. Anstatt die Veröffentlichung des OpenAI-Sprachmodus zu verzögern, hatte das Unternehmen angekündigt, dass die Funktionen allen Benutzern zur Verfügung stehen würden, wobei Premium-Abonnenten primären Zugriff erhalten würden, was für Benutzer, die selbst versuchen wollten, mit der KI zu sprechen, aufregend war. Die Ankündigung während ihrer Frühlings-Update sagte, dass der Sprachmodus „bald verfügbar“ sein würde, aber wir hatten keine genaue Vorstellung davon, wann er eintreffen würde.

Als es so aussah, als stünde eine Veröffentlichung Ende Juni unmittelbar bevor, wurde der GPT-4o-Sprachmodus verschoben, um „die Fähigkeit des Modells zu verbessern, bestimmte Inhalte zu erkennen und abzulehnen“. Das Unternehmen scheint auch an der Benutzererfahrung zu arbeiten und seine Infrastruktur darauf vorzubereiten, „auf Millionen zu skalieren und gleichzeitig Echtzeitantworten aufrechtzuerhalten“.

Bild: OpenAI Logo

Verzögerung im OpenAI-Sprachmodus – müssen wir uns für immer von Sky verabschieden?

Die Nachricht, dass sich der Sprachmodus von OpenAI verzögert, ist keine Überraschung, insbesondere weil die Funktion seit ihrer Ankündigung in der Öffentlichkeit heftig umstritten war. Viele Fans waren begeistert von der Veröffentlichung des Sprachmodus von OpenAI, da er dem Chatbot eine sehr lebensechte Qualität verlieh und ein beispielloses Maß an Reaktionsfähigkeit zeigte. Die Leistung der fünf Synchronsprecher war natürlicher als alles, was wir bisher bei Assistenten wie Alexa und Siri gesehen hatten, aber das auffälligste Detail war, wie der Assistent in der Lage war, in Echtzeit auf die Welt um ihn herum zu reagieren.

Allerdings waren nicht alle von ChatGPTs neuer Sprachfähigkeit so begeistert. Die Zuschauer waren von der KI erschrocken und stellten sich eine Frage:Warum brauchten wir einen lebensechten Chatbot? Bei OpenAI ging es schon immer weniger um das „Warum“, sondern mehr um das „Warum nicht“. Daher ließen sie sich nicht von der Einführung dieser Funktion abbringen. Allerdings scheint es beim Sprachassistenten ChatGPT einige Probleme zu geben.

Das Unternehmen hatte geplant, die Funktion Ende Juni einer kleinen Gruppe von ChatGPT Plus-Benutzern vorzustellen, hat seine Kunden nun jedoch gebeten, noch einen Monat zu warten, bevor dies geschieht. Die Strategie, mit einer begrenzten Gruppe zu beginnen, bleibt unverändert, aber das Unternehmen sollte bereit sein, die Funktion im Herbst für ein breiteres Publikum einzuführen. „Wir arbeiten auch daran, die neuen Video- und Bildschirmfreigabefunktionen einzuführen, die wir separat vorgeführt haben, und werden Sie über diesen Zeitplan auf dem Laufenden halten“, hieß es in der Ankündigung.

ich habe immer wieder gesagt, dass die Verzögerung im Sprachmodus nicht auf irgendeinen verschwörungstheoretischen Grund zurückzuführen ist. Die Antwort ist langweilig: Es ist schwierig, die Latenz so zu skalieren, dass sie niedrig genug ist, um einen Gesprächsfluss in Echtzeit zu ermöglichen. Verwenden Sie 4°, und die Latenz kann mehrere Sekunden betragen. Das wird nicht einfach *auf magische* Weise gelöst https://t.co/OS9QNXWq4L

— und ⚡️ (@mynamebedan) 26. Juni 2024

OpenAI kündigte eine weitere Verzögerung für den neuen Sprachmodus von ChatGPT an und löste damit eine Debatte über dessen Bereitschaft aus.
Verheimlichen sie technische Probleme? 🧐

Obwohl sie behaupten, Sicherheit und Qualität hätten Vorrang, deuten die wiederholten Verschiebungen auf tiefere, ungelöste Probleme hin. Konkurrenten wie Googles… https://t.co/wP36ysiaHS

– mlukicic (@AI_Evolutionist), 26. Juni 2024

Wir verstehen die Entscheidung, den Sprachmodus von OpenAI zu verzögern, um sicherzustellen, dass ein vollständiges Produkt veröffentlicht wird, da Sicherheit bei KI-Fortschritten an erster Stelle steht. Der Missbrauch von KI ist seit langem ein Gesprächsthema, und OpenAI wurde oft vorgeworfen, mit den Auswirkungen der von ihnen entwickelten Technologie zu lax umzugehen. Trotz der schrumpfenden Konkurrenz ist es für das Unternehmen besser, zuerst alle Details auszuarbeiten, anstatt eine Funktion überstürzt herauszubringen. Es besteht auch die Möglichkeit, dass die Verschiebung der Veröffentlichung des Sprachmodus von OpenAI etwas mit ihren Rechtsstreitigkeiten über die angebliche Nachahmung der Stimme einer Schauspielerin für die KI zu tun hat.

Bild: Ein Mitarbeiter bei OpenAI testet den GPT-4o

OpenAI News – Das konfliktreiche Debüt des Sprachassistenten ChatGPT

Die Probleme mit dem Sprachassistenten ChatGPT nahmen zu, als sich Benutzer fragten, ob die Stimme von „Sky“ der Schauspielerin Scarlett Johansson gehörte, die die Rolle der digitalen Begleiterin „Samantha“ im Film gesprochen hatte. Ihr. Die Schauspielerin gab bald ihre Entscheidung bekannt, das Unternehmen zu verklagen, da die Stimme nicht ihr gehöre. Sie behauptete, dass das Unternehmen trotz der Ablehnung der Anfrage, der KI eine Stimme zu geben, einen Sprachassistenten gefunden habe, der ihre Stimme für sie nachahmen könne.

OpenAI-CEO Sam Altman bestritt die Vorwürfe und wies jegliche Absicht zurück, sie zu imitieren, aber die Sky-Stimme wurde dennoch „aus Respekt vor ihren Bedenken“ entfernt. Die Ablehnung des Unternehmens, dass der OpenAI Voice Mode veröffentlicht werden sollte, um sie zu imitieren, wurde durch die Entscheidung des CEOs behindert, nach der Ankündigung der Sprachfunktion nur das Wort „Sie“ zu twittern.

Die implizite Verbindung mit dem Film Ihr war für alle sichtbar, aber OpenAI bekräftigte seine Ablehnung mit einem langen Blogbeitrag über die Auswahl der Synchronsprecher aus mehr als 400 eingereichten Einsendungen – und das alles, bevor das Unternehmen Kontakt mit der Schauspielerin aufnahm. Die Verzögerung des GPT-4o-Sprachmodus könnte mit einem Konflikt in Bezug auf dieses Problem zusammenhängen, aber das erscheint unwahrscheinlich. Angesichts der prompten Reaktion von OpenAI, den spezifischen Sprachmodus-Assistenten abzuschalten, kann das Unternehmen zu nichts anderem verpflichtet werden, als eine finanzielle Entschädigung zu zahlen.

Bild: Einige Fans sind über die Verzögerung frustriert und müssen nach der ersten Ankündigung noch länger warten.

Die Verzögerung des OpenAI-Sprachmodus ist kein dauerhaftes Ende

Unabhängig davon, wie es zu den Problemen mit dem Sprachassistenten ChatGPT kam, wird ein Rechtsstreit zwischen dem Unternehmen und der Schauspielerin sicherlich einen starken Präzedenzfall dafür schaffen, wie solche Fälle in den kommenden Jahren behandelt werden. Dies ist bei weitem nicht das einzige Rechtsproblem, mit dem das Unternehmen konfrontiert ist. Unter anderem reichte die New York Times im vergangenen Jahr eine Klage wegen Urheberrechtsverletzung gegen das Unternehmen ein, und der Fall ist noch nicht abgeschlossen. Vor kurzem beschloss Elon Musk auch, den KI-Riesen zu verklagen, weil er seine Gründungsmission, der Menschheit zu dienen, zugunsten des Profits aufgegeben hatte. Diese letzte Klage wurde ziemlich schnell zurückgezogen.

Mit zunehmender Verbreitung von KI werden wir mehr solcher Konflikte zwischen KI-Exporteuren und der breiten Öffentlichkeit erleben, die bestimmen werden, wie weitere Fortschritte bei der KI erzielt werden. Der Rechtsstreit wird nicht ausreichen, um die Veröffentlichung des OpenAI Voice Mode dauerhaft zu beenden, und Fans werden die Funktion ausprobieren können, sobald sie fertig ist.

Wir haben bereits Hinweise darauf, dass es im Unternehmen vorangeht, da wir andere OpenAI-Neuigkeiten gesehen haben, die nichts mit der Verzögerung des Sprachmodus zu tun hatten. Das Unternehmen gab bekannt, dass ein ChatGPT für macOS endlich für alle Benutzer verfügbar sei, ob kostenpflichtig oder nicht. Microsoft und Google haben versucht, aus dem KI-Marktsegment für Desktop-Benutzer Kapital zu schlagen, und während ChatGPT über eine Browserversion verfügt, die auf jedem Gerät einwandfrei funktioniert, wird die Desktop-App dazu beitragen, sie besser in das Desktop-Erlebnis zu integrieren.

Kaynak

LEAVE A REPLY

Please enter your comment!
Please enter your name here