Home Uncategorized Berichten zufolge hat das Video-Startup AI Runway mit „Tausenden“ nicht lizenzierten YouTube-Videos...

Berichten zufolge hat das Video-Startup AI Runway mit „Tausenden“ nicht lizenzierten YouTube-Videos trainiert

22
0
Berichten zufolge hat das Video-Startup AI Runway mit „Tausenden“ nicht lizenzierten YouTube-Videos trainiert

Berichten zufolge hat das KI-Unternehmen Runway „Tausende“ YouTube-Videos und Raubkopien urheberrechtlich geschützter Filme ohne Erlaubnis kopiert. 404 Medien erhalten angebliche interne Arbeitsblätter zeigen, dass das KI-Videoerstellungs-Startup seine Gen-3-Modelle mithilfe von YouTube-Inhalten von Kanälen wie Disney, Netflix, Pixar und beliebten Medien trainiert hat.

Ein mutmaßlicher ehemaliger Runway-Mitarbeiter sagte der Veröffentlichung, dass das Unternehmen die Tabelle verwendet habe, um eine Liste von Videos abzuhaken, die es in seine Datenbank aufnehmen wollte. Anschließend lädt das Unternehmen sie mithilfe einer Open-Source-Proxy-Software unbemerkt herunter, um seine Spuren zu verwischen. Auf einem Blatt sind einfache Schlüsselwörter wie „Astronaut“, „Elf“ und „Regenbogen“ aufgeführt, mit einer Fußnote, die angibt, ob das Unternehmen qualitativ hochwertige Videos gefunden hat, die für die Schulung geeignet sind. Der Begriff „Superheld“ enthält beispielsweise den Hinweis „Viele Filmausschnitte“. (Natürlich.)

Andere Notizen zeigen, dass Runway den YouTube-Kanal für Unreal Engine, den Filmemacher Josh Neuman und eine Call of Duty-Fanseite als gute Quellen für „High-Movement“-Trainingsvideos markiert.

„Die Kanäle in der Tabelle waren der Versuch des Unternehmens, qualitativ hochwertige Videos für den Aufbau des Modells zu finden“, sagte der ehemalige Mitarbeiter 404 Medien„Dies wird dann als Eingabe für einen riesigen Webcrawler verwendet, der alle Videos von all diesen Kanälen herunterlädt und dabei Proxys verwendet, um eine Blockierung durch Google zu vermeiden.“

Berichten zufolge hat das Video-Startup AI Runway mit „Tausenden“ nicht lizenzierten YouTube-Videos trainiert

Runway

Eine Liste von fast 4.000 YouTube-Kanälen, zusammengestellt in einer Tabelle, listet „empfohlene Kanäle“ von CBS New York, AMC Theaters, Pixar, Disney Plus, Disney CD und dem Monterey Bay Aquarium auf. (Weil kein KI-Modell ohne Biber vollständig ist.)

Darüber hinaus hat Runway Berichten zufolge eine separate Liste mit Videos von Piraterieseiten zusammengestellt. Das Arbeitsblatt mit dem Titel „Nicht-YouTube-Quellen“ enthält 14 Links zu Quellen wie nicht autorisierten Online-Archiven von Studio Ghibli-Filmen, Anime- und Filmpiraterieseiten, Fanseiten mit Xbox-Videospielen und der Animations-Streaming-Seite kisscartoon.sh.

Dies könnte als vernichtende Bestätigung dafür angesehen werden, dass das Unternehmen Trainingsdaten verwendet. 404 Medien fanden heraus, dass die Abfrage eines Videogenerators mit den in einer Tabelle aufgeführten Namen beliebter YouTuber zu sehr ähnlichen Ergebnissen führte. Am wichtigsten ist, dass die Eingabe desselben Namens in das ältere Gen-2-Modell von Runway – das trainiert wurde, bevor die Daten angeblich in der Tabelle enthalten waren – zu „nicht verwandten“ Ergebnissen führte, wie bei einem generischen Mann im Anzug. Nachdem die Veröffentlichung außerdem Runway kontaktiert hatte, um nach den in den Ergebnissen auftauchenden YouTuber-Ähnlichkeiten zu fragen, stellte das KI-Tool die Generierung dieser Ähnlichkeiten vollständig ein.

„Ich hoffe, dass die Leute durch die Weitergabe dieser Informationen die Größe dieser Unternehmen besser verstehen und wissen, was sie tun, um ‚coole‘ Videos zu machen“, sagte der ehemalige Mitarbeiter. 404 Medien.

Als ein YouTube-Vertreter um einen Kommentar gebeten wurde, verwies er Engadget an Interview Sein CEO Neal Mohan gab es dazu Bloomberg Im April. Im Interview beschrieb Mohan die Schulung in seinem Video als „eindeutigen Verstoß“ gegen die Bestimmungen. „Unsere vorherigen Kommentare hierzu bleiben bestehen“, schrieb YouTube-Sprecher Jack Mason an Engadget.

Runway antwortete zum Zeitpunkt der Veröffentlichung nicht auf eine Bitte um Stellungnahme.

Zumindest einige KI-Unternehmen scheinen darum zu kämpfen, ihre Geräte zu normalisieren und die Marktführerschaft zu erlangen, bevor Benutzer – und die Gerichte – wissen, wie ihre Würste hergestellt werden. Schulungen mit Genehmigung durch Lizenzverträge sind eine Sache, und es ist eine andere Taktik, die Unternehmen wie OpenAI kürzlich übernommen haben. Allerdings ist es ein viel zweifelhafterer (wenn nicht sogar illegaler) Schachzug, das gesamte Internet – inklusive urheberrechtlich geschütztem Material – als etwas zu behandeln, das es in einem Verdrängungswettlauf um Profit und Vorherrschaft zu gewinnen gilt.

404 Mediensehr gut Die Berichterstattung ist lesenswert.

Source link