Post Thumbnail

OpenAI entwickelt Werkzeug zur Musikgenerierung

OpenAI entwickelt ein Werkzeug zur Musikgenerierung basierend auf Text- und Audio-Prompts. Dies berichtet The Information unter Berufung auf Quellen. Ein solches Werkzeug könnte verwendet werden, um Musik zu bestehenden Videos hinzuzufügen oder um Gitarrenbegleitung zu einer Gesangsspur hinzuzufügen.

Es ist noch unklar, wann OpenAI das Produkt starten plant und ob es als separate Anwendung verfügbar sein wird oder mit ChatGPT und der Videoanwendung Sora integriert wird. Eine der Quellen erzählte The Information, dass OpenAI mit Studenten der renommierten Juilliard School arbeitet, damit diese Partituren annotieren. Das ist eine Möglichkeit, Trainingsdaten zu erhalten.

Interessantes Detail: OpenAI hat bereits in der Vergangenheit generative Musikmodelle gestartet, aber das war vor ChatGPT. Und in letzter Zeit konzentrierte sich das Unternehmen auf Audiomodelle für Text-zu-Sprache und Sprache-zu-Text-Umwandlung. Jetzt kehrt es zur Musik zurück.

Auf diesem Markt hat OpenAI bereits Konkurrenten – Google und Suno. Es stellt sich heraus, dass KI nach Text, Bildern, Videos und Stimme noch ein kreatives Gebiet erobert. Und Musik wird zum nächsten Schlachtfeld generativer Modelle.

Eine Frage bleibt: Wenn Juilliard School-Studenten Partituren für das KI-Training annotieren, bereiten sie nicht ihren eigenen Ersatz vor? Das ist die klassische Automatisierungsgeschichte – Menschen helfen, Technologie zu schaffen, die dann ihren Platz einnimmt.

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.
Latest News
Chinesischer Humanoide Bumi kostet wie iPhone 17 Pro Max

Das chinesische Startup Noetix Robotics stellte den humanoiden Roboter Bumi vor, der so viel kostet wie ein iPhone 17 Pro Max in China. Preis - 9998 Yuan. Das sind etwa 1370 Dollar.

Reddit erwischte Perplexity beim Inhaltsdiebstahl

Ich erzählte früher, dass Reddit Klage gegen die KI-Suchmaschine Perplexity eingereicht hat. Reddit beschuldigt Perplexity des "industriellen" Content-Sammelns. Aber jetzt gibt es Fakten und Reddit zeigte, wie sie den Beklagten in eine Falle lockten.

OpenAI entwickelt Werkzeug zur Musikgenerierung

OpenAI entwickelt ein Werkzeug zur Musikgenerierung basierend auf Text- und Audio-Prompts. Dies berichtet The Information unter Berufung auf Quellen. Ein solches Werkzeug könnte verwendet werden, um Musik zu bestehenden Videos hinzuzufügen oder um Gitarrenbegleitung zu einer Gesangsspur hinzuzufügen.

Amazon verwandelt Kuriere in Cyborgs mit KI-Smart-Brillen

Amazon beschloss, seine Kuriere in Cyborgs zu verwandeln. Nein, ernsthaft - das Unternehmen kündigte Smart-Brillen mit KI für Lieferanten an. Die Idee, laut E-Commerce-Giganten, ist es, den Fahrern die Hände freizugeben. Und sie davon zu befreien, ständig den Blick zwischen Telefon, Paket und Umgebung wechseln zu müssen.

OpenAI wird Charakter-Cameos zu Sora hinzufügen

OpenAI veröffentlichte die Entwicklungs-Roadmap für Sora, und wissen Sie was? Es scheint, das Unternehmen hat endlich erkannt, dass Videogenerierung nicht nur eine technologische Demonstration ist. Sondern ein Werkzeug, das Menschen wirklich nutzen müssen. Bill Peebles, Projektleiter, kündigte eine ganze Reihe von Updates an, und einige davon sind wirklich interessant.