MusicLM

MusicLM von Google generiert aus einfachen Texteingaben hochwertige, realistische Musik. Entdecken Sie Beispiele und sehen Sie, wie KI Ihre Worte in ausdrucksstarke, genreübergreifende Audiokompositionen verwandelt.

Zur KI gehen
MusicLM cover

Über MusicLM

KI-gestützte Musikgenerierung aus Text

MusicLM ist ein leistungsstarkes Musikgenerierungsmodell von Google Research, das Beschreibungen in natürlicher Sprache in hochwertige Musik umwandelt. Ob Sie eine beruhigende Klaviermelodie, einen energiegeladenen Techno-Beat oder ein synchron jammendes Jazz-Trio wünschen — MusicLM interpretiert Ihre Ideen und wandelt sie in originelle Audioinhalte um.

Hierarchische Sequenz-zu-Sequenz-Modellierung

Das Modell generiert Musik mithilfe einer hierarchischen Struktur, wodurch lange und zusammenhängende Audioclips mit 24 kHz erzeugt werden können. Dies gewährleistet sowohl Klarheit als auch musikalische Kontinuität über mehrere Minuten Wiedergabe.

So funktioniert MusicLM

Textbasierte Komposition

Nutzer geben detaillierte oder einfache Textbeschreibungen an — etwa «ein entspannendes Jazzstück mit Klavier und sanftem Schlagzeug» — und MusicLM komponiert Musik, die sowohl dem beschriebenen Genre als auch der emotionalen Stimmung entspricht. Es erkennt und reproduziert Nuancen in Stil, Tempo, Instrumentierung und Stimmung.

Doppelte Konditionierung: Text und Melodie

Neben Texteingaben kann MusicLM auch Melodiekonditionierung einbeziehen. Das bedeutet, dass Sie eine Melodie summen oder pfeifen können und diese anhand Ihrer Texteingabe in ein stilistisch passendes Musikstück umgewandelt wird.

MusicLM-Funktionen

Langform-Generation

MusicLM zeichnet sich durch die Erstellung längerer Kompositionen aus, die über mehrere Minuten hinweg thematische und harmonische Konsistenz beibehalten. Dies ist ideal für Hintergrundmusik, Erzählungen oder Ambient-Musik.

Story-Modus

Mithilfe einer Abfolge von Eingabeaufforderungen können Nutzer Audioinhalte generieren, die sich im Laufe der Zeit verändern. Beispielsweise könnte ein Stück als meditativer Soundtrack beginnen und sich allmählich zu einem energiegeladenen Workout-Beat entwickeln, wodurch jede Phase einer Erzählung oder Erfahrung widergespiegelt wird.

Anwendungsfälle für MusicLM

Kreative Projekte

Komponisten, Filmemacher und Kreative können mit MusicLM Musik erzeugen, die ihrer Vision entspricht — ganz ohne traditionelle Produktionswerkzeuge. Einfach die Szene beschreiben, und MusicLM erstellt den passenden Soundtrack.

Musikexperimente

Künstler können neue Genres erkunden, Instrumente miteinander vermischen oder Variationen derselben Idee entwickeln, um unerwartete Inspiration zu finden.

Anwendungen in Bildung und Forschung

Mit seinem veröffentlichten MusicCaps-Datensatz von 5.500 Musik-Text-Paaren unterstützt MusicLM auch die akademische Forschung in den Bereichen Musikgenerierung und maschinelles Lernen.

Beispiele dafür, was MusicLM generieren kann

Aus den Beschreibungen

  • «A fusion of reggaeton and electronic dance music, with a spacey, otherworldly sound.»
  • «Slow tempo, bass-and-drums-led reggae with relaxed vocals and sustained electric guitar.»

Von bildinspirierten Bildunterschriften

  • The Persistence of Memory by Salvador Dalí becomes an eerie, surreal soundscape.
  • Dance by Henri Matisse inspires upbeat, joyful rhythms with collective energy.

Von Instrumenten oder Genres

  • Generate solo compositions based on instruments like cello, flute, or electric guitar.
  • Choose from genres such as ambient, 8-bit, big beat, or 90s house.

Technische Highlights

  • 24 kHz Audio Output: Professional-quality audio generation.
  • Multi-minute Duration: Capable of maintaining structure and theme.
  • Melody Conditioning: Hummed or whistled melodies guide the output.
  • Diversity Testing: Generates multiple variations from the same prompt to show creative range.

Alternative Werkzeuge