Künstliche Intelligenz (KI) prägt immer mehr Lebensbereiche und auch die Musik. Die Möglichkeiten reichen von KI-gestütztem Song-Mastering bis zu ganzen Musikvideos, von Produktion bis Promotion. Was geht verloren, wenn der Mensch musikalisch durch die Maschine ersetzt wird? Einiges, aber da sind auch Chancen,
sagen Sängerin und Komponistin Balbina sowie Sänger und Songwriter Johannes Oerding im Gespräch mit den KI-Expert:innen Alexandra Wudel und Maximilian Raabe.

BALBINA
"Morgen wird es besser, hör nicht auf zu träumen, alles wird gut werden“ heißt es in dem Popsong, den ich euch zur Vorbereitung auf unser Gespräch geschickt habe. Sowohl Text als auch Musik und männliche Gesangsstimme darin sind KI-generiert. Wie ging es euch beim Hören damit?"

*Hier gelangst Du zum KI-generierten Song*

JOHANNES OERDING
"Ich habe den Song mit sensiblen Ohren gehört. Was ist anders als bei der Musik, die ich mache und sonst höre? Im Vergleich dazu wirkt der Track ein bisschen konstruierter, gleichmäßiger. Der Text ist recht plakativ, man merkt schon, da wird etwas zusammengewürfelt, den- noch erkennt man die Aussage eindeutig. Es ist ein fertiger Pop-Song mit einer eingängigen Melodie, fertigen Akkorden. Auch wenn ich glaube, gehört zu haben, dass er künstlich generiert wirkt, fast wie gesampelt, ist er nah dran an gängigen Pop-Liedern, auf denen die Stimme klingt, als hätte man ein paar Töne geradegebogen. Was die Aussage anbelangt: Ob alles besser wird, wie die KI sagt, kann ich nicht beurteilen, doch es wird sich auf jeden Fall ganz viel verändern. Davor möchte ich mich nicht verschließen."

BALBINA
"Könntest du dir vorstellen, dass man so einen Song als Basis nutzt, um daraus etwas zu entwickeln?"

JOHANNES OERDING
"Absolut, ich habe mich die letzten Monate mit Freunden aus Spaß damit beschäftigt, was ChatGPT oder auch der Song-Generator Suno so können. Das Ergebnis war eine Mischung aus Grusel und Staunen, wie schnell und wie gut die Resultate dann doch scheinen. Ich persönlich kann mir sogar vorstellen sowas zumindest in den Brainstorming-Prozess einzubeziehen. Ich glaube, jeder Songwriter hat schon mal ein Reim-Lexikon in die Hand genommen oder im Internet nach Synonymen gesucht. Solch eine Art von KI-Recherche scheint mir ähnlich zu solchen Prozessen – aber eben als Sammlung von Reimen und Worten für die Textdichtung, nicht musikalisch. Meines Erachtens klingt das kompositorisch vielfach sehr holprig und nach 08/15."

BALBINA
"Alexandra, du bist CEO von FemAI, Expertin für Ethik im Bereich KI und wurdest dieses Jahr vom Digitalbranchen- Magazin t3n zur AI Person of the Year gewählt. Musik ist nicht dein Beruf. Wie hast du den Song wahrgenommen?."

ALEXANDRA
"Wenn ich mir vorstelle, dass ich diesen Song im Radio gehört hätte, hätte ich nicht nachgeguckt, wer der Interpret ist. Ich hätte mich auch nicht daran erinnert, worum es im Song geht. Mir hat die Emotionalität darin gefehlt und die Innovation. Da schließe ich mich Johannes an. Der Track war nicht catchy, eher repetitiv und generisch."

BALBINA
"KI mit relativ wenigen Stichworten gefüttert – Singer-Songwriter, Deutschpoeten, Gitarrenmusik, Uptempo und dass der Song von Hoffnung handeln soll. Die männliche Stimme habe ich mit dem Gedanken gewählt, dass Johannes sich even- tuell damit identifizieren kann."

ALEXANDRA
"Interessant, was eine KI mit minimalem Einsatz von Stichworten so liefert. Daran kann man gut ablesen, wie sie bestimmte Stile definiert. Was ist zum Beispiel Genrerelevant bei Rap und was bei Pop? Da kann es schnell passieren, dass in solchen Songtexten Sexismus oder andere Diskriminierungsformen reproduziert werden."

BALBINA
"Maximilian, als jemand, der auf dem Instagram-Channel ai.your.life KI-Fortschritt dokumentiert: Wie stehst du zu den Risiken und Vorteilen?"

MAXIMILIAN
"Lustigerweise habe ich gestern eine Story dazu gemacht. Jemand hatte mich gefragt: „Maxi, ist KI gefährlich?“ Ich entgegnete mit einem klaren Ja. Meines Erachtens ist den Gründern von ChatGPT das Thema Sicherheit nicht allzu wichtig. Die haben ihr Security-Team, das sich mit den Risiken von künstlicher Intelligenz beschäftigt, in den letzten neun Monaten größtenteils entlassen. KI bietet Hammer-Möglichkeiten, Prozesse zu optimieren, das wird vieles verändern. In der Musikbranche kann es dazu führen, Textideen zu brainstormen und zu entwickeln, Kompositionen zu testen und wieder zu verwerfen, ohne viel Aufwand, genau wie Johannes gesagt hat. Sicher wird es auch Menschen geben, die KI für die Erstellung kompletter Tracks nutzen. Wahrscheinlich wird beides koexistieren. Andererseits werden sowohl Suno als auch KI-Videoproduktions-Applikationen gerade großflächig abgemahnt und verklagt, weil sie ihre Content-Datenbanken mit nicht-lizensiertem Material trainiert haben. Da wurden Daten von Spielfilmen benutzt, für deren Nutzung man eine Erlaubnis braucht, was meist sehr viel Geld kostet."

BALBINA
"Das neue Update von ChatGPT 4.0 kann emotionale Fähigkeiten simulieren. Damit soll man unter anderem Avatare für Dating-Apps diversifizieren und emotionalisieren können. Am Song habt ihr die fehlende Gefühlsebene von KI bemängelt. Offenbar wird die bald aber erfahrbar."

MAXIMILIAN
"Emotionalität in KI zu verankern, kann sehr gefährlich sein, weil es das Digitale menschlich wirken lässt. Das könnte unsere Wahrnehmung verfälschen und sie auf die Probe stellen. Ich vergleiche KI manchmal mit einem kleinen Kind: Du musst Grenzen setzen, um Gefahren einzudämmen, denn von selbst wird sie sich nicht regulieren, weil KI kein Bewusstsein für mögliche Konsequenzen hat. Ein bisschen langsamer zu machen, täte da gut. Und es braucht gesetzliche Rahmenbedingungen, um Risiken einzudämmen."

JOHANNES
"Schon, dass man KI manchmal nicht erkennt, ist gefährlich. Du siehst perfekte Menschen im Feed und bekommst ein falsches Abbild der Realität, das dich prägt. Oder um beim Beispiel Musik zu bleiben: Du testest herum, forderst die KI heraus, Lieder in deinem Stil zu generieren, und merkst, dass das zwar nicht du bist, aber es ist schon gefährlich nah dran an dir."

BALBINA
"Wahrscheinlich ist es bloß eine Frage der Zeit und des KI-Trainings, bis man KI-generierte Werke erschaffen kann, die exakt nach bestimmten Interpret:innen oder Songwriter:innen klingen, obwohl die mit der Entstehung nicht im Ansatz was zu tun hatten. Der vermeintliche Depeche-Mode-Song "Like a Mystery“, der dieses Frühjahr im Netz auftauchte, war ein Wake-up-Call für viele Musiker:innen – dass KI solche Möglichkeiten bietet, wussten viele nicht."

 

JOHANNES
"Momentan herrscht wirklich viel Un- wissen, auch Genre-spezifisch. In meiner Welt, wo vieles analog eingespielt, produziert und aufgenommen wird, setzt man noch auf das Alleinstellungsmerkmal und blendet mögliche Veränderungen durch KI oft aus. Im Hip-Hop oder der elektronischen Musik, wo schon hauptsächlich digital gearbeitet wird, ist das anders. Dort ist man es gewohnt, mit digitalen Datenbanken von Samples zu arbeiten."

BALBINA
"Alexandra, du hast mit ai.your.life und POLYTON im Kanzleramt eine Begegnung von Kreativschaffenden zum Thema KI initiiert. Welche Eindrücke hast du mitgenommen?"

ALEXANDRA
"Es dominieren Sorgen und Hilflosigkeit. Ich sehe die Notwendigkeit, im Rahmen von zum Beispiel POLYTON Kräfte von Musikschaffenden zu bündeln, um diese Themen im gesellschaftspolitischen Diskurs zu thematisieren. Machtdifferenzen zwischen den KI-Netzwerken und jenen, die die Inhalte für diese Netzwerke überhaupt erst liefern, sind fast unüberbrückbar. Das Machtgefälle in der Musikindustrie war schon immer ausgeprägt, jetzt kommt ein neuer Stakeholder dazu, der das Feld an sich reißt. Wir sehen, dass marginalisierte Gruppen noch stärker marginalisiert werden, und erleben täglich, dass Wissen fehlt. Nur jene, denen es gelingt, sich die aktuellste Technologie zu eigen zu machen, können in ihren Berufsfeldern bestehen. Alle anderen fühlen sich und werden faktisch abgehängt."

MAXIMILIAN
"Felix Lobrecht verbietet in seinen Shows Handys, um die Aufmerksamkeit vom Digitalen zum gemeinsam Erlebten zu lenken. Dieser Aspekt kommt mir in der KI-Entwicklung zu kurz, die Vereinsamung der Menschen. Das Wertvollste für mich sind Zeit und menschliche Begegnung. Ich wünsche mir Debatten, in denen es darum geht, welche analogen Räume wir parallel zur KI-Evolution neu schaffen. Wo kann ich KI nutzen, um Zeit zu sparen, die ich dann in Real-Life-Erfahrungen investiere? Diese Verantwortung könnten die neuen KI-Plattformen implementieren."

ALEXANDRA
"Bei FemAI haben wir Deepfake-Detection-Tools für ein Paper ausgewertet und an der essenziellen Verantwortung der Konzerne kommt man da nicht vorbei. Können wir nicht gerade durch diesen Fortschritt gleichzeitig Probleme lösen und Gemeinschaft neu denken? Indem wir zum Beispiel Deepfakes mit Hilfe von Technologie sofort erkennen und dazu beitragen, dass sie wieder verschwinden? Wer watermarkt Content und an welcher Stelle genau liegt die Verantwortung der KI-Konzerne oder Plattformen? Man kann nicht erwarten, dass die Gesellschaft hinterherkommt beidem rasanten Fortschritt, den die Industrie selbst befeuert. Deshalb sind Initiativen wie unsere essenziell für Aufklärung. Ich sehe an meiner Tätigkeit im Bundestag, wie wichtig es ist, politische Vertreter:innen engmaschig auf dem neuesten Stand zu halten."

BALBINA
"Johannes, spürst du diesen Widerspruch und Wandel, wenn du auf die Bühne gehst und deine Fans erlebst?"

JOHANNES
"Es gibt meiner Meinung nach drei Ebenen innerhalb der Popmusik-Landschaft. Wir haben einmal die Audio-Ebene – die Leute hören einen Song im Streaming oder im Radio, sie genießen den Tonträger. Die zweite Ebene ist für mich der Begleitkonsum zu den Werken, also Musikvideos, Social-Media-Content der Artists, Merchandise und so weiter. Die wichtigste und interessanteste Ebene ist für mich die dritte: Das Interagieren mit den Menschen, in Verbindung mit Hören, Sehen und Spüren. Das gemeinsame Konzert-Erlebnis also, vielleicht aber auch eine digitale Jam-Session. Man erlebt gemeinsam ein einzigartiges Event: „Ich war dabei auf der Loreley, als er vor 10.000 Leuten irgendwie die Traverse hochgeklettert ist und von da oben ,Kreise‘ gesungen hat. Das hat er nur da gemacht und das hat er nur für uns gemacht.“ Ich glaube, genau das sind kleine Kostbarkeiten, die Menschen für sich aus dem Alltag filtern und die 79 das Leben besonders machen. Man holt die Leute in solchen Momenten vom Bildschirm weg in die Gegenwart."

BALBINA
"Nur sind Konzerterlebnisse nach Corona leider so teuer geworden, dass viele Leute sich Tickets nicht mehr leisten können und zu Hause bleiben."

ALEXANDRA
"Die Musikindustrie muss sich neu erfinden, Räume neu denken, sonst wird das nicht funktionieren. Was für Erlebnisse möchte man als Künstler:in seinen Fans bieten, welche Dienstleistungen müssen konzernseitig dafür erbracht werden? Es muss von Grund auf umgedacht werden."

BALBINA
"Es geht also um das Erleben von Authentizität. Nur kann die leider trügerisch sein. Um nochmal zu unserem besprochenen KI-Song zurückzukommen: Er scheint eine andere Wirkung zu haben, wenn er von einer Sängerin interpretiert wird. Ich habe das Lied einem Freund vorgesungen, mit maximaler Interpretationsdichte – und es hat gewirkt. Der Song wurde als authentische Emotion wahrgenommen. Ein Gänsehautmoment aus der Dose?"

JOHANNES
"Das mag arrogant klingen, für mich ist das aber der Grund, weshalb Menschen immer zu Live-Konzerten gehen werden. Denn auf der Bühne steht ein Mensch mit all seinen Emotionen und interpretiert Musik auf seine ganz eigene Art in einem ganz bestimmten Augenblick, mit dem Transportmittel Stimme und mit Instrument oder Tanz. Der gegenwärtige Ausdruck veredelt nicht nur das Werk, er macht es erlebbar. Authentizität wird immer relevant sein."

BALBINA
"Gleichzeitig sind Konzertbesuche eher eine Ausnahme. Deep-Fake-Szenarien warten dagegen leider in jeder Ecke des Internets. Wenn zum KI-Song plötzlich auch noch der authentische Johannes-Oer- ding-Video-Clip auftaucht, kann es gefährlich werden, oder?"

ALEXANDRA
"Die Forschung zeigt, dass die meisten Deepfakes mit Protagonist:innen aus
der Entertainment-Industrie arbeiten. 53 Prozent aller Opfer von Deepfakes sind Sängerinnen und Schauspielerinnen, also Frauen. Als wir im Bundeskanzleramt vorgestellt haben, was mit Eleven- Labs und HeyGen möglich ist, waren viele schockiert. Die Daten der jeweiligen Musiker:innen sind durch Konzertvideos, Interviews und Spielfilme überall online verfügbar."

BALBINA
"Wie kann europäische Gesetzgebung dagegenhalten? Aktuell werden die meisten KI-Patente pro Woche in China angemeldet. Globale Stakeholder außerhalb der EU legen also eigene Regularien und Wertesysteme an und diktieren damit dann wirtschaftlich und politisch die Bedingungen auf unserem Markt, siehe zum Beispiel TikTok."

ALEXANDRA
"Europäische Gesetze sind trotzdem anwendbar. Der Digital Service Act greift auch bei TikTok innerhalb der EU. Und der EU AI Act reguliert KI, die hier angewendet wird, egal, ob das Unternehmen aus Europa kommt oder nicht. Selbstverständlich müssen diese Gesetzesgrundlagen schnell umfassender werden, aber ich sehe da einen guten Weg."

BALBINA
"Wir sprechen viel von neuen Machtstrukturen in der Musikindustrie. Parallel dazu findet eine Demokratisierung statt bei den Zugängen zu Feldern wie der Musik-Produktion oder Musik-Promotion. Wer geringe finanzielle Ressourcen hat, kann musikalische Ideen auch ohne Vitamin B und ohne hohen technischen Aufwand auf Marktniveau umsetzen. Ein gutes Bespiel sind da Frauen in technischen Musikberufen, die mit Hilfe technischer KI-Tools schneller Fuß fassen können in der Branche."

MAXIMILIAN
"Das ist der schöne Part daran. Recording mit wenig Geld, einfach am Handy, kann man bald in Studio-Qualität hinbekommen. Das ist auch der Grund, warum es uns bei ai.your.life so wichtig ist, über KI-Innovationen aufzuklären. KI schafft Zugänge. Es gibt mittlerweile Tools, die Sounds fertig mixen und mastern. Für Newcomer, die sich diese Schritte nicht leisten können, ist das von Vorteil. Gleichzeitig bedroht diese Entwicklung ganze Berufsfelder. Das zeigt den Widerspruch: Der Fortschritt geht auf Kosten vieler gelernter Strukturen."

ALEXANDRA
"Was wir auch immer betrachten: Wie lange hat das gedauert? Wie hoch
war der Energieverbrauch? War das jetzt effizienter, als wenn ein Mensch es erledigt hätte? Wenn wir sehr, sehr viele Interaktionen mit solchen Systemen haben, wird es Menschen und Ressourcen geben müssen, die diese Interaktionen ermöglichen. Wie viel Wasser verbraucht dann zum Beispiel ein Large Language Model wie ChatGPT? Die Jobs, die an einer Stelle wegfallen, schaffen an anderer neue Herausforderungen, die man auch ethisch einordnen muss."

BALBINA
"Maximilian, ich frage mich, ob wir gerade etwas Ähnliches erleben wie
in den 1990er Jahren, als sich der Personal Computer in allen Lebensbereichen etablierte. Bauzeichner:innen oder Schriftsetzer:innen wurden plötzlich arbeitslos, und man musste Programme wie Corel Draw erlernen."

MAXIMILIAN
"KI wird Jobs so schnell ersetzen, wie wir es noch nie gesehen haben. Das ist ein Fakt, keine Spekulation. Die Leute machen sich Sorgen und fragen mich ständig, welches Buch sie lesen sollen, um sich auf die kommende Dekade vorzubereiten. Ich entgegne stets das Gleiche: „Wie man Freunde gewinnt“ von Dale Carnegie. Der Grund: Peter Thiel, Elon Musk und Mark Zuckerberg, quasi die Elite der KI-Gestalter, sagen, dass Soft Skills das Allerwichtigste für unser nächstes Zeitalter werden. Mit Soft Skills meinen sie Kommunikation und Empathie im wirtschaftlichen Kon- text, der unsere Gesellschaft kommunikativ prägen wird. Deswegen gebe ich Johannes mit seiner Einschätzung der dritten Ebene vollkommen Recht – die Interaktion ist entscheidend. Klarna soll mit der Abschaffung des Kundendienstes seinen Gewinn dieses Jahr um 40 Millionen Dollar gesteigert haben. Viele Unternehmen werden folgen. Doch was ist, wenn die Menschheit einen wachsenden Wil- len nach authentischen Erlebnissen entwickelt? Dann werden einzigartige Kundenerlebnisse eventuell wieder zur Marktlücke und es findet eine dynamische Gegenbewegung statt, alles ist möglich."

BALBINA
"Die Moralphilosophin Eva Weber-Guskar warnte im Spiegel kürzlich vor emotional wirkenden künstlichen Intelligenzen, indem man die Maschine immer mehr dem Menschen annähert. Meint ihr, es wird irgendwann real wirkende KI-Avatare
von uns geben, die uns womöglich sogar überleben?"

JOHANNES
"Der Film „Transcendence“ behandelt genau diese Thematik. Ich halte
das nicht für utopisch. Ich finde die Vorstellung nicht schön, einen mich überlebenden digitalen Avatar zu haben. Die höchste Intelligenz auf der Welt ist die Natur. Ich mag es nicht, wenn wir in die Natur eingreifen, in unsere natürlichen Prozesse. Wenn du lebst, gehört der Tod dazu, das ist die Polarität, die wir haben. Wenn es links gibt, gibt es rechts. In den Sterbeprozess digital einzugreifen, finde ich falsch."

MAXIMILIAN
"Natürlich wäre ich gern weiter in Kontakt mit meiner verstorbenen Oma und
ich verstehe den Wunsch, seine Liebsten nicht verlieren zu wollen. Wenn wir versuchen, die Natur zu leugnen oder zu unterdrücken, sucht sie sich ihren Ausweg, und das führt meist zu unvorhersehbarer Gegenwehr. Der Versuch, den Tod zu überbrücken, schmälert den Wert des Lebens."

JOHANNES
"Ich geb’ dir Recht, Maxi, das empfinde ich als unheimlich."

BALBINA
"Unser KI-Song wiederholt das  folgende Mantra: „Komm, gib nicht auf, die Welt dreht sich weiter, halt fest an deinem Glauben!“ Hat die KI recht – schafft die Menschheit es, sich die KI zu Nutze zu machen, ohne sich vollends in ihr zu verlieren und sich ihr zu unterwerfen?"

MAXIMILIAN
"Ich würde niemals in meinem Leben die Hoffnung aufgeben, weil ich grundsätzlich keinen Vorteil im Aufgeben sehe. Sogar, wenn die KI-Prognosen auf eine dystopische Zukunft hinweisen würden, würde ich an das gute Szenario glauben."

JOHANNES
"Ich stimme dem aus einem anderen Gefühl heraus zu. Wir haben schon einige Strukturwandel auf dieser Welt hinter uns, vom Kohlebergbau hinzu alternativen Energien, was ein paar Jahrzehnte lang gedauert hat, aber wir sind auf einem guten Weg. Auch der Strukturwandel der Musikindustrie hat vielfältige Musik nicht verstummen lassen. Vom Plattenspieler über CDs, MP3 bis hin zum Streaming. Auch wenn es hohe Reibungsverluste gibt, die Menschheit ist anpassungsfähig, darauf vertraue ich."