Cybergrajek. Sztuka generatywna, czyli sztuka tworzona przez algorytmy komputerowe [Rozmowa w PnŚ]

Jakie cechy naszego umysłu są najbardziej tajemnicze? 🤔 Wiele osób odpowiada, że kreatywność lub wyobraźnia i jest to właściwe tylko człowiekowi. Nic bardziej mylnego, komputery również mogą być kreatywne! 🤖🤓


Sztuka generatywna – sztuka tworzona przez algorytmy komputerowe.

Automatyczne generowanie muzyki ma już pół wieku, pierwszy utwór powstał w 1957 roku – dwaj naukowcy z Uniwersytetu w Illinois wygenerowali kompozycję dla kwartetu smyczkowego, korzystając z techniki zwanej łańcuchami Markowa.


Do tej pory mieliśmy wiele różnych prób stworzenia cyfrowego grajka, jednak to system Jukebox firmy OpenAI, który powstał w kwietniu 2020 roku, jest w tej chwili najlepszy. Przewyższa wszystkie programy, które do tej pory powstały - pod względem jakości i wszechstronności. Wykorzystuje zaawansowaną technikę generowania SUROWEGO sygnału audio - nie składa go z „cegiełek” MIDI w postaci gotowych dźwięków, jak to robiły poprzednie systemy, tylko odtwarza surowy dźwięk. Oprócz komponowania melodii, Jukebox potrafi śpiewać głosem dowolnych artystów (żyjących lub nieżyjących) lub napisać tekst piosenki (we współpracy z algorytmem GPT- 2). Piosenki zachowują przy tym spójność obejmującą kilka minut.
Modele Jukebox mogą produkować utwory z bardzo różnorodnych gatunków muzycznych, takich jak rock, hip-hop i jazz… Sercem rozwiązania jest sztuczna inteligencja, a dokładnie konwolucyjne sztuczne sieci neuronowe, które uczą się komponowania piosenek słuchając utworów napisanych wcześniej przez człowieka. Program przesłuchał w tym celu 1,2 mln utworów, które znalazły się w bazie danych zawierającej m.in. przeboje najpopularniejszych artystów. W trakcie uczenia sztucznej inteligencji (oprócz samej piosenki) są dostarczane dodatkowe warunkujące informacje, takie jak: [artysta piosenki], [album], [gatunek], [styl muzyczny], [tekst]. Dzięki temu sztuczna inteligencja może nauczyć się, jaki jest związek pomiędzy tymi parametrami a piosenkami, co pozwala jej odkryć przepis na melodię opisaną przez te parametry.
Aby skomponować nową piosenkę, najpierw uczymy sztuczną inteligencję, a później zadajemy jej własne parametry warunkujące – czyli podajemy na wejście AI interesujący nas styl muzyczny, artystę, tekst itd. Oczywiście tekst do piosenki może zostać również napisany automatycznie, przez współpracujący algorytm GPT-2 – wystarczy, że określimy temat, na jaki ma być piosenka. Po podaniu parametrów sztuczna inteligencja zaczyna pracę - po kilkunastu godzinach mamy unikalną piosenkę, w całości skomponowaną, zagraną i zaśpiewaną przez sztuczną inteligencję.
Jak to brzmi? Przykład wskrzeszonego Elvisa Presleya, Franka Sinatry, Celine Dion i Elli Fitzgerald pokazaliśmy we wczorajszej rozmowie w Pytanie na śniadanie, do której link znajdziecie tutaj

👉👉 https://pytanienasniadanie.tvp.pl/48496845/i-ty-mozesz-spiewac-jak-elvis-presley-czy-celine-dion