Beethoven AI Project

9 września 2021 roku w Bonn w Niemczech odbyła się premiera dokończonej wersji 10 symfonii Beethovena. 200 letnie opóźnienie premiery nie było jednak spowodowane zgubieniem materiałów ani ukryciem publikacji przez niemieckiego kompozytora. Ludwik zwyczajnie nie zdążył dokończyć swojej pracy. Na szczęście, prawie dwa wieki po jego śmierci, zrobiła to za niego sztuczna inteligencja.

24 miesiące wcześniej grupa pod nadzorem kompozytora Waltera Wezowa i Profesora Ahmeda Elgammala zebrała niedokończone szkice 10 symfonii. Nakarmili oni nimi sztuczną inteligencję (AI – artificial intelligence) i dorzucili poprzednie prace autora. To pomogło programowi „zrozumieć” styl komponowania muzyka.

Kolejne kilkanaście miesięcy Walter spędził słuchając owoców współpracy Beethovena i AI. Jego zadaniem było wybierać te utwory, które brzmiały najbardziej wiarygodnie.

Gdy próbna wersja została zagrana po raz pierwszy ani dziennikarze, ani muzycy nie potrafili usłyszeć różnicy między częścią oryginalną i dodaną. Zespół wiedział wtedy że jest na dobrej drodze. Po dokonaniu ostatnich szlifów, ukończone dzieło zostało udostępnione szerokiej publiczności w internecie w dzień premierowego koncertu.

 

Test Turinga i Chatboty

Droga do tego etapu zajęła ludzkości blisko 70 lat. Co prawda pierwsze wzmianki o „sztucznej inteligencji” znajdziemy już w siedemnastowiecznych tekstach Kartezjusza (w formie rozmyślań o istnieniu umysłu oddzielonego od ciała), ale to Alan Turing jako pierwszy ugryzł temat od strony technologii. Dla tych którzy nie są pewni skąd kojarzą to nazwisko: Turing zyskał sławę, gdy w oparciu o prace polskich kryptologów, zbudował pierwsze urządzenie do łamania kodu enigmy w czasie II wojny światowej.

W 1950 roku Alan wydał artykuł pt. „Computing Machinery and Intelligence”.  Opisał w nim test, który miał weryfikować, czy maszyna może być uznana za inteligentną. Pierwszym krokiem było umieszczenie sędziego w odizolowanym pokoju. Po drugiej stronie ściany przebywał człowiek i komputer. Sędzia odbywał (zwykle w formie tekstowej) dyskusję z jednym i drugim. Po jej zakończeniu jego zadaniem było zweryfikować kto jest osobą, a kto komputerem. Jeśli sędzia nie potrafił ich rozróżnić, to maszyna zdawała Test Turinga.

Pierwszym pretendentem była Eliza — stworzony w 1966 chatbot psychoterapeuta. Eliza próbowała znajdować słowa kluczowe w komunikatach użytkowników i na ich podstawie tworzyć odpowiedzi. Gdy nie wiedziała co powiedzieć — zachęcała do dalszego uzewnętrzniania się. Oczywiście nie wystarczyło to, by przekonać sędziów o jej inteligencji.

Przez kolejne lata powstawały coraz bardziej rozbudowane wersje chatbotów. Przykładami mogą być:

  • PARRY — wydany w 1972 chatbot udający człowieka ze schizofrenią,
  • Cleverbot — stworzony w 1997 chatbot, który stale zbiera od użytkowników dane i wykorzystuje ich własne sposoby odpowiedzi,
  • Eugene Goostman — chatbot z 2001 udający 13 letniego ukraińskiego chłopca,
  • Kuki — chatbot będący uosobieniem 18 letniej kobiety, działający przez stronę internetową, messengera, twitcha, discorda, a wkrótce mający mieć również swoją wersję wideo.

Dotychczas najlepsze chatboty osiągnęły zdawalność testu Turinga rzędu 30-35%. Najbardziej obiecująca wydaje się być Kuki, która pięciokrotnie wygrała nagrodę Loebnera, przyznawaną najbardziej wiarygodnym chatbotom.

Na uwagę zasługuje również twitterowy chatbot Tay wypuszczony przez Microsoft. Jest on zwykle pomijany w różnych rankingach ze względu na swój krótki żywot; Tay był bowiem aktywny jedyne 16 godzin. Przez ten czas zdążył jednak nauczyć się wielu zachowań użytkowników i opublikować posty takie jak te:

 

Trzy typy sztucznej inteligencji

Test Turinga był przełomowym pomysłem jak na swoje czasy, ale dziś jesteśmy zmuszeni rozszerzyć nieco definicję AI. W końcu ciężko porównać ze sobą inteligencję używaną przy rekomendowaniu nam filmów na Netflixie do tej, która byłaby bardziej inteligentna od nas samych. Ale, no właśnie — czym właściwie jest inteligencja?

Jak zwykle, w przypadku tak abstrakcyjnych konceptów, definicji jest wiele. Większość z nich jednak zawiera w sobie takie sformułowania jak „zdolność do adaptacji do otoczenia” czy „zdolność do uczenia się i wykorzystania wiedzy i umiejętności w różnych sytuacjach”. 

Jednym ze sposobów klasyfikacji jest podział na trzy typy sztucznej inteligencji. Są to:

  • Słaba (wąska) AI, 
  • Silna (Generalna) AI oraz 
  • Super AI 

Jedynie o dwóch ostatnich można powiedzieć, że podpadają pod ogólną definicję inteligencji.

Dotychczas udało się stworzyć jedynie Słabą AI. Ten rodzaj skupia się na wykonaniu jednego konkretnego zadania. Przykładami takiej sztucznej inteligencji mogą być Deep Blue — pierwszy szachowy komputer, który pokonał mistrza świata czy Siri — inteligentny asystent systemów Apple rozpoznający naturalną mowę. Do tej kategorii zaliczymy również wspomnianą już AI kończącą 10 symfonię Beethovena.

Słaba AI wykorzystuje w celu samodoskonalenia systemy takie jak deep learning. Polega on na tworzeniu wirtualnych sieci neuronowych, które analizują zebrane dane i wynajdują ukryte w nich prawidłowości. Przykładowo: sztuczna inteligencja nakarmiona zdjęciami banana, będzie w stanie odróżnić go od innych owoców za pomocą znalezionych wskazówek takich jak zarys kształtu czy kolor.

Silna AI ma z kolei być naprawdę inteligentna. Musi rozumieć wieloznaczne konteksty, rozwiązywać nowe problemy, mieć samoświadomość, własne poglądy oraz theory of mind (umiejętność przyjmowania cudzej perspektywy). W skrócie — ma być odwzorowaniem ludzkiego umysłu.

Niektórzy twierdzą, że od stworzenia Silnej AI do Super AI jest niedługa droga. Inteligentny program może być w stanie udoskonalać się sam znacznie efektywniej niż z ludzką pomocą. Może zaprojektować komputer, na którym jego moc obliczeniowa wzrośnie wielokrotnie lub maksymalnie zoptymalizować swój kod. Ten nagły skok wydaje się być jednym z największych powodów do obaw. Może bowiem okazać się, że Super AI powstanie tak szybko, że nawet się nie zorientujemy.

 

Sztuczna inteligencja dziś

Już dzisiaj jednak zobaczyć można wpływ sztucznej inteligencji na prawie każdą dziedzinę naszego życia. Ma ona swoje zastosowanie w:

    • mediach społecznościowych — pokazuje najbardziej interesujące posty na podstawie naszej aktywności, wykrywa mowę nienawiści czy zachowania wskazujące na myśli samobójcze,
    • wyszukiwarkach — wybiera najtrafniejsze wyniki na podstawie słów kluczowych, naszej historii oraz lokalizacji.
    • mapach — przewiduje korki i wskazuje potencjalnie niebezpieczne skrzyżowania,
    • zakupach internetowych — proponuje interesujące produkty i dobiera ich ceny w zależności od związanych z nami danych (takich jak marka telefonu którego używamy czy częstość odwiedzania produktu),
    • serwisach streamingowych — automatycznie tworzy playlisty z najchętniej słuchanych piosenek czy sugeruje nowe utwory,
    • skrzynkach mailowych — identyfikuje spam oraz najbardziej istotne wiadomości, a także samemu układa odpowiedzi na maile,
    • zabezpieczeniach — na przykład w postaci Face ID, gdzie algorytm „uczy się” twarzy użytkownika,
    • grach komputerowych — steruje postaciami niegrywalnymi czy oblicza fizykę silnika,
    • medycynie — rozpoznaje choroby ze zdjęć lub przewiduje, czy osoba ma predyspozycje do zawału.

Oprócz tego AI działa też prężnie w dziedzinach bardziej rozrywkowych. Znaleźć można na przykład algorytm zmieniający zdjęcie w obraz któregoś ze znanych malarzy czy próby stworzenia nowych rozdziałów Harry’ego Pottera (Polecam sprawdzić, można umrzeć ze śmiechu). Ba, sztuczna inteligencja może nam nawet wygenerować nowego mema.

Wpływ AI można znaleźć również w muzyce rozrywkowej. Robot Shimon gra na Marimbie i potrafi improwizować z zespołem. I mówiąc improwizować nie mam na myśli tylko obsługi instrumentu. Shimon potrafi bowiem również generować i śpiewać całkiem nowe teksty!

Inną ciekawą postacią w artystycznym światku jest AIVA (Artificial Intelligence Virtual Artist). Ta AI nie ma co prawda swojej fizycznej formy, ale potrafi za to komponować całe piosenki. AIVA skupia się głównie na muzyce filmowej, podniosłej i fantastycznej. I szczerze mówiąc, jej utwory potrafią wywołać ciarki.

 

Granica między człowiekiem i AI

15 stycznia 2020 roku menadżer banku mieszczącego się w Hong Kongu otrzymał telefon od poznanego niedawno dyrektora jednej z firm. Dyrektor opowiedział mu o dużej inwestycji, do której trzeba dokonać transferu 35 milionów dolarów. Menedżer po konsultacji z prawnikiem zlecił mu wykonanie przelewów.

Jakież było jego zdziwienie, gdy już po ich wykonaniu ten sam dyrektor skontaktował się z nim twierdząc, że nie wie nic o żadnym zleceniu. Jego głos, choć z pewnością roztrzęsiony, brzmiał tak samo jak podczas poprzedniej rozmowy. Dopiero teraz jednak osoba po drugiej stronie słuchawki była prawdziwym dyrektorem firmy. Okazało się bowiem, że głos dyrektora podrobiony był za pomocą technologii deepfake.

Deepfake to technika pozwalająca na przykład na zmianę głosu czy twarzy aktorów występujących w filmie. Pozwoliła ona przywrócić Paula Walkera do filmu Szybcy i wściekli 7 po tym, gdy zmarł w czasie trwania zdjęć. Jak widać, technologia ta ma jednak drugą, niebezpieczną stronę — stronę, o której mówi (?) sam Barack Obama

Z każdym rokiem powstaje coraz więcej wynalazków, które czynią nasze życie prostszym i bardziej komfortowym. Te same technologie sprawiają też, że granica między tworami ludzkimi, a tymi wychodzącymi spod rąk AI się zaciera.

Przykładowo: Sztuczna inteligencja Lately tworzy posty i artykuły na podstawie przekazanych danych w postaci chociażby filmów. Aktualnie nie jest ona jeszcze w pełni samodzielna, ale to kwestia czasu nim posty na naszym feedzie będą generowane automatycznie. 

Lately może też współpracować z Concured — sztuczną inteligencją, analizującą jaki typ treści jest najbardziej oczekiwany przez użytkowników. Taki zestaw pozwoli AI projektować treści perfekcyjnie uderzające w nasze prawdziwe i wykreowane potrzeby.

A co z muzyką? Cóż, najwyraźniej Spotify jest na drodze do stworzenia algorytmu, który będzie potrafił perfekcyjnie zidentyfikować, które piosenki staną się hitami. Robi to za pomocą testu, który po przeanalizowaniu utworu przyznaje mu punkty w zakresie 0-100. Te, które otrzymają powyżej ⅔ maksymalnego wyniku mają szansę stać się hitami. Aktualnie jego skuteczność w przewidywaniu czy piosenka znajdzie się na liście Top 200 jest na poziomie około 85%.

Jeśli połączymy taki algorytm z działaniem np. Shimona, to możemy się domyśleć, kto stanie się największym w dziejach kozakiem w graniu na Marimbie. 

 

Dalszy rozwój sztucznej inteligencji

Już wkrótce ulubieni bohaterowie z kilkudziesięcioletniego serialu będą mogli reklamować twój ukochany sok. Chyba że akurat masz nastrój na coś mocniejszego, wtedy możliwe że będą reklamować Whisky. Jak to możliwe? Cóż, odpowiedź na to pytanie z pewnością znają programiści z firmy Ryff:

Ale oczywiście nie samą rozrywką i marketingiem człowiek żyje. Czego jeszcze możemy oczekiwać od AI w najbliższym czasie?

Pfizer już dziś wykorzystuje komputer IBM Watson do stworzenia sztucznej inteligencji odkrywającej leki na raka. Celem programistów jest odtworzenie w pełni naturalnego systemu immunologicznego. Jeśli im się uda, to może się okazać, że jeden dzień spędzony przez Watsona na poszukiwaniach będzie bardziej owocny od kilku tysięcy lat postępu człowieka w tej dziedzinie.

Kolejny segment, którego dominacja przez AI nadchodzi wielkimi krokami to motoryzacja. Apple i Tesla już pracują nad samochodami sterowanymi autopilotem, a Google testuje właśnie algorytmy optymalizacji działania świateł drogowych.

Potrzebujesz zakupów? Musisz jechać do sklepu swoim autonomicznym autem? Nieprawda, wcale nie musisz. Zamówienie zostało złożone zanim w ogóle przyszło ci do głowy. Predictive Buying to dziedzina, która skupia się na analizie zachowań konsumentów i ich zwyczajów. Jeśli twoja inteligentna lodówka przyswoiła jej osiągnięcia, to zakupy zapewne czekają już na progu domu.

AI przejmie więc kontrolę nad wieloma segmentami, które dotychczas wymagały ludzkiej pracy. Czy to oznacza wzrost bezrobocia? Cóż, i tak i nie.

Zapewne na miejsce pewnych prac pojawią się kolejne. Potrzeba będzie więcej osób znających się na technologii, rozwijających potencjał różnych sztucznych inteligencji. Dodatkowo, wzrost efektywności, który przy zastosowaniu AI jest nieunikniony, zapewne odbije się na znacznym wzroście PKB. Oznacza to wzrost ogólnego bogactwa, a co za tym idzie — mniej czasu spędzonego w pracy. 

Pozostają pytania o kwestie bardziej społeczne i moralne. Czy możemy pozwolić, by jedna korporacja stworzyła prawdziwie inteligentną AI? Czy nie postawi jej to na pozycji światowego monopolisty? A gdy już to się wydarzy, jakie prawa powinna mieć sztuczna inteligencja? Czy jej samoświadomość jest dla nas zagrożeniem?

Cieszmy się prostszym życiem, póki takie dylematy są dopiero przed nami. 

 

Szymon Konieczny

Student Psychologii oraz Kognitywistyki na UAM. W Expansio pełni funkcję Content Editora. Tworzy treści w oparciu o metody Storytellingu i UX Writingu. Dba, by jego teksty były proste i przejrzyste, ale nie banalne. Prywatnie fan sportów ekstremalnych. Większość pieniędzy przeznacza na książki naukowe i literaturę piękną, a także na podróże z wielkim plecakiem. Jest ciekawy wszystkiego, więc zmienia zainteresowania jak skarpetki. Każdemu z nich jednak oddaje serce i cały wolny czas.