Ojciec GAN: Człowiek, który obdarzył maszyny darem wyobraźni

Christie Tam Klok



Pewnej nocy w 2014 roku Ian Goodfellow poszedł na drinka, aby świętować z kolegą doktorantem, który właśnie ukończył szkołę. W Les 3 Brasseurs (The Three Brewers), ulubionym wodopoju w Montrealu, niektórzy przyjaciele poprosili go o pomoc przy trudnym projekcie, nad którym pracowali: komputer, który sam tworzył zdjęcia.

Naukowcy już wykorzystywali sieci neuronowe, algorytmy luźno modelowane na sieci neuronów w ludzkim mózgu, jako modele generatywne do tworzenia własnych, prawdopodobnych nowych danych. Ale wyniki często nie były zbyt dobre: ​​obrazy twarzy wygenerowanej komputerowo były zwykle niewyraźne lub zawierały błędy, takie jak brak uszu. Plan, który proponowali przyjaciele Goodfellow, polegał na użyciu złożonej analizy statystycznej elementów składających się na zdjęcie, aby pomóc maszynom samodzielnie tworzyć obrazy. Wymagałoby to ogromnej ilości obliczeń, a Goodfellow powiedział im, że to po prostu nie zadziała.





10 przełomowych technologii 2018

Ta historia była częścią naszego wydania z marca 2018 r.

  • Zobacz resztę numeru
  • Subskrybuj

Ale gdy zastanawiał się nad swoim piwem, wpadł na pomysł. A co, jeśli zestawisz ze sobą dwie sieci neuronowe? Jego przyjaciele byli sceptyczni, więc kiedy wrócił do domu, gdzie jego dziewczyna już mocno spała, postanowił spróbować. Goodfellow kodował do wczesnych godzin porannych, a następnie testował swoje oprogramowanie. Udało się za pierwszym razem.

To, co wymyślił tamtej nocy, nazywa się teraz GAN, czyli generatywną siecią adwersarzy. Technika ta wywołała ogromne emocje w dziedzinie uczenia maszynowego i zmieniła jej twórcę w celebrytę AI.



przemowa hitlera z tuby

Christie Tam Klok

W ciągu ostatnich kilku lat naukowcy zajmujący się sztuczną inteligencją poczynili imponujące postępy, korzystając z techniki zwanej głębokim uczeniem. Dostarcz systemowi głębokiego uczenia wystarczającą ilość obrazów, a system nauczy się, powiedzmy, rozpoznawać pieszego, który ma przejść przez ulicę. Takie podejście umożliwiło takie rzeczy, jak autonomiczne samochody i technologia konwersacyjna, która napędza Alexę, Siri i innych wirtualnych asystentów.

Ale chociaż sztuczna inteligencja głębokiego uczenia się może nauczyć się rozpoznawać rzeczy, nie była dobra w ich tworzeniu. Celem sieci GAN jest zapewnienie maszynom czegoś zbliżonego do wyobraźni.

W przyszłości komputery będą znacznie lepiej ucztować na surowych danych i wypracowywać, czego muszą się z nich nauczyć.



Takie postępowanie nie tylko umożliwiłoby im rysowanie ładnych obrazów lub komponowanie muzyki; sprawiłoby, że byliby mniej zależni od ludzi, którzy instruowaliby ich o świecie i sposobie jego działania. Obecnie programiści AI często muszą dokładnie powiedzieć maszynie, co znajduje się w danych treningowych, które są jej karmione — który z miliona zdjęć przedstawia pieszego przechodzącego przez jezdnię, a które nie. Jest to nie tylko kosztowne i pracochłonne; ogranicza to, jak dobrze system radzi sobie nawet z niewielkimi odchyleniami od tego, na czym był szkolony. W przyszłości komputery będą znacznie lepiej ucztować na surowych danych i wypracowywać, czego muszą się z nich nauczyć.

Będzie to duży krok naprzód w tym, co w sztucznej inteligencji znane jest jako nienadzorowane uczenie się. Samojezdny samochód mógłby nauczyć się wielu różnych warunków drogowych bez wychodzenia z garażu. Robot może przewidzieć przeszkody, jakie może napotkać w ruchliwym magazynie, bez konieczności okrążania go.

Będzie to duży krok naprzód w tym, co w sztucznej inteligencji znane jest jako nienadzorowane uczenie się.

Nasza zdolność do wyobrażania sobie i refleksji nad wieloma różnymi scenariuszami jest częścią tego, co czyni nas ludźmi. A kiedy przyszli historycy technologii spojrzą wstecz, prawdopodobnie zobaczą GAN jako duży krok w kierunku stworzenia maszyn o ludzkiej świadomości. Yann LeCun, główny naukowiec Facebooka zajmujący się sztuczną inteligencją, nazwał GANs najfajniejszym pomysłem w dziedzinie głębokiego uczenia się w ciągu ostatnich 20 lat. Inny luminarz sztucznej inteligencji, Andrew Ng, były główny naukowiec chińskiego Baidu, mówi, że GAN stanowią znaczący i fundamentalny postęp, który zainspirował rosnącą globalną społeczność badaczy.

The GANfather, część II: klub walki AI

Goodfellow jest teraz naukowcem w zespole Google Brain w centrali firmy w Mountain View w Kalifornii. Kiedy spotkałem go tam niedawno, nadal wydawał się zaskoczony swoim statusem supergwiazdy, nazywając to trochę surrealistycznym. Być może nie mniej zaskakujące jest to, że po dokonanym odkryciu spędza większość czasu, pracując przeciwko tym, którzy chcą go wykorzystać do złych celów.

Magia GAN polega na rywalizacji między dwiema sieciami neuronowymi. Naśladuje to, co dzieje się między fałszerzem a detektywem artystycznym, którzy wielokrotnie próbują się przechytrzyć. Obie sieci są szkolone na tym samym zestawie danych. Pierwszy z nich, zwany generatorem, zajmuje się wytwarzaniem sztucznych danych wyjściowych, takich jak zdjęcia czy pismo ręczne, które są jak najbardziej realistyczne. Drugi, znany jako dyskryminator, porównuje je z autentycznymi obrazami z oryginalnego zestawu danych i próbuje określić, które są prawdziwe, a które fałszywe. Na podstawie tych wyników generator dostosowuje swoje parametry do tworzenia nowych obrazów. I tak to się dzieje, aż dyskryminator nie może już powiedzieć, co jest prawdziwe, a co fałszywe.

GAN wyszkolony na zdjęciach prawdziwych celebrytów wymyślił własny zestaw wyimaginowanych gwiazd. W większości przypadków podróbki wyglądały całkiem realistycznie. Nvidia

W jednym z szeroko nagłośnionych przykładów w zeszłym roku, naukowcy z Nvidii, firmy produkującej chipy, która mocno zainwestowała w sztuczną inteligencję, wyszkolili GAN do generowania zdjęć wyimaginowanych celebrytów poprzez badanie prawdziwych. Nie wszystkie fałszywe gwiazdy, które wyprodukowała, były idealne, ale niektóre były imponująco realistyczne. W przeciwieństwie do innych podejść do uczenia maszynowego, które wymagają dziesiątek tysięcy obrazów szkoleniowych, sieci GAN mogą osiągnąć biegłość w zakresie kilkuset.

Powiązana historia

Ta siła wyobraźni jest wciąż ograniczona. Po przeszkoleniu na wielu zdjęciach psów, GAN może wygenerować przekonujący fałszywy obraz psa, który ma, powiedzmy, inny wzór cętek; ale nie może wyobrazić sobie zupełnie nowego zwierzęcia. Duży wpływ na wyniki ma również jakość oryginalnych danych treningowych. W jednym wymownym przykładzie GAN zaczął produkować zdjęcia kotów z losowymi literami wkomponowanymi w obrazy. Ponieważ dane treningowe zawierały kocie memy z Internetu, maszyna nauczyła się, że słowa są częścią tego, co oznacza bycie kotem.

Sprawienie, by GANS działał dobrze, może być trudne. Jeśli występują usterki, wyniki mogą być dziwaczne. Alec Radford

GAN są również temperamentne, mówi Pedro Domingos, badacz uczenia maszynowego z Uniwersytetu Waszyngtońskiego. Jeśli dyskryminator jest zbyt łatwy do oszukania, wydajność generatora nie będzie wyglądać realistycznie. A kalibracja dwóch pojedynkujących się sieci neuronowych może być trudna, co wyjaśnia, dlaczego GAN czasami wypluwają dziwaczne rzeczy, takie jak zwierzęta z dwiema głowami.

Jednak wyzwania nie odstraszyły badaczy. Odkąd Goodfellow i kilku innych opublikowali pierwsze badanie dotyczące jego odkrycia, w 2014 roku napisano setki artykułów związanych z GAN. Jeden z fanów tej technologii stworzył nawet stronę internetową o nazwie zoo GAN, poświęconą śledzeniu różnych wersji opracowanej techniki.

Najbardziej oczywiste natychmiastowe zastosowania dotyczą obszarów, które zawierają wiele obrazów, takich jak gry wideo i moda: jak na przykład postać z gry może wyglądać biegając w deszczu? Ale patrząc w przyszłość, Goodfellow uważa, że ​​GAN będą napędzać bardziej znaczące postępy. Jest wiele dziedzin nauki i inżynierii, w których musimy coś zoptymalizować, mówi, przytaczając przykłady, takie jak leki, które muszą być bardziej wydajne, lub baterie, które muszą stać się bardziej wydajne. To będzie kolejna wielka fala.

W fizyce wysokich energii naukowcy używają potężnych komputerów do symulacji prawdopodobnych interakcji setek cząstek subatomowych w maszynach takich jak Wielki Zderzacz Hadronów w CERN w Szwajcarii. Symulacje te są powolne i wymagają ogromnej mocy obliczeniowej. Naukowcy z Yale University i Lawrence Berkeley National Laboratory opracowali GAN, który po przeszkoleniu na istniejących danych symulacyjnych uczy się generować całkiem dokładne prognozy zachowania określonej cząstki i robi to znacznie szybciej.

Twórczość Goodfellow może być wykorzystana do wyobrażenia sobie różnych rzeczy, w tym nowych projektów wnętrz. Ian Goodfellow

Kolejną obiecującą dziedziną są badania medyczne. Obawy o prywatność oznaczają, że naukowcy czasami nie mogą uzyskać wystarczającej ilości prawdziwych danych pacjentów, aby, powiedzmy, przeanalizować, dlaczego lek nie działał. GAN może pomóc rozwiązać ten problem, generując fałszywe rekordy, które są prawie tak dobre, jak prawdziwe, mówi Casey Greene z University of Pennsylvania. Te dane można by udostępniać szerzej, pomagając w rozwoju badań, podczas gdy prawdziwe zapisy są ściśle chronione.

Ojciec GAN, Część III: Źli towarzysze

Jest jednak ciemniejsza strona. Maszyna zaprojektowana do tworzenia realistycznych podróbek jest idealną bronią dla dostawców fałszywych wiadomości, którzy chcą wpłynąć na wszystko, od cen akcji po wybory. Narzędzia AI są już wykorzystywane do umieszczania zdjęć twarzy innych ludzi na ciałach gwiazd porno i wkładania słów w usta polityków. GAN nie stworzyły tego problemu, ale go pogorszą.

Hany Farid, który studiuje kryminalistykę cyfrową w Dartmouth College, pracuje nad lepszymi sposobami wykrywania fałszywych filmów, takich jak wykrywanie niewielkich zmian w kolorze twarzy spowodowanych wdechem i wydechem, których GAN trudno jest dokładnie naśladować. Ostrzega jednak, że GAN z kolei się dostosują. Jesteśmy zasadniczo na słabej pozycji, mówi Farid.

Ta gra w kotka i myszkę sprawdzi się również w cyberbezpieczeństwie. Badacze już zwracają uwagę na ryzyko ataków typu „czarna skrzynka”, w których sieci GAN są wykorzystywane do odkrywania modeli uczenia maszynowego, za pomocą których wiele programów zabezpieczających wykrywa złośliwe oprogramowanie. Po odgadnięciu, jak działa algorytm obrońcy, atakujący może go obejść i wstawić fałszywy kod. To samo podejście można również zastosować do omijania filtrów spamowych i innych mechanizmów obronnych.

Istnieje wiele dziedzin nauki i inżynierii, w których musimy coś zoptymalizować. To będzie kolejna wielka fala.

Goodfellow doskonale zdaje sobie sprawę z niebezpieczeństw. Teraz kierując zespołem w Google, który koncentruje się na zwiększeniu bezpieczeństwa uczenia maszynowego, ostrzega, że ​​społeczność AI musi wyciągnąć wnioski z poprzednich fal innowacji, w których technolodzy traktowali bezpieczeństwo i prywatność jako refleksję. Zanim przebudzili się do ryzyka, źli goście mieli znaczną przewagę. Najwyraźniej jesteśmy już poza początkiem, mówi, ale miejmy nadzieję, że możemy poczynić znaczące postępy w dziedzinie bezpieczeństwa, zanim będziemy zbyt daleko.

jak duży jest mózg muchy

Niemniej jednak sądzi, że nie będzie czysto technologicznego rozwiązania fałszerstwa. Uważa, że ​​zamiast tego będziemy musieli polegać na społecznych, takich jak uczenie dzieci krytycznego myślenia poprzez skłonienie ich do zajęcia się takimi rzeczami, jak przemowa i zajęcia z debaty. W mowie i debacie konkurujesz z innym uczniem, mówi, i myślisz o tym, jak tworzyć wprowadzające w błąd twierdzenia lub jak tworzyć poprawne twierdzenia, które są bardzo przekonujące. Może mieć rację, ale jego wniosek, że technologia nie może wyleczyć problemu z fałszywymi wiadomościami, nie jest tym, który wielu chciałoby usłyszeć.

ukryć

Rzeczywiste Technologie.

Kategoria

Bez Kategorii

Technologia

Biotechnologia

Polityka Techniczna

Zmiana Klimatu

Ludzie I Technologia

Dolina Krzemowa

Przetwarzanie Danych

Magazyn Mit News

Sztuczna Inteligencja

Przestrzeń

Inteligentne Miasta

Blockchain

Historia Funkcji

Profil Absolwenta

Połączenie Absolwentów

Funkcja Wiadomości Mit

1865

Mój Widok

77 Msza Św

Poznaj Autora

Profile W Hojności

Widziany Na Kampusie

Listy Absolwentów

Aktualności

Wybory 2020

Z Indeksem

Pod Kopułą

Magazyn Informacyjny Mit

Wąż Pożarowy

Nieskończone Historie

Projekt Technologii Pandemicznej

Od Prezydenta

Przykrywka

Galeria Zdjęć

Zalecane