В 2017 году канадская компания Lyrebird опубликовала аудиозаписи, на которых Дональд Трамп, Барак Обама и Хиллари Клинтон читают свои твиты вслух. Но в действительности никто из них этого не делал – это был фейк!
Благодаря новой технологии можно за пару секунд создавать убедительные, но фальшивые видео- и аудиозаписи, какие только захотите. В эпоху фейковых новостей многие люди вообще перестали доверять новостям из интернета и полагаются только на видео или аудио, которое может подтвердить, что событие действительно произошло. Но если эти записи тоже можно подделать, то чему тогда верить? Итак, как создать фейковые видео- и аудиозаписи?
Это возможно благодаря секретной технологии, называемой генеративно-состязательными сетями, или GAN. GAN – это особая версия технологии, построенная на нейронных сетях. Поэтому, прежде чем мы объясним, как работает GAN, давайте разберемся с нейронными сетями.
Ваш мозг учится новому благодаря экспериментам, получая обратную связь и обрабатывая информацию. Допустим, вы хотите испечь торт, но не умеете. Для начала вы в случайных пропорциях смешиваете муку, сахар, яйца, масло и прочие ингредиенты, ставите тесто в духовку, определяете время выпекания и смотрите, что получится. Кто-то из друзей пробует торт и говорит, что он слишком сладкий, сырой и нужно добавить еще шоколада. Вы немного корректируете рецепт с учетом полученных замечаний, и хотя ваш друг в целом будет доволен, у него еще есть предложения. Повторите этот процесс, и в конечном итоге получите тот рецепт, который сделает вас гуру по выпеканию тортов, а вы даже не притронулись к кулинарной книге. Такое обучение возможно, потому что в мозге есть нейронная сеть: набор связанных клеток – нейронов, которые «общаются» друг с другом.
Чтобы компьютеры стали мощнее, ученые в области теории вычислительных систем попробовали смоделировать нейронную сеть мозга внутри компьютера. Она называется искусственной нейронной сетью, но многие специалисты по технологиям продолжают называть ее просто нейронной сетью (что несколько странно). Как и в случае с тортом, искусственная нейронная сеть отслеживает множество переменных и присваивает каждой из них весовые коэффициенты: количество сливочного масла, время выпекания или температуру в духовке. Когда искусственная нейронная сеть получает от вас обратную связь, она меняет весовые коэффициенты, чтобы получить ответ, наиболее близкий к правильному, так же, как и вы меняете рецепт торта на основе рекомендаций друга.
Нейронные сети обладают невероятными возможностями: они могут автоматически заменять текст в телефоне, перехватывать спам-сообщения, переводить текст или разбирать почерк и т. п. Нейронные сети прекрасно умеют распознавать что-либо, но не предназначены для создания нового, вроде фейковых аудио- и видеозаписей. Для этого создан еще более продвинутый вариант нейронных сетей. Давайте его рассмотрим.
В генеративно-состязательной сети вы создаете две нейронные сети и сталкиваете их друг с другом. Генератор создает фейковые образцы, а дискриминатор старается отличить правильные образцы от неправильных. Сети начинают нечто вроде соперничества: генератор пытается создать более убедительные фейки, а дискриминатор – лучше их распознать. Сети учатся друг у друга, не переставая улучшать качество результата, пока генератор штампует невероятно убедительные фейки.
Давайте представим, что вы хотите создать генеративно-состязательную сеть, создающую фальшивое видео с выступлением генерального директора какой-нибудь американской компании. Вы создаете сеть генератора и дискриминатора. Изначально ни одна из них не знает, что происходит, поэтому генератор может создать видео человека, говорящего по-итальянски, а дискриминатор не распознает, что это фальшивка. Далее вы показываете дискриминатору видео с настоящей речью американца, из которого он узнает, что американские руководители обычно говорят по-английски. Следовательно, дискриминатор начинает отбраковывать видео на других языках. Генератор не сдается и предлагает видео на разных языках, чтобы обмануть дискриминатор.
В конце концов, генератор обнаруживает, что дискриминатор выбрал видео с человеком, говорящим по-английски. Эта игра продолжается до тех пор, пока генератор не сможет создать убедительный фейк.
Что бы мы сделали, увидев фальшивые видео кандидатов в президенты, произносящих провокационные речи? Понятия не имею, но, по крайней мере, мы бы знали, как его создали.
В 2014 году компания Facebook шокировала мир технологий приобретением компании-разработчика очков виртуальной реальности (VR) Oculus Rift, которые в основном использовались для видеоигр. Поначалу решение казалось странным: зачем соцсетям вдруг понадобилась игровая компания.
С финансовой точки зрения приобретение тоже было сомнительным. Новинка продвигалась на рынке достаточно медленно. Неоднократное снижение цен на Oculus Rift с момента их появления это подтверждает. Позже Марк Цукерберг признал, что это приобретение было стратегическим ходом, заявив в 2016 году, что виртуальной реальности потребуется еще 10 лет, чтобы выйти на массовый рынок.
Facebook предполагал, что виртуальная реальность станет будущим коммуникации. Вместо того чтобы переписываться, слать картинки или видео, Цукерберг предложил будущее, в котором благодаря виртуальной реальности можно поиграть в спортивные игры, сходить на лекцию в университет, на прием к врачу и погулять с друзьями – и все это не выходя из дома. (Критики считают это маловероятным, так как надевать тяжелую и дорогую гарнитуру просто для того, чтобы пообщаться с друзьями, может надоесть. Тем не менее Facebook оптимистично настроена и верит, что очки виртуальной реальности однажды станут такими же удобными, как и обычные.)
Если Цукерберг прав, владение социально ориентированными Oculus Rift может принести Facebook реальную пользу. Стратегия компании давно заключается в том, чтобы максимально продлить время, которое люди проводят на их платформах; это позволяет чаще показывать рекламу и получать больше пользовательских данных для того, чтобы делать ее более точной. Facebook может попробовать заставить пользователей проводить еще больше времени в Oculus Rift, после чего начнет запускать новые формы рекламы: скрытую, игроподобную или иммерсивную.
Пример видеотрансляции на Facebook: виртуальная работа с профессором. Источник: Facebook
В доказательство этой теории рассмотрим пример того, как в 2017 году компания предложила владельцам Oculus Rift возможность прямой трансляции видеохроник Facebook. Теперь они могли собраться за столом виртуальной реальности, отвечать на вопросы слушателей (персонажи могут «ухватить» боксы с комментариями других пользователей), общаться в чате или рисовать в воздухе.
Эта новая функция – продуманный способ привлечь внимание к виртуальной реальности и подтолкнуть любопытных пользователей к покупке очков.
Так почему же Facebook купила компанию, производящую очки виртуальной реальности? Не только чтобы поиграть в видеоигры. Facebook считает, что будущее компьютеров и социальных сетей – за виртуальной реальностью, а ведь компания хочет быть лидером в этой сфере.