Книга: Четвертая мировая война. Будущее уже рядом
Назад: Тест Тьюринга
Дальше: Патологическая связь

Разобрать на лайки

Мы не заметим, как мир захватит искусственный интеллект.

МИХАЛ КОСИНСКИ


О том, что ящик Пандоры уже открыт, публике сообщили через швейцарский журнал Das Magazin. Материал назывался: «Я просто показал, что есть бомба».

Случилось это аккурат после выборов Дональда Трампа президентом Соединённых Штатов. Собственно, этим выборам статья и посвящалась («текст года», как её назвали в Spiegel), но была она не о Трампе, а о скромном учёном Михале Косинском.

Над своей моделью Косински работал в Центре психометрии английского Кембриджа с 2008 года. Ему удалось показать, что, совместив данные психометрии (тестов, проведённых на добровольцах) с поведением человека в сети, о нём можно очень многое сказать.



Например, модели Косинского образца 2012 года требовалось проанализировать всего 68 лайков пользователя в Facebook, чтобы:

• с 95 % вероятностью определить цвет кожи испытуемого;

• с 88 % вероятностью – его гомосексуальность;

• с 85 % – приверженность Демократической или Республиканской партии США.



Общие же показатели его модели уже тогда были таковы:

• 10 лайков – и она знает человека лучше, чем коллеги по работе;

• 70 лайков – и она знает человека лучше, чем его друг;

• 150 лайков – лучше, чем родители;

• 300 лайков – лучше, чем партнёр;

• 500 лайков – лучше, чем он сам.



Собственно, такого ограниченного набора данных, как выясняется, вполне достаточно, чтобы каждого из нас «посчитать». И мы можем сколько угодно рассуждать о собственной индивидуальности, исключительности, невообразимости и т. д. Но это бред сумасшедшего, страдающего манией личностного величия.

Косински не без иронии рассказывает, что в день, когда научная статья с этими данными была опубликована, он получил два звонка: жалобу и предложение работы, и оба раза звонили из Facebook.

Впрочем, сейчас ему, я думаю, звонят изо всех мест и круглосуточно – он звезда. Этот нежданно-негаданный статус ему принесла как раз победа Трампа, к которой, впрочем, он не имел ни малейшего отношения.

В 2014 году к Косинскому действительно обратился молодой коллега Александр Коган и от имени некой компании Strategic Communications Laboratories предложил проанализировать с помощью его модели 10 млн американских пользователей Facebook.

Косински чувствовал что-то неладное, но на кону стояли большие деньги, которые нужны были его лаборатории для проведения дальнейших исследований. Он ведёт с Коганом переговоры, медлит с сотрудничеством, а дальше разворачивается почти детективная история, которую мы опустим.

Всё заканчивается ВгехК’ом, когда на сцене появляется компания Cambridge Analytica некого Александра Никса. Как выясняется, она активно работала в этой политической схватке на стороне Найджела Фараджа – ярого и наиболее радикального сторонника развода между Британией и ЕС.

К этому моменту компания Никса уже сотрудничает с Тедом Крузом – одним из участников президентской гонки в США. Результаты этого сотрудничества поражают всех – никому толком не известный кандидат показывает удивительные результаты за крайне небольшой промежуток времени.

Ну, и ещё через паузу Александр Никс, как пальмовая ветвь, переходит в штаб Трампа.

Cambridge Analytica скопировала и воспроизвела модель Косинского. Впрочем, в отличие от бедного Косинского, она могла позволить себе скупить все доступные персональные данные (в США этого добра навалом – кадастровые списки, бонусные программы, телефонные справочники, клубные карты, газетные подписки, медицинские данные).

Эти данные скрещивались со списками зарегистрированных сторонников Республиканской партии и данными по лайкам-репостам в Facebook, а дальше система делала расчёт, и начиналась бомбардировка намеченных целей строго выверенным, воздействующим именно на этих людей контентом.

СИЛА ВОЗДЕЙСТВИЯ

Таргетированная реклама – это очень хитрая вещь. Обычные системы работают на стандартных и обобщенных выборках, и рекомендации маркетологов в данном случае – пальцем в небо. Известное: «Детям – мороженое, бабе – цветы! Не перепутай!» – и то выглядит более информативным. Так что толку от таких рекламных кампаний немного.

А теперь давайте задумаемся, что сеть знает о нас, чего о нас не знает больше никто. На самом деле она может не знать о вас, на первый взгляд, очень важных вещей – например, какой у вас пол или возраст, если вы ей об этом, конечно, сами не скажете.

Впрочем, алгоритмы могут легко это выяснить – ни с цветами, ни с мороженным проблем не возникнет. Но дальше интереснее: она будет знать, что вы расист, даже если это вы тщательно скрываете и на каждом углу показушно демонстрируете отчаянную политкорретность.

Каким образом ей это удаётся? Да потому, что вы в поисковой строке Google вбиваете слово «нигер», а потом зависаете на сайтах соответствующего содержания – с оскорбительным юмором, нацистскими призывами и т. д.

Видимо, что-то подобное случилось в 2016 году и с Пенсильванией.

Штат этот традиционно демократический, консерваторов там никогда не поддерживали. Но проблема в том, что в этом штате, судя по всему, много врут, ведь частотность запросов «Нигера» там выше, чем в среднем по стране.

Проще говоря, в Пенсильвании много людей, которые только прикидываются политкорректными, потому что так в этом штате принято вести себя на людях. И, конечно, на них нетрудно повлиять, используя рекламу прорасистского толка (благо Трамп предоставил для такой рекламы кучу забористого контента).

И вот оно, чудо: Пенсильвания, никогда толком не голосовавшая за республиканцев, отдаёт 20 своих выборщиков за Трампа. Америка в шоке! Cambridge Analytica – нет.

Да, всё на этих чудных выборах пошло не так:

• оскандалились социологи – по данным предварительных соцопросов, победа Клинтон казалась неизбежной, а вот на тебе;

• почти вся американская пресса – этот великий рупор общественного мнения, – была против Трампа, но Дональду хоть бы хны: он в огне не горит, в воде не тонет;

• наконец, какая-то совершенно удивительная – прицельная стрельба по выборщикам: по этому ключевому для результатов выборов показателю Трамп побеждает Клинтон на голову, тогда как фактических голосов американцев за него отдано на два миллиона меньше.

В целом, им бы и молчать, конечно, но Cambridge Analytica не удержалась. Специализирующийся на «политическом микромаркетинге» Никс даёт комментарий от лица компании: мол, мы и сами не ожидали, насколько повлияем на исход голосования!

О дальнейших событиях, возможно, вы слышали:

• сообщение об утечке данных о тех самых 10 миллионах пользователей Facebook, которой способствовал тот самый Александр Коган (затем, правда, стали говорить уже о 50 миллионах вовлечённых в эту аферу аккаунтов);

• бывший сотрудник Cambridge Analytica Кристофер Уайли даёт показания о том, что для предвыборного штаба Трампа использовали данные о пользователях Facebook, плюс, по его же словам, канадская компания Aggregate IQ (AIQ) разработала программу Ripon, которая выявляла сторонников Республиканской партии;

• совет директоров Cambridge Analytica отстраняет Александра Н1икса от занимаемой им должности исполнительного директора компании и уверяет общественность, что влияние действий компании не могло быть настолько существенным;

• телеканал Channel 4 сообщает о том, что Cambridge Analytica и её материнская компания Strategic Communications Laboratories (SCL) участвовали более чем в 200 предвыборных кампаниях по всему миру, в том числе в Н1игерии, Кении, Чехии, Индии и Аргентине, проведены подтверждённые журналистские расследования;

• американские бизнесмены и звёзды публично объявляют о том, что закрывают свои аккаунты в Facebook в знак протеста против этого безобразия, и предлагают всем поступить так же;

• на фоне всей этой информации акции Facebook регулярно входят в головокружительное пике;

• Марк Цукерберг, который сначала всё отрицал, теперь просит прощения у пользователей за неаккуратное обращение с данными, у инвесторов – за допущенные ошибки, выступает на слушаниях в Конгрессе, где вынужден комментировать случившееся, снова извиняться и заверять;

• ФБР проводит обыски в офисе Cambridge Analytica;

• Cambridge Analytica официально заявляет о банкротстве.

Помню, когда я после выборов Трампа подготовил материал о Cambridge Analytica для «Сноба», портал Meduza выпустил статью, в которой говорилось, что всё это слухи, блажь, ерунда, фейк-ньюс и вообще не может быть. Так что редакторская коллегия «Сноба» заставила меня дать ссылки на источники по каждому приведённому в моей статье факту.

Честно говоря, я был в бешенстве. Заниматься ссылками я по целому ряду причин не люблю, а если какой-то мой читатель действительно нуждается в каких-то пояснениях, легко отыщет любой приведённый мною факт в Google – благо мы не в XX веке, и за книжками в библиотеку ходить не надо. А тут, глядишь, благодаря работе с источниками и мысль какая-то затеплится.

Но в тот раз все эти ссылки пришлось делать, слишком уж мне нравился повод – не отвертишься: наконец-то Big Data продемонстрировала свои возможности в мировом масштабе. Выбрать Трампа президентом – это надо было суметь!

Та статья в Das Magazin заканчивалась прямой речью Косинского: «Нет, тут нет моей вины. Это не я соорудил бомбу, я лишь показал, что они существуют». Это очень трогательно, в эйнштейновском, так сказать, эпистолярном духе.

И это ещё более трогательно, если вы ознакомитесь с новыми – 2017 года – исследованиями, теперь уже профессора Стэндфордского университета Михала Косинского.

На сей раз он занимается психодиагностикой по фотографиям…

Он обещает, что нейросети, натренированные на фотографиях, смогут «на глаз» определять интеллектуальный уровень человека, его политические взгляды, склонность к преступлениям и многие черты его характера.

Это звучит как абсолютная фантастика (и одновременно – как отсутствие права на какую-либо приватность): вообще-то долгое время считалось, что серьёзная наука уже окончательно покончила с френологией, евгениками и прочими лжеучениями. Но вот нет.

Новый алгоритм Косинского, например, в 81 % случаев отличает по фотоизображению геев от натуралов (в случае с женщинами – 74 % попаданий). Если же этому алгоритму показать по пять фотографий каждого человека, то точность в случае геев увеличивается до 91 %, а в случае лесбиянок – до 83 %.

Интересно, насколько бы вы хорошо справились с этой задачей? Если думаете, что так же, то не обольщайтесь. Обычных людей тоже исследовали, вот результаты: люди угадывали геев в 61 % случаев, а лесбиянок – в 54 %.

То есть, может быть, френология и ерунда, но вот искусственный интеллект действительно, как выясняется, способен, используя Big Data, находить закономерности и там, где, казалось бы, их даже не может быть.

В интервью The Guardian, по результатам этого исследования, Косинский в свойственной ему манере отметил, что все необходимые технологии в распоряжении правительства и крупных корпораций уже есть. Его задача – лишь продемонстрировать их опасность, быть может, кто-то задумается…

Вопрос, впрочем, как мне кажется, в том, каким будет результат этой задумчивости. Возможно, совсем не тот, что предполагает Косинский. По крайней мере, предыдущие его «предостережения» – в случае с Cambridge Analytica, например, – дали, как оказалось, обратный результат.

В общем, все желающие и неверующие могут обманываться и дальше. Но их тоже посчитают – и по фотографиям, и так. На непереводимом языке искусственного интеллекта будет сделана соответствующая пометка – «наивен, недальновиден, без ума от себя».

Да, мы кажемся друг другу разными, но искусственный интеллект, работающий с BigData, этого не подтверждает.

Если анализировать всё, что мы с вами делаем – и в онлайне, и в оффлайне (к чему и движется семимильными шагами новая технология), – а не частью и не местами (как это происходит в рамках социальной коммуникации), мы предельно предсказуемы.

«При потенциальном количестве датчиков в 2030 году от 50 до 100 триллионов большая часть данных будет генерироваться автоматически, а не через устройство ввода. Они будут поступать через датчики на пульсометрах, акселерометрах в смартфонах, биометрические регистраторы, пассивные камеры или алгоритмы для сбора данных о поведении. Объём данных, поступающих из окружающего нас мира, за 10 лет превысит данные, которые мы вводим с помощью клавиатуры или сенсорного экрана, в 10 000 раз. Иными словами, встроенные в нашу среду обитания компьютеры будут больше реагировать на то, что мы делаем, что говорим и как поступаем, чем на то, что мы набираем на клавиатуре или на что кликаем».

БРЕТТ КИНГ, эксперт по экономике будущего

Поэтому Рэй Курцвейл и работает сейчас над созданием индивидуального помощника, который будет знать, чего мы хотим, раньше нас. А Илон Маск – над автомобилем, который будет знать, куда мы собираемся поехать, даже если мы ничего ему об этом не сообщим.

Предсказать наше поведение и манипулировать им теперь не сложнее, чем управляться с тем самым автомобилем или переводчиком Google. И в результате какой-нибудь Трамп вполне может появиться там, где, что называется, не ждали.

Искусственные самообучающиеся нейронные сети, получившие в распоряжение всю возможную информацию о нас, включая не только данные о нашем поведении в интернете, но и с банковских карт, информацию о наших передвижениях через GPS смартфона, наши телефонные звонки, эсэмэски, твиты, медицинские карты, фотографии, данные с видеорегистраторов, налоговые декларации и т. д., и т. и., возьмут нас под тотальный контроль, а мы даже этого не заметим.

И вот почему так важен пример Трампа: это не будет контролем в стиле Оруэлла или Хаксли, это будет тотальный контроль, который мы, при всём желании, не сможем идентифицировать. Мы просто будем действовать так, как велит нам искусственный интеллект, искренне полагая, что совершаем свой сознательный и личностный выбор.

Он возьмёт нас голыми руками.

ЦЕНА ЗА ВЗГЛЯД

Конечно, неприятно сознавать, что мы предсказуемы, подвержены манипуляциям, что наши «внутренние установки» и «личные убеждения», на самом деле, настолько поверхностны и незначимы. Но отрицать это теперь не только глупо, но и просто небезопасно.

На каждого из нас уже созданы сотни специальных профилей. Да, сотни компаний в реальном времени следят за вами.

Всякий раз, когда вы открываете очередную интернет-страницу и видите вываливающиеся на вас рекламные баннеры, это, как правило, уже адресованные лично вам сообщения.

А та секундная задержка в появлении баннера, которую вы можете даже заметить, – это отнюдь не медленный интернет. Напротив, это очень быстрый интернет! В этот момент происходит колоссальный обмен данными: несколько десятков игроков, занимающихся размещением рекламы в интернете, проводят самый настоящий тендер за ваше внимание.

Сначала этим роботам необходимо запросить собственные базы данных – что те знают о вас? Поняв это, они анализируют: кому из их клиентов (чью рекламу они размещают) вы по своему полу, возрасту, семейному положению, финансовому достатку, интересам и т. д. больше всего подходите?

Следующим этапом решается вопрос: сколько за ваше внимание к рекламе, которую они размещают, разумно заплатить? Если вероятность того, что вам нужен этот товар, высокая, можно не мелочиться. Если непонятно, то за вас много не дадут. Рекламодателю нужен ваш переход с баннера на сайт – так что тут всё прозрачно.

Определившись с ценой вашего внимания, роботы, размещающие рекламу, делают свои ставки. Ещё раз: одновременно десятки роботов, которые вас оценили, соревнуются за ваше внимание конкретным рублём или долларом. Тот робот, который оценил вас, в связи с вашим соответствием запросу его клиента больше всего, и выиграет.

Стремительный тендер заканчивается, и ваш взгляд падает на слегка, казалось бы, запаздывающий баннер. Да, вот такой «медленный-медленный» интернет…

И это касается абсолютно любого контента, не только рекламного. Когда какой-либо интернет-сервис вам что-то предлагает, это всегда уже «умное» предложение: оно учитывает вашу предыдущую активность на данном ресурсе, на ресурсах партнёров, оно сличает ваше поведение с поведением других пользователей, ищет корреляции…

В общем, там по вашему поводу большая жизнь происходит, хотя вы и не догадываетесь. И чем больше шагов в сети вы делаете, чем больше информации обрабатывается в ваших, но скрытых от вас профилях: во множестве досье, которые искусственные интеллекты создают на вас в интересах третьих лиц.

Назад: Тест Тьюринга
Дальше: Патологическая связь