Глава 1. Волшебство прогностических машин
Что общего у Гарри Поттера, Белоснежки и Макбета? Их действиями движет пророчество, то есть прогноз. Даже сюжет «Матрицы», вроде бы описывающий прогностические машины, построен на вере персонажей в предсказание. Везде, от религии до сказок, знание будущего имеет решающее значение. Предсказания влияют на наше поведение и принятие решений.
Древние греки чтили своих многочисленных оракулов за пророческие способности, но их предсказания иногда бывали такими туманными, что сбивали с толку вопрошающих. Например, однажды царь Лидии Крез задумал рискованный штурм Персидской империи. И поскольку не доверял полностью ни одному оракулу, решил проверить каждого, прежде чем просить совета о нападении на Персию. Ко всем оракулам он разослал гонцов. На сотый день они должны были спросить, что Крез делает прямо сейчас. Ближе всех к истине оказался оракул из Дельф, поэтому царь обратился за пророчеством к нему.
Как и в примере с Крезом, прогноз может касаться и настоящего. Мы предполагаем, правомерная или мошенническая операция проводится по кредитной карте, злокачественная опухоль на снимке или доброкачественная, в камеру телефона смотрит владелец iPhone или посторонний человек.
Слово «прогноз» происходит от греческого слова πρόγνωσις, буквально означающего «предузнавание» (то есть знание того, что произойдет), но в современном понимании это скорее способность видеть скрытую информацию как в будущем, так и в прошлом и настоящем. Наверное, самый известный символ магического предсказания – хрустальный шар. И хотя в нашем представлении он связан с гадалками, обещающими финансовое процветание или успех в любви, в книге Фрэнка Баума «Волшебник страны Оз» Дороти с его помощью видит, что делает ее тетя Эм в настоящем. Все это приводит нас к определению прогностики.
Волшебство прогностики
Несколько лет назад Ави Голдфарб обнаружил, что в казино Лас-Вегаса с его кредитной карты снята крупная сумма. Но он в это время был совершенно в другом месте. А в Лас-Вегас ездил лишь однажды и очень давно – азартные игры не вписываются в его экономическое мировоззрение. После продолжительных переговоров банк отменил транзакцию и выдал новую карту.
Недавно неприятность повторилась. Кто-то снова сделал покупку по кредитной карте Ави. Но на этот раз он даже не успел увидеть транзакцию, так что ему не пришлось сто раз описывать ситуацию вежливому, но строгому сотруднику службы поддержки. Ави сообщили по телефону о подозрительной операции по карте и что уже выслали новую по почте.
Банк совершенно правильно заключил, исходя из потребительских привычек Ави и тонны другой информации, что транзакция мошенническая. И был настолько уверен в этом, что даже не стал блокировать карту до выяснения обстоятельств.
Вместо этого у Ави, как по волшебству, появилась другая карта, для чего он и пальцем не шевельнул. Конечно, хрустального шара у банка нет, но есть данные и надежная предсказательная модель: прогностическая машина. Повышение качества прогнозов позволило снизить риск мошенничества и одновременно, как выразился президент MasterСard по вопросам безопасности Аджай Бхалла, «избавить клиентов от ошибочного отклонения транзакций».
В сфере бизнеса применение прогностики полностью соответствует ее определению как процесса заполнения информационных пробелов. Эмитентам необходимо знать, не была ли недавняя транзакция мошеннической. Для прогноза по конкретной операции используются данные о совершенных мошеннических (и правомерных) переводах денежных средств. В случае подтверждения неправомерности эмитент может заблокировать карту, а если прогноз сделан достаточно быстро, то успеет отменить и текущую транзакцию.
Данный принцип – когда из имеющейся информации выводится отсутствующая – положен в основу главных современных достижений ИИ в области перевода. Об этой цели говорилось еще в предании тысячелетней давности о Вавилонской башне; цивилизация шла к ней на протяжении всей своей истории. Раньше для разработки автоматических переводчиков нанимали лингвиста (владеющего каким-либо конкретным языком), чтобы он изложил грамматические правила в приемлемой для программирования форме. Таким образом, например, если требовалось перевести фразу с испанского языка, слова не просто последовательно переводились, но существительные и прилагательные менялись местами, чтобы в итоге получилось грамотно составленное и понятное предложение.
Недавний рывок в развитии ИИ позволил поместить переводы в сферу прогностических задач. После этого качество онлайн-переводчика Google прямо-таки чудесным образом изменилось. Рассказ Эрнеста Хемингуэя «Снега Килиманджаро» начинается такими словами: «Килиманджаро – покрытый вечными снегами горный массив высотой в 19 710 футов, как говорят, высшая точка Африки».
В ноябре 2016 года профессор Юн Рекимото, ученый, IT-специалист из Токийского университета, переводил рассказ в Google-переводчике с японского языка на английский и получил такой результат: «Килиманджаро высота 19 710 футов гора снежный покров, и сказал самая высокая в Африке». На следующий день перевод выглядел уже по-другому: «Килиманджаро гора высотой 19 710 футов покрыта снегом и считается самой высокой в Африке».
Разница невероятная! Прошла всего одна ночь, а вместо корявого автоматического перевода получилось складное предложение, словно вместо недоучки работу делал человек, одинаково хорошо владеющий обоими языками.
Конечно, следует признать, что автору перевода до Хемингуэя далеко, но налицо явный прогресс. Вавилон возродился. И это не случайная перемена и не сбой: Google перекроила машинный переводчик с учетом недавних достижений в области ИИ, о которых мы рассказываем. Если быть точнее, современная программа Google-переводчик базируется на глубоком обучении повышению точности прогнозов.
Перевод заключается в определении японских эквивалентов английских слов и выражений. Прогнозируемые отсутствующие данные – это японские слова и их грамматический порядок. Если на основании данных иностранного языка составлять алгоритм слов и их правильный порядок на известном языке, то перевод получается читабельным. А если сделать все точно, то не всегда можно догадаться, что это перевод.
Компании, не теряя времени, начали коммерческое применение этой волшебной технологии. Например, более 500 миллионов граждан Китая уже пользуются сервисом на основе глубокого обучения, разработанным iFlytek, для перевода, транскрибирования и переписки на родном языке. С его помощью домовладельцы договариваются с иностранными арендаторами, пациенты больниц получают справочную информацию, врачи дают рекомендации, а водители общаются со своими автомобилями.
Чем чаще используется ИИ, тем больше он собирает данных и учится и тем лучше становится. А с таким количеством пользователей он совершенствуется очень быстро.
Насколько сейчас прогнозы лучше, чем раньше?
Изменения в программе Google-переводчик иллюстрируют, как машинное обучение (один из его подразделов – глубокое обучение) снижает цену на качественные прогнозы. За ту же цену в единицах вычислительной мощности Google предоставляет перевод более высокого качества. Цена прогнозов аналогичного качества значительно снизилась.
Инновации в прогностических технологиях влияют на традиционно связанные с прогнозом сферы, такие как обнаружение финансового мошенничества. Здесь наблюдается такой прогресс, что эмитенты кредитных карт выявляют и пресекают случаи мошенничества раньше, чем пользователи успевают их заметить. И все же улучшение происходит постепенно. В конце 1990-х с помощью передовых тогда методов удавалось предотвратить около 80 % мошеннических транзакций. К 2000 году эти показатели поднялись до 90–95 %, а сегодня достигают 98–99,9 %. Последний рывок стал результатом машинного обучения: разница между 98 и 99,9 % огромна.
Кажется, что от 98 % совсем недалеко до 99,9 %, но, если ошибки обходятся дорого, важно действовать постепенно. Улучшение с 85 до 90 % означает, что количество ошибок уменьшилось на треть. А с улучшением с 98 до 99,9 % ошибок стало в 20 раз меньше. Про такой показатель уже не скажешь «постепенно».
Падение цены на прогноз меняет и человеческую деятельность. Как первоначально компьютеры использовались для арифметических вычислений, таких как учет численности и разнообразные таблицы, так и первые прогнозы, полученные в результате машинного обучения, применялись для решения обычных прогностических задач. Помимо обнаружения мошенничества в них входили кредитоспособность, медицинская страховка и управление ресурсами.
Кредитоспособность – это прогноз вероятности погашения кредита заемщиком. Для медицинской страховки рассчитывали сумму, которую страхователь потратит на лечение. В управлении ресурсами важен прогноз загрузки склада в определенный день.
Не так давно возникли совершенно новые категории прогностических задач. Многие из них считались невыполнимыми до недавнего прогресса в технологии машинного интеллекта, в том числе распознавание объектов, языковой перевод и разработка лекарственных средств. Возьмем, к примеру, широко известный ежегодный конкурс ImageNet Challenge. Распознавание объектов – не всегда легкая задача и для человека. В данных ImageNet содержится множество категорий объектов, в том числе породы собак и другие схожие изображения. Не всегда можно уловить разницу между тибетским мастифом и бернским зенненхундом или между сейфовым и кодовым замком. Люди ошибаются примерно в 5 % случаев.
Если сравнивать первый (2010) и последний (2017) конкурсы, то прогнозы заметно улучшились. На рис. 1 приводится график точности победителей по годам. На вертикальной оси отмечена частота ошибок (поэтому чем ниже, тем лучше). В 2010 году лучшие прогностические машины неверно распознавали 28 % изображений. В 2012 году конкурсанты впервые использовали глубокое обучение, и частота ошибок снизилась до 16 %. Как отмечает профессор Принстона, IT-специалист Ольга Русаковская, «2012-й действительно стал годом огромного прорыва в точности, и это доказывает эффективность модели глубокого обучения, существующей уже несколько десятков лет».
Рис. 1. Временной график ошибок в распознавании объектов
Алгоритмы улучшались быстро, впервые человеческий эталон был превзойден в 2015-м. К 2017 году у большинства участников было уже в два раза меньше ошибок. Машины стали распознавать объекты лучше человека.
Последствия удешевления прогнозов
Нынешнее поколение ИИ пока отстает от разумных машин из научной фантастики. У нас нет ЭАЛа из «2001: Космическая одиссея», «Скайнет» из «Терминатора», Си-Три-Пи-О из «Звездных войн». Если современный ИИ способен только на прогностику, почему вокруг него такой ажиотаж? Да потому, что прогноз действительно важен. Не все это понимают, но прогноз имеет значение во всех сферах человеческой деятельности, в том числе в деловой и частной жизни. Решения принимаются на основе прогнозов; чем они качественнее, тем полнее информация и, следовательно, тем лучше результаты.
Прогноз можно назвать «добычей полезной информации», что слегка отдает шпионажем. Машинный же прогноз – это искусственная выработка полезной информации, а она всегда во главе угла. Качество прогноза влияет на итоги чего бы то ни было, как мы объяснили в примере с выявлением мошенничества. Благодаря снижению цены на прогноз мы делаем его полезным для многих других сфер, открывая его безграничные возможности, – например, машинный языковой перевод, который раньше нельзя было даже вообразить.
Выводы
• Прогресс роста точности прогнозов обманчив. Например, улучшение с 85 до 90 % кажется больше, чем с 98 до 99,9 % (в первом случае на 5 %, а во втором – на 2 %). Однако улучшение с 85 до 90 % означает, что количество ошибок уменьшилось на 30 %. А с улучшением с 98 до 99,9 % ошибок стало в 20 раз меньше. В некоторых условиях это меняет все.
• За волшебством прогностических машин стоит самое что ни на есть заурядное заполнение информационных пробелов. Машины умеют видеть (распознавание объектов), ориентироваться (беспилотные автомобили) и переводить.