14. Мир, управляемый данными

Кеннет Кукьер

Повсеместное массовое и инновационное использование данных позволит многое делать проще, дешевле и в больших объемах.

Вы просыпаетесь, и ваш личный робот плавно парит в воздухе, чтобы подать вам в постель завтрак — белковую таблетку и эспрессо в виде леденца. Вы зеваете, и вмонтированный в потолок датчик дыхания анализирует данные, проверяя наличие недомоганий. А чуть позже беспилотный реактивный ранец аккуратно везет вас на работу.

Вообще-то, пока это лишь мечта. Фантастика. Но в течение следующих трех десятилетий, когда практики искусственного интеллекта проникнут во все сферы жизни, грядут фундаментальные изменения. Данные преобразуют каждый аспект бизнеса и общества, точно так же, как это происходило в период развития вычислительной техники и Интернета.

Начало современной научной революции датируется 1638-м — годом выхода книги Галилео Галилея "Беседы и математические доказательства двух новых наук" ("Discorsi e dimostrazioni matematiche intorno a due nuove scienze"), в которой он выдвинул идею о том, что все природные явления могут быть выражены языком математики. Сейчас начинается новый этап: все происходящее в мире будет оцениваться и оптимизироваться путем сбора и анализа данных. Информация начнет рассматриваться в качестве важнейшего ресурса. В XIX веке все приводилось в действие паром, в XX — нефтью, а в XXI веке важнейшим "топливом" станут данные.

С помощью передового искусственного интеллекта мы сможем осуществлять обучение не только в беспрецедентных масштабах, но и в автоматическом режиме. Американский философ технологий Кевин Келли называет это "когнитивизацией", то есть внедрением искусственного интеллекта во все, что мы делаем. Это станет возможно вследствие появления крошечных компьютерных чипов и высокоэффективных алгоритмов. Однако способности искусственного интеллекта в конечном счете определяются данными, которыми он располагает. Именно поэтому гаджеты будут не только использовать данные, но и постоянно собирать новые.

Предвестников этого явления мы видим в таких элементарных вещах, как термостаты (продукция Google под названием Nest) и разнообразные подсчитывающие шаги и пульс фитнес-трекеры, не говоря уж о невероятных, постоянно связанных с человеком личных помощниках, активируемых голосовыми командами (Google Home и Amazon Echo). К 2050 году они будут распространены так же широко, как наручные часы или радиоприемники более полувека назад.

Применение собранных данных в нашей ежедневной деятельности, по сути, другой способ сказать, что мы применяем на практике наши эмпирические знания об устройстве мира. Общество давно поступает именно так, но когда их объем был ограничен, это выглядело как определенные, весьма заметные стереотипы поведения. Теперь, когда нам доступно куда больше информации, стереотипы стали гораздо тоньше. Если в течение последующих 35 лет эффективность человеческого труда будет расти так же, как она росла в последние 35 лет благодаря компьютерам, можно пытаться спрогнозировать, как будет выглядеть жизнь в 2050 году.

Она разобьется на три основных направления. Во-первых, то, что сегодня сложно, станет легче. Во-вторых, подешевеет то, что сегодня дорого. В-третьих, проблема дефицита перестанет быть столь острой. Короче: проще, дешевле, больше. Давайте возьмем три эти направления и наложим их на некоторые самые важные и крупные сферы жизни общества: здравоохранение, образование и право.

Врач, исцелись сам

Сегодня медицинская практика имеет больше общего с XIX веком, чем с XXI. Доктора опираются на прочитанное в медицинских учебниках и на многолетний опыт принятия решений. Звучит вполне разумно. Но на самом деле это нелепо: никто из практикующих врачей не может быть знаком со всеми возможными заболеваниями и методами лечения, особенно с учетом постоянного появления новых лекарств.

Если Google среди миллиардов страниц может найти нужные и упорядочить их по релевантности, а Amazon — удивительно точно порекомендовать вам следующую покупку, не должны ли доктора при составлении каждого диагноза полагаться на компьютер? К 2050 году это, вероятно, окажется самым привычным делом. Медицинские карты станут электронными, и алгоритмы будут перебирать их в поисках действенных методов лечения, побочных эффектов и их возможной взаимосвязи.

База данных станет самым умным врачом в мире: она помнит каждый случай и видит связь между назначенными лечебными средствами и результатами, благодаря чему может порекомендовать, что лучше всего сработает в данной ситуации. Но окончательное решение все еще будет за врачом. В то же время они будут подвергаться риску судебного преследования по обвинению в ненадлежащем исполнении врачебных обязанностей, если они попытаются поставить диагноз без консультации с системой больших данных, так же, как сегодня летчики потеряют свою работу, если выключат автопилот, наденут кожаный шлем и очки и попытаются посадить самолет "как в старые добрые времена".

Для помощи врачам в диагностике заболеваний, Watson — суперкомпьютер фирмы IBM, способный находить в своей обширной базе данных ответы на вопросы, заданные на естественном языке, — уже несет в себе большой объем медицинской информации. Решения из области больших данных используются для разработки новых лекарств. А роботизированные хирургические системы "обучены" накоплению информации о прошлых операциях, так же как беспилотный автомобиль опирается на опыт предыдущих дорожных ситуаций.

Одной из областей, где большие данные смогут произвести локальный переворот в здравоохранении, является цифровая патология. В 2011 году команда исследователей во главе с Эндрю Беком из Гарвардского университета использовала компьютерное распознавание образов и алгоритм машинного обучения для анализа биопсии клеток рака молочной железы. Эта информация сопоставлялась с уровнем выживаемости пациентов, чтобы понять, сможет ли система строить прогнозы для раковых пациентов так же хорошо, как живые люди. Что удивительно, ей это удалось. Более того, среди 11 признаков, использованных алгоритмом для предсказания наличия рака в биопсии клеток, только восемь ссылались на сами клетки. Три остальные были связаны с окружающими стромальными клетками, врачи даже не знали, что именно следует искать. Эта информация была скрыта от человеческих глаз, но анализ огромных массивов данных помог докопаться до истины.

Цифровая патология все еще находится на стадии лабораторных исследований, и для введения ее в повседневный обиход необходимо пересмотреть нормативно-правовые акты. Тем не менее к 2050 году именно так и будет проводиться медицинская диагностика. Данные революционизируют оказание медицинской помощи. Собственно, все, требующее узкоспециализированной подготовки, суждений и принятия решений в условиях неопределенности, будет осуществляться лучше, если человек станет использовать соответствующие алгоритмы. Это будет точнее, быстрее и дешевле.

Обучение учителей

Вторая область, готовая к преобразованию под влиянием больших данных, — образование. Государственная система образования, став в 1800-х годах на Западе привычным делом, должна была заменить частных учителей (а именно так обычно получали образование представители высших классов). Раньше преподавание было индивидуальным и адаптированным к способностям конкретного человека. Теперь система отражала промышленную организацию того времени — фабрику. Обучение стало серийным, одинаковым для всех — учащиеся словно двигались по конвейеру. Трудно было организовать это как-то иначе. В те времена, как и сейчас, данные о качестве обучения снимались в виде единовременных измерений: балл за контрольную, оценка за работу в классе и т. д. Но никто не анализировал их на постоянной основе с тем, чтобы определить, что работает лучше для конкретного ученика или как адаптировать курс к его потребностям. До недавнего времени это было бы слишком дорого и громоздко. Однако понемногу подобные ограничения исчезают. В результате мы можем представить себе, как будет выглядеть образование к 2050 г.: собранные данные будут использоваться для оценки работы как ученика, так и учителя, а также для понимания того, что лучше всего способствует учебному процессу. Большие данные позволят снова ввести индивидуальное обучение, утраченное в эпоху единообразного государственного образования.

Образовательная платформа станет цифровой, поэтому информацию можно будет собирать на каждом шагу. Иногда это будет означать использование "перевернутого" класса, в котором ученики слушают лекции дома, а приходят на занятия для решения задач и выполнения упражнений (чтобы учитель мог им помочь).

Первые примеры подобного подхода к учебе уже есть. В 2012 году преподаватель информатики в Стэнфорде Эндрю Ын. вел онлайн-курс, и собранные при этом данные помогли ему улучшить преподавание. Проанализировав видеожурналы работы аудитории, он заметил странную картину: студенты, как правило, просматривали материал последовательно, но, дойдя до урока 7, возвращались на несколько недель назад — к уроку 3. Учитывая, что на курсе учились десятки тысяч человек, это не могло оказаться случайностью. Что же происходило? Н. присмотрелся внимательнее: более ранний урок был посвящен математике, и ученики возвращались к нему, чтобы освежить материал. В результате преподаватель понял, что ему нужно изменить учебную программу: поставить больше уроков математики в начале — это позволит студентам подготовиться к наиболее трудным моментам программы.

Онлайн-классы — это цветочки. Будучи электронной книгой, учебник учится у студента в той же степени, что и наоборот. Устройство знает, читает ученик или нет — и насколько быстро. Если его внимание отвлекается (это проявляется в более медленной скорости чтения), электронная книга может автоматически вставить короткое видео с объяснением или викториной. Устройство будет в курсе, читает ли ученик в воскресенье днем дома или в понедельник утром в автобусе — и сможет увидеть, коррелируют ли более высокие баллы за тест с изучением материала до или после обеда.

При этом информация в образовании, как и в здравоохранении, перестанет собираться лишь время от времени, а станет использоваться постоянно, образовав устойчивый поток данных. Это обеспечит реализацию метода, носящего название "адаптивное обучение". Идея заключается в анализе действий ученика и выборе материала и темпа обучения, подходящих именно ему. К примеру, если ученик быстро решает три задачи на треугольники подряд, ПО поймет, что пора перейти к чему-то более сложному. Если же, наоборот, задачи на длину окружности вызывают затруднения, система добавляет дополнительные упражнения. Адаптивное обучение гарантирует освоение всех материалов того или иного предмета, прежде чем двинуться дальше.

К 2050 году данные позволят вернуться к индивидуальному преподаванию. При этом получить образование станет легче и дешевле.

Убить адвокатов

Верховенство права и власть закона очень важны, но большинство людей наверняка желают видеть мир с меньшим количеством юристов. "Первое, что мы сделаем — убьем всех адвокатов", — провозглашает Дик Мясник в драме Шекспира "Король Генрих VI". До недавнего времени закон был одной из отраслей, где сбор информации осуществлялся наиболее консервативно, это область письменных аргументов и человеческих суждений. Но все меняется. К 2050 году данные будут лежать в основе юридической профессии и определять основы правосудия.

Уже сейчас большие данные используются для выявления неправомерной деятельности полиции и несправедливых решений судов, например, можно оценить частоту вынесения обвинительных приговоров в США в отношении молодых черных и белых мужчин. Несколько фирм уже предлагают услуги по подбору присяжных, рассчитывая вероятность того, что, скажем, азиатская женщина проголосует за осуждение женщины-подсудимой. Система работает путем корреляции огромных массивов демографических данных о присяжных с результатами судебных разбирательств, позволяя юристам повысить шанс наилучшего выбора.

Еще одна область — истребование имеющихся по делу документов в электронной форме. Сложные корпоративные судебные процессы могут предполагать необходимость ознакомиться с миллионами страниц документов. В прошлом подобным занимались целые армии молодых юристов. Это было дорого и неэффективно. Но для выявления подозрительного поведения сканировать материалы по ключевым словам или отслеживать трафик электронной почты могут алгоритмы, причем гораздо быстрее и точнее людей.

Существуют и другие полезные приемы. Компания Ravel перенесла огромные массивы данных по прецедентному праву — заявления, постановления, приговоры и тому подобное — в огромные хранилища данных, откуда их можно при необходимости извлекать и находить взаимосвязи. Цель состоит в том, чтобы революционизировать поиск правовой информации. В конечном итоге юристы не только найдут соответствующие прецеденты, но и увидят, какие из них чаще всего упоминаются при выигрыше или проигрыше дел — вплоть до уровня округа или судьи. Они смогут определить, какие аргументы чаще всего использует адвокат оппонента и каковы наиболее эффективные стратегии противостояния им.

К 2050 году большинство юридических обоснований и контрактов — по крайней мере изначально — будут составляться с помощью алгоритма, использующего большие массивы данных для поиска наиболее выгодных вариантов. Но документы должны быть рассмотрены и утверждены адвокатом-человеком, дабы убедиться, что обе стороны не имеют никаких претензий. Точно так же — хотя алгоритм и может вынести надежный и авторитетный приговор по основным видам споров — ассоциации адвокатов будут по-прежнему требовать участия в процессе судьи-человека, чтобы обе стороны конфликта и общественность чувствовали: в деле учтены все конкретные обстоятельства.

Главный принцип судебной практики заключается в том, что правосудие не просто должно быть осуществлено, оно должно восторжествовать. Поэтому новое мышление предусматривает право каждого на достойный суд — суд человека, а не робота.

Большие данные улучшат правоприменение и создадут более справедливое общество. К 2050 году не будет случаев, когда ответчику будет отказано в выходе на свободу под залог по причине того, что он может скрыться от правосудия. Вместо этого сумма залога будет основана на тех же данных, на которых банки сегодня опираются, определяя ставки по ипотеке. Аналогичным образом как выдумка будет восприниматься идея о том, что члены совета по условно-досрочному освобождению могут посмотреть заключенному в глаза и понять, по-прежнему ли он опасен для общества или его уже можно выпустить из тюрьмы. Вместо этого решение будет основываться на статистической вероятности рецидива в данном случае.

Одним из последствий слияния данных и права станет повышение эффективности юридической профессии, поскольку она будет использовать более весомые аргументы и принимать более быстрые решения. (Правда, неизвестно, станут ли клиенты получать меньшие счета.) При использовании больших данных осуществление закона станет проще и дешевле, а доступ к правосудию расширится. Сегодня обращение к судебной системе для урегулирования спора является роскошью, многие люди не имеют такой возможности, в случаях, когда неприятности не достигают уровня, превышающего неудобства от судебной канители. По мере того как данные изменят экономику юридических услуг, затраты на получение возмещения по закону могут снизиться. И мы обнаружим, что верховенство права глубже проникнет в общество — так же, как снижение расходов на хранение и передачу информации вследствие изобретения печатного станка позволило расширить распространение знаний.

Апокалипсис на рынке труда?

Данные приведут к значительным улучшениям ситуации не только в областях медицины, образования и права, но и во всем обществе. Тем не менее существуют законные опасения, что это может нанести огромный ущерб в плане занятости населения. Если алгоритм может обнаружить рак лучше человека-патолога, не лишатся ли работы многие врачи? Если один преподаватель может учить онлайн одновременно сотни тысяч студентов, возможно, нам понадобится меньше преподавателей? А убивать юристов и вовсе нет необходимости, они сами исчезнут, поскольку горстка старших партнеров вполне сможет контролировать работу алгоритмов, и им не потребуется армия младших сотрудников.

Для многих это, безусловно, будет тяжелым периодом. Однако в долгосрочной перспективе нет причин, по которым рынок таких услуг, как медицина, образование и право, не должен расширяться, а занятость в них даже увеличится. Характер труда также может измениться к лучшему, ведь черновой работой, которую никто не хотел бы делать, будут заняты алгоритмы.

Возьмем, например, патологов. Некоторые из них по-прежнему будут необходимы для взаимодействия с программой, проверки ее работы и обеспечения правильного пополнения базы данных нужными новыми результатами. По мере того как эффективность работы системы начнет повышаться, а цены падать, анализы людей будут собираться ежедневно, а не лишь тогда, когда кто-то нащупает у себя уплотнение и придет к хирургу. И эта процедура будет осуществляться не только для тех, кто может себе это позволить, но для всего населения. Таким образом, мы, несомненно, узнаем о развитии заболеваний много нового, чего никогда не знали раньше, когда нам не хватало информации. В таком мире нам может понадобиться больше патологов, а не меньше.

Аналогичный бум в сфере занятости может наблюдаться и в других профессиях. Если классы станут "перевернутыми", практическое обучение окажется еще более важным. Мы просто избавимся от "мудреца на сцене", вещающего, пока студенты спят. Учителя будут действовать как спортивные тренеры, которые находят правильный баланс между подталкиванием игроков к проявлению инициативы и подсказками при нехватке у тех собственных знаний. Но это потребует новых навыков. Аналогичным образом нам может понадобиться больше юристов, и тогда у нас будет более справедливое общество, поскольку для расширения доступа к правовой защите для большего числа людей с алгоритмами станут работать адвокаты.

Стрела причинности, сломанная

Благодаря этим достижениям мы станем лучше понимать, что происходит в мире, но хуже — почему. Система машинного обучения может определить, что в образце клетки нет рака, но она не может указать, почему: вариантов настолько много и они могут быть настолько сложными, что разобраться в них человеку может быть не под силу. Скажем, алгоритм определяет кого-то в группу риска по отношению к тому, чтобы бросить учебу, но ни один из параметров в отдельности не объясняет, почему это происходит. Программное обеспечение может подсказать полиции, что следует патрулировать конкретный квартал, поскольку там высока вероятность всплеска преступности, но оно не может указать, почему ситуация складывается так, а не иначе.

Таким образом, мы заменим превратности жизни эпохи до появления больших данных, когда недостаток информации тормозил рост знаний новыми капризами жизни в эпоху ИИ, когда у нас наконец появится избыток информации, но мы утратим способность разобраться в причинах тех или иных явлений. Общество добилось большей эффективности, но ему не хватает знаний о причинах и следствиях работы системы. По большей части решения в 2050 году будут приниматься по принципу "черного ящика", лишенного прозрачности, которая является краеугольным камнем ответственности за совершаемые действия.

Праву придется адаптироваться к этому новому миру. Директива ЕС о защите данных, вступившая в силу в 2018 году, указывает на предоставление общественности "права на объяснение" алгоритмических решений, равно как и "право на забвение" для обеспечения конфиденциальности. Законодатели США, со своей стороны, открыто опасаются, что передовые методики обработки данных могут привести к новым формам высокотехнологичной дискриминации. Вопрос причинно-следственной связи может стать камнем преткновения. На карту поставлено слишком многое. Инженер крупной американской компании, занимающейся медицинским оборудованием, признает: в одном из разработанных его фирмой устройств используется несколько более грубая методика, поскольку лучший алгоритм основан на "глубоком обучении" (deep learning) и не дает четкого объяснения принципов свой работы, как того требует законодательство.

К 2050 году мир, не задумываясь, обменяет причинно-следственные связи на эффективность — точно так же, как к концу эпохи Просвещения общество признало: то, что можно визуально наблюдать (например, вращение Земли вокруг Солнца), не объясняет природных явлений. Использование больших объемов данных смирит гордыню человечества.

Данные, всюду данные

По мере роста ценности данных, все громче зазвучат призывы к установлению более четкой денежной стоимости информации, особенно персональных данных. Будет заманчиво защитить последние правом собственности. Компаниям станет сложнее получать разрешение на использование персональных данных, и они будут нести более серьезные наказания, если не смогут защитить их конфиденциальность или неправильно распорядятся ими.

Так же как сегодня существуют банки для денежных активов, в будущем появится новый сектор экономики — банк данных для информационных активов компаний и людей. В 2016 году многие люди скачали блокировщики рекламы, встраиваемые в браузер. Легко представить, что в будущем подобное ПО за отдельную плату будет устанавливаться для управления передачей данных между человеком и сайтом. Но если мы будем не готовы расплачиваться предоставлением данных, за до сих пор бесплатные сервисы — такие, как Facebook и Google — придется платить. Так что в 2050 году неприкосновенность частной жизни, вероятно, станет такой же роскошью, как полет бизнес-классом или покупка второго дома.

К тому времени информация будет собираться практически обо всем происходящем в мире. Это приведет к трем крупным изменениям в жизни людей. Во-первых, наши действия станут более эффективными, а в некоторых случаях будут производиться совершенно по-новому. Во-вторых, мы будем лучше понимать мир и видеть его таким, какой он есть на самом деле, а не только то, что доступно при наличии мизерного количества данных. В-третьих, информация из потенциально полезной вещи станет насущной необходимостью, то есть мы постоянно будем все отслеживать, как кинофильм, а не запоминать время от времени, как фотоснимок.

Большие данные не обеспечат рай на земле. ИИ не ликвидирует смертность. Лев не возляжет рядом с агнцем, а автоматы Калашникова не превратятся в палки для селфи. Но на основании полученных данных практически все будет оптимизировано. И мир станет немного лучше.

Назад: 13. Этика искусственного интеллекта

Дальше: 15. Представьте, что все люди получили новые возможности