Книга: Эпоха дополненной реальности
Назад: Глава 6. Человек дополненный
Дальше: Часть 3. Эпоха дополненной реальности

Глава 7

«Поток жизни»: агенты, аватары и консультанты

Моя личная задача на 2016 год – построить простейший искусственный интеллект, который будет отличным помощником дома и на работе. Что-то вроде Джарвиса из «Железного человека».

Начать я планирую с изучения уже имеющихся технологических разработок в этой области. А потом выберу какое-то умное устройство и научу его распознавать мои голосовые команды и контролировать все происходящее в доме – музыку, освещение, температуру и так далее. Научу его узнавать друзей и впускать их в дом, когда они звонят в дверь. Научу следить за тем, что происходит в детской, и сообщать, когда Макс требуется мое внимание. Что касается работы, то здесь искусственный интеллект поможет мне визуализировать мои идеи в формате виртуальной реальности, а это значит, что наши сервисы станут еще лучше, а возглавляемые мной компании – еще эффективнее.

Марк Цукерберг, пост в Facebook, 3 января 2016 года


Personal LifeStream®: существование в персональном потоке

Только задумайтесь о небывалых процессорных мощностях, имеющихся сегодня в нашем распоряжении, о возрастающих потоках данных, об умных алгоритмах, способных предугадывать и исполнять наши желания. Существует ли слово, которое адекватно описывало бы совокупность этих явлений? Я бы назвал это LifeStream («Поток жизни») или LifeCloud («Облако жизни»).

LifeStream – не то же, что персональная панель управления Windows или набор личных настроек OSX, поскольку может работать сразу на многих устройствах и в разных средах. Нельзя его отнести и к интерфейсам, поскольку в его состав могут входить десятки каналов обмена данными с различными устройствами и компьютерными платформами. Вполне возможно, лет через десять LifeStream обзаведется искусственным интеллектом и будет не только узнавать вас, но и вести от вашего имени переговоры с другими компьютерами и даже людьми. С помощью сенсорных датчиков и других средств он будет день и ночь наблюдать за вами, но вы добровольно согласитесь на такое вторжение в вашу частную жизнь ради преимуществ, которые это вам дает, – в конце концов, ваши личные данные останутся при вас. Не сводится LifeStream и к учетной записи в облачном хранилище, поскольку представляет собой совокупность разнообразных наборов данных, которые понятны и нужны именно вам. Если хотите, можете считать LifeStream своей личной операционной системой, хотя, по-моему, даже аналогия с ОС не вполне передает смысл этого явления.

Здесь приведены элементы, которые теоретически могут войти в состав вашего LifeStream.

В фильме «Она» Теодор Туомбли (в исполнении Хоакина Феникса) загружает на свои компьютеры и смартфон «умную операционную систему» по имени Саманта. В конечном итоге Туомбли влюбляется в Саманту, но та предпочитает объединиться с подобными себе ОС и перейти в иное измерение. В популярной видеоигре Halo персональный искусственный интеллект зовут Кортана. Такое же имя носит персональный помощник, встроенный в ОС Microsoft Windows 10. В видеоигре Кортана помогает Мастеру Чифу находить нужную информацию, взламывать информационные системы и решать другие задачи, связанные с миссией героя. Но если бы Мастер Чиф не был всецело поглощен борьбой с Ковенантом, Кортана вполне органично смотрелась бы в роли его персональной помощницы и спутницы.





Есть два пути, по которым может пойти развитие таких ИИ в ближайшее десятилетие. Первый – это дальнейшее выстраивание нашей жизни вокруг облачных хранилищ Apple, Google или Microsoft, которые будут дополнены неким встроенным ИИ или агентом (улучшенной версией Siri, если хотите). Но возможно, что мы уклонимся с этого пути в сторону разработки отдельного, коллективно создаваемого и не зависящего ни от устройств, ни от платформ агента с ИИ. Огромные массивы данных и аналитики, на мой взгляд, с большой вероятностью подтолкнут разработчиков к развитию по второму сценарию, с отказом от модели ИИ в привязке к конкретным ОС и платформам, поскольку от персонального агента потребуется большая степень универсальности и разносторонности. Нельзя гарантировать, что ваш умный автономный автомобиль будущего будет работать под управлением, скажем, iOS в паре с помощником Siri. Логичнее, по-моему, предположить, что его работа будет организована по тому же кроссплатформенному принципу, на котором строится сегодня функционирование мобильных приложений и социальных сетей, то есть ИИ будет размещен поверх всего многообразия устройств и операционных систем, а не встроен в них. Поживем – увидим, но агент, доступный через любой интерфейс, безусловно удобнее и ценнее.





Рисунок 7.1. Facebook M готовится стать первым персональным помощником с ИИ в социальных сетях (источник: Facebook)





Вне зависимости от этих соображений движущие силы, приближающие нас к жизни в персональном информационном потоке с обменом данными через интерфейсные подключения, просматриваются все отчетливее. У нас все больше устройств, все больше экранов, и вскоре мы просто перестанем самостоятельно справляться с логической обработкой огромных объемов входных данных не только на индивидуальном уровне, но и силами коллективного разума всего человечества. А значит, нам неизбежно потребуются алгоритмы устранения этой проблемы посредством отслеживания, фильтрации и предварительной обработки данных. Как бы ни были устроены подобные базы данных, подключаться к ним мы будем через персональные интерфейсы. И тот, кто успешно решит эту проблему, к середине следующего десятилетия получит бизнес крупнее, чем сегодня у Facebook. Впрочем, и сама Facebook надеется захватить этот невероятно перспективный рыночный сегмент и уже анонсировала проект цифрового персонального помощника Facebook М.

Подобные решения будут обладать двумя главными категориями возможностей: во-первых, прямой ввод данных, визуализация и обратная связь; во-вторых, самостоятельный сбор и синтез информации, а также представление интересов пользователя на правах уполномоченного агента.

Для прямого ввода данных потребуются устройства и интерфейсы ввода и/или конфигурируемое и даже самообучающееся прикладное программное обеспечение. Визуализация и обратная связь будут требоваться всякий раз, когда программа должна сообщать пользователю результаты обработки введенной или запрошенной информации посредством вывода на экран или через иной интерфейс, например тактильный (вибрация, пульсация, биения и т. п.) или голосовой.







Автоматизированный сбор ключевых данных будет вестись при помощи камер, акселерометров, GPS-навигаторов, маячков iBeacon, платежных экосистем, мобильных приложений и широкого спектра датчиков – как персональных, так и внешних. Эти данные будут объединяться в единый пул и, во-первых, сохраняться на вашем персональном устройстве или в облачном хранилище, а во-вторых, передаваться удаленным серверным приложениям, алгоритмы которых смогут оперативно анализировать характер ваших текущих действий, состояния и поведения – и выдавать в ответ оптимальные рекомендации.





Агенты-аватары – к вашим услугам!

Самые интересные разработки в области персонализации не ограничатся функциями визуализации и обратной связи, но будут включать также и агентов на основе искусственного интеллекта, умеющих изучать ваше поведение, привычки, нужды и типичные реакции, с тем чтобы со временем научиться действовать от вашего лица и совершенно в вашем духе и стиле. Рано или поздно эти агенты и аватары трансформируются в ваших персональных помощников и друзей, наделенных искусственным интеллектом и колоссальными техническими знаниями. Как мы к этому придем? Эволюционным путем.

Поначалу будут использоваться лишь агентские и представительские функции, которые уже появились, и умным помощникам будут поручаться простые задачи, которые станут дальнейшим развитием способностей, имеющихся сегодня у Сири (Siri) или Кортаны, например:

● «Сири, вызови мне машину Uber к дому».

● «Кортана, перечисли тысячу долларов с моего текущего счета на карточный».

● «Сири, купи биткоинов на двести долларов из моего электронного кошелька».

● «Джибо, закажи мне стандартный обед из китайского ресторана через Seamless».

● «Сири, разбуди меня завтра в восемь утра».

● «Кортана, заведи мою машину и прогрей двигатель до семидесяти градусов» (при подключении робота-помощника к мобильному приложению OnStar или BMW).

● «Джибо, пропылесось пол на первом этаже» (при подключении к роботу-пылесосу Roomba).

● «Кортана, не забудь включить обогреватель в моей комнате к моему возвращению».

Следующая фаза стартует через 5-10 лет, и с выходом на нее агент будет договариваться за вас о времени посещения парикмахерской, записывать вашу машину на техобслуживание и т. п. К этому времени, возможно, вы уже постепенно начнете относиться к своему агенту как к личности. Типичными поручениями для ИИ-помощников к тому времени станут задания наподобие следующих:

● «Люси, забронируй мне авиабилет во Флориду на следующую среду первым классом и оплати его с корпоративного счета».

● «Боб, свяжись с моей парикмахерской и узнай, смогут ли меня там обслужить в пятницу».

● «iThing, подыщи какое-нибудь дневное шоу в моем вкусе в субботу в Вест-Энде».

● «Альфред, найди какой-нибудь мексиканский ресторан неподалеку от театра и закажи столик на троих по окончании спектакля».

Следующий уровень агентского представительства – способность ИИ-помощника выполнять делегированные ему ответственные функции, например вести переговоры и взаимодействовать с другими ИИ-агентами и людьми от имени «хозяина». Здесь уже потребуются хотя бы базовые нейронные сети и/или алгоритмы самообучения, необходимые для выработки правильной реакции на происходящее в процессе взаимодействия. Подобные алгоритмы обучения будут публиковаться в открытом доступе в целях совместного совершенствования машинного разума и придания ему способности правильно прогнозировать развитие событий и реагировать на текущую ситуацию.

На таком уровне агентского представительства появляется возможность сделать ИИ-помощника вашим настоящим «аватаром», передав ему/ей знания обо всех ваших пристрастиях, предпочтениях и т. п. В вышеприведенных примерах, скажем, Люси без вашего напоминания будет знать, бронировать вам место у окна в носовой части салона самолета или у прохода в хвостовой части, Боб – что на вашу прическу в парикмахерской тратится около 45 минут плюс небольшой запас на ожидание, а iThing – что вы терпеть не можете мюзиклы. Когда подобные взаимодействия станут обычными, мы сформируем такие слои онлайновых сервисов, в которых наши ИИ-представители будут договариваться друг с другом за нас в режиме реального времени и без нашего участия. Иными словами, компьютерные агенты начнут общаться с компьютерными агентами по выделенным межмашинным каналам.

На этой стадии кое-кто из вас задумается о защите своей конфиденциальной информации и о том, как сделать так, чтобы агент не разгласил лишнего о вашей частной жизни без вашего разрешения. В таком случае советую не забывать, что в ближайшее время объем подобных межмашинных контактов возрастет настолько, что люди окажутся просто не в состоянии эффективно выполнять все необходимые переговорные и посреднические функции. Данных и взаимодействий станет слишком много. Люди своим участием начнут тормозить любые процессы и портить друг другу настроение, а потому очень скоро самоустранятся от роли агентов. Конечно, если вы живете в элитном доме, консьерж-услуги с возможностью поговорить по-человечески никуда не денутся. Только хотите, я вас теперь удивлю? Попросив у консьержа по старой доброй памяти вызвать вам бригаду грузчиков для подъема мебели на этаж или договориться о приходящей уборщице, знайте, что консьерж закажет эти услуги все через тех же агентов. В итоге все и повсюду будут пользоваться их услугами, чтобы договориться о чем бы то ни было. Мы даже станем специально просить своего ИИ-агента внимательно вслушиваться в ход наших совещаний или переговоров и оперативно давать нам полезные подсказки по мере необходимости.

Представьте себя сидящим на деловом совещании или участвующим в конференции, где выясняется по ходу дела, что для дальнейшего согласования какого-либо вопроса вам нужно в ближайшую среду днем лично встретиться с клиентом или начальником в другом городе. Не успеете вы это осознать, как ваш агент уже договорится с его агентом о точном времени и месте встречи и закажет вам билет на самолет с вылетом в ночь со вторника на среду, чтобы вы, не дай бог, на важную встречу не опоздали.

Ни для чего из вышеперечисленного по-настоящему самодостаточный искусственный интеллект не требуется. Цифровой персональный помощник или агент-аватар, способный успешно справляться со всеми подобными задачами, внешне может выглядеть вполне разумным существом, но самосознанием он обладать не будет, и круг функций и опыта у него будет ограничен – примерно как у библиотекаря из классического романа Нила Стивенсона «Лавина». В какой-то момент способности и функциональные возможности агентов усовершенствуются настолько, что они окончательно перестанут походить на Siri, чьи ответы часто смешат нас своей шаблонностью, и смогут решать по-настоящему сложные задачи. И тогда нам станет, по большому счету, все равно, полностью или не полностью в нашем помощнике реализована концепция искусственного интеллекта.

Возможности эти, вероятнее всего, будут кроссплатформенными, то есть реализованными «поверх» различий в операционных системах и типах устройств. Например, вы находитесь в автономном автомобиле с роботизированным управлением и даете условной Люси, своему агенту, распоряжение забронировать авиабилет. Так ли важно, по какому именно каналу оно будет передано: будет ли Люси встроена в ваш iPhone 12 либо в компьютерную систему управления автомобилем, или этот агент станет вездесущим и одновременно присутствующим и в машине, и дома, и в смартфоне либо ином устройстве? Вероятнее всего последнее, и ваш агент будет распределенным – существующим в облаке данных, а не в привязке к конкретному мобильному приложению или устройству. Способность этих алгоритмов поддерживать обучение агента с использованием входных данных, поступающих по всем каналам, как раз и будет ключевым фактором успешного предугадывания ваших потребностей в разных ситуациях. Однако эти алгоритмы могут поддерживать и избирательное обучение в зависимости от устройства/канала поступления информации. Например, умный автомобиль, вероятно, лучше запомнит ваши излюбленные маршруты перемещения по городу и рестораны, чем смартфон. А умные наручные часы с сенсорной матрицей скорее разберутся, какую музыку вы предпочитаете включать во время спортивных тренировок или даже какие музыкальные ритмы лучше сказываются на вашем состоянии при физических нагрузках. Со временем же они определят и оптимальное время для крепкого кофе, чтобы продлить часы вашего бодрствования.

Если помните, в главе 3 мы говорили о том, что чем мощнее и функциональнее пользовательские интерфейсы персональных устройств, тем проще они в обращении. В то же время платформы, на которых реализованы эти интерфейсы, становятся распределенными, а значит, пользовательский опыт не ограничивается привязкой к одному экрану. Например, Facebook уже обеспечивает вполне приличную универсализацию вывода информации на дисплеи устройств различных классов, включая персональные компьютеры, планшеты и смартфоны, а мобильная версия ленты Twitter теперь и вовсе интегрирована в смартфоны в виде стандартного приложения наряду с другими потоковыми уведомлениями. Банковские услуги такого рода давно вышли за рамки ПО для банкоматов и включают интернет-банкинг в браузере, мобильные приложения для совершения текущих операций и мониторинга состояния счетов, а также системы моментальных платежей и переводов типа Venmo, PayPal или Dwolla. А мобильные устройства со встроенными чипами бесконтактной связи близкого радиуса действия (NFC) вроде iPhone с функцией Apple Pay или смартфона на основе Android с функцией Android Pay позволяют расплачиваться ими в магазинах вместо карт.

У вашего агента с ИИ, однако, степень повсеместного проникновения будет несравненно выше всего вышеописанного. И в связи с этим интересно задаться вопросом, навеваемым образом Саманты из фильма «Она»: а может ли, действительно, развиться у человека привязанность к своему агенту-аватару? Возможен ли выход на уровень межличностных отношений с персональным искусственным интеллектом?

Хацунэ Мику – прообраз идеального аватара?

Впервые искусственный интеллект упоминается в популярной литературе в серии статей, опубликованных во второй половине XIX столетия Сэмюелом Батлером и впоследствии включенном им в роман «Едгин», три главы из которого были опубликованы в 1872 году под заглавием «Книга машин». В этих главах Батлер утверждает, что у машин может развиться сознание в процессе, аналогичном дарвиновскому отбору.

Мы не имеем гарантии безопасности от развития, в конечном итоге, механического самосознания, на основе одного лишь того факта, что машины не сознают себя сейчас. Медуза тоже особым самосознанием не отличается. Но поразмыслите над тем, насколько невероятный прогресс проделали машины всего за пару сотен последних лет и сравните его с медлительностью эволюции представителей царств животных и растений. Не так давно все более высокоорганизованные машины появлялись ежедневно, а теперь они рождаются буквально каждые пять минут.

Сэмюэл Батлер. «Едгин»

Если обратиться к отражению темы ИИ в научной фантастике, то там прослеживается несколько лейтмотивов: перспектива завоевания искусственным интеллектом мирового господства; проблема доминирования человеческого разума над искусственным и постановки его под контроль; не так давно получившая развитие тема способности ИИ к самосознанию, чувственно-эмоциональному восприятию, страданию и т. п. и вытекающие отсюда этические проблемы. Есть и образы таких носителей ИИ, которые, как Библиотекарь из «Лавины» Стивенсона, по каким-то причинам все еще не достигли полноценного самосознания.

Тут ключевой момент в следующем: если вы переходите на уровень речевого общения с носителем искусственного интеллекта, вы волей или неволей наделяете его человеческими чертами. Это, кстати, еще одна из причин регулярного отражения темы ИИ в литературе и кинематографе.





Рисунок 7.2. Макс Хедрум – первый телеведущий, сгенерированный при помощи компьютера?.. А ведь мы чуть было не поверили (источник: The Max Headroom Show, Channel 4)





Первым аватаром или неким подобием аватара в современной массовой культуре стал Макс Хедрум. Этот вымышленный носитель ИИ впервые «засветился» на британском телевидении в 1985 году – сначала в киберпанк-телефильме «На 20 минут в будущее», затем в музыкальном ток-шоу The Max Headroom Show, после чего персонаж ненадолго перекочевал еще и в рекламу «новой формулы кока-колы». Увы, хотя его и позиционировали как «первого в мире телеведущего, сгенерированного при помощи компьютера», с технической точки зрения Макс Хедрум оказался и не «аватаром», и не «сгенерированным». Исполнявшего его роль актера Мэтта Фрюера просто очень тщательно гримировали и умело снимали на фоне футуристических декораций – технологии того времени не позволяли достичь желаемого эффекта. Подготовка к съемкам, чтобы все выглядело «правдоподобно», включала 4,5 часа в гримерной, и сам Фрюер впоследствии характеризовал ее словами «жестокое издевательство» и «вовсе не смешно», а ощущения от пребывания в таком гриме описывал так: «Представьте, что вашу голову засунули внутрь гигантского теннисного мяча».

Обычно этот персонаж представал перед зрителями в блестящем черном или белом костюме (причем из стеклоткани) и массивных солнцезащитных очках Ray-Ban Wayfarer. На экране показывали только голову и плечи Хедрума, обычно на фоне «сгенерированного компьютером» задника – медленно вращающегося интерьера в виде проволочного куба, который первоначально, кстати, также снимали методами традиционной мультипликации – лишь в поздних выпусках удалось действительно использовать наложение на задний план настоящей компьютерной графики. Еще одним фирменным отличием Макса была его «роботизированная» речь: тембр голоса «плавал» вверх-вниз, иногда возникал эффект испорченной пластинки, а достигалось это с помощью… обычных электронно-музыкальных эффектов вроде питч-шифтера.

В популярной литературе образы компьютерных аватаров появились всего за несколько лет до телевизионного воплощения в лице Макса Хедрума. Само слово «аватар» берет начало в традициях индуизма и означает «нисшедшее» на землю в явленном облике божество. В романе Нормана Спинарда «Песни со звезд», опубликованном в 1980 году, термин «аватар» используется для описания сгенерированной компьютером виртуальной реальности как таковой, но лишь «Лавина» Нила Стивенсона окончательно отчеканила смысл этого понятия применительно к информационно-вычислительным технологиям. Главный герой «Лавины» по имени Хиро Протагонист открывает псевдонаркотик под названием «снежная лавина», представляющий собой компьютерный вирус, который инфицирует аватары, населяющие метавселенную – 3D-модель альтернативного виртуально-игрового мира. Однако вскоре выясняется, что пагубное действие «лавины» передается от зараженных аватаров их хозяевам из реального мира через очки виртуальной реальности, проецирующие лазером образы метавселенной на сетчатку их глаз. Интересно, что Стивенсон детально описывает целую индустрию, выстроенную вокруг обслуживания потребностей аватаров в метавселенной: коммерческие дизайнеры разрабатывают для аватаров игроков модные тела, одежду, аксессуары и даже выражения лиц виртуальных персонажей.

Сегодня под «аватаром» принято понимать виртуальный образ пользователя в цифровой реальности. Аватары из игровых реальностей Minecraft, Halo и Destiny перекочевали в альтернативные виртуальные миры наподобие Second Life. Однако у виртуальных персонажей, разрабатываемых компьютерными аниматорами, все больше прослеживаются черты наших будущих агентов с элементами ИИ и возможностью самостоятельного взаимодействия.

Всего за полтора десятилетия, разделяющие выход на экраны «Историй игрушек» с шерифом Вуди и «Аватара» Джеймса Кэмерона, технологии компьютерной анимации проделали невероятный путь, и сегодня в этом сегменте индустрии информационных технологий и программного обеспечения крутятся сотни миллиардов долларов. Первая попытка вывести на большой экран фотореалистичных компьютерных киногероев была предпринята в датированном 2001 годом фильме «Последняя фантазия: духи внутри». Увы, революционная графика далеко не всем зрителям пришлась по вкусу, и в прокате фильм провалился, принеся студии Columbia Pictures убытки на сумму 50 млн долларов. Некоторые даже упрекали создателей в излишнем правдоподобии и совершенстве компьютерно синтезированных лиц и тел.

Когда смотришь, как идеально сложенная доктор Аки Росс (озвученная Минг-На Вен) пытается спасти нашу опустошенную планету от вторжения злых духов, видишь лишь совершенное компьютерное произведение, а не творение Матери-природы. С первого же видеоанонса «Последней фантазии» от Sony Pictures онлайновые критики прочили фильму полный провал. Поначалу зрелище захватывает и занимает… Но затем начинаешь замечать холод в их глазах и механистичность их пластики…

Рецензия П. Трэверса в Rolling Stone, 6 июля 2001 года

Как сказано в главе 4, японский специалист по робототехнике Масахиро Мори еще в 1970 году в не дожившем до наших дней журнале Energy назвал подобный нюанс восприятия человекоподобных роботов «эффектом зловещей долины» (яп. 不気味の谷現象 – «букими но тани геншо»).

Так что, похоже, нам предстоит выбор между попыткой добиться сверхреалистичного сходства синтетических персонажей с человеком – и созданием человекоподобных, но подчеркнуто отличных от человека сущностей. И тут нам поможет пример Хацунэ Мику, японской виртуальной аниме-певицы, работающей на платформе синтезатора артикулированного вокала Yamaha Vocaloid. Мику стала настоящей поп-звездой.

Она скорее похожа на богиню: части тела у нее как у человека, но она выходит за грани человеческих возможностей. Это великая поп-звезда эпохи постгуманизма.

Отзыв с сайта поклонников Хацунэ Мику

Поначалу Мику представляла собой просто компьютерную программу с функциями синтезатора вокала, разработанную японской компанией Crypton Future Media. В 2007 году глава Crypton Хироюки Ито никак не мог придумать подходящего маркетингового хода для сбыта своей программы синтеза виртуального артикулированного вокала, разработанной с использованием технологии Yamaha Vocaloid 2, но чувствовал, что нужно разработать некий предмет всеобщего поклонения, «идола», – и привлек к разработке подходящего японского художника, иллюстратора комиксов, работающего под псевдонимом КЕИ. Через месяц КЕИ выдал детальный визуализированный образ 16-летней виртуальной героини ростом 158 см и весом 42 кг. Длинные тонкие ноги, кокетливые глаза-плошки, бирюзовые распущенные косы до пят, компьютерный интерфейс на рукаве… Имя Мику значит «Будущее», а фамилия Хацунэ – «Первый звук».

Знаете ли вы, что Хацунэ Мику:

● Выпустила свыше 100 000 песен, на YouTube загружено около 1,5 млн видеоклипов с ее участием, и ей посвящено более миллиона рисунков поклонников?

● Породила собственный модный танец MikuMikuDance (MMD)?

● С момента выпуска в 2007 году по март 2012 года уже принесла своим создателям, по оценке Исследовательского института Номура, свыше 10 трлн японских иен (130 млрд долларов) прибыли?

● Уже заработала на рекламных контрактах больше, чем Тайгер Вудс и Майкл Джордан вместе взятые?

● Имеет свыше 2,5 млн поклонников на Facebook?

● Дала более тридцати «живых» концертов по всему миру, прошедших при полном аншлаге в Лос-Анджелесе, Нью-Йорке, Тайбэе, Гонконге, Сингапуре, Токио, Ванкувере, Вашингтоне, а совсем недавно выступила в США совместно с Леди Гага?

Рисунок 7.3. Японский вокалоид Хацунэ Мику – аниме-аватар и поп-звезда, зарабатывающая миллиарды долларов в год (источник: Crypton Future Media)





Сегодня у Мику миллионы обожающих поклонников по всему миру – реальному, а не только виртуально-сетевому Как могло получиться, что какая-то программа синтеза вокала стала не просто хитом продаж, а превратилась в вокалоидный аватар поп-звезды?

Для уроженцев цифрового мира, выросших в окружении гибридных информационных технологий, по большому счету нет разницы между впечатлениями от концерта аватара-вокалоида и ощущениями, полученными на выступлении живого певца или певицы. Для будущих поколений, воспитанных в тесном контакте с умным роботом или агентом с искусственным интеллектом, такое положение вещей также будет представляться более чем естественным. Конечно, потребуется какой-то переходный период от нынешнего мира, где подобные вещи еще в диковинку, к миру, где они будут в порядке вещей. Тем из вас, кто все еще обеспокоен проблемами конфиденциальности, перспективами оказаться в «зловещей долине» или нежеланием доверять заказ столика и ужина в ресторане ИИ, советую задуматься над тем, что самое позднее через 20 лет все это станет нормой жизни.

Пример Мику учит нас, что не обязательно быть человеком, чтобы стать поп-звездой. Пока что это первый в истории случай, когда компьютерная конструкция достигла столь высокого уровня популярности в реальном мире. Да, до этого всемирную славу завоевывали персонажи мультфильмов и комиксов, герои фантастических книг и фильмов. Но это первый случай, когда полностью цифровой, виртуальный аватар (а не изображающий его человек-актер) настолько уверенно и полно шагнул в реальный мир и стал на равных конкурировать с людьми.

Вне зависимости того, будет ли наш виртуальный помощник представлен аватаром или абсолютно фотореалистичным образом и подобием человеческого существа, налаживать ежедневные рабочие отношения со своим компьютерным агентом или искусственным интеллектом в ближайшее время нам придется, – и для этого предсказания не требуется даже напрягать воображение. Скорее всего, большой надобности в визуализации своего агента мы испытывать не будем. Поначалу нам вполне хватит обычных функций распознавания и синтеза речи для голосового общения с нашими агентами, как это показано в вышеупомянутом фильме «Она», и сегодня такой интерфейс на начальном уровне уже реализован в смартфонах и компьютеризованных автомобилях. Пока что исследования не выявили каких-либо проявлений эффекта «зловещей долины» от общения с голосовыми роботами, так что, вероятно, он развивается только при визуальном контакте с носителями ИИ, облеченными в подобие человеческого тела. По правде говоря, в реальной жизни мы едва ли даже будем отдавать себе отчет, что имеем дело с роботом, общаясь со своим агентом. Для большинства из нас в будущем агент станет привычным виртуальным, но никак не физическим спутником жизни. Тем не менее мы будем-таки персонифицировать своих агентов и относиться к ним как к личностям.

Когда живые люди начинают поклоняться виртуальной звезде и подражать ей, всякие споры о восприятии человеком виртуальных сущностей прекращаются. На примере Мику мы видим, что способны восхищаться компьютерно сгенерированным персонажем и даже влюбляться в виртуальный образ. Сегодня многим из нас трудно в это поверить, но будут ли такие проявления казаться странными или необычными лет через двадцать?

Задумайтесь вот о чем. Эти агенты будут специально разработаны для удовлетворения большинства наших повседневных нужд, а значит, они будут персонализированными с учетом наших вкусов и предпочтений, моделей поведения, склонностей и реакций. Со временем агенты научатся лучше определять наши потребности и вырабатывать детализированные отклики на наши нужды с точным учетом нашей индивидуальности и характера. В человеческих отношениях нам часто приходится приспосабливаться, изменять свой подход и отношение к различным вопросам или даже идти на компромиссы, поступаясь собственными убеждениями и чувствами, ради налаживания продуктивных взаимоотношений с окружающими. Ведь фактически любые межличностные отношения строятся на основе тех или иных уступок. Когда же дело дойдет до выстраивания личных отношений с ИИ или агентом, вам, возможно, вовсе не понадобится поступаться какими бы то ни было привычками, убеждениями или естественными реакциями. По-моему, нетрудно понять, почему многим из нас персональный агент может стать роднее и ближе кого-либо из людей.

В противовес вызванному из небытия Илоном Маском и Стивеном Хокингом призраку всевластного робота – поработителя мира, подчинившего себе все искусственные интеллекты и наделившего себя гиперразумом, давайте призовем свой милый призрак будущего, населенного носителями ИИ и аватарами, в которых можно влюбляться – настолько они будут обворожительны и для ума, и для сердец. Такую перспективу наша культура только начала исследовать, но сама возможность ее реализации видится отчетливо.

Смерть продавца

За последние 50-100 лет широкое распространение получили коммерческие услуги, требующие высокого уровня технической компетенции и знаний, – такие области, как медицина, консалтинг, финансовые и юридические услуги, программное обеспечение и т. п. Примерно у 1 % человечества выработалась привычка считать главным выражением и олицетворением своего материального благополучия наличие персонального консьержа или личного секретаря, организующего встречи, поездки и прочие дела. Конечным выражением вершины банковского обслуживания стало наличие персонального банкира – вашего личного консультанта по всем вопросам инвестиций и размещения финансовых активов. Персональные няни и репетиторы для детей, личные тренеры, диетологи и т. п. – все это вещи из того же разряда.

В прошлом на переходных этапах от одной эпохи к другой смена системообразующих технологий приводила в целом к слому и перестройке инфраструктуры и процессов. В эпоху дополненной реальности, однако, главный прорыв коснется опыта потребления товаров, услуг и экспертных консультаций, а не производственных технологий и сферы распространения и сбыта, как это обычно бывало.







Восприятие и впечатления от потребления продуктов и услуг – вот что претерпит наиболее кардинальные изменения в ближайшие 30 лет. Опыт взаимодействия, омрачаемый недопониманием, неэффективностью, неточностью, а порою и просто человеческими причудами, уступит место умному и безошибочному обслуживанию, характерному для машинного интеллекта. Все наши взаимодействия в целях потребления будут тщательно моделироваться и снизу доверху встраиваться в нашу повседневную жизнь настолько гладко и умно, как и не снилось никому из продавцов-консультантов сегодняшнего дня.

Представьте себе жизнь с личным консьержем, персональным тренером, индивидуальным репетитором для ваших детей и т. д., – но только все эти роли будут играть не люди, а окружающая нас интеллектуальная технологическая среда, в которую соответствующие функции будут встроены. Неоспоримо, что люди-консультанты значительно уступают претендующим на их место роботам-консультантам практически по всем статьям. Вот лишь некоторые примеры.





Безоговорочное преимущество ИИ в сборе и анализе больших массивов данных

Мы уже приводили в главе 3 пример суперкомпьютера IBM Watson, побеждающего лучших игроков в телевикторине Jeopardy! и консультирующего врачей-онкологов по вопросам диагностики и лечения раковых заболеваний. Watson имеет доступ к миллионам электронных документов, включая медицинские журналы, результаты клинических исследований, словари, энциклопедии, монографии, статьи в периодике и множество баз данных. Он состоит из 90 серверов IBM Power 750, каждый из которых оснащен четырьмя восьмиядерными процессорами архитектуры POWER 7 с тактовой частотой 3,5 ГГц. В сумме система Watson располагает почти 3000 виртуальных процессоров («нитей») на ядрах POWER 7 и оперативной памятью объемом в 16 терабайт.

Это означает, что Watson способен изучать и запоминать с фотографической точностью более 10 млн книг в секунду, и вся информация из них откладывается в его памяти навсегда и в любой момент может быть извлечена. По слухам, на получение врачебного диплома у суперкомпьютера Watson ушло всего два года. Когда бы исследователей из Онкологического центра имени М. Д. Андерсона ни попросили представить руководству краткую справку о состоянии пациентов на утреннем совещании, «доктор Ватсон» всегда давал ответ быстрее, полнее и качественнее всех.

«Я была просто поражена, – поделилась впечатлениями 31-летняя врач-стажер из Италии по имени Витале. – Даже проработав всю ночь напролет, никто из нас не был бы в состоянии собрать и обобщить столь исчерпывающую информацию, как он».

Из статьи «Доктор Ватсон от IBM обращает силу своего искусственного разума на исследование раковых заболеваний», Herald Tribune Health, 14 июля 2015 года

Заместитель руководителя проекта IBM Watson Health по медицинской части Роб Меркель сообщил, что на протяжении жизни среднестатистического человека накапливается информация о всевозможных показателях его здоровья объемом около миллиона гигабайт, что сопоставимо с текстом 300 млн томов печатных изданий. Помножив это число на многомиллиардное население планеты, получим такое количество сведений, что сразу становится ясно, почему ни один живой человек не в состоянии сколь бы то ни было полно и всесторонне ее проанализировать, не говоря уже об использовании накопленных результатов для оперативного принятия решений.

Мы давно перешагнули границу старой доброй реальности, где умудренный опытом человек, выступающий в роли консультанта, был способен «держать руку на пульсе» последних данных хотя бы в своей узкоспециализированной области и, исходя из этого, давать точные советы. Еще важнее то, что любой человеческий совет субъективен, особенно в таких областях, как, например, финансовые услуги, где консультанты зарекомендовали себя крайне ненадежными советчиками при выработке индивидуальных решений о вложениях средств: они редко способны учесть личные предпочтения инвестора, его готовность к риску и иные параметры, формулируя свои предложения. Вот где у ИИ имеется огромное преимущество, поскольку роботы-консультанты будут иметь возможность анализировать, обобщать и синтетически включать все данные такого рода в единую рекомендацию.

Будь то последние сведения о какой-либо отрасли, результаты новейших исследований или просто информация о текущих биржевых котировках, тенденциях и симптомах, почерпнутая из интернета, у машин всегда будет больше данных, более оперативный доступ к ним и большая скорость реагирования, причем в любое время дня и ночи. Иными словами, на протяжении минувших двух веков финансовые консультанты привыкли работать по принципу информационной асимметрии, наживаясь на том, что знают больше, чем их клиенты, либо располагают более достоверной, нежели клиенты, информацией. Сегодня мы подошли к той точке, когда машинный разум располагает ровно тем же преимуществом по отношению к классическим финансовым консультантам, и в будущем эта асимметрия будет только нарастать и обостряться. Для консалтинговых фирм, состоящих из людей, единственная надежда на выживание связана с тем, чтобы попытаться каким-то образом включить искусственный интеллект в свои процессы, одновременно оградив клиентов от прямого подключения к источникам данных текущей бизнес-аналитики.





Лучший совет – контекстная подсказка

Консультант в лучшем случае «всегда готов откликнуться на ваш звонок», а в худшем – обслуживает клиентов по предварительной записи. Вот только сама роль консультанта, эксперта или советника как неизбежного «шлюза доступа» к нужной информации сегодня утрачивает актуальность.

Первая концепция, которую мы должны оспорить, – это сама необходимость обращаться за консультацией. Платные советчики привыкли работать в условиях асимметричной информированности и по привычке настаивают, чтобы к ним обращались за «единственно верным» решением, а то еще и включают наценку за свой эксклюзивный доступ к информации в стоимость продуктов или услуг. И ведь так сложилось, что для получения их «правильной» рекомендации приходилось не просто «прыгать через их обручи» – записываться и являться на прием в отделение, офис, кабинет, клинику, – но еще и дожидаться приема днями или даже неделями и переплачивать за то, чтобы вас принял самый высококвалифицированный консультант или специалист. Этому приходит конец. Ни ваша платежеспособность, ни привилегированный доступ к какой-либо сети отныне не являются определяющими факторами в возможности получения квалифицированной консультации по каким бы то ни было вопросам, включая финансовые, юридические, медицинские, физкультурно-оздоровительные и т. д.

Часы Apple Watch или браслет Samsung Simband в режиме реального времени проследят за вашим сердечным ритмом, а интеллектуальное устройство проанализирует показания в поиске возможных отклонений от нормы; ваш электромобиль сам подскажет, где и когда его лучше поставить на подзарядку и техобслуживание, как и куда проехать (и даже сможет автоматически планировать графики и маршруты ваших поездок); мобильный банк отсоветует делать невыгодные покупки и предупредит о перерасходе денежных средств; умные контактные линзы порекомендуют срочно съесть какой-нибудь свежий фрукт для нормализации уровня сахара в крови, а смартфон – воздержаться от кофе в ближайшие часы… Консультации все больше будут встраиваться в нашу повседневную жизнь на основе обратной связи с высокотехнологичными устройствами.

Попробую сформулировать то же самое при взгляде под иным углом зрения.

Какой из двух вариантов лучше: 1) персональная сеть, включающая смартфон, умные часы, умную одежду или заглатываемые датчики, ведущая непрерывный мониторинг состояния вашего здоровья и выявляющая любые нарушения, которая незамедлительно предупредит вас о признаках развития у вас, например, аритмии сердца; ИЛИ 2) перспектива дождаться острого сердечного приступа, экстренной госпитализации и снятия ЭКГ, по результатам которой врачи объявят вам, что его первопричиной стала аритмия?

Что лучше: 1) раз в год обращаться к своему финансовому консультанту за советом относительно дальнейшего распоряжения портфелем ваших ценных бумаг и оптимальных возможностей для новых инвестиций; ИЛИ 2) умный банковский счет, контролирующий динамику ваших ежедневных расходов по мере того, как вы расплачиваетесь своим смартфоном с чипом бесконтактных платежей, и подсказывающий вам, что стоит изменить в своих привычках, чтобы оптимизировать издержки и сэкономить деньги, а также подыскивающий самый экономичный вариант запланированной дорогостоящей покупки, плюс робот-консультант, оперативно оптимизирующий портфель ваших инвестиций для получения максимальных доходов при минимальных рисках и обладающий при этом более объективной и полной информацией, чем самые лучшие финансовые эксперты мира?

Будь то советы по изменению образа жизни от умного зеркала в ванной комнате, интерактивный повар, готовящий завтраки, обеды и ужины по вашему вкусу и указаниям, или алгоритм оптимизации поездок, подбирающий тарифы с максимальными скидками либо рейсы с наибольшей вероятностью попасть в салон бизнес-класса по цене эконом-класса, – консультации будут все шире внедряться в окружающую нас действительность, причем на самых чувствительных для нас участках. Крайне мало останется областей, где человек, с его ограниченным доступом к данным, сможет давать рекомендации, не уступающие контекстным подсказкам встроенных в информационно-технологическую среду умных помощников.





Машины будут знать о нас больше, чем мы сами

Возможности самообучения машин в прошлом сталкивались с ограничениями, обусловленными недостаточным развитием технологий распознавания образов и речи, а также другими препятствиями подобного рода, но сегодня картина меняется, и техника начинает буквально «схватывать все на лету». Преимущество подключения к интернету вещей и наличия сенсорных датчиков в будущем даст роботизированной обслуге возможность выяснять наши вкусы и привычки полнее и точнее, чем это умеют лучшие представители сферы обслуживания сегодняшнего дня.

Как сегодня сетевые сервисы узнают о наших предпочтениях? Всего четырьмя доступными им способами:

● по социально-демографическим признакам;

● по результатам опросов, данным маркетинговых и потребительских исследований;

● по ранее заполненным онлайн-анкетам или по введенным в систему данным опросных листов, заполненных вручную;

● по персональным настройкам онлайновых и мобильных приложений и аналогичным данным.

Все вышеперечисленное не только несовершенно в плане объективной оценки наших реальных предпочтений, привычек и поведения, но и зависит как минимум от нашей внимательности и правдивости при ответах на вопросы, а также от эффективности организации сбора, анализа и обобщения информации.

В банковской сфере хорошо известен классический пример «конфликта данных». Как показывают социологические опросы, подавляющее большинство клиентов отвечают утвердительно на вопросы вроде «Предпочитаете ли вы банковское обслуживание в отделении?». Среди ипотечных заемщиков на подобные вопросы отвечают «да» практически 100 %, хотя на практике выясняется, что свыше 50 % новых клиентов приходят в банк виртуально – заполнив онлайновую форму. Более того, в развитых странах до трети клиентов вообще ни разу не заглядывали в отделение своего банка. Вот вам и пример того, что задавать людям прямые вопросы об их предпочтениях – не лучший способ получения достоверной информации. Надежнее изучать их фактическое поведение в реальном мире.

Полевые исследования – оптимальный на сегодня метод, позволяющий наблюдать за людьми в их естественной среде жизни и выяснять, как они используют физическое пространство или устройства интересующей исследователей категории, – если, конечно, ученым понятен смысл изучаемых действий и у них имеется разрешение на сбор и использование персональных данных такого рода. Но надо понимать, что такие исследования сопряжены с большими трудозатратами и обходятся крайне дорого, поэтому их невозможно проводить часто.

Сенсорные датчики в этом плане способны все перевернуть. Окружающий нас мир сегодня стремительно наполняется всевозможными камерами видеонаблюдения, радарами, регистраторами. Наши мобильные устройства также все больше оснащаются, в придачу к камерам, всевозможными акселерометрами, GPS-датчиками и тому подобным. К тому же у нас есть подключаемые к ним кардиографические и биометрические датчики в часах и браслетах, точки Wi-Fi доступа, мобильные приложения и плагины, куки-файлы, остающиеся после нас на сайтах, – все это позволяет собирать данные о нашем поведении и предпочтениях, по сути, безостановочно. По этим данным можно установить даже наше эмоциональное состояние, но самое главное – они дают безошибочное и всестороннее представление о характере нашего поведения при достаточно продолжительном сроке наблюдения.

В конечном итоге будущее взаимодействий между потребителями и поставщиками услуг просматривается вполне отчетливо. Благодаря развитым вычислительным мощностям, позволяющим обрабатывать колоссальные массивы данных, компьютерные программы с искусственным интеллектом станут людям лучшими советниками, превосходящими возможности профессиональных консультантов даже при условии равного доступа к данным. Ну а в области синтеза данных человек уже неконкурентоспособен. Именно поэтому услуги, предлагаемые нам ИИ-агентами, по-настоящему изменят всю нашу жизнь. Попомните мое слово: в недалеком будущем одним из самых распространенных ответов на любой вопрос, даже касающийся лично вас, будет: «Не знаю, сейчас посмотрю в смартфоне».

Если вы сегодня работаете консультантом любого рода, все вышесказанное, увы, рисует перед вами пугающие перспективы, – теперь вы можете представить, каково было ткачам в начале XIX века, когда появились паровые машины. В любом случае повернуть ход событий вспять нам не по силам.

Назад: Глава 6. Человек дополненный
Дальше: Часть 3. Эпоха дополненной реальности