Книга: Сердце машины. Наше будущее в эру эмоционального искусственного интеллекта
Назад: Глава 3 Строя будущее
Дальше: Глава 5 Начало эмоциональной экономики

Глава 4
Расскажи нам, как ты чувствуешь

Колорадо-Спрингс; Колорадо – 20 апреля 2015 года

 

Тихий ранний вечер на Вест-Колорадо-авеню. Магазины и офисы района, в котором полно бизнес-центров, ресторанов быстрого питания и скромных лавочек, готовятся к закрытию. Внезапно спокойствие нарушил звук выстрела, а потом еще один и еще. Жители окрестных домов потеряли счет выстрелам, некоторые в панике бросились к телефонам. Стрельба прекратилась так же внезапно, как и началась, но через несколько секунд тишина взорвалась воем полицейских сирен. На место преступления быстро приехал патруль, но было поздно. Они обнаружили последствия расстрела, подобного которому город еще не видел. Виновный – тридцатисемилетний предприниматель Лукас Хинч. В состоянии тяжелого расстройства Хинч вытащил жертву в глухой переулок, достал недавно купленный пистолет Hi-Point калибра 9 миллиметров и безжалостно выпустил восемь пуль в сердце своего компьютера 2012 Dell XPS410. Компьютер не выжил.
Еще не зная о том, что совершил противозаконное деяние, Хинч рассказал полиции, что компьютер доставлял ему проблемы на протяжении многих месяцев. (В Колорадо-Спрингс незаконно производить выстрелы из огнестрельного оружия в черте города.) По словам Хинча, когда на мониторе компьютера раз за разом появлялся печально известный «синий экран смерти» Windows, его терпение кончилось.
«Это было великолепно», – сказал Хинч об акте убийства машины, добавив, что совершенно не испытывает сожаления или чего-то в этом роде.
* * *
С тех пор как появились персональные компьютеры, все больше становится историй о пользователях, которые разбивают их вдребезги или вышвыривают из окна пятого этажа. В видео с камеры наблюдения 1997 года, получившем название «Неудачный день», офисный работник настолько рассвирепел, что сначала ударами кулаков разнес на куски клавиатуру, а потом разбил монитор об пол. Видеоролик набрал огромную популярность, его увидели миллионы людей. Помимо того, что это видео просто смешное, оно несомненно обязано своей популярностью тому, что многие люди, когда-либо работавшие за компьютером, испытывали отчаяние.
Как часто происходят случаи применения грубой физической силы по отношению к компьютерам? Возможно, чаще, чем вы думаете. Согласно интерактивному опросу компании Harris, проведенному по инициативе сайта Crucial.conn, более трети американцев признались, что проявляли физическую или словесную агрессию к своим компьютерам1. Агрессивное поведение проявлялось в виде сквернословия, крика, ударов по оборудованию кулаком или тяжелым предметом, когда компьютер выходил из строя или выдавал критическую ошибку.
Концепция компьютерной ярости исследовалась с тех пор, как появился сам термин. Как отмечает Клиффорд Насс в своей книге «Медиауравнение» (The Media Equation), наше взаимодействие с компьютерами носит в основном социальный характер. Однако машины еще не настолько сложны, чтобы полноценно участвовать в этих отношениях. Люди постоянно проявляют эмоции, но компьютерам нет дела до наших чувств, и иногда это доводит нас до отчаяния.
Мы все больше работаем с компьютерами, и все больше аспектов нашей жизни зависит от технологий. Пока компьютеры не станут полноценными участниками социальных отношений между человеком и машиной, наша злость будет только расти.
Это одна из перспектив эмоционального программирования: удовлетворить потребность, которую вряд ли удастся удовлетворить другими способами. В своей книге «Аффективное программирование» (Affective Computing) Розалинд Пикард пишет об этом, понимая, что отчаяние пользователя нередко является барьером, который мешает освоить новое программное обеспечение. В то же время есть уровень помощи и поддержки, который не только бесполезен, но раздражает. Microsoft пришлось узнать это на собственном горьком опыте.
В середине 1990-х годов в пакете программ Microsoft Office для Windows появился Помощник, один из первых интеллектуальных пользовательских интерфейсов. В нем использовался байесовский алгоритм, основанный на вероятностях намерений, а выглядел он как анимированная канцелярская скрепка по имени Скрепочка. (Многие пользователи называли его Скрепыш, и это имя прижилось.) Скрепыш часто выскакивал в неподходящие моменты и предлагал помощь независимо от того, какое из выполняемых пользователем заданий он обнаруживал. Проблема была в том, что Скрепыш был назойливым. Стоило напечатать за адресом слово «Дорогой», и тут же появлялся полный энтузиазма помощник и отвлекал пользователя. «Похоже, ты пишешь письмо, – говорил он и добавлял: – Тебе нужна помощь?» И хотя эта функция задумывалась как средство виртуальной помощи, постоянное раздражающее выпрыгивание помощника привело к тому, что его ругали все кому не лень. Насс подчеркнул это в своей статье 2010 года в «Wall Street Journal», написав: «Одной из самых одиозных программных разработок был Скрепыш – анимированная скрепка из Microsoft Office. Одно упоминание о нем вызывало такую бурю ненависти, с какой обычно отзываются о неверных возлюбленных или смертельных врагах». С годами на Скрепыша появлялись бесчисленные пародии и даже мем «Скрепыш, умри!» В 2001 году Microsoft отменила эту функцию.
В пакете Office было несколько проблем, связанных с работой функции Помощник, но самой вопиющей было полное игнорирование эмоционального состояния пользователя. От щелчков кнопкой мыши и печати текста с клавиатуры было очень далеко до действительно полезного взаимодействия, в частности потому, что человек, которому требовалась помощь, уже был расстроен. Комически антропоморфная внешность помощника и общение напрямую, которое усиливало у пользователя подсознательное ожидание социального взаимодействия, напоминающего человеческое, лишь усиливали разочарование.
Решением подобных проблем занялась новая исследовательская группа по эмоциональному программированию при Междисциплинарной исследовательской лаборатории. Например, Microsoft, отреагировав на почти повсеместную непопулярность Скрепыша, связалась с группой, чтобы узнать, как повысить эмоциональный интеллект и привлекательность Помощника. Команда Пикард предложила в качестве решения мышь, которая по силе нажатия кнопок распознает, насколько напряжен пользователь. При демонстрации устройства пользователь написал письмо мистеру Эбботу, но Microsoft Word постоянно менял имя на мистера Аббата. Распознав напряженное состояние пользователя по сжатию мыши, внезапно появился Скрепыш.
Он заметил: «Кажется, вы расстроены. Нужно ли мне выключить автокоррекцию?» Хотя мышь с датчиком сжатия была относительно простым устройством, она давала некоторое представление о состоянии пользователя почти в реальном времени. Основную часть проблемы удалось решить, не изменяя формата программы. Но даже несмотря на явное улучшение, судьба злополучной скрепки была решена. Скрепыш вошел в историю проектирования компьютерных интерфейсов как пример урока, полученного на горьком опыте.
Группа по эмоциональному программированию работала над необычными проектами и применяла нестандартные подходы в решении проблем, о которых многие даже не задумывались. Но именно это принесло Междисциплинарной исследовательской лаборатории Массачусетского технологического института всемирную известность. Ее основателями были профессор института Николас Негропонте и бывший президент института Джером Уиснер. Лаборатория занимается проектами на стыке технологии, науки, мультимедийных средств, искусства и проектирования. Результатом ее работы становятся инновации в области робототехники, искусственного интеллекта, взаимодействия человека и компьютера, разработки пользовательских интерфейсов, биомеханической электроники, социальной инженерии и других сфер.
Анализ походки и поз также считается предметом исследования эмоционального программирования и находит применение в таких областях, как физиотерапия и эргономика.
Когда Розалинд Пикард в 1997 году основала исследовательскую группу при Междисциплинарной исследовательской лаборатории, она получила решительную поддержку. По ее словам, в тот момент лаборатория была, возможно, единственным местом в мире, способным ее поддержать. Междисциплинарный характер лаборатории хорошо подходил для работы исследовательской группы, планировавшей совмещать инженерное проектирование и информатику с психологией, нейронауками, социологией, образованием, психофизиологией, ценностно-ориентированным проектированием, этикой и многими другими областями.
Междисциплинарный подход был крайне важен из-за сложности перевода эмоциональной экспрессии в форму, которую компьютеры могут опознать как процесс. Некоторые студенты и научные сотрудники группы создавали системы, способные распознавать выражения лиц, используя фотоснимки и видеокамеры. Другие записывали голос и пытались по интонации определить настроение говорящего, независимо оттого, какие слова он произносит. Некоторые работали с физиологическими сигналами, такими как показатели электромиографии, пульсовые колебания объема крови, кожно-гальванический рефлекс и дыхание. Ко многим из них они применили ряд техник распознавания образов, обучая системы определять значения и варианты экспрессии, которое нам, людям, удается естественно и без труда.
Распознавание образов – это отрасль машинного обучения и искусственного интеллекта, сложность которой возрастает на протяжении десятилетий. Поскольку это очень узкоспециализированная область искусственного интеллекта, ее часто называют одной из форм ограниченного или слабого ИИ. Программы пытаются повторить невероятную работу по распознаванию образов, которую без труда выполняет человеческий мозг. Однако механизм работы нейронов нельзя имитировать с помощью машинной логики. Таким образом, компьютерные методы значительно отличаются от естественных процессов. Например, распознавание образов посредством машинного зрения происходит в несколько этапов, на которых объекту или месту нужно присвоить значения. Первые стадии – установление и обработка, на которых изображение принимается и упорядочивается. За этими этапами может следовать стадия извлечения деталей, на которой в элементах выделяют линии, углы, области интереса и, возможно, текстуру, форму и движение. При распознании и делении на сегменты точки и области разбивают на категории, создавая иерархию для дальнейшей обработки. На этапе высокоуровневой обработки данные группируют, классифицируют и маркируют. Кроме того, изображение, которое нам кажется простым, может оказаться насыщенным с точки зрения вычислений.
Исследователи из группы по эмоциональному программированию обнаружили, что более прямые методы измерения эмоциональных изменений полезны сами по себе или в качестве дополнения к другим эмоциональным системам. Определение активных изменений с помощью отслеживания психологических сигналов позволяет сделать общее предположение о настроении тестируемого. Исследователи уже делали подобное в прошлом веке, изучая автономные сигналы, что в конечном итоге привело к созданию полиграфа и других разновидностей детектора лжи (подробнее об этом в главе 10).
Считывать выражение лица для машины намного сложнее, чем распознавать и сопоставлять визуальные структуры. Нюансы и варианты, возникающие в различных культурах, у разных людей и даже у одного человека могут быть настолько значительными, что совсем недавно специалисты считали, что проблему нельзя решить компьютерными средствами. Даже при доступных сегодня возможностях распознавания все еще актуальна проблема, как классифицировать и различить то, что компьютер распознал. Например, разница между экспрессивными и более сдержанными людьми. Как отличить искреннюю улыбку от фальшивой? Скалится ли человек от гнева или это ироническая ухмылка?
К счастью, группа по эмоциональному программированию, как и многие лаборатории, открывшиеся при институтах и на предприятиях по всему миру, знала ответ. В 1960-х годах молодой психолог Пол Экман начал исследование о том, как люди в разных культурах выражают эмоции. То есть зависит ли их проявление эмоций от места и условий, в которых человек вырос? За время исследования Экман объехал Соединенные Штаты, Бразилию, Чили и Аргентину. При помощи определенного набора изображений и вопросов он пытался определить, насколько универсальны эмоциональные проявления. Обнаружив высокую степень совпадения в разных культурах, Экман захотел исключить вероятность межкультурного влияния и отправился в Папуа – Новую Гвинею. Он хотел провести те же тесты в племенах, считавшихся самыми изолированными культурами в мире. Несмотря на изолированность, представители племен весьма точно распознавали эмоции по выражению лица2. (В этом случае наиболее сложно было различить выражения страха и удивления на лицах людей с фотографий.) На основании первоначальной работы Экман предположил, что существует шесть базовых эмоций: радость, печаль, гнев, удивление, страх и отвращение.
Позже некоторые ученые заявили о том, что базовых эмоций только четыре, но Экман на основании своего исследования выделил и классифицировал двадцать одну выраженную эмоцию.
На протяжении своей последующей карьеры как психолога, профессора, а позже главы компании, выпускающей учебные материалы по развитию эмоциональных навыков, Экман разработал множество теорий и методов работы с эмоциями. Он стал одним из самых цитируемых психологов XX века, вошел в топ-100 самых влиятельных людей по версии журнала «Time» и даже стал прототипом персонажа телесериала «Обмани меня» (Lie to Me) доктора Кэла Лайтмана (которого сыграл актер Тим Рот). Для эмоционального программирования особенно полезной оказались адаптация и популяризация системы кодирования лицевых движений (СКЛиД), таксономии выражений человеческого лица, разработанной за десятилетие до него шведским исследователем в области анатомии Карлом-Херманом Ёртье3. (Таксономия – это систематическая схема классификации.) Система позволяла разбить изображение на единицы, пригодные для процессной обработки. После этого компьютер анализировал движения отдельных лицевых мышц и подразделял на категории тем способом, который больше соответствовал машинной логике. Такая структурированная система была крайне полезна для зарождающейся области эмоционального программирования.
Позже Экман разработал еще несколько инструментов анализа выражения лица. Самые известные из них – программа MicroExpressions Training Tool, распознающая непроизвольные движения, возникающие даже тогда, когда человек пытается тщательно подавлять своим эмоции4, и Subtle Expression Training Tool, используемая для распознавания самых незаметных признаков эмоций. Позже выяснилось, что из десяти тысяч выражений человеческого лица лишь три тысячи соответствуют собственно эмоциям, и появились другие инструменты. В справочнике по интерпретации кодирования эмоциональной системы применяются те же таксономические методы, но только применительно к лицевым движениям, вызванным эмоциями5. Все эти инструменты создали основу для предварительной эмоциональной систематизации выражения лиц.
Создание систем программного обеспечения, способных понимать нас и взаимодействовать с нами более естественным образом, постоянно способствует усовершенствованию множества поддерживающих технологий.
При использовании систем типа СКЛиД Экмана стал очевиден один аспект: они основывались на статичных изображениях, их нельзя было применить к анализу видео. Но добавление в систему нелокальных пространственных структур и временной информации позволило распознавать эмоции в сменяющихся выражениях лица6. Это важно, поскольку в конечном итоге система смогла предоставлять на выходе более точные данные, чем со статичных изображений. Выражения лица не статичны, изменения происходят в реальном времени. Каждая черта, формирующая выражение, проходит стадию приложения, высвобождения и расслабления7. Таким образом, было бы проще и удобнее верно различать выражения лица, особенно микровыражения, при движении лицевых мускулов, например при общении между людьми.
Однако Пикард отмечает, что выражение лица не всегда указывает на глубинную эмоцию, благодаря которой оно появилось. Тем не менее поскольку лицо дает самое заметное визуальное представление о внутреннем эмоциональном состоянии, оно остается наилучшей отправной точкой для понимания сложных, часто скрываемых чувств.

 

Новая группа Междисциплинарной лаборатории делала успехи и в проектах применяла разные подходы к проблеме считывания эмоций8. Такой подход крайне важен для исследований в новой области. Лишь рассмотрев все возможности, предлагаемые эмоциональным программированием, можно было всесторонне изучить проблему.
Одна из команд разработала гальвактиватор – похожее на перчатку устройство, отслеживавшее электропроводность кожи владельца9. Гальвактиватор создали Пикард и Джоселин Шрайер, применив разработки Нэнси Тилбери и Джонатана Фаррингдона. Устройство выводило сигнал на диодный дисплей, который становился ярче, когда у пользователя повышался уровень возбуждения. Позже, в 1999 году, биологическую обратную связь использовали в компьютерной игре Quake. Когда сенсор отмечал, что игрок слишком нервничает из-за происходящего на экране, его персонаж прыгал назад. Группа разработала и другие биосенсоры, отслеживавшие специфические изменения психологического состояния пользователя. Концепция гальвактиватора нашла применение в более сложных портативных устройствах, некоторые из них пошли в серийное производство.
Среди других разработок группы был проект «Эмоция как индекс». В нем в качестве входных данных использовались физиологические показатели в группе людей. Показатели объединяли по различным демографическим параметрам и присоединяли к мультимедийному контенту10. Пользователи смогли «делиться» эмоциями, исследовать возможности и причины, по которым события по-разному влияли на их участников, и приходить к диалогу и пониманию. Другие проекты изучали динамику групп в социальных сетях. Цель проекта «Эмоция в речи» – создание базы данных с вариантами эмоций для проектов, ориентированных на автоматическое распознавание эмоций в речи11. Проект EyeJacking работает по принципу «посмотри, что я вижу». Используя такой феномен, как мудрость толпы, он позволяет «перехватить» поле зрения другого человека и определить, где он находится и что видит12. В случае с людьми, страдающими аутизмом, это позволяет их членам семьи, опекунам и сверстникам познавать их мир удаленно, получая другие данные в режиме времени, приближенном к реальному. Этот проект мог бы обеспечить возможности распознавания образов для роботов.
У многих проектов двойное назначение, они не только выполняют собственные задачи, но и могут использоваться в других проектах. Например, базу данных с вариантами интонации голоса можно использовать в программном обеспечении и устройствах с голосовым интерфейсом. Систему, собирающую настроение группы, можно задействовать в приложениях для соцсетей или в эпидемиологических исследованиях.
Одна из групп, «Эмоциональное общение при аутизме», занимается проектами, изучающими базовые проблемы в вербальном общении, в том числе расстройства аутического спектра13. Люди с такими расстройствами могут быть внешне спокойными, а внутренне находиться на грани срыва. Подобные устройства могут определить приближение опасного момента и помочь тем, кто заботится о больных аутизмом, предотвратить срыв.
Гальвактиватор, одна из первых эмоциональных технологий, вышедших из лаборатории, развивался на протяжении нескольких версий и поколений и становился все более сложным и удобным в качестве портативного устройства. Такие устройства, известные как сенсоры кожно-электрической активности, измеряют и отслеживают электропроводность кожи. (Название «гальвактиватор» произошло от более раннего термина «кожно-гальваническая реакция».) Первоначально гальвактиватор напоминал перчатку с обрезанными пальцами и проходил испытания в различных группах. В некоторых испытаниях участвовали и предоставляли свои данные более тысячи человек одновременно. Позже, в 2007 году, на основе гальвактиватора был выпущен браслет iCalm. Это бюджетное маломощное беспроводное устройство отслеживало изменения нескольких автономных процессов, таких как кожно-электрическая активность и сердцебиение. Устройство применялось для отслеживания ритма сна, снижения веса, уровня стресса, физической активности, обучения при аутизме, тестирования программных продуктов и даже интерфейсов видеоигр.
В статье для Института инженеров по электротехнике и радиоэлектронике Пикард описала случай Джоди, молодой женщины, страдающей аутизмом, которая выступала на ежегодной встрече аутистов14. Джоди, как и многие люди с расстройствами аутического спектра, испытывала сильный стресс, когда происходило что-то неожиданное, поэтому Пикард надела на нее браслет. Он отслеживал три биометрических сигнала: электропроводимость кожи, движение и температуру. Из-за изменений в расписании Джоди переволновалась. Браслет показал, что Джоди нервничает и пытается каким-то образом приспособиться к ситуации. Полученные данные позволили команде Пикард определить поведение, которое помогло Джоди избежать аутической истерики, крайне тяжелого и опасного состояния.
Группа эмоционального программирования выдвинула множество идей и создала множество проектов и изобретений, но одним из самых действительно важных результатов ее работы в лаборатории стали ее партнерские связи. В группе работало множество невероятно талантливых людей, и у многих из них сложились важные деловые отношения. В частности, одно партнерство послужило началом ряда новых технологий и коммерческих предприятий.
Рана эль Калиуби родилась и выросла в Каире, Египет, и там же получила степень бакалавра и магистра. Во время учебы в магистратуре у нее появилась идея использовать компьютеры, чтобы изменить связи людей друг с другом. Примерно в то же время ее жених Уаэль Амин, основавший технологический стартап в Каире, дал ей прочесть отзыв на знаменитую книгу Пикард 1997 года. Эль Калиуби заказала книгу и – через четыре месяца получив книгу – прочла ее. Она посчитала работу Пикард вдохновляющей, не в последнюю очередь потому, что ее написала женщина-инженер, которая стала для нее образцом для подражания, а позже учителем. Благодаря книге Пикард эль Калиуби решила, что будет заниматься разработкой систем, способных читать выражения лиц.
После магистратуры – темой диплома была система слежения за выражением лица – эль Калиуби приехала в Англию. Она собиралась получить докторскую степень в Кембриджском университете, но оказалось, что там никто не знал об эмоциональном программировании. Ее засыпали вопросами о том, почему она выбрала именно это направление. На одной из ее презентаций присутствовавший в аудитории молодой человек рассказал, что ему знакомы некоторые проблемы, возникшие перед эль Калиуби, потому что у его брата такие проблемы возникают каждый день. Его брат был аутистом.
Эль Калиуби ничего не знала об аутизме и начала исследования в этой области, поскольку надеялась найти подсказки. Когда она начала работу, директор Центра исследования аутизма, эксперт в области когнитивной нейробиологии Саймон Барон-Коэн сам работал над созданием видеокаталога выражений человеческого лица. Проект должен был помочь людям, страдающим расстройствами аутического спектра, распознавать выражения лица, поскольку неспособность читать человеческую мимику – широко распространенная проблема среди аутистов. Каждый видеоролик оценивала коллегия из двадцати специалистов. В результате в рамках проекта собрали свыше четырехсот одобренных видеороликов, которые эль Калиуби могла использовать для обучения своих программ. Алгоритмы машинного обучения обрабатывали все видеоролики, снабженные меткой отдельной эмоции – например, радости или смущения, – а затем находили общие черты в лицах, показанных во всех роликах. Программа знала, как выглядит то или иное выражение лица, и могла обучаться за счет дополнительных примеров и обратной связи.
Однажды настанет время, когда во все устройства будет встроен эмоциональный чип. Ваше устройство будет реагировать на ваши эмоции и приспосабливаться к ним.
В результате эль Калиуби разработала первый «протез» социальных навыков – очки с вмонтированной веб-камерой, которая выводила изображение на диодные дисплеи, обращенные к пользователю. Во время беседы устройство определяло выражение лица слушателя и предоставляло владельцу обратную связь в режиме реального времени. Светодиодный экран светился зеленым, желтым или красным цветом в зависимости от того, заинтересован собеседник в разговоре, настроен нейтрально или ему скучно. К концу пребывания в Кембридже эль Калиуби разработала систему, которая с точностью 88 % распознавала не только базовые эмоции, но и достаточно большой спектр выражений. Она дала устройству название MindReader.
В 2004 году, когда эль Калиуби разрабатывала MindReader в рамках работы над докторской диссертацией, ее лабораторию в Кембридже посетила Розалинд Пикард. Женщины очень быстро нашли общий язык15. Сложность и стабильность системы эль Калиуби произвели такое впечатление на Пикард, что они вместе усовершенствовали MindReader. Эль Калиуби попросила Пикард дать оценку ее докторской диссертации, а Пикард пригласила эль Калиуби в группу эмоционального программирования при Междисциплинарной исследовательской лаборатории. В 2006 году, получив докторскую степень, эль Калиуби присоединилась к группе. Они успешно работали вместе и вскоре получили от Национального научного фонда около миллиона долларов на разработку iSET, «протеза» эмоциональных навыков, на основе созданной эль Калиуби программы FaceSense.
Пикард и эль Калиуби сотрудничали по ряду проектов, основанных на технологиях iCalm и MindReader. На протяжении пяти лет они разрабатывали и тестировали свои устройства на детях в Гроден-центре и центре исследования аутизма в Провиденсе, Род-Айленд. Они просвещали людей, испытывающих проблемы с переживанием и распознанием эмоций, и работа в этой области была успешной.
Междисциплинарная исследовательская лаборатория дважды в год организовывала «спонсорскую неделю», когда сотрудники демонстрировали свои проекты корпоративным спонсорам, то есть компаниям, понимавшим потенциал того или иного исследования. Помимо благосклонности, которую обеспечивала эта информационно-просветительская акция, исследователи получали обратную связь. Хотя прогресс в работе Пикард и эль Калиуби впечатлял спонсоров, они считали объем работы над проектами недостаточным. Ученым постоянно говорили, что их технологии имеют огромный коммерческий потенциал, в частности для присвоения коммерческим продуктам марочных названий и исследования товарного рынка. Через некоторое время приложение MindReader загрузили на серверы Междисциплинарной лаборатории, и корпоративные спонсоры смогли протестировать продукт на стадии разработки. Приложение быстро стало самым скачиваемым продуктом лаборатории. Несмотря наживой интерес спонсоров, вместе с популярностью пришел и целый ряд вопросов. Самые разные компании хотели знать, что это за разработка и что она означает. Банк Америки, а также компании FOX, Gibson, HP, Hallmark, Microsoft, NASA, Nokia, Pepsi, Toyota и Yamaha продемонстрировали заинтересованность в приложении. Пикард и эль Калиуби были польщены, что их разработка может найти коммерческое применение помимо помощи людям, страдающим аутизмом, но и немного напуганы. Все же они были учеными, а не бизнесменами. Они хотели заниматься исследовательской работой, а не запускать стартапы.
Точность разрабатываемых устройств и систем продолжала постепенно повышаться. Одно из полезных качеств алгоритмов машинного обучения заключалось, в общих чертах, в том, что чем больше данных получали программы, тем лучше они становились. Некоторые модификации повышали скорость распознавания, например асимметричный сканер рта, созданный для систем распознавания лиц. Сначала системы распознавали рот человека симметрично. Но форма и расположение рта у человека часто отличается с разных сторон. При ухмылке, а также насмешливой или кривой улыбке левая сторона рта обычно отличается от правой. Сканер рта считывал данные с двух сторон независимо друг от друга, и точность распознавания значительно повысилась.
Несмотря на периодические модификации, машинное обучение еще было куда улучшать. Чтобы усовершенствовать точность программ, требовалось как можно больше примеров для обучения – огромные объемы данных. К сожалению, сотрудники группы по эмоциональному программированию не могли предоставить образцы в таком количестве. Более того, процесс получения образцов был трудоемким. Были необходимы тысячи, вернее десятки, а возможно, и сотни тысяч людей для обучения систем. Позже Пикард подсчитала, что если продолжить добывать образцы тем же способом, которым добывали до этого, процесс обошелся бы в миллиард долларов! Несмотря на все успехи лаборатории, получить такой бюджет было за гранью возможного.
Запросы от спонсоров продолжали поступать, и в конце концов Пикард и эль Калиуби обратились к директору лаборатории Фрэнку Моссу с просьбой привлечь к проекту больше исследователей. Мосс отказал, сказав, что для дальнейшего развития технологии нужно ориентироваться на бизнес-проекты. Мосс дал совет: «Пришло время действовать самостоятельно», добавив, что коммерческое использование сделает приложения более стабильными и многофункциональными16. Женщины хотели заниматься исследованиями, а не управлять компанией, но понимали, что выход на рынок неизбежен. Чтобы усовершенствовать разработку и повысить ее качество, придется выйти за пределы привычной академической среды и с головой погрузиться в жестокий мир бизнеса.
Назад: Глава 3 Строя будущее
Дальше: Глава 5 Начало эмоциональной экономики