Глава 8
…и последнее
Расположенный на берегу Тихого океана всего в часе езды на юг от Сан-Франциско, Санта-Круз буквально дышит чувственностью, как и все остальное в Северной Калифорнии. Богемный дух университетского городка смешивается с технократическими веяниями Кремниевой долины, лежащей за соседним холмом. Город с его близостью к сердцу компьютерного мира и глубоко укоренившейся контркультурой явно контрастирует с устремившимися ввысь офисными и производственными зданиями, разбросанными к северу от Сан-Хосе по другую сторону гор. И географически, и культурно Санта-Круз очень далек от гоночной трассы Homestead-Miami Speedway.
Одним туманным субботним утром в этом эклектичном прибрежном городке через несколько месяцев после того, как бегающие роботы Boston Dynamics стали гвоздем программы на трассе во Флориде, Том Грубер со своей подругой Рией Гауэн отправились в расположенную на первом этаже возле реки танцевальную студию The 418 Project. Они пришли одними из первых. Грубер был разработчиком программного обеспечения, а Гауэн – преподавательницей танцев. Она вернулась в Соединенные Штаты несколько лет назад, а до этого на протяжении 20 лет руководила в Японии труппой театра танцев «Буто».
В Санта-Круз Гауэн преподавала танцы в стиле «контактная импровизация», где партнеры не теряют физического контакта друг с другом, свободно двигаясь под музыку. Неподготовленному зрителю контактная импровизация кажется смесью танца, гимнастики, акробатики и даже борьбы. Танцор занимает такие позиции, чтобы партнер мог перекатываться и даже отталкиваться от него в такт музыке. Утренний сеанс в субботу, на котором присутствовали Грубер и Гауэн, выглядел еще более необычно: это была ритуальная встреча Общества экстатического танца Санта-Круз, проходившая по выходным. Вот основные правила этого действа с сайта ecstaticdance.org:
1. Двигайтесь как хотите.
2. Никаких разговоров на танцполе.
3. Уважайте себя и друг друга.
В соответствии с принятым этикетом партнер должен быть «чувственным», если он хочет танцевать с кем-то, если же нет, то ему предписывается «просто поблагодарить напарника, приложив руку к сердцу».
Музыкальное сопровождение тем утром менялось от медитативного джаза до кантри, рока, а затем переходило в каскад стилей электронной музыки. Комната постепенно заполнялась людьми. Одни танцевали с постоянным партнером, другие меняли партнеров, третьи покачивались, следуя внутреннему ритму. Это был танец свободной формы, вызывающий ассоциации с уроком физкультуры нового века.
Грубер и Гауэн пробирались сквозь толпу. Они то двигались вместе, то разделялись, чтобы потанцевать с другими партнерами, то воссоединялись. Он поддержал ее и наклонился, чтобы она могла перекатиться через его спину. Это не было идеальное движение «до-си-до», но, если оно выполнялось хорошо, один танцор становился опорой, которая без напряжения выдерживала вес партнера. Грубер был хорошим танцором и легко справлялся с движениями, которые и выражали чувственность современного танца. Это заметно контрастировало со стилем многих более хипповатых калифорнийцев средних лет, которые прыгали и махали руками в ответ на ускоряющийся ритм. Темп танца вырос до предела, а затем снизился до приятного грува. Танцоры стали расходиться. Грубер с Гауэн надели куртки и вышли на все еще туманный утренний воздух.
Грубер небрежно вынул iPhone из кармана и задал разработанному им персональному помощнику Siri простой вопрос о следующей остановке. В понедельник он вновь отправится в ярко освещенные коридоры Apple с бесконечными, заполненными плоскими дисплеями офисами, но пока пребывал в более антропоцентрическом мире, где компьютеров не было, а такие обычные устройства, как телефон, казались волшебными.
Корпоративный кампус Apple ограничен Инфинит-луп, улицей в форме овала рядом с федеральной автомагистралью 280 в Купертино. В этом «магическом круге» находятся шесть современных офисных зданий, обращенных фасадами на травянистый внутренний двор. Улица очерчивает территорию штаб-квартиры компании, словно подчеркивая скрытность Apple. Кампус был построен в эпоху, когда компанией управлял Джон Скалли. После завершения строительства он служил исследовательским центром, но, когда Apple провела сокращения с уходом Скалли в 1993 г., стал крепостью для осажденной компании. В 1997 г., когда вернулся Стив Джобс, сначала как временно исполняющий обязанности генерального директора, в компании произошли значительные изменения, включая решительное улучшение питания в кафе. Серебро, которым отличался кабинет директора в краткий период руководства Гилберта Амелио, исчезло.
Несмотря на ухудшение здоровья в 2011 г., связанное с раком поджелудочной железы, Стив Джобс вернулся, чтобы последняя глава его жизни прошла в Apple. Он третий раз находился в отпуске по болезни, но продолжал направлять компанию. Джобс перестал водить машину, и его привозил в штаб-квартиру Apple шофер. Он страшно похудел и на заседаниях не раз ссылался на проблемы со здоровьем, хотя никогда не признавал, что у него рак. Джобс постоянно потягивал 7UP, и это косвенно указывало на то, что он проходит курс химиотерапии.
Предыдущей весной Джобс приобрел Siri, крошечного разработчика приложения на естественном языке, которое должно было стать виртуальным помощником в iPhone. Покупка привлекла большое внимание в Кремниевой долине. Apple крайне редко осуществляла приобретения, особенно крупные. Слухи о том, что фирма куплена, возможно, более чем за $200 млн, стали потрясением для Сэнд-Хилл-роуд, а вместе с ней и для всей процветающей «экономики прикладных программ», которую породил iPhone. После приобретения Siri программа немедленно исчезла из App Store, службы iPhone, через которую предлагаются и продаются программы, а немногочисленная команда разрабатывавших Siri программистов растворилась в кампусе Купертино. Более важное последствие этого приобретения было не таким очевидным – одно из последних решений Стива Джобса на посту руководителя Apple открывало путь к кардинальному изменению характера взаимодействия людей с компьютерами. Джобс твердо встал на сторону тех, кто отдавал контроль над компьютерными системами людям.
Принципиальным вкладом Джобса в развитие компьютерного мира стало то, что он первым увидел в графическом интерфейсе более эффективное средство управления PC. Переход от командной строки эпохи DOS IBM к интерфейсу настольных предшественников Macintosh привел к широкому распространению персональных компьютеров среди студентов, проектировщиков и офисных работников – к появлению компьютера для «всех нас», как говорили в Apple. Визиты Стива Джобса в Xerox PARC стали легендой. Еще не ставшая публичной компания Apple получила от гиганта копировальной техники не только благословение, но и небольшие инвестиции. Джобс приезжал несколько раз в 1979 г., а за следующую половину десятилетия создал сначала Lisa, а затем Macintosh.
Но эра PC уже уступала дорогу второй концепции Xerox PARC – сплошной компьютеризации. Марк Вейзер из PARC высказался на этот счет в конце 1980-х гг. Джобс первым успешно материализовал идеи Вейзера в товарах массового потребления. iPod, а затем iPhone были действительно вездесущими вычислительными устройствами. Джобс сначала переделал магнитофон, а затем телефон, добавив к ним компьютер – «тысяча песен в вашем кармане» и «кое-что замечательное у вас в руке». Он был истинным шоуменом, и выражение «еще кое-что» стало девизом, который Джобс использовал во время представлений продуктов, перед тем как объявить о чем-то «безумно грандиозном». Приложение Siri для Джобса было «последнее кое-что». Приобретение Siri стало шагом к изменению компьютерного мира. Он перебросил мост между Dynabook Алана Кея и Knowledge Navigator, тщательно продуманным рекламным роликом Apple, демонстрирующим виртуального персонального помощника. Философская пропасть между искусственным интеллектом и усилением интеллекта привела к появлению двух областей, представители которых редко общались друг с другом. Даже сегодня в большинстве университетов искусственный интеллект и взаимодействие человека с компьютером остаются совершенно изолированными дисциплинами. Siri, близкое по сути к големическому подходу Ли Фельзенштейна, должно было стать программным роботом с чувством юмора, который является партнером, а не слугой.
Это было необычное требование, которое мог выдвинуть только Стив Джобс. Он дал команду своим проектировщикам телефонов принять группу неизвестных разработчиков программного обеспечения, не имевших никакого отношения к операционной системе Apple, и позволить им встроить свой код прямо в сердце iPhone. После этого он заставил своих разработчиков создать связи со всеми приложениями iPhone с нуля и потребовал сделать это меньше чем за год. Ядро из 24 человек, пришедших после приобретения Siri, усилили программистами, собранными со всех уголков Apple. Но это не все. В большинстве технологических компаний требование такого масштаба было бы отвергнуто как невозможное. Джобс же просто сказал: «За работу!»
В конце 1970-х гг. Том Грубер изучал психологию в колледже и открыл для себя искусственный интеллект случайно. Копаясь в библиотеке, он нашел доклад о работе Раджа Редди и группы специалистов по информатике из Университета Карнеги – Меллона, которые создали систему распознавания речи под названием Hearsay-II. Программа распознавала только тысячу слов в предложениях с 90 %-ной точностью. С одной ошибкой на каждые 10 слов она, конечно, не годилась для использования. Грубера, однако, поразило то, что в системе Hearsay обработка акустического сигнала сочеталась с общими методами искусственного интеллекта. Он сразу понял, что эта система потенциально представляет собой модель мозга, несущего знания. Психологи пытались моделировать его, но неудачно. В то время, в 1980-е гг., не было позитронно-эмиссионных и магнитно-резонансных томографов. Психологи изучали поведение человека, а не сам мозг.
Вскоре после того, как он прочитал о Hearsay, Грубер нашел работу преподавателя информатики Стэнфордского университета Эдварда Фейгенбаума, который разрабатывал идею «экспертных систем» для накопления знаний и выполнения функций специалистов в узких областях. Когда Фейгенбаум был аспирантом в Университете Карнеги – Меллона и работал с Гербертом Саймоном, он занимался созданием компьютерных моделей человеческой памяти. «Элементарное восприятие и запоминание», или EPAM, – психологическая теория обучения и памяти человека, которую исследователи смогли интегрировать в компьютерную программу.
Работа Фейгенбаума вдохновила Грубера задуматься над созданием моделей разума. Но в то время он не собирался идти в аспирантуру. Ни у кого в его семье не было ученой степени, и эта идея не входила в число его приоритетов. К тому времени, когда он наконец отправил заявление, лишь в паре-тройке мест можно было рассчитывать на стипендию. И Стэнфорд, и Массачусетский технологический институт ответили Груберу, что он опоздал почти на три месяца, и предложили подать заявление на следующий год. К счастью, его приняли в Массачусетский университет, где в то время работала яркая исследовательская группа, занимавшаяся робототехникой и программированием манипуляторов. Учебная программа там сочетала в себе искусственный интеллект и когнитивистику, что идеально подходило для моделирования человеческого разума.
Для Грубера искусственный интеллект оказался увлекательной частью компьютерной науки. Это была философски богатая и с научной точки зрения интересная область со своими идеями о психологии и функциях человеческого разума. С точки зрения Грубера, все остальное в компьютерной науке было в действительности просто техникой. Оказавшись в 1981 г. в Массачусетском университете, он познакомился с молодым ученым-компьютерщиком Полом Коэном, который был студентом Фейгенбаума в Стэнфорде и разделял интерес Грубера к искусственному интеллекту и психологии. Отец Пола Коэна, Гарольд Коэн, был известным художником, работавшим на стыке искусства и искусственного интеллекта. Он разработал компьютерную программу Aaron и с ее помощью рисовал и продавал художественные произведения. У программы не было художественного стиля, но она генерировала бесконечные ряды сложных образов на основе заданных Коэном параметров. Aaron оказалась плодотворной средой для размышлений над философскими аспектами автономности и креативности.
Грубер сказал заведующему кафедрой информатики, что хотел бы заниматься чем-нибудь, имеющим социальную значимость, и ему предложили проект по созданию систем, помогающих общаться инвалидам с серьезными нарушениями, например страдающим церебральным параличом. Многие из них не могли разговаривать и в то время использовали знаковые системы Bliss Board, которые позволяли составлять слова, указывая на буквы. Это был трудный и неудобный процесс. Система, которую Грубер помогал разрабатывать, относилась к одной из первых версий того, что сейчас исследователи называют «семантическим автодополнением». Исследователи работали с детьми, которые понимали язык, но говорили с трудом. Они добивались того, чтобы система предугадывала следующую фразу. Задача состояла в составлении сообщений типа «Я хочу гамбургер на обед».
В то время мир искусственного интеллекта был очень ограниченным. «Больших данных» не существовало, исследователи могли лишь построить небольшую модель мира ребенка. Поучаствовав в этом проекте, Грубер создал программу моделирования такого мирка. Он дал няням и родителям возможность добавлять предложения и таким образом персонифицировать систему для конкретного ребенка. Программа Грубера была примером того, что сообщество искусственного интеллекта называет «системами на основе знаний», программ, которые судят о сложных проблемах, опираясь на правила и базу данных. Идея состояла в создании программы, способной действовать как эксперт: врач, адвокат или инженер. Грубер быстро увидел трудность приобретения сложных знаний и сделал эту проблему предметом своей докторской диссертации.
Грубер был квалифицированным программистом, и многие сотрудники кафедры хотели заручиться его помощью в выполнении трудной части своей работы. Он, однако, подрабатывал по вечерам в компании – производителе мини-компьютеров Digital Equipment Corporation. Ему довелось участвовать в целом ряде проектов DEC, включая разработку первой многооконной системы, написанной на созданном Маккарти языке программирования Lisp. Программа, к удивлению многих разработчиков программного обеспечения, работала хорошо, хотя Lisp не был предназначен для графических приложений, где необходима высокая скорость. Груберу потребовался месяц, чтобы написать программу. Разработчики обычно писали приложения такого типа на ассемблере или C, но, как оказалось, для Грубера Lisp был достаточно эффективен. Чтобы показать возможности языка Lisp, он сделал для посетителей из Агентства национальной безопасности демоверсию системы «подборки вырезок». У программы был интерактивный интерфейс, позволявший пользователю проводить поиск, а затем сохранять результаты в системе оповещения, осуществлявшей фильтрацию этой информации. Грубер не бросил эту идею и воспользовался ею несколько лет спустя, когда основал свою первую компанию.
Сосредоточенный на получении степени доктора философии и по-прежнему увлеченный наукой о разуме, Грубер не пошел работать в тогда быстро растущую DEC. Аспирантура была нирваной. Он часто колесил на велосипеде по Западному Массачусетсу и мог работать удаленно со своего домашнего терминала, зарабатывая больше $30 в час, а лето проводил в Кембридже, работая в лаборатории DEC. Грубер также стал частью узкого сообщества исследователей искусственного интеллекта, которые пытались создать программные системы, приближающиеся к человеку по интеллектуальному потенциалу. Встречи членов сообщества проходили ежегодно в Банфе. Исследователи быстро поняли, что некоторые модели мышления противоречат обычной логике. Например, инженерное проектирование связано с целым рядом разных видов деятельности. Проектировщик систем обогрева, вентиляции и кондиционирования воздуха за редким исключением мог руководствоваться набором правил и ограничений. В оптике точные требования позволяют написать программу, которая проектирует идеальные линзы. Но встречаются и сложные случаи: например, конструирование изделий без очевидных правильных ответов и с миллионом вопросов о том, что обязательно, а что опционально. Здесь набор возможных ответов огромен, и очень сложно формализовать в программе талант квалифицированного проектировщика.
Груберу уже в начале исследований стало ясно, почему традиционные модели экспертных систем потерпели неудачу: интеллектуальный потенциал человека не сводится к отдельным идеям или методам. Он начал с разработки небольших моделей вроде инструмента для минимизации применения пестицидов в лесничествах. Помимо этого он работал с кардиологами над созданием диагностической системы, моделирующей использование их знаний и опыта. И то и другое было попыткой описать специальные знания с помощью программы. Очень простые модели могли работать, но реальный мир было крайне трудно упростить до набора правил. Врачи десятилетиями занимаются медициной, и Грубер понял, что свести их работу к «симптомам и признакам» невозможно. Врач мог спросить пациентов, что у них болит, сделать анализы, а затем выписать нитроглицерин и отправить их домой. В медицине соединялись диагностическое и лечебное направления. То, что наблюдал Грубер, было высокоуровневой стратегией, намного превосходившей простое запоминание действий, доступное в то время для сравнительно негибких экспертных систем.
Вскоре Грубер осознал, что ему интересно не улучшать экспертные системы, а создавать инструменты, облегчающие другим разработку экспертных систем. Потом это назовут «проблемой накопления знаний». В диссертации он утверждал, что для создания эффективной экспертной системы надо моделировать не знания, а стратегию, т. е. понимание того, что делать дальше. В то время экспертные системы постоянно зависали, создавались вручную и требовали участия специалистов для компилирования знаний. Его цель состояла в автоматизации приобретения этого неуловимого «стратегического знания».
Во время учебы в аспирантуре подход Грубера не выходил за рамки существующей в сообществе искусственного интеллекта концепции: сначала он определял искусственный интеллект традиционно, как понимание принципов функционирования интеллекта и выполнение задач на уровне человека. Со временем его точка зрения изменилась – необходимо не просто копировать интеллект человека, а стремиться к его усилению. Он не встречался с Энгельбартом и не был знаком с его идеями, но основным направлением исследований для него стало использование компьютеров не для копирования и замены людей, а для расширения их возможностей.
Еще во время работы над диссертацией Грубер решил перебраться на Западное побережье. Стэнфорд тогда был уже известным центром исследований искусственного интеллекта, и там работал Эд Фейгенбаум, восходящая звезда этой сферы. Он инициировал проект по созданию крупнейшей в мире экспертной системы по «техническим знаниям», знаниям о том, как разрабатываются и производятся такие вещи, как ракеты и реактивные двигатели. Консультант Грубера Пол Коэн представил его Фейгенбауму, который вежливо сказал, что его лаборатория работает на пожертвования и у него нет вакансий для новых сотрудников.
«А что, если я сам достану деньги?» – спросил Грубер.
«Принесете свои деньги?!»
Фейгенбаум не возражал, и Грубер получил финансирование от нескольких компаний, которые он консультировал. В скором времени он руководил проектом Фейгенбаума в области инженерии знаний. Вот так в 1989 г. Грубер оказался в Стэнфордском университете во время взрывного распространения персональных компьютеров и второй зимы искусственного интеллекта. В Стэнфорде Грубер был изолирован от коммерческой гонки. Начав работать в проекте Фейгенбаума, он сразу столкнулся с проблемой получения знаний, необходимых для моделирования работы эксперта. Именно на ней он споткнулся во время работы над диссертацией. Стало также понятно, что для перехода от «строительства» к «производству» систем знаний разработчикам нужны стандартные блоки. Грубер включился в стандартизацию языков и категорий, используемых при разработке искусственного интеллекта. Язык должен быть точным, если разработчики хотят создавать системы, в которых общается множество людей и программ. Модули не смогут работать без стандартизированных определений. Исследователи искусственного интеллекта заимствовали философский термин «онтология» и стали применять его для обозначения набора понятий – событий, объектов, взаимосвязей, которые составляют знания в той или иной области. В соответствии с определением Грубера онтология была «соглашением», общественным договором людей, заинтересованных в обмене информацией или ведении коммерции.
Это была технология, которая идеально сочеталась с новым тогда интернетом. Совершенно неожиданно бессвязный мир множества языков и компьютерных протоколов превратился в электронную Вавилонскую башню. Всемирная паутина предложила универсальный механизм, позволявший легко находить документы через интернет. В основе сети лежала давняя работа Дуга Энгельбарта и Теда Нельсона, которые независимо друг от друга выдвинули идею гипертекстовых ссылок, облегчавших доступ к хранящейся в компьютерных сетях информации. В 1990-х гг. сеть быстро стала средой соединения любого с чем угодно, предоставляя подобный Lego способ связи информации, компьютеров и людей.
Онтология предложила более эффективный способ обмена любыми видами информации, соединив мощь глобальной цифровой библиотеки с возможностью маркировки информационных «объектов». Это позволяло включить семантику, или смысл, в обмен электронной информацией и фактически сделать шаг в направлении искусственного интеллекта. Первоначально онтологиями занималась маленькая группка в сообществе искусственного интеллекта. Грубер одним из первых применил инженерные решения к созданию онтологий. Это вовлекало его в совместную работу с целым рядом программистов, которые могли находиться как в кампусе, так и на другом конце света. Он познакомился с ученым-компьютерщиком Джеем «Марти» Тененбаумом, который ранее руководил исследованиями в области искусственного интеллекта в SRI International, а в тот момент возглавлял одну из первых лабораторий искусственного интеллекта в Кремниевой долине, созданной французским гигантом в области нефтеразведки Schlumberger. Тененбаум сразу разглядел будущее электронной коммерции, предшествовавшей Всемирной паутине. В 1992 г. он основал одну из первых компаний «электронной торговли» Enterprise Integration Technologies (EIT), тогда такая идея была еще мало кому знакомой.
В офисе около того места, где когда-то располагался первый производитель микросхем Долины Fairchild Semiconductor, Тененбаум набросал модель «беспроблемной» электронной торговли. Он предвидел появление автоматизированной экономики в стиле Lego, в которой целые отрасли будут связаны компьютерными сетями и программными системами, осуществляющими обмен товарами и услугами. Работа Грубера в области онтологии отлично подходила к системе торговли Тененбаума, которой требовался общий язык для соединения разрозненных частей. В определенной мере благодаря их сотрудничеству Грубер одним из первых технологов в Кремниевой долине погрузился во Всемирную паутину. Сеть, созданную Тимом Бернерсом-Ли в недрах сообщества физики элементарных частиц в Швейцарии, быстро приняли ученые-компьютерщики. Широкая публика узнала о ней после публикации статьи в New York Times в декабре 1993 г.
Интернет позволил Груберу создать небольшую группу, которая превратилась в живое киберсообщество, связанное посредством электронной почты. Хотя некоторые из его членов встречались друг с другом, они были фактически «виртуальной» организацией. Недостаток заключался в том, что их связь была двухточечной, не позволявшей вести коллективные обсуждения. «Было бы неплохо иметь "живой" накопитель наших сообщений», – подумал Грубер. У него зародилась идея создать общедоступную, постоянную групповую память с возможностью поиска. Сегодня, когда существуют онлайновые конференции, системы поддержки и Google, такая идея кажется тривиальной, но в то время это был прорыв. Именно эта концепция лежала в основе системы NLS Дуга Энгельбарта, но с появлением персонального компьютера его широкое видение отошло на второй план. Xerox PARC, а затем Apple и Microsoft использовали лишь отдельные его идеи, такие как мышь и гипертекст, а более масштабная задача – облегчение работы небольших групп специалистов – была забыта. Грубер создал программу, которая автоматически генерировала обновляемый документ о работе, выполненной группой людей. За пару недель он написал программу под названием Hypermail, которая «живет» на почтовом сервере и генерирует цепочечную копию переписки, которую можно получить через сеть. В результате появился цифровой снимок электронной переписки с постоянными ссылками, который можно было разметить и заархивировать.
Появление Всемирной паутины изменило жизнь Грубера. Ему было 30 лет, он работал в Стэнфорде и быстро понял, что сеть представляла собой намного более масштабную идею, чем все его прежние начинания. Он увидел, что работа Тененбаума способна кардинально изменить использование компьютеров. Тененбаум нанял молодого программиста по имени Кевин Хьюз из Гавайского колледжа. Хьюз был представителем нового класса программистов, поколения, выросшего с компьютерами. Со стороны он казался недостаточно взрослым для серьезной работы, однако сам он называл себя «веб-мастером». Грубер написал Hypermail на своем любимом языке программирования Lisp и распространял ее через популярные в то время каналы для установки программного обеспечения. С точки зрения Хьюза, этот подход уже устарел. Он сказал Груберу, что Hypermail нужно переписать на C и что программа должна быть свободно доступной в сети. Грубер поговорил с Тененбаумом и за выходные переписал программу на C. Хьюз был прав. Как только она появилась в свободном доступе в сети, ее использование резко возросло.
Это был крупный шаг к реализации представлений Энгельбарта – Нельсона о гипертексте. Теперь любой, у кого на компьютере с Unix был запущен сервер рассылки, мог сбросить программу к себе, и его электронные сообщения становились доступными широкому кругу пользователей интернета. Для Грубера это был наглядный урок использования интернета для раскрутки идеи. В 1995 г., в самом начале эры доткомов, EIT была куплена компанией VeriFone. Два года спустя во время надувания первого интернет-пузыря VeriFone, известная своими кассовыми терминалами, сама была куплена HP, но лишь для того, чтобы быть выброшенной после схлопывания пузыря. Грубер ушел из Стэнфорда в EIT в 1994 г., однако оставил ее до того, как она была продана в первый раз, чтобы реализовать собственные идеи. Он задавался вопросом: зачем останавливаться на электронной почте? Ему хотелось создать что-то на основе видения Энгельбарта и продать это корпоративной Америке.
В начале 1990-х гг. в Стэнфорде идеи Энгельбарта переживали второе рождение. За четыре года, которые Грубер провел в университете, попытки создать систему инженерии знаний Фейгенбаума на основе множества правил, утверждений и онтологий не принесли успеха. В проекте Hypermail Грубер видел возможность создать коммерческую систему знаний и в предпринимательском порыве периода доткомов намеревался организовать для этого собственную компанию. Бернерс-Ли совершил прорыв, разработав Всемирную паутину. Он не только создал работающую версию гипертекстовой системы Энгельбарта – Нельсона, но и определил систему постоянных идентификаторов для пакетов информации, которую инженеры описывали как «объекты знаний». Это меняло все. У веб-разработчиков появилась возможность создавать устойчивые структуры знаний, функционировавшие как доступные цифровые библиотеки, на базе которых можно было строить и системы искусственного интеллекта, и системы усиления интеллекта.
Идея Грубера заключалась в создании «корпоративной памяти», системы, связывающей все документы современной организации и обеспечивающей простоту их структурирования и поиска. Это напоминало систему Энгельбарта oN-Line System, но с использованием возможностей изобретения Бернерса-Ли. Тогда уже существовала Lotus Notes Рэя Оззи, молодого программиста, работавшего по контракту на Митча Капора из Lotus, но она была лицензионной и не выходила за пределы мира корпоративного программного обеспечения. Теперь интернет и новые веб-стандарты позволяли создавать что угодно значительно большего масштаба.
В 1996 г. Грубер вместе с исследователем искусственного интеллекта Питером Фридлендом и бывшим менеджером программ DARPA Крейгом Виром основал в Лос-Алтосе компанию Intraspect и стал в ней техническим директором. Сначала он работал с программистом, у которого была основная работа в Стэнфорде. Грубер работал над прототипом днем, а программист приезжал вечером и продолжал работу ночью. Поскольку Грубер уезжал в конце дня, они обсуждали сделанное и определяли, что нужно завершить. Такое взаимодействие позволяло быстро двигаться вперед.
Компания в конечном итоге привлекла от венчурных капиталистов более $60 млн, наняла 220 сотрудников и получила доведенный до ума продукт. В число ее клиентов вошли «голубые фишки», включая GTE, General Motors, KPMG, Boeing и Siemens. Эра PC преобразовала компании, которые перешли на электронную почту, отказавшись от бумажного документооборота. Этот переход позволил создать недорогую систему, которая просто «проглатывала» каждое отправление, посланное на определенный адрес электронной почты. Ей не нужен был ни веб-мастер, ни ИТ-специалист. Система Intraspect всасывала корпоративную переписку и документы и делала их доступными для любого сотрудника компании через персональный компьютер. Значки папок на мониторе по-прежнему воспринимались как символ систематизированных документов, поэтому инженеры Intraspect создали Windows-программу с ориентированным на папки интерфейсом.
В представлении Грубера именно так и должно было выглядеть будущее искусственного интеллекта. То, что начиналось как попытка смоделировать человеческий мозг, закончилось моделированием взаимодействия группы людей. В некотором смысле это различие составляло основу культурного разрыва между двумя научными сообществами. Сообщество искусственного интеллекта пыталось создать копию разума человека, а нарождающееся сообщество человеко-машинного взаимодействия следовало традиции усиления интеллекта Энгельбарта. Грубер начал с разработки компьютерной системы, расширявшей возможности небольших групп совместно работающих людей, а потом полностью перешел на сторону сообщества усиления интеллекта. В Стэнфордской лаборатории систем знаний он встречался с разработчиками авиационной электроники и принял близко к сердцу их точку зрения. Конструкторы на протяжении целой эпохи исходили из того, что люди должны адаптироваться к машине. Они считали машину центром вселенной, а людей, использующих машины, менее значительными персонажами. Авиаконструкторы на горьком опыте убедились, что без объединения человека и машины в одно целое создаваемые системы управления приводили к катастрофам. Списать все аварии на ошибки пилотов было просто невозможно. Поняв, что пилот является частью системы, разработчики изменили конструкцию кабины самолета. Такие переменные, как продолжительность концентрации внимания и когнитивная нагрузка, впервые предложенные психологами, стали обязательно учитываться сначала в бортовой электронике, а позже в компьютерных системах.
Грубер уделял большое внимание этим вопросам при разработке системы запросов Intraspect. В его представлении заказчики (во многих случаях агенты по сбыту) были «пилотами самолетов», которых не следовало перегружать информацией. Как-то Intraspect продемонстрировала свою систему одному из руководителей J. P. Morgan. Грубер ввел несложный запрос, и руководитель получил подборку последних писем ведущих сотрудников с присоединенными документами. От удивления у него отвисла челюсть – он мог буквально видеть, что происходило в его компании. Алгоритм поиска в системе Intraspect ранжировал документы по новизне и релевантности, первое поколение поисковых систем в интернете не позволяло делать это.
На пике эры доткомов Intraspect добилась впечатляющих успехов. У нее были престижные заказчики и прочное положение в таких крупных отраслях, как финансовые услуги. Потенциальный доход оценивался в $30–40 млн. Компания даже подготовила форму S-1, намереваясь выйти на биржу, и переехала в большое новое здание с заметным логотипом, который был виден с автострады 101. Затем все рухнуло. Хотя Intraspect пережила крах доткомов, обвал рынка подкосил некоторых из ее лучших заказчиков.
После 11 сентября 2001 г. ситуация изменилась. Финансовые директора крупнейших заказчиков просто запретили приобретение продуктов и услуг у непубличных компаний. Волна страха связала Intraspect руки. Грубер отдал шесть лет созданию компании и сначала отказывался верить, что все кончено. У них были такие крепкие заказчики и такой универсальный продукт, что, казалось, обязательно найдется способ выжить. Но успех компании строился на помощи в продвижении профессиональных услуг, таких как услуги «большой пятерки» аудиторских фирм, а кризис нанес сильный удар по этой сфере.
Чтобы остаться на плаву, Груберу пришлось уволить 60 % персонала. Но Intraspect все же умерла. Хотя у нее были преимущества перед конкурентами, рухнул весь рынок программного обеспечения для коллективной работы. Компании, занимавшиеся разработкой порталов, управлением документооборотом, поисковыми системами и управлением знаниями, сливались друг с другом. В 2003 г. Intraspect была продана Vignette по бросовой цене, и это был конец.
Грубер поработал пару месяцев в Vignette, а затем взял отпуск на год, чтобы собраться с мыслями и решить, что делать дальше. Он отправился в Таиланд, где занимался подводным плаванием и фотографией, и открыл для себя восьмидневный фестиваль Burning Man в пустыне штата Невада, который привлекал десятки тысяч представителей компьютерной элиты Долины. Когда академический отпуск закончился, Грубер был готов создать новую компанию.
Он знал Рида Хоффмана, который к тому времени запустил социальную сеть для делового общения LinkedIn. Благодаря приобретенному в Intraspect опыту, Грубер хорошо понимал суть «социального программного обеспечения». Эти двое долго вели переговоры о присоединении Грубера к стартапу, который впоследствии стал одной из первых успешных социальных сетей в Кремниевой долине. Грубер хотел сосредоточиться на разработке, а Хоффман искал нового технического директора, но в конце концов совет директоров LinkedIn наложил вето на идею по той причине, что компания вот-вот должна была начать новый раунд привлечения инвестиций.
Проведенный в разъездах год навел Грубера на размышления о пересечении сферы туризма и «коллективного разума», родившегося с появлением Web 2.0. Интернет теперь не только позволял создать корпоративную память, использование ресурсов больших групп пользователей стало легкодоступным для любого начинания. Самым ярким примером была, конечно, Google. Алгоритм поиска PageRank компании использовал предпочтения людей для оценки результатов поисковых запросов в интернете. Через Рида Хоффмана Грубер нашел стартап, намеревавшийся конкурировать с TripAdvisor, которая в то время предлагала только отзывы туристов об отелях. Он убедил владельцев в том, что сможет привлечь широкую аудиторию, а на их долю останется лишь развитие бизнеса. Так Грубер стал вице-президентом по разработкам в новом стартапе, однако на сей раз у него была команда из трех инженеров вместо 60. Малочисленность армии программистов больше не была критическим фактором успеха компании – интернет изменил все. Даже самые маленькие стартапы могли намного увеличить свои возможности, используя более мощный набор средств разработки.
Стартап планировал собирать лучшие описания туров от людей, разъезжающих по всему миру. На создание сервиса у них ушел год, и сайт realtravel.com был представлен на конференции О'Рейлли по Web 2.0 в 2006 г., интернет-событии, которое быстро стало популярным среди так называемых социальных стартапов следующей волны. Realtravel.com рос быстро, в какой-то момент даже говорили о 2 млн уникальных посетителей, но все же не так, как хотелось, и в 2008 г., спустя всего два года после раунда первоначального финансирования, компания была продана. Грубер покинул ее еще до этого из-за конфликтов с генеральным директором-дальтоником по поводу цветов страниц сайта.
Он взял еще один годовой отпуск. При создании realtravel.com Грубер занимался всем, от написания кода до руководства разработкой, и ему требовался отдых. По возвращении он задействовал свою сеть контактов в Кремниевой долине для поиска интересных проектов. Он был членом регулярно собиравшейся неформальной группы под названием «Клуб технических директоров», и там кто-то упомянул о новом проекте в SRI.
При Тони Тетере средства DARPA, заинтересованного в создании программного персонального помощника, рекой текли в исследовательский центр. За пять лет, в 2003–2008 гг., это агентство Пентагона немало потратило на идею «когнитивного помощника». Проект в конечном счете привлек больше 300 исследователей в 25 университетах и корпоративных исследовательских лабораториях, а SRI играл роль интегратора проекта. Когнитивный помощник CALO был неосуществимым проектом в традиции DARPA, на деньги которого уже были построены целые отрасли в Кремниевой долине. Рабочие станции, сети и персональные компьютеры – все начиналось как исследовательские проекты DARPA.
Название CALO происходило от латинского слова calonis, означавшего слугу солдата, или неуклюжего работягу. Этот проект в значительной мере пересекался с работой Энгельбарта, которая финансировалась DARPA в 1960-х и 1970-х гг. CALO должен был помогать офисным работникам в управлении проектами: упорядочивать электронную почту, календари, документы, контакты, календарные графики и управление задачами. В результате из проекта CALO вышел целый ряд коммерческих приложений – умный календарь и персонализированный путеводитель, а также компания по разработке игр и образовательных программ, но все они не шли ни в какое сравнение с Siri.
Задолго до того, как набрало популярность движение мейкеров, субкультура Кремниевой долины, превозносившая подход «сделай сам», в этот мир с подачи матери вошел Адам Чейер, будущий соучредитель Грубера по Siri. Как ребенку из пригорода Бостона, ему разрешали смотреть телевизор лишь час в неделю, однако и этого было достаточно для получения представления о достижениях технологии и появления страсти к новейшим игрушкам. Но когда он попросил купить ему что-то, мать дала ему пачку картонок, которые в прачечных вставляют в рубашки для придания формы. Адам с помощью ленты, клея и ножниц воссоздавал игрушки, которые видел по телевизору: роботов и хитрые изобретения Руба Голдберга. Это приучило Чейера к мысли, что, стоит приложить немного воображения, и можно сделать все, что хочешь.
Ребенком он мечтал стать фокусником. Чейер читал книги о великих фокусниках и считал их изобретателями и умельцами, обманывавшими других с помощью технологии. Ему еще не было 10, а он уже откладывал деньги на книги и наборы для фокусов, продававшиеся в местном магазине. Позже он осознал, что его интерес к искусственному интеллекту основывался на любви к волшебству. Его любимые фокусники XVIII в. и часовщики во главе с Жаком де Вокансоном создали первые автоматы: игравшие в шахматы и говорящие машины и другие механические гуманоиды, которые пытались приблизиться к тому, что он, как и Грубер, считал самым удивительным устройством, – человеческому мозгу.
Хотя Чейер ничего не знал о легендарной NLS Энгельбарта, в 1987 г., работая исследователем искусственного интеллекта во Франции, в аэрокосмической фирме Bull, он создал собственную систему под названием HyperDoc. Он интегрировал систему ведения документации в редактор, который программисты использовали при разработке экспертных систем. Это новшество позволяло, простого кликнув по любой функции или команде, просмотреть соответствующее онлайновое руководство. Легкий доступ к документации по программному обеспечению упростил программирование компьютеров и сократил количество ошибок. В то время Чейер не был знаком с историей Исследовательского центра усиления интеллекта Дуга Энгельбарта в Менло-Парке в 1960-е и 1970-е гг. Он переехал в Калифорнию, чтобы получить степень магистра в области компьютерных наук, планируя после защиты вернуться во Францию. Ему нравилось в Калифорнии, но французская компьютерная фирма платила за его обучение только с условием, что он вернется в Европу.
Незадолго до возвращения Чейер наткнулся на небольшое объявление о вакансии в Лаборатории искусственного интеллекта в SRI. Работа показалась ему привлекательной, и он решил подать заявление. Прежде чем лететь в район залива Сан-Франциско на собеседование, он пролистал отчеты о работе всех исследователей группы и знал, над чем работал каждый, кто и с кем сотрудничал и какого мнения придерживался по разным вопросам. Его изыскания оправдались. Он был принят в Центр искусственного интеллекта SRI.
В начале 1990-х гг., несмотря на зиму искусственного интеллекта, SRI оставался процветающим центром коммерческих, военных и академических исследований искусственного интеллекта, и через десятилетия после Shakey роботы по-прежнему бродили по его коридорам. Когда Чейер приехал в лабораторию, он получил небольшой грант на проведение исследований от корейской телекоммуникационной лаборатории, принадлежавшей правительству Южной Кореи. Проект предполагал создание офисной системы голосового управления с возможностью рукописного ввода информации. «Сделайте хотя бы один из вариантов», – предложили ему.
Он решил создать систему, к которой можно легко подключать дополнительные возможности в будущем. Систему назвали Open Agent Architecture (OAA). Она должна была обеспечивать «делегирование компьютерной обработки», как называл это Чейер. Например, если у компьютера спрашивали: «Какой у Боба электронный адрес?» – поиск ответа можно было произвести несколькими способами. Чейер создал язык, дававший виртуальному помощнику возможность интерпретировать задачу и эффективно находить ответ.
При разработке платформы он оказался в самом центре споров между исследователями искусственного интеллекта и конкурирующим сообществом человеко-машинного взаимодействия. Одна группа полагала, что пользователь должен полностью контролировать компьютер, а другая ориентировалась на программные агенты, которые могли «жить» в компьютерных сетях и выполнять задачи от имени пользователей. У Чейера было свое представление об идеальных отношениях между человеком и машиной. Он считал, что людям иногда нравится напрямую управлять системами, но зачастую они не прочь отдать что-то системе и не отвлекаться на детали. Поэтому его язык позволял отделять задачи, полностью передаваемые системе, от задач, где система помогала пользователю выбрать вариант решения.
Через год после приезда в SRI Чейер фактически сфокусировался на создании рабочей версии программы Knowledge Navigator, разрекламированной Джоном Скалли в футуристическом видео в 1987 г. Как и Алан Кей, начавший с создания «промежуточного» Dynabook, в течение следующих двух десятилетий Чейер раз за разом разрабатывал прототипы, каждый из которых все ближе подходил к возможностям Knowledge Navigator. Он создавал виртуальных роботов, программных помощников, которые должны были в равной мере служить и партнерами, и слугами.
К концу 1993 г. он разработал планшетный компьютер, напоминавший iPad. Сенсорного интерфейса еще не существовало, поэтому Чейер интегрировал в планшет перьевой ввод, позволявший распознавать и почерк, и такие жесты, как очерчивание объектов для их выбора. Планшет мог также распознать речь, поскольку Чейер пристрастился к тому, что походило на заимствование сахара у соседей по коридору. Он убедил исследователей из Лаборатории речевой технологии SRI установить программный интерфейс API на его планшет. Это позволило ему подключить систему распознавания речи на базе мейнфрейма к своей системе. С целью развития речевой технологии SRI, разработка которой началась еще во времена Shakey, в следующем году создали отдельный стартап Nuance Communications, который первоначально занимался голосовыми приложениями для колл-центров. Точно так же Чейер поступил с технологиями распознавания рукописного текста SRI. Он сделал демонстрационную систему с возможностью голосового и перьевого ввода, что приближало ее к программному секретарю. Она автоматизировала связанные с календарем задачи и обрабатывала электронную почту, списки контактов и базы данных, а Чейер пошел дальше и стал экспериментировать с такими задачами для виртуальных помощников, как поиск ресторанов и кинотеатров на карте.
Чейер ходил по коридорам и высматривал для себя интересные проекты: понимание естественного языка, распознавание речи, сотрудничество с роботами, машинное зрение. SRI был его игровой площадкой, он использовал ее, чтобы свести вместе очень разнородный и богатый набор вычислительных систем и сервисов. Надо отметить, что все это делалось еще до того, как он впервые увидел веб-браузер. Всемирная паутина только начинала проникать в мир. Когда, наконец, появился первый популярный браузер Mosaic NCSA, открывший сеть для широкой публики, Чейер испытал эффект дежавю.
Чейеру хотелось создать помощника, способного предоставить пользователю компьютера такую же помощь, как и внимательный секретарь. Хотя он начинал в одиночестве, потом у него появилась небольшая команда программистов и разработчиков, и за шесть лет они выпустили больше 40 приложений: от интеллектуальных холодильников, которые находили рецепты и сами пополняли запасы, до телевизоров, позволявших управлять домом, роботов-помощников и интеллектуальных офисов. В конечном счете команда оказала значительное влияние на мир мобильных компьютеров. Спустя 15 лет два члена его исследовательской группы стали ключевыми техническими руководителями, отвечавшими за разработку смартфона Samsung Galaxy, а три пошли в Apple работать с Siri.
Чейер заработал в SRI репутацию «следующего Энгельбарта». Он настолько увлекся идеями Энгельбарта, что держал фотографию легендарного ученого-компьютерщика на своем столе, как напоминание о его принципах. К концу 1990-х гг. Чейер был готов к решению новой задачи. Эра доткомов была в полном разгаре, и он решил коммерциализировать свои идеи. Использование интернета при взаимодействии бизнес – бизнес расширялось взрывными темпами, и повсюду были сервисы, которые нуждались в сетевом соединении. Исследование Чейера идеально подходило для недавно ставшей популярной идеи слабосвязанного управления. В мире связанных в сеть компьютеров только начинало разрабатываться программное обеспечение, позволявшее им работать совместно. Он шел тем же путем, что и исследователь искусственного интеллекта Марти Тененбаум, создавший компанию CommerceNet, для которой Том Грубер формировал онтологии.
Чейер был одним из немногих исследователей Кремниевой долины, рано понявших, что интернет станет звеном, объединяющим всю коммерцию. Чейер пришел к одному из конкурентов, VerticalNet, создал там исследовательскую лабораторию и вскоре был назначен вице-президентом по разработке. Как и Грубера, его захватил водоворот доткомов. В какой-то момент рыночная стоимость VerticalNet взлетела до $12 млрд при доходах немного больше $112 млн. Конечно, это не могло продолжаться долго. Он проработал в компании четыре года, а затем вернулся в SRI.
DARPA обратилось к Чейеру с предложением возглавить амбициозный проект национального масштаба по созданию CALO, находившийся под крылом Тони Тетера. DARPA рассчитывало, что он привлечет исследователей искусственного интеллекта со всей страны. Обычно DARPA финансировало сразу несколько исследовательских лабораторий и не интегрировало результаты. Однако на этот раз предполагалось, что разработку CALO будет координировать SRI. Все должны были отчитываться перед командой SRI и работать над одной интегрированной системой. Чейер помог написать первоначальное предложение DARPA и стал архитектором проекта, когда SRI получил заказ. CALO твердо основывался на традиционном символьном подходе первого поколения искусственного интеллекта – планирование, рассуждение и онтологии, – но было и новое направление, которое обозначалась как «обучение в естественной среде».
CALO был похож на небольшой Манхэттенский проект. На пике в нем участвовало более 400 человек, а его результатом стало более 600 исследовательских работ. DARPA потратило на него почти четверть миллиарда долларов, что делает его одним из самых дорогих проектов в области искусственного интеллекта в истории. Участники проекта CALO пытались создать программного помощника с адаптируемостью, как у человека, способного учиться у человека, с которым он работает, и соответственно менять свое поведение.
Когда CALO прошел ежегодные тесты, DARPA было в восторге. Тетер наградил проект за отличные успехи, а часть технологий перешла в проекты ВМС. Но Адам Чейер, как архитектор проекта, испытал сильнейшее разочарование. Джон Маккарти как-то сказал, что для создания «интеллектуальной машины» нужны «1,8 Эйнштейна и десятая часть ресурсов Манхэттенского проекта». Если исходить из оценки Маккарти и учесть, что Манхэттенский проект стоил бы больше $25 млрд в текущих долларах, то на CALO ушло меньше того, что требовалось для создания интеллектуальной машины.
Для Чейера, однако, основным препятствием в проектировании CALO был не дефицит финансирования, а DARPA, пытавшееся мелочно контролировать процесс. Часто ему не удавалось действовать по своему плану, руководство неоднократно отклоняло его идеи. Ему было трудно направлять огромное количество команд, каждая из которых имела собственные приоритеты и получила лишь небольшую часть финансирования от проекта CALO. Призывы Чейера работать совместно над общим проектом, интегрировавшим множество идей в новую «когнитивную» архитектуру, в основном не находили отклика. Его вежливо выслушивали, поскольку хотели получить следующий транш, и создавали программы, но всех в первую очередь интересовали собственные проекты. Большая и бюрократическая программа не могла родить нечто, способное оказать прямое воздействие на реальный мир.
Чтобы справиться с разочарованием, он наметил ряд параллельных проектов для продолжения работы в 2007 г. Они варьировали от попыток коммерциализировать технологию CALO до создания с несколькими друзьями социальной сети для активистов под названием change.org. Этот год стал удивительно плодотворным для Чейера. С аспирантом Дидье Гуццони он использовал технологии CALO для создания новой системы разработки программного обеспечения, в конечном итоге ставшей основой для Siri. Он также собрал небольшую группу разработчиков, начавшую выпускать на рынок различные компоненты Siri: календари для смартфонов, средства онлайнового чтения новостей и т. д. Он также принял участие в создании компании машинного обучения Genetic Finance, построившей кластер более чем из миллиона компьютеров для решения задач в сфере финансов, например прогнозирования состояния фондового рынка.
Попутно Чейер обратился к руководству SRI с просьбой профинансировать исследовательские работы. Он сказал: «Я хочу начать небольшой параллельный проект и создать собственного помощника CALO, но так, как я вижу это». Ему хотелось получить цельную интегрированную систему, а не лоскутное одеяло, сделанное десятками различных организаций. SRI согласился, проект назвали Active Ontologies. Чейер занимался им параллельно основной работе.
Проект получил ускорение, когда группа ведущих технических специалистов SRI собралась на однодневном выездном семинаре в Хаф-Мун-Бэй, прибрежном городке неподалеку от лаборатории в Менло-Парке. Глава SRI Курт Карлсон все настойчивее требовал превращения результатов исследований в источник прибыли, и CALO был очевидным кандидатом. Семинар имел большое значение для поиска ответов на основополагающие вопросы о целях программного обеспечения: какими должны быть «ощущения» от персонального помощника? Следует ли использовать аватар? Аватары всегда были спорным аспектом при разработке виртуальных помощников. Видео о Knowledge Navigator компании Apple показывало строгого молодого человека с галстуком-бабочкой, чуть смахивавшего на Стива Джобса. Однако у проекта CALO не было аватара. Разработчики по-разному отвечали на вопрос, должна ли система быть виртуальным собеседником, своего рода персональным компаньоном, которым исследователи занимались не одно десятилетие, предлагая пользователям «поговорить» с помощью клавиатуры с программами вроде Eliza. В конце концов компромисс нашли. Было решено, что вряд ли кто-то станет сидеть и болтать с виртуальным роботом весь день и нужно создавать систему для людей, которым требуется помощь в управлении повседневными делами.
Группа придумала понятие «наггетсы для удовольствия». Поскольку она пыталась создать подобную человеку личность, возникла идея вставить в программу вызывающие расположение людей фразы. Например, если пользователь спрашивает систему о прогнозе погоды на день, то она не просто отвечает, что может быть дождь, а добавляет: «Не забудьте зонтик!» Разработчики хотели дать пользователю то, что он хочет, и сделать целью проекта помощь людям в управлении повседневными делами и при этом (чуть-чуть) удивить их. Включение этих фраз добавляло взаимодействию ощущение человечности, хотя системы еще не обладали функциями синтеза и распознавания речи.
Встреча 2007 г. послужила стартовой площадкой. Совет SRI по коммерциализации одобрил в августе решение команды найти внешнее финансирование. Название Siri стало работать на самых разных уровнях. Помимо того, что оно означало «секрет» на суахили, Чейер когда-то работал над проектом Iris, т. е. Siri наоборот. И конечно, всем понравилось, что это название было похоже на SRI.
В 1987 г. руководитель Apple Джон Скалли выступил с программной речью на национальной конференции по информационным технологиям в образовании Educom. Он показал рекламный ролик, сделанный небольшой командой Apple для демонстрации идеи Knowledge Navigator. Идея, конечно, привлекла внимание публики, но в тот момент она показалось очень далеким будущим. Система Knowledge Navigator была прорывом, указывавшим путь к компьютерному миру после настольных компьютеров середины 1980-х гг. Knowledge Navigator в конечном итоге породила в Кремниевой долине поток высокотехнологичных «заявлений о видении», в том числе одно от Microsoft, сделанное Биллом Гейтсом в 1991 г. и названное «Информация на кончиках пальцев» (Information at Your Fingertips). Но Knowledge Navigator первой дала убедительное представление о будущем после настольных компьютеров. В центре видео находился разговор между рассеянным преподавателем и веселым экранным аватаром с галстуком-бабочкой, действовавшим как советчик преподавателя в его исследованиях и повседневных делах. Это был набросок будущего, где для взаимодействия с компьютером не требовались клавиатура и мышь. Knowledge Navigator предполагала естественный разговор с интеллектуальной машиной, которая и распознавала, и синтезировала речь.
Приходу Скалли в Apple на пост руководителя во время бума PC в 1983 г. предшествовал его хорошо описанный «роман» с соучредителем Apple Стивом Джобсом. Позже, когда рост Apple прекратился под давлением со стороны IBM и других конкурентов, Скалли вступил в схватку с Джобсом за управление компанией и победил.
В 1986 г. Джобс организовал новую компьютерную фирму NeXT. Он хотел выпускать хорошие рабочие станции для студентов колледжей и научных работников. Это вынудило Скалли продемонстрировать, что Apple может создавать инновации и без своего первого провидца. Скалли предложил Алану Кею, который ушел из Xerox PARC и сначала создал Atari Labs, а потом оказался в Apple, роль проводника в будущее компьютерного рынка. Диалоги Кея с генеральным директором Apple обобщены в последней главе автобиографической книги Скалли «Одиссея» (Odyssey). Кей предложил «замечательную, словно из мира фэнтези машину под названием Knowledge Navigator». Она вобрала в себя целый ряд его идей относительно Dynabook и концепций, которые в конечном счете примут форму Всемирной паутины.
Алан Кей впоследствии говорил, что Джон Скалли попросил его придумать «современный Dynabook», что было забавным, поскольку в тот момент не существовало даже прототипа Dynabook. По просьбе Скалли он соединил идеи из своих наработок с предложениями сообщества искусственного интеллекта, а также директора Media Labs Массачусетского технологического института Николаса Негропонте, сторонника речевых интерфейсов. Негропонте в 1967 г. создал в институте «Группу архитектурных машин», вдохновляясь в какой-то мере идеями Айвена Сазерленда, докторская диссертация которого Sketchpad (система ввода графической информации) была основополагающей работой и в области компьютерной графики, и в области дизайна интерфейсов.
Историки недооценили влияние Негропонте на Apple и компьютерную отрасль в целом. Хотя идея «архитектурной машины» Негропонте так и не стала популярной, она оказала очень сильное влияние на Билла Аткинсона, одного из основных разработчиков компьютеров Lisa и Macintosh компании Apple. Многие идеи для Lisa и Macintosh были заимствованы из ранних исследований Негропонте, пытавшегося представить, какой станет архитектура при помощи компьютеров. Группа Негропонте создала прототип системы управления визуальными данными DataLand. Во многих отношениях DataLand была широким исследованием того, как пользователи компьютера могут оперировать информацией. Она определенно представляла собой более масштабное исследование в этой области, чем проекты PARC, которые фокусировались на создании виртуального рабочего стола. Задача Негропонте действительно была шире. DataLand давала возможность находящимся в специальной комнате пользователям погрузиться в информационную среду, создаваемую с помощью проецирования на огромное полированное стекло разных изображений – от документов до карт. Это походило на работу с системой Macintosh или Windows, где вместо маленького дисплея использовался окружающий пользователя экран. Можно было увеличить и уменьшить масштаб, «пролететь» через виртуальную среду с помощью джойстика, а когда вы приближались к объектам вроде файлов, они начинали разговаривать с вами тихим голосом (например, «Это календарь Николаса»). Аткинсон бывал в лаборатории Негропонте и считал, что такой тип интерфейса мог бы решить проблему хранения документов в электронном виде. Он хотел организовать документы пространственно и размещать их поблизости со связанными материалами. Хотя концепция была привлекательной, ее реализация оказалась неподъемной, и группа вернулась к вариантам, больше похожим на идеи PARC о настольных компьютерах.
Идеи, полученные из обмена мнениями с Негропонте, Кей «перенаправил» Скалли и группе, которая делала видео о Knowledge Navigator. Кей считал, что Негропонте действует по принципу «игры Уэйна Гретцки»: надо спешить туда, куда летит шайба, а не туда, где она была. Кей с интересом прочитал одну из первых статей Гордона Мура в Electronics, которая довольно смело оценивала уровень вычислительной мощности через 10 лет, в 1975 г. Он экстраполировал прогнозную кривую до 1995 г. и дальше. Результат говорил о том, что на коммерческую доступность 3D-графики можно рассчитывать уже через несколько десятилетий.
Негропонте был «недостающим звеном» между идеями Норберта Винера относительно компьютеризации и ее последствий, нарождающимся миром искусственного интеллекта и взрывным ростом индустрии персональных компьютеров в 1980-е гг. В конце 1960-х гг. Негропонте вел курс по автоматизированному проектированию для архитекторов в Массачусетском технологическом институте. Не слишком большой любитель чтения лекций, он ловко использовал подход Тома Сойера, и на его курсе всегда было много приглашенных лекторов. Он привлек яркую группу талантов. В их числе были, например, Айзек Азимов, который в то время жил в Кембридже и ежегодно приезжал для выступлений у Негропонте, и британский кибернетик Гордон Паск, который в 1960-х и 1970-х гг. часто появлялся в сообществе американских ученых-компьютерщиков. Если Кей находился под влиянием идей Негропонте, то было бы справедливо отметить и роль Гордона Паска. В начале эры интерактивных вычислений Паск в немалой мере повлиял на исследования в области информатики и когнитивистики в Соединенных Штатах. Тед Нельсон познакомился с ним в чикагском кампусе Иллинойсского университета и тоже поддался его очарованию. Он с любовью охарактеризовал Паска в своем манифесте Computer Lib как «самого сумасшедшего из сумасшедших ученых».
В 1968 г. Негропонте, как и многих в компьютерном мире, захватила идея из докторской диссертации Айвена Сазерленда – графический и интерактивный инструмент Sketchpad, наметивший контуры взаимодействия человека с машиной. Следуя по стопам Сазерленда, Негропонте начал работу над «архитектурной машиной», которая должна была помочь архитекторам строить системы, превосходящие индивидуальные интеллектуальные возможности. Первым шагом в этом направлении стала программа URBAN5. Через год после ее создания он привез рекламный ролик о проекте «архитектурной машины» на проходившую в Институте современного искусства в Лондоне выставку, известную как «Кибернетическая прозорливость» (Cybernetic Serendipity). Выставка собрала огромное число механических и компьютеризированных экспонатов, включая большие подвижные скульптуры, созданные Гордоном Паском с применением интерактивных элементов, позволявших зрителям вступать в «разговор» с инсталляциями.
Эти два ученых познакомились на выставке и подружились. Паск по три-четыре раза в год приезжал на неделю в группу ArcMac и всегда останавливался в доме Марвина Мински. Он был удивительным человеком, одевался почти как эдвардианский денди, дополняя костюм кепкой, и иногда начинал выражаться двусмысленно и играть словами. Паск твердо придерживался традиции Норберта Винера, которая была в Европе сильнее, чем в Соединенных Штатах. Он был к тому же решительно настроен против существующего мира искусственного интеллекта. Если искусственный интеллект занимался созданием умных машин, имитирующих способности человека, то кибернетика фокусировалась на разработке систем для достижения целей. Взгляды Гордона Паска на природу интеллекта, который он связывал не с отдельным человеком, а с общением между людьми, оказали сильное влияние на Негропонте. Именно Паск заложил фундамент для подхода к человеко-машинному взаимодействию как к диалогу, который позднее был продемонстрирован в Knowledge Navigator, а потом реализован в Siri: он «задумывал человеко-машинное взаимодействие как форму разговора, динамического процесса, в котором участники знакомятся друг с другом».
Негропонте рано воспринял идеи Паска о компьютерном взаимодействии. Позже, в 1970-е гг., идеи Паска повлияли также на взгляды Негропонте и его проекты в Медиалаборатории Массачусетского технологического института, когда он расширил первоначальную задачу группы ArcMac. Идеи Медиалаборатории перекочевали в стратегию Apple, поскольку Кей был близок к Негропонте и преподавал у него. В то время мало кто заметил, что Apple выпустила Siri в качестве важнейшего дополнения к iPhone 4S в октябре 2011 г., отклонившись от предсказанной Кеем даты выпуска Knowledge Navigator не более чем на две недели. Идея проделала путь от Паска к Негропонте, а от него к Кею и к команде Siri. Параллельно она прошла от первой работы Грубера над компьютерными инструментами для инвалидов к его работе над Intraspect и к новому проекту в SRI. В течение всего одного поколения развитие компьютерных средств коммуникации открыло новый путь к сотрудничеству людей и машин. Как отмечал Грубер, люди перешли от внутриплеменного общения к письменному языку, а затем очень быстро к использованию телефонной и компьютерной связи.
Компьютеры стали протезом, не в негативном смысле, а в смысле расширения способностей человека, как предсказывали Ваннивар Буш, Ликлайдер и Энгельбарт. Intraspect и Hypermail представляли собой попытку создать когнитивный протез для работы, выполнение которой требовало выхода за пределы малочисленного племени. Характер сотрудничества изменился в одно мгновение. Люди могли общаться, не находясь в одной комнате или даже в одном часовом поясе. Простые онлайновые конференции типа www-talk использовались для разработки новых веб-стандартов. Постоянный архив позволял новым участникам быстро включаться в обсуждение, читая запись прошлого разговора.
Идея архива стала основным принципом при создании Siri. Инженеры SRI разработали внешнюю память, в которой были заметки, напоминания, расписания и информация в форме разговора с человеком. Создатели Siri взяли наработки по проекту CALO и довели их до ума. Им нужен был компьютер, который возьмет на себя функции секретаря. Они хотели, чтобы можно было сказать: «Напомни мне позвонить Алану в три тридцать или когда я поеду домой».
Накануне переименования проекта Чейера в Siri к крошечной команде в составе Чейера и Дага Киттлауса в SRI присоединился Грубер. До прихода в SRI Киттлаус руководил в Motorola проектами в сфере мобильной связи. Между собой они называли свой проект HAL, и это была не совсем шутка.
Чейер был приятным человеком, но по существу чистым технарем, не способным управлять компанией. Киттлаус представлял собой его полную противоположность. Красивый, загорелый норвежец, чувствовавший себя одинаково уверенно и в технической сфере, и в бизнесе, он был отличным менеджером. Раньше он работал в сфере мобильного интернета в Европе. Киттлаус получил широкие возможности выбора – по замыслу руководства лаборатории он должен был стать «предпринимателем в организации». Определенного назначения не было, предполагалось, что он осмотрится и найдет что-нибудь перспективное. Именно Киттлаус нашел Чейера. Он сразу понял, что Чейер – скрытое сокровище.
В первый раз они встретились, когда Чейер демонстрировал прототипы продуктов для беспроводной связи, основанные на его работе над OAA в 1990-х гг. Телекоммуникационная отрасль проявила некоторый интерес, но Чейер понял, что у его игрушечных демоверсий, написанных на языке искусственного интеллекта Prolog, нет шансов превратиться в нечто доступное миллионам пользователей мобильных телефонов.
Хотя SRI впоследствии приложил немало сил, чтобы связать CALO и Siri и получить свою долю славы, именно Чейер на протяжении всей своей карьеры работал над созданием виртуального помощника и пониманием естественного языка. Когда Киттлаус в 2007 г. впервые увидел работу Чейера над Siri, он сказал: «Я могу создать на этом компанию!» Но убедить Чейера удалось не сразу. Он не понимал, как Киттлаус может коммерциализировать Siri, но согласился помочь с демоверсиями. Киттлаус убедил его, подарив только что выпущенный iPhone. У Чейера был очень старый Nokia, и он совершенно не интересовался новыми смартфонами. «Поиграй вот с этим! – сказал ему Киттлаус. – Это революционная штучка. Через пару лет конкуренты осознают это, и все производители телефонов и телекоммуникационные компании будут отчаянно состязаться с Apple». Поскольку скорость передачи информации будет все еще не очень высокой, а экраны небольшими, этим компаниям придется цепляться за любое конкурентное преимущество, которое удастся найти.
Они решили создать стартап и начали искать соучредителя – технического специалиста, но им также был нужен кто-то со стороны, способный оценить технологию. Поиски привели к Тому Груберу. Чейер и Киттлаус подготовили простую демоверсию и показали ее Груберу в Mosaic, первом веб-браузере. Пользователи могли ввести вопрос в поле поиска, и система отвечала. Первая реакция Грубера была скептической.
«Я уже видел такое, вы, парни, замахиваетесь на невыполнимое», – сказал он Чейеру.
Программа походила на поисковую систему, но потом Чейер начал показывать интегрированные компоненты искусственного интеллекта.
Грубер задумался. «Минуточку, – сказал он. – Это ведь должна быть не просто поисковая система?»
«Нет, конечно, – ответил Чейер. – Это помощник».
«Но все, что вы показываете, это поисковая система. Я не вижу помощника, – возразил Грубер. – Одна только способность говорить со мной ничего не меняет».
Он продолжал задавать вопросы, а Чейер демонстрировал все новые функции системы. Наконец Грубер выдохся и замолк. Тут свое слово вставил Киттлаус: «Мы собираемся установить его в телефоны».
Это застало Грубера врасплох. В то время iPhone еще не имел огромного коммерческого успеха.
«Этот телефон будет вездесущим, – сказал Киттлаус. – Он полностью изменит мир. Они собираются обойти BlackBerry, и мы хотим присутствовать в этом телефоне». Грубер всегда занимался разработками для персональных компьютеров и Всемирной паутины, а не мобильных телефонов, поэтому нарисованная Киттлаусом картина будущего компьютеров стала для него откровением.
В середине 2000-х гг. клавиатура мобильных телефонов была ограничивающим фактором, и распознавание речи давало преимущество. SRI уже не одно десятилетие находился на переднем крае исследований в области распознавания речи. Крупнейшая независимая фирма в области распознавания речи Nuance вышла из недр SRI, поэтому Чейер очень хорошо представлял возможности средств распознавания речи.
«Пока этого нет, – сказал он. – Но обязательно будет».
Грубер был заинтригован. Чейер действовал как главный архитектор проекта CALO в SRI, а Киттлаус хорошо знал индустрию мобильных телефонов. Кроме того, Чейер располагал командой выдающихся программистов, способных создать помощника. Грубер сразу понял, что этот проект получит значительно более широкое распространение, чем все его прежние работы. Чтобы добиться успеха, команде нужно было определить, как создать сервис, хорошо взаимодействующий с людьми. Грубер еще со времен работы в Intraspect и Real Travel понимал, как создавать вычислительные системы для пользователей-неспециалистов. «Вам нужен вице-президент по разработке», – сказал он. Груберу было ясно, что у него появилась возможность работать с двумя экспертами мирового уровня, однако он только что ушел из неудачного стартапа. Стоит ли снова связываться с безумным миром стартапов?
Почему бы нет?
«Вам нужен соучредитель?» – спросил Грубер в конце встречи.
Ядро команды, которая сделает Siri, было сформировано.
Все три основателя Siri имели немалый опыт привлечения инвесторов, накопленный в процессе осуществления предыдущих проектов. Для Грубера это был тяжкий крест – бесчисленные походы к венчурным капиталистам, часто демонстрировавшим незаинтересованность, высокомерие или и то и другое одновременно. На сей раз, однако, связь с SRI открыла для них двери ведущих венчурных компаний Долины. Даг Киттлаус был умелым шоуменом, и во время тура по венчурным компаниям на Сэнд-Хилл-роуд он придумал остроумный и эффективный прием. Он брал с собой Чейера и Грубера на каждую встречу по привлечению средств. Их проводили в конференц-зал, и после того, как они представлялись, Киттлаус невинно обращался к вице-президентам: «Скажите, есть ли у кого из вас какой-нибудь новомодный смартфон?» Вице-президенты совали руки в карманы и почти всегда доставали совершенно новый тогда iPhone компании Apple.
«У вас загружены последние приложения?» – спрашивал Киттлаус.
Да.
«У вас есть поиск Google?»
Конечно!
Тогда Киттлаус клал на стол 20-долларовую банкноту и говорил: «Если вы сможете ответить на три вопроса за пять минут, то деньги ваши». Затем он называл вопросы, ответы на которые было трудно найти в Google и других подобных приложениях. Венчурные капиталисты слушали вопросы, а затем говорили: «О, у меня нет такого приложения», – или начинали бродить в браузере по различным гиперссылкам, пытаясь синтезировать ответ. Можно было не сомневаться в том, что никто не уложится в отведенное время, и Киттлаус никогда не терял свои деньги.
Это был отличный способ визуализировать необходимость приложения Siri. В дополнение команда сделала подборку бутафорских обложек журналов. Одна из них провозглашала: «Конец поиска – войдите в эру виртуального персонального помощника». На другой Siri выталкивал Google за пределы обложки. Команда Siri также сделала слайды, показывающие, что поиск Google – не предел возможностей в мире поиска информации.
В конечном счете команда добилась своего. Google не спешила внедрять широкий, более диалоговый подход к сбору и передаче информации. Впрочем, поисковому гиганту все же пришлось сделать это. В мае 2013 г. Амит Сингхал, глава группы Knowledge, которая занималась в том числе технологией поиска, начал внедрять новый продукт, объявив «конец поиска в том виде, в каком мы его знаем». Google через четыре года после появления Siri признала, что будущее поиска – это диалог. У Чейера челюсть отвисла до пола, когда он услышал эту презентацию. Даже Google, компания, полностью ориентированная на данные, отошла от статического поиска и повернулась в сторону помощи при поиске.
До начала тура по Сэнд-Хилл-роуд в поисках венчурного капитала Адам Чейер скептически оценивал вероятность того, что венчурное сообщество проглотит их предложение. Он ждал, что им укажут на дверь, но этого не случилось. К тому моменту некоторые компании уже пробовали выпускать системы с голосовым управлением, но неудачно. Например, General Magic, некогда амбициозное дочернее предприятие Apple, занимавшееся карманными устройствами, попробовала сделать голосового персонального помощника, но в 2002 г. обанкротилась. Постепенно Чейер понял: если команда сможет разработать действительно хорошего технического помощника, то венчурные капиталисты и деньги не заставят себя ждать.
Команда начала искать деньги в конце 2007 г. и получила финансирование до наступления нового года. Сначала они встретились с Гари Моргенталером, одним из старейших деятелей Кремниевой долины и влиятельным союзником SRI, для консультации, но идея понравилась ему так, что он предложил им представить бизнес-план. В результате команда получила поддержку не только Morgenthaler, но и Menlo Ventures, другой известной венчурной фирмы.
До эры доткомов компании держали свои проекты в секрете до объявления о достижениях на каком-нибудь крупном публичном мероприятии, но ситуация изменилась во время надувания пузыря в конце 1990-х гг. Среди более ориентированных на сервисы новых компаний царил дух открытости, они свободно обменивались информацией и спешили первыми выйти на рынок. Разработчики Siri, однако, решили не поднимать шум и даже использовали доменное имя stealth-company.com как шаблон и приманку. Они нашли офис в Сан-Хосе, далеко от других софтверных стартапов, которые часто обосновывались в Сан-Франциско. База в Сан-Хосе облегчала также поиск новых талантов. В то время технические специалисты с семьями перебирались ближе к южной части полуострова Сан-Франциско, и поездки на работу в центр Сан-Хосе были приятной прогулкой по сравнению с дорогой в Маунтин-Вью или Пало-Альто.
Чтобы создать культурный фон компании, Адам Чейер купил рамки для фотографий и раздал их всем сотрудникам с просьбой выбрать себе героя и поставить его портрет на стол. Затем он попросил всех подобрать цитату, показывающую, почему эта личность так важна. Чейер надеялся убить таким образом двух зайцев: посмотреть, кто кого выбрал, и получить некоторое представление о каждом сотруднике. Сам Чейер выбрал Энгельбарта и добавил к портрету одно из его давних обязательств в SRI: «Максимально расширять возможности людей по коллективному решению сложных, неотложных задач». С точки зрения Чейера, эта цитата идеально показывала разницу между автоматизацией и расширением возможностей человека. Работая, он всегда испытывал чувство вины, когда переходил от систем, которые считал «ориентированными на людей», к проектам на основе искусственного интеллекта. На протяжении всей своей карьеры он колебался между этими двумя полюсами. В 2007 г. Чейер помог своим друзьям создать общественный сайт change.org, который в полной мере соответствовал традиции Энгельбарта, и надеялся, что Siri идет по этому же пути. Грубер тоже хотел выбрать Энгельбарта, но, узнав, что Чейер опередил его, вернулся к своему музыкальному герою Фрэнку Заппе.
Несмотря на продажу его проекта Tymnet в начале 1970-х гг., Дуг Энгельбарт вернулся в ряды исследователей SRI ко времени приезда Чейера, и тот воспринимал стареющего ученого как отца и путеводную звезду. Занимаясь проектами, навеянными идеями об усилении интеллекта, он старался показать Энгельбарту, что работает в его традиции. Это было непросто. К 1990 гг. Энгельбарт, обрисовавший свой подход еще в 1960-х, стал одинокой фигурой, игнорируемой миром. Это не смущало Чейера. Он отчетливо видел силу подхода Энгельбарта и взял его на вооружение, когда оставил SRI, чтобы создать Siri.
Чейер еще со времен учебы в колледже привык четко обрисовывать цели, а затем методично осуществлять их. Как-то раз в самом начале работы над Siri он зашел в Apple Store и увидел рекламные объявления со множеством красочных пиктограмм, представлявших самые популярные приложения iPhone. Там были все ведущие разработчики программного обеспечения: Google, Pandora, Skype. Он задержал взгляд на них и сказал себе: «Когда-нибудь у Siri будет свой значок прямо здесь, в Apple Store! Я могу представить себе это, и я сделаю это».
Они приступили к работе. С точки зрения Грубера, у них подобралась идеальная команда. Чейер был инженером мирового класса, Киттлаус – великим шоуменом, а Грубер умел создавать высокотехнологичные демоверсии, приводившие в восторг зрителей. Они знали, как позиционировать свой проект и для инвесторов, и для потребителей. Они не только предвидели вопросы, которые им будут задавать во время демонстраций, но и целенаправленно работали над идеями и технологиями, которые сильнее всего привлекали публику. Внушение наблюдателю мысли о том, что будущее уже рядом, превратилось в Кремниевой долине в уникальную форму искусства, где главным было не переборщить. Обещать слишком много – прямой путь к провалу. Предыдущие попытки создать персонального помощника закончились неудачей, а Джон Скалли детально расписал идею Knowledge Navigator, который так и не появился. Когда работа над Siri уже шла полным ходом, Грубер откопал копию видео о Knowledge Navigator. После того как Apple продемонстрировала его несколько лет назад, среди разработчиков пользовательских интерфейсов развернулись горячие споры. Некоторые высказывались и продолжали высказываться против персонификации виртуальных помощников. Бен Шнейдерман и другие критики настаивали на технической и этической ущербности программных помощников. Они ратовали за то, чтобы непосредственный контроль оставался за пользователем, а принятие решений не передавалось программному слуге.
Команда Siri не уклонялась от дискуссии и вскоре после этого немного приоткрыла завесу тайны над своим проектом. Если в конце весны 2009 г. Грубер уклончиво говорил о новой технологии, то летом того же года на конференции Semantic Web он уже детально описывал, как футуристические технологии Knowledge Navigator становятся действительностью. Он акцентировал внимание на появлении сенсорных экранов и реализации так называемого жестового интерфейса, на существовании глобальной сети для совместного использования информации и сотрудничества, на разработке программ, способных взаимодействовать с людьми, на достижениях в области распознавания естественной и слитной речи. «Это большая проблема, над которой исследователи бьются уже давно, и в ее решении наметился определенный прогресс», – сказал он аудитории. Грубер также упомянул новшества, маячившие на горизонте, вроде диалога между программным агентом и человеком и устного ввода задач в компьютер. Наконец, он отметил существование проблемы доверия. В видео о Knowledge Navigator преподаватель позволял программному агенту отвечать на звонки матери. Разве это не признак доверия? Грубер надеялся, что его технология обеспечит такой же уровень взаимодействия.
После обсуждения технологий, предсказанных в видео о Knowledge Navigator, Грубер подразнил аудиторию. «Как вы считаете, такая система Knowledge Navigator возможна сегодня?» – спросил он. «Я хочу заявить, – он сделал паузу для большего эффекта, – что ответ все еще НЕТ». Аудитория разразилась смехом и взорвалась аплодисментами. Он добавил: «Но мы приближаемся к этому».
Разработчики Siri быстро обнаружили, что можно улучшить распознавание речи на основе облачных технологий. В то время они использовали не технологию Nuance SRI, а конкурирующую систему под названием Vlingo. Чейер заметил, что стоит разместить систему распознавания речи в сети, как на них обрушивается поток откликов в форме миллионов пользовательских запросов и исправлений. Иначе говоря, они получали эффективную обратную связь, позволяющую обучать и улучшать Siri.
Разработчики продолжали видеть конкурентное преимущество Siri в кардинальном отходе от доминирующей парадигмы поиска информации в сети, олицетворением которой являлась очень успешная поисковая система Google. Siri был не поисковой системой, а интеллектуальным агентом в форме виртуального помощника, способным к социальному взаимодействию с людьми. Грубер, который был также техническим директором в Siri, изложил лежащие в основе сервиса концепции в форме технических презентаций. Поиск информации, по его мнению, должен был выглядеть как разговор, а не как ввод поискового запроса. Программа должна была справляться с неоднозначностью вопросов, чтобы давать правильные ответы. Siri должен был предоставлять услуги, например подбор фильмов и ресторанов, а не контент. Для пользователя он должен стать высокоперсонализированным агентом. В начале 2010 г. команда Siri подготовила демонстрацию на iPhone для своего совета директоров. Siri еще не мог говорить, но программа умела интерпретировать речевые запросы и вести разговор, отвечая на вопросы предложениями на естественном языке, которые выводились на экран в мультяшных пузырях. Совет воспринял это с энтузиазмом и дал разработчикам дополнительное время на доработку программы.
В феврале 2010 г. крошечный стартап выложил программу на App Store iPhone и вскоре получил отзыв от представителя элиты компьютерной индустрии Кремниевой долины. Роберт Скобл, один из известных технологических блогеров Долины, отозвался о программе как о «самой полезной вещи, которая попадалась ему на глаза в этом году». Серьезной похвалой это нельзя было считать, но год только начался.
В момент выпуска системы Грубер был на техническом семинаре и почти не имел доступа к сети. Ему пришлось довольствоваться отзывами из вторых рук. «Приятель, ты слышал, что происходит с вашим приложением?!» – спрашивали у него.
Дальше – больше. Благодаря решению поместить приложение в менее очевидную категорию на App Store – Lifestyle – Siri сразу взлетел на верхние строчки рейтинга. Это был один из приемов, которому Грубер научился во время работы в Real Travel, – искусство оптимизации поисковой системы. Хотя они представили Siri на iPhone, Киттлаус договорился о взаимодействии с компанией Verizon, которая пока еще не поддерживала iPhone. По его словам, это была «величайшая сделка в области мобильных устройств в истории». Она гарантировала установку Siri в каждом новом телефоне Verizon, а это означало, что программа появится в смартфонах на Android. Оставалось лишь подписать документы, когда зазвонил сотовый телефон Киттлауса.
«Привет, Даг, – сказал голос в трубке. – Это Стив Джобс».
Киттлаус на мгновение потерял дар речи. «Откуда у вас этот номер телефона?» – спросил он.
«Это до смешного просто», – ответил Джобс. У него не было контактов с этой маленькой группой разработчиков, но он знал, где искать. Поскольку каждый разработчик программ для iPhone должен был указывать номер своего телефона в App Store, генеральный директор Apple нашел номер Киттлауса в своей базе данных разработчиков.
Первое соприкосновение команды с легендарным «полем искажения реальности» – гипнотической аурой Джобса – не было обещающим. Джобс пригласил трио разработчиков Siri к себе домой в сердце старого Пало-Альто. Жилище Джобса представляло собой довольно скромное здание в тюдоровском стиле 1930-х гг. возле пустоши, которую он превратил в небольшую рощу плодовых деревьев и сад. Они встретились в гостиной, которая, как и подавляющая часть дома Джобса, не отличалась богатством обстановки, но зато была украшена внушительным оригиналом фотоработы Ансела Адамса.
Джобс поставил трио перед дилеммой. Все они были успешными предпринимателями Кремниевой долины, но никому из них не удалось дойти до определяющего карьеру IPO. Сейчас команда Siri и, конечно, их совет директоров высоко оценивали вероятность очень крупного публичного размещения акций Siri на бирже. Джобс прямо сказал, что он хочет приобрести Siri, однако на тот момент команда не собиралась продавать компанию. «Большое спасибо», – сказали они Джобсу и откланялись.
Несколько недель спустя Apple вернулась. Команду Siri еще раз пригласили в дом Джобса, где он, уже очевидно больной, хотя публично и отрицал это, включил свое очарование. Он обещал им готовый рынок в сотню миллионов пользователей без маркетинга и бизнес-модели. В противном случае они могут рискнуть, попытаться стать следующей Google и одержать победу. Команда Siri также поняла, что если они пойдут с Verizon, то рискуют лишиться доступа к iTunes Store. Стиву даже не пришлось говорить это, было ясно и так, что нужно выбирать, на какой половине рынка они хотят находиться.
Предложение Джобса устроило их, но не совет директоров, который к тому времени жаждал выхода через IPO. Трем основателям пришлось перейти на другую сторону и убеждать совет. В конечном счете они убедили инвесторов – предложение Джобса было достаточно выгодным и намного менее рискованным.
После того как Apple в апреле 2010 г. приобрела Siri, команда Siri переехала в самый центр офиса группы разработки Apple, на половину верхнего этажа дома 2 по Инфинит-луп. Хотя Apple могла купить лицензию Nuance, чтобы преобразовывать речь непосредственно в текст, как позже сделала Google, Джобс решил, что Apple поставит более амбициозную цель – разместит аватар интеллектуального помощника на iPhone. Siri помогал решить большую проблему, возникшую у Apple с ее новыми iPhone и iPad. Стеклянные экраны и мультисенсорная панель могли заменить клавиатуру и мышь при навигации по экранам, но они были не очень удобны для ввода данных. Это было слабое место, несмотря на великолепную демонстрацию Джобсом ввода и автоматического редактирования текста во время первой презентации продукта. Голосовой ввод слов и целых предложений намного быстрее, чем кропотливый ввод каждого слова пальцем на экране.
Сначала, однако, проект встретил в компании сопротивление. Сотрудники Apple называли эту технологию «голосовым управлением», и команде Siri пришлось терпеливо объяснять, что у их проекта другой фокус. Проект Siri не попадал в разряд «приятного для глаз» в Apple, а именно такое отношение к дизайну программных и аппаратных средств и определяло Apple как компанию; он должен был дать пользователям надежную, невидимую и хорошо работающую программу. Многие инженеры из отделения разработки программного обеспечения в Apple думали, что, если бы Стив, а потом один из его главных помощников, Скотт Форстолл, не сказали «сделайте это», они ни за что не стали бы работать над этим проектом. В конце концов, Apple не была компанией, разрабатывающей облачные сервисы. Зачем изобретать колесо? Помощник или просто голосовое управление? В конце концов, какая разница? Но в реальной жизни люди гибли, читая электронную почту и отправляя сообщения во время управления автомобилем, поэтому предоставление водителям возможности пользоваться телефонами безопасно имело огромное значение.
Когда бюрократическая система управления проектами Apple заартачилась в отношении добавления возможности отправки текстовых сообщений без использования рук, Грубер, который после покупки компании оказывал техническую поддержку, сказал, что берет на себя ответственность за завершение проекта вовремя к моменту запуска Apple Siri. Он воспринял это как дело чести. Имея в качестве помощника только практиканта, он стал работать над дизайном и прототипами сервиса обмена текстовыми сообщениями. В конце концов его система была принята. Ко времени запуска Siri можно было отправлять и получать тексты, не касаясь экрана iPhone.
Впрочем, не все шло гладко. Команда Siri хотела сосредоточиться также на том, что называлось «управлением вниманием». Виртуальный персональный помощник должен был помогать людям держать «список текущих дел» во «внешней памяти», не забивая себе голову. Начальная версия Siri отличалась тщательной проработкой того, что команда называла «персональной памятью»: набор задач выстраивался в определенном порядке, а пользователь получал напоминания как от хорошего секретаря. Но в гонке за то, чтобы поставить Siri на iPhone, большую часть потенциала сервиса убрали, по крайней мере временно. Первый вариант Siri включал в себя лишь малую толику того, что создала команда.
Под занавес своего выступления в компьютерном мире Стив Джобс решительно встал на сторону усиления интеллекта и партнерства. Siri должен был стать дружелюбной, элегантной моделью будущего сотрудничества людей и машин и началом кардинальных изменений в Apple, значение которых проявится годы спустя. Проект закончился успешно, но, к сожалению, Джобс умер на следующий день после дебюта Siri. Поэтому мероприятие, посвященное выпуску продукта на рынок в октябре 2011 г., имело налет неоднозначности. Естественно, было общее ощущение триумфа. В день публичного представления Siri Чейер вновь оказался в Apple Store. Он подошел к магазину, где рядом с парадной дверью красовался гигантский плазменный дисплей с надписью «Представляем Siri!».