Зачем создавать разумные машины?
Чем же будут заниматься разумные машины?
Меня часто просят рассказать о будущем мобильной вычислительной техники, например, о том, как будут выглядеть карманные компьютеры или мобильные телефоны лет через двадцать. Когда мои собеседники интересуются моим видением будущего, я затрудняюсь дать ответ. Чтобы моя позиция была более доходчивой, я однажды вышел на сцену со «шляпой волшебника» и хрустальным шаром в руках. Я объяснил, что никто не может предвидеть будущее в подробностях, любой, кто утверждает, что может предвидеть то, что случится в ближайшие годы, ошибается. Лучшее, что мы можем сделать, – это понять ключевые тенденции. Понимая ключевую идею, вы сможете успешно следовать за ней независимо от того, чем она обернется.
Одним из наиболее ярких примеров технологических тенденций является закон Мура. Гордон Мур совершенно точно предсказал, что количество элементов, которые можно поместить на кремниевую пластину, будет удваиваться каждые два с половиной года. Мур не сказал, будут ли это чипы памяти, или центральные микропроцессоры, или еще что-то. Он также ничего не сказал о том, в каких типах носителей будут использоваться пластины. Он не прогнозировал, будут они помещены в пластиковую оболочку или в керамическую или же будут расположены на микросхеме. Он ничего не говорил о различных процессах, используемых для производства чипов. Он остановился на ключевой тенденции и оказался прав.
В наши дни мы не в силах представить пределы применения разумных машин. Если я или кто-либо другой во всех подробностях опишет перспективы функционирования искусственного интеллекта, он неминуемо ошибется. Тем не менее мы можем сделать нечто большее, чем просто пожать плечами. Существуют два направления, которым мы можем последовать. Первое: представить себе возможные области применения мозгоподобных систем памяти в краткосрочной перспективе, т. е. сначала испробовать менее захватывающие и интересные, но более реалистичные варианты. Второй подход: представить себе общие возможности применения ИИ в долгосрочной перспективе так, как это сделал Мур.
Предлагаю начать с возможных краткосрочных перспектив применения. Некоторые примеры (скажем, замена трубок на транзисторы в радиоприемниках или создание калькуляторов на микропроцессорах) более очевидны. Рассмотрим проблемные области, с которыми тем или иным образом сталкивался искусственный интеллект, но разрешить проблему так и не удалось. Я имею в виду распознание речи, зрительное восприятие и «мыслящие» автомобили.
Если вы когда-нибудь использовали программное обеспечение для ввода произносимого вслух текста на персональном компьютере, тогда вы знаете, насколько бесполезным оно бывает. Как и в эксперименте с «Китайской комнатой», компьютер не понимает того, о чем идет речь. Несколько раз я пробовал использовать подобные приложения и всегда впадал в уныние. Если в комнате появлялся какой-то посторонний шум, от стука упавшего карандаша до голоса человека, обращающегося ко мне, то на экране сразу же возникали посторонние слова. Процент ошибок распознания речи был очень высок. Часто слова, которые, как предполагала программа, я произнес, вообще не были связанными по смыслу. Даже ребенок понял бы, что в предложении ошибки, но не компьютер. Так называемый интерфейс естественной речи многие годы был целью инженеров, занимающихся разработкой программного обеспечения. Суть состоит в том, чтобы вы могли сказать машине, чего вы от нее хотите, обычным языком, и она бы выполнила ваши команды. Личной цифровой записной книжке вы могли бы сказать: «Перенеси дочкину игру по баскетболу с субботы на сегодня, на десять утра». Подобного рода вещи невозможно было сделать с помощью традиционного искусственного интеллекта. Даже если бы компьютер распознал каждое слово, для выполнения задания ему нужно знать, где находится школа вашей дочери, какую именно субботу вы имели в виду, и, вообще, что такое баскетбольная игра, поскольку у вас может быть занесена информация как «Ментло против Сен-Джо». Или вы хотите, чтобы компьютер слушал радиопередачи и сканировал звуковой поток на предмет упоминания в нем определенного товара, а рассказчик будет описывать свой запрос, не упоминая его названия. Вы и я поймем, о чем он говорит, но этого не поймет компьютер. Подобные приложения требуют, чтобы машина могла не только слушать, но и слышать разговорную речь, что пока не достижимо. Программа распознания речи соотносит звуковые сигналы с шаблонами слов, внесенных в память путем механического запоминания, не учитывая их значения. Представьте, что вы бы научились распознавать звучание отдельных слов на каком-то иностранном языке, не зная их значения. Я вас попрошу записать разговор на этом языке. Во время разговора вы понятия не имеете, о чем он, но пытаетесь распознать отдельные слова и записать их. Но в какой-то момент многие слова перекрываются, или частично неслышны, или появляется какой-то посторонний шум. Вам будет чрезвычайно сложно распознавать слова и вычленить их. Именно с такого рода препятствиями сталкиваются современные программы по распознаванию человеческой речи. Их разработчики обнаружили, что, используя вероятность и переход слов, они могут несколько улучшить качество распознавания. Например, чтобы решить, какой из омонимов нужно выбрать, они используют правила грамматики. Это очень простая форма прогнозирования, однако системы в данном случае остаются немыми. Современные программы по распознаванию речи работают успешно лишь в очень ограниченных ситуациях, когда количество слов, которые человек может произнести в каждое отдельное мгновение, строго ограничено. А вот людям распознание речи дается без труда, потому что неокортекс не только воспринимает отдельные слова, но и предугадывает содержание целых предложений, а также рамки общего контекста. В процессе распознания устной речи мы прогнозируем идеи, фразы, отдельные слова, мало того – кора головного мозга выполняет всю эту работу автоматически.
Мы имеем основания ожидать, что системы памяти, построенные на принципах работы коры головного мозга, позволят создать грамотные системы распознавания речи. Вместо программирования на основе вероятностей словесных переходов иерархическая память будет отслеживать акценты, слова, фразы, идеи и использовать их для интерпретации того, что было сказано. Как и человек, такая система сможет проследить различия между разнообразными ситуациями беседы (например, ваш разговор с другом в комнате, телефонный разговор, редактирование команд для книги). Конечно, создать такие машины будет непросто. Чтобы полностью понимать человеческую речь, машина должна многое «пережить» и «научиться» тому же, что и люди. Возможно, нам понадобятся долгие годы, чтобы создать разумную машину, которая понимает язык так же хорошо, как вы и я. А в ближайшем будущем мы можем рассчитывать лишь на улучшения существующих систем распознания человеческой речи путем использования системы памяти, построенной на принципах работы коры головного мозга.
Зрительное восприятие – еще одна задача, которую так и не смог решить существующий искусственный интеллект, но она под силу по-настоящему разумным системам. На сегодняшний день не существует машины, которая смогла бы наблюдать естественную сцену, как, например, мир перед вашими глазами или картинка видеокамеры, и описать то, что она видит. Есть несколько примеров успешного применения систем, распознающих изображения, но весьма ограниченные. Речь идет, например, о регистрации расположения чипа на интегральной схеме или сопоставлении черт лица с базой данных. На данной стадии компьютер не может распознавать различные объекты или анализировать наблюдаемую картину в более широком плане. У вас не возникает проблем, когда вы заходите в комнату и ищете место, где можно было бы сесть, но не просите компьютер сделать то же самое. Представьте себе, что вы смотрите на экран камеры безопасности. Сможете ли вы увидеть различия между человеком, держащим в руке подарок и стучащим в дверь, и человеком, у которого в руке перо ворона? Конечно сможете, однако эти различия превосходят возможности современного программного обеспечения. Поэтому мы нанимаем людей, которые следят за экранами камер безопасности круглые сутки и наблюдают, не происходит ли что-нибудь подозрительное. Человеку-наблюдателю непросто сохранять бдительность много часов подряд, а вот машина могла бы сделать это без труда.
Давайте также рассмотрим транспортные средства. Устройство автомобилей постоянно усложняется. Существуют глобальные системы позиционирования, способные просчитать кратчайший маршрут от точки А до точки Б, существуют сенсоры, автоматически включающие фары, когда на улице становится темно, сенсоры приближения, которые помогают определить безопасность обгона и так далее. Существуют даже автомобили, способные ехать без водителя на специальных трассах в идеальных условиях. Они, правда, не поступают в открытую продажу. Чтобы вести машину безопасно и эффективно на любых дорогах при любых условиях, вовсе не достаточно несколько датчиков или схем обратного контроля. Чтобы быть хорошим водителем, вам нужно понимать устройство автомобиля, характер дорожного движения, предугадывать маневры других водителей и учитывать массу других обстоятельств. Водителю следует внимательно отслеживать сигналы, предостерегающие об опасности. Например, включенный сигнал поворота у впереди идущего автомобиля предупреждает о том, что водитель собирается перестроиться в другой ряд. Если сигнал включен несколько минут подряд, то, скорее всего, водитель о нем просто забыл и перестраиваться не собирается. Когда водитель видит мяч, катящийся на проезжую часть со стороны тротуара, он автоматически предполагает, что, возможно, за мячом сейчас побежит ребенок, и интуитивно резко сбрасывает скорость.
Допустим, мы хотим создать по-настоящему «умный» автомобиль. Сначала нам нужно определить набор сенсоров, которые позволят нашему автомобилю воспринимать текущую дорожную ситуацию. Мы, вероятно, начнем с камеры видения, даже нескольких камер в передней и задней частях автомобиля, затем придумаем микрофоны для воссоздания звукового восприятия, затем, возможно, добавим радар или ультразвуковые сенсоры, точно определяющие диапазон и скорость других объектов на трассе как при хорошем освещении, так и в темное время суток. Не надо создавать рамки, ограничиваясь ощущениями, свойственными исключительно человеку. Алгоритм коры головного мозга очень гибок, и если мы спроектируем нашу рукотворную иерархическую систему памяти должным образом, она будет работать независимо от типов установленных сенсоров. Теоретически наш воображаемый «мыслящий» автомобиль может воспринимать ежесекундно меняющуюся дорожную ситуацию лучше, чем водитель-человек, потому что может выбирать разные наборы сенсоров в зависимости от поставленной задачи. Сенсоры будут связаны с достаточно большой иерархической системой памяти. Разработчики автомобилей будут тренировать его память путем помещения в условия реального мира, чтобы она училась создавать модель мира точно так же, как это делают люди, только в условиях более ограниченной области. (Ведь автомобилю нужны знания об автодорогах, а не об элеваторах и аэропланах.) Память автомобиля «выучит» иерархическую структуру транспорта и дорог так, что сможет понимать, что происходит в ее мире движущихся автомобилей, дорожных знаков, препятствий и перекрестков в текущий момент времени, и прогнозировать ход развития дальнейших событий. Инженеры-разработчики такого автомобиля могут настроить систему его памяти так, чтобы она полностью управляла автомобилем или только отслеживала, что происходит, когда за рулем сидите вы. Она может давать советы или принимать на себя управление в экстремальных ситуациях. Как только память будет полностью натренирована и сможет понимать и решать любые проблемы, с которыми сталкивается, инженеры получат возможность выбрать два варианта последующего применения. Они могут поместить стандартную память во все автомобили, сходящие с конвейера, или же комплектовать их памятью, которая будет продолжать самообучение после продажи автомобиля. Как и в случае с компьютерами, память автомобиля должна поддаваться перепрограммированию более актуальной версией.
У меня нет абсолютной уверенности в том, что нам удастся создать подобные умные автомобили или машины, обладающие зрительным и слуховым восприятием. Я лишь привел примеры того, какие типы устройств мы, возможно, разработаем и какие типы разумных машин кажутся реалистичными на сегодняшний день.
* * * * *
К очевидному применению разумных машин у меня гораздо меньше интереса. Я способен оценить пользу и искренне восхититься новой технологией лишь тогда, когда она получает неизвестное доселе применение. Чем удивят нас разумные машины и какие неожиданные их свойства и способности проявятся со временем? Я убежден, что иерархические системы памяти, подобно транзисторам и микропроцессорам, улучшат нашу жизнь совершенно неожиданным образом, но как именно? Один из способов заглянуть в будущее разумных машин – рассмотреть их составляющие, легко поддающиеся измерению. Например, какие атрибуты разумных машин будут становиться все более дешевыми, более быстродействующими и менее громоздкими? То, чему присущ экспоненциальный рост, может быстро превзойти наши ожидания и, скорее всего, сыграет ключевую роль в наиболее радикальных разработках будущих технологий.
Примерами технологий, которые развивались экспоненциально на протяжении многих лет, являются кремниевый чип памяти, винчестер, техники последовательности ДНК и фиброоптика. Указанные быстро-развивающиеся технологии положили начало многим новым товарам и сферам бизнеса.
В отличие от приведенных примеров развитие некоторых технологий, таких как аккумуляторы, двигатели и традиционная робототехника, довольно инертно. Несмотря на многочисленные усилия и постоянные усовершенствования, рука современного робота не очень отличается от руки его предшественника, разработанного несколько лет тому назад. Развитие традиционной робототехники можно считать медленным, а успехи скромными, несравнимыми с экспоненциальным развитием дизайна чипов или темпами распространения программного обеспечения. Рука робота, созданная в 1985 году и повлекшая затраты в миллион долларов, не будет сегодня в тысячу раз сильнее при цене в десять долларов. И аккумуляторы, производимые сегодня, не намного лучше, чем те же устройства десятилетней давности. В лучшем случае они превосходят мощность предшественников в два-три раза, но не в тысячи или десятки тысяч раз. Прогресс в их развитии происходит очень и очень медленно. Если бы емкость батарей возрастала с той же скоростью, что и емкость винчестеров, тогда мобильные телефоны и прочую электронику никогда не понадобилось бы перезаряжать, а электромобили, проходящие расстояния в тысячу миль после одной-единственной подзарядки, были бы сегодня нормой повседневной жизни.
Теперь мы подошли к разговору о том, какие аспекты мозгоподобных систем памяти значительно превзойдут биологический мозг. Я вижу четыре потенциальных свойства, которые могут превзойти человеческие способности. Это быстрота, емкость, реплицируемость и сенсорные системы.
Быстрота
Быстродействие нейронов измеряется в миллисекундах, а кремний функционирует со скоростью наносекунд, причем постоянно возрастающей. Различия скорости быстродействия органического и кремниевого разума – на шесть порядков! – будут иметь большие последствия. Разумные машины смогут мыслить в миллион раз быстрее, чем человеческий мозг. Такой разум сможет прочесть целую библиотеку книг или изучить большую и очень сложную базу данных – задача, для выполнения которой любому из нас понадобились бы годы, – за несколько минут, причем понимание прочитанного не пострадает. В этом нет никакой магии. Биологический мозг развивался в условиях двух временных ограничений: пределов скорости действия нервных клеток и скорости изменений внешнего мира. Какой резон биологическому мозгу ускорять мышление в миллионы раз, если окружающая человека среда изначально инертна?! Однако в самом алгоритме коры головного мозга не заложено ничего такого, что тормозило бы его быстродействие. Если бы разумная машина взаимодействовала с человеком, ей пришлось бы снизить свое быстродействие и работать с «человеческой» скоростью. Если бы ей пришлось читать книгу и переворачивать при этом страницу за страницей, тоже существовало бы ограничение скорости чтения. Но вот если бы разумная машина взаимодействовала с электронным миром, она бы работала гораздо быстрее. Две разумные машины общались бы друг с другом в миллион раз быстрее, чем двое людей. Представьте себе прогресс разумной машины, которая решает математические задачи или реализует научные идеи в миллионы раз быстрее, чем человек. За десять секунд она добьется более впечатляющих результатов, чем вы – за месяц. Не знающий усталости и скуки, искусственный разум, работающий со скоростью света, явно может найти очень полезное применение, такое, о котором мы еще даже не подозреваем.
Емкость
Несмотря на впечатляющую емкость человеческой коры головного мозга, разумные машины смогут ее намного превзойти. Размер нашего мозга ограничивается несколькими биологическими факторами, среди них – соотношение размера черепа ребенка и диаметр таза матери, большие метаболистические затраты на поддержание мозга (мозг составляет порядка 2% веса тела и при этом потребляет 20% вдыхаемого кислорода), низкое быстродействие нейронов. С другой стороны, мы можем создавать разумные системы памяти любых размеров, заложив свою задумку в отдельные атрибуты дизайна. Возможно, несколько десятилетий спустя емкость человеческого мозга будет нам казаться очень скромной.
Предскажу несколько способов увеличения емкости памяти будущих разумных машин. Во-первых, сделав иерархическую систему памяти более глубокой, мы добьемся более глубокого понимания – умения распознавать сигналы высокого порядка. Увеличение емкости отдельных зон поможет разумной машине запоминать больше подробностей, проявлять более высокую точность восприятия (подобно тому, как незрячий человек обладает повышенной осязательной и слуховой чувствительностью). Добавление новых ощущений и сенсорной иерархии позволит устройству создавать более качественные модели внешнего мира. К этому мы еще вернемся ниже.
Возникает закономерный вопрос: существует ли предел того, как далеко может зайти разумная система памяти и в каких измерениях? Предположительно, на какой-то стадии устройство станет слишком громоздким, чтобы быть по-настоящему полезным, или оно начнет давать сбои, приблизившись к своему теоретическому пределу. Возможно, человеческий мозг уже приблизился к своему максимальному теоретическому размеру, хотя я считаю это маловероятным. Человеческий мозг увеличился относительно недавно в ходе эволюции, и ничто не наводит на мысль о том, что мы вышли на стабильный максимальный уровень. Каким бы ни был лимит емкости разумной системы памяти, человеческий мозг почти наверняка до него и близко не дотягивает.
Еще один способ понять, каким образом могли бы быть полезны разумные системы памяти, – проанализировать пределы человеческих возможностей. Эйнштейн, вне всякого сомнения, был очень умен, но его мозг был всего лишь мозгом. Можно предположить, что его выдающийся ум был последствием физических отличий его мозга от типичного. Эйнштейн был уникален потому, что человечество нечасто рождает гениев. А создавая мозг из кремния, мы можем воплотить в жизнь что угодно. Кремниевый мозг может располагать таким же уровнем интеллекта, как и Эйнштейн, или даже превзойти его. С другой стороны, лучше познать возможные измерения разума нам помогут умственно отсталые люди, проявляющие фотографическую память или способности осуществлять в уме сложные математические вычисления. Совершенно нетипичный мозг таких индивидов, несмотря ни на что, является мозгом, неокортекс которого работает по тому же алгоритму. Если нетипичный мозг обладает невероятными способностями к запоминанию, то теоретически мы можем добавить эти способности нашему искусственному мозгу. Подобные экстремальные проявления человеческих умственных способностей не только показывают, что можно было бы воссоздать, но и указывают направления, в которых мы могли бы превзойти наилучшие проявления работы человеческого мозга.
Реплицируемость
Каждый новый органический мозг растет и обучается на протяжении десятилетий человеческой жизни. Каждый человек на собственном опыте познает основы координации конечностей и мышечных групп, осваивает азы и передвижения, изучает общие свойства множества объектов окружающей среды, животных, других людей, названия предметов и структур речи, семейные и общественные правила. Как только основа заложена, начинаются годы формального обучения. Каждый человек в течении своей жизни проходит множество кругов обучения. Несмотря на то что путь этот несметное количество раз повторялся другими людьми, модель мира в коре головного мозга каждого из нас создается в индивидуальном порядке.
Разумным машинам нет необходимости проходить подобную спиралевидную кривую обучения, поскольку чипы и другие единицы хранения информации можно реплицировать бесконечно, а сохраненные данные – копировать. В этом отношении разумные машины подлежат такой же репликации, как и программное обеспечение. Как только прототип системы достаточно обучен, его можно скопировать столько раз, сколько нам потребуется. Процессы разработки дизайна, настройки системного обеспечения, обучения, испытания и выявления ошибок с тем, чтобы усовершенствовать систему памяти умной машины, могут длиться годами. Но, как только мы получим конечный продукт, его можно будет запускать в массовое производство. Как я уже отмечал, мы сможем обеспечить возможность последующего обучения для копий или обойтись без таковой. Для некоторых приложений мы захотим ограничить возможности с тем, чтобы разумные машины работали известным и испытанным нами способом. Как только «умный» автомобиль усвоит все, что ему положено «знать», мы примем меры, чтобы у него не образовались плохие привычки или не закрепились самостоятельно найденные ложные аналогии. Мы захотим, чтобы все машины подобного строения вели себя одинаково. Но вот для других приложений может оказаться целесообразной возможность постоянного обучения мозгоподобных систем памяти. Например, разумной машине, созданной для того, чтобы искать математические доказательства, понадобится способность обучаться на основе опыта, применять старые решения для новых проблем, ей желательно быть универсально гибкой и открытой.
Возможным станет общее использование компонентов, как сейчас общедоступны программные продукты. Разумная машина определенного дизайна может быть перепрограммирована набором новых связей с тем, чтобы генерировать новое поведение (вот, например, если бы я смог загрузить новый набор связей в ваш мозг, моментально превратив вас из человека, разговаривающего на английском, в человека, знающего только французский, или из профессора политологии в музыковеда). Люди получили бы возможность «переключаться» и осуществлять новые наработки на основе чужого опыта. Допустим, что я разработал и внедрил в жизнь суперсистему зрительного восприятия, а другой человек разработал и обучил систему с превосходными способностями слухового восприятия. При надлежащем дизайне мы смогли бы объединить обе системы без необходимости повторного обучения с самого начала. Такого рода объединение экспертных знаний не представляется возможным для человека – у каждого из нас свой путь. Бизнес создания разумных машин смог бы развиваться по аналогии с компьютерной индустрией, в таком случае перепрограммирование разумных машин не слишком отличалось бы от разработок новых версий видеоигр или инсталляции новой программы.