Параметры человеческого мышления
Поскольку для нас человек есть мера всех вещей, включая искусственный интеллект, мы должны понимать, какими возможностями по переработке информации он обладает.
Наш мозг насчитывает немногим менее 90 млрд нейронов, которые время от времени возбуждаются (когда распознают в своем окружении знакомые им паттерны). По энергетическим оценкам, в каждый момент времени активным может быть лишь 1 из 50 нейронов,. Разбив общее число
N нейронов на
ячеек, в каждой из которых может быть активным лишь один из нейронов, получаем грубую оценку разнообразия паттернов мозговой активности в каждый момент времени:
. Скорость обработки информации (равной логарифму разнообразия) определяется частотой смены этих паттернов:
Здесь мы использовали максимальную частоту генерации нейронных спайков ν = 300 Гц, задающую временной масштаб смены состояний мозга, и выразили вычислительную мощность в привычных для компьютерщиков единицах – в числе арифметических операций в секунду.
По нынешним меркам 1011 FLOPS – это не так уж и много. Современный универсальный процессор Intel Core i9 с производительностью 1012 FLOPS и специализированные матричные процессоры NVIDIA Tesla V100 с пиковой производительностью 1014 FLOPS уже далеко превосходят рассчитанную нами вычислительную мощность мозга. Этот парадоксальный вывод мы подробно обсудим чуть ниже.
Основным каналом получения информации из внешнего мира для нас является зрение. Скорость обработки зрительной информации примерно в 100 раз ниже вычислительной мощности мозга (поскольку первичная зрительная кора занимает примерно 1 % площади всей коры), то есть составляет 109 FLOPS. Этого вполне достаточно для обработки информации, поступающей от глаза по зрительному нерву, содержащему 106 нервных волокон.
Сенсорная информация обрабатывается параллельными «спецпроцессорами» первичной коры, распознающей наиболее простые мелкомасштабные признаки. Далее информация проходит еще несколько этапов обработки, на каждом из которых распознаются все более сложные и крупномасштабные признаки, пока наконец входная информация не будет представлена в символьной форме – в виде сцены с распознанными объектами и схемой их расположения. Например, это может быть текст с распознанными буквами и порядком их следования. Все этапы распознавания образов проходят параллельно, быстро и на бессознательном уровне. Осмысление распознанной символьной информации осуществляется в форме сознательного мышления и совсем в другом темпе «рассказывания историй».
Символы, в отличие от образов, обладают небольшим разнообразием. Например, буквы могут кодироваться всего лишь пятью битами (так как 25 = 32). Зато комбинациями компактного набора символов можно закодировать практически неограниченный набор высокоуровневых понятий, определяющих любую распознанную сцену. В приведенном выше примере чтения текста этим понятиям соответствуют слова и их сочетания. Сознательное мышление вообще тесно связано с языком и представляет собой последовательные операции с символьной информацией. Минимальный акт сознания длится около 0,5 с. За это время мы успеваем распознать примерно одно слово в среднем из 5 букв, или около 25 бит. Соответственно сознательное мышление (около 50 бит/с, или 10 байт/с) гораздо – в миллионы раз! – медленнее бессознательного. Но именно с такой скоростью мы разговариваем, думаем, читаем, печатаем, решаем задачи.
Сознательное мышление определяет скорость обучения, передачи знаний. Ведь бóльшую часть наших профессиональных знаний мы получили в процессе коммуникации с другими людьми. Скорость обучения особенно важна, так как она ограничивает объем наших знаний. Даже если учиться непрерывно по 16 часов в день (то есть 2 × 107 с в год) в течение 100 лет, максимальный объем знаний составит 1011 бит, или 1010 байт. Иными словами, знания каждого из нас составляют не более 10 ГБ, и их можно было бы записать на небольшую флешку.
Наши оценки объема знаний гораздо ниже, чем привычные 1014 бит – по числу синапсов в коре головного мозга. Бóльшая часть этих синапсов организует локальные контуры бессознательной обработки информации в коре. Наша более скромная оценка относится к глобальным связям, участвующим в запоминании распознанных нашим сознанием эмоционально окрашенных высокоуровневых понятий. Не случайно «оператор» человеческой памяти, гиппокамп, связан лишь с высокоуровневыми разделами ассоциативной коры.
Таким образом, по сравнению с современными компьютерами наши возможности по обработке информации довольно скромны. Почему же машинный интеллект до сих пор не достиг человеческого уровня и мы по-прежнему считаем компьютеры «быстрыми, но глупыми»? Как ни странно, но именно по этой причине – из-за недостатка знаний о мире. Для решения сложных задач важны не столько вычислительные мощности, сколько сложные алгоритмы. А сложность современных компьютерных программ до сих пор недотягивает до человеческого уровня. Даже операционная система Windows, содержащая 50 млн строк кода, скажем, по 20 символов на строку, имеет сложность 1 Гбайт, то есть содержит меньше знаний, чем мозг одного человека. А ведь ее создавали сотни людей в течение десятков лет!
Значит, узким местом, мешающим созданию компьютерного разума, является трудоемкость ручного программирования или, в более общем случае, процесса передачи компьютерам знаний. Как только этот процесс будет автоматизирован, путь к искусственному интеллекту окажется свободен. Компьютерные мощности для него уже готовы. Вот почему сегодня фокус исследований в сфере ИИ сосредоточен в области машинного обучения – автоматизации процесса создания компьютерных программ. Современные искусственные нейросети могут содержать сотни миллиардов настроечных параметров, то есть имеют сложность, в сотни раз превышающую Windows, притом что настройка всех этих параметров происходит автоматически, без участия человека – путем обучения на примерах. И, что самое важное, на много порядков быстрее и дешевле!
Почему же тогда машинное обучение не использовалось раньше? Ведь зародилось оно еще в конце 1950-х годов. Краткий ответ, как водится, прост: машинное обучение требует больших вычислительных мощностей, которые стали доступны лишь недавно. Более развернутый ответ, который займет оставшуюся часть этой главы, требует анализа движущих сил развития компьютерной техники: какие сегменты платежеспособного спроса она обслуживала, какие задачи помогала решать на разных этапах своего развития? Иначе говоря, на чьи деньги развивались компьютеры все 75 лет своего существования? Как они постепенно все глубже проникали в ткань современной экономики?