Инвариантные представления
Помните ли вы, как я назвал кору головного мозга тканью из нервных клеток размером со столовую салфетку и толщиной в шесть визитных карточек, в которой связи между разными зонами создают определенную иерархическую структуру? Сейчас я хочу проиллюстрировать иерархическую структуру неокортекса иначе. Представьте, что мы разрезали эту салфетку на несколько частей, соответствующих зонам, специализирующимся на выполнении определенных задач, и наложили полученные кусочки друг на друга. У нас вышел своеобразный слоеный, или «блинный» пирог. Разрезав «пирог», получим срез (см. рис. 6.3). Разумеется, в действительности неокортекс выглядит по-другому, но благодаря этой картинке вы составите четкое представление о передвижении потоков информации. На рис. 6.1 показано, как информационные сигналы поступают в низшую зону коры головного мозга и передвигаются вверх от зоны к зоне. Обратите внимание, что информационные потоки циркулируют в обоих направлениях.
Рис. 6.1 представляет первые четыре зрительные зоны, вовлеченные в распознание объектов окружающего мира. С их помощью вы узнаете кошку, церковь, свою мать, Большую китайскую стену и так далее. Биологи обозначают эти зоны V1, V2, V4 и IT. Входной визуальный сигнал показан стрелкой под зоной V1. Зрительная информация с сетчатки ваших глаз передается к V1. Этот входной поток информации можно представить как непрерывно изменяющиеся последовательности сигналов, которые передаются приблизительно по миллиону аксонов, составляющих ваш зрительный нерв.
Ранее мы уже упоминали о пространственно-временных сигналах, однако сейчас стоит освежить эти знания, поскольку мы будем часто к ним обращаться. Кора головного мозга состоит из функциональных зон, специализирующихся на отдельных задачах. Эти зоны связаны друг с другом большими пучками аксонов, или нервных волокон, передающих информацию из одной зоны в другую. Каждую секунду какой-то пучок волокон посылает электрический разряд, называемый потенциалом действия, или импульсом, в то время как другие пучки молчат. Общая активность пучка волокон называется паттерном (последовательностью сигналов). Паттерн, полученный зоной V1, будет пространственным, если ваши глаза на мгновение остановились на объекте, и временным, если они его разглядывают.
Примерно трижды в секунду ваши глаза осуществляют скачкообразное движение – саккаду, после чего следует пауза – фиксация. Если бы вы участвовали в эксперименте и исследователь при помощи специального устройства отслеживал движения ваших глаз, вы бы удивились, узнав, насколько резки саккады, при том что воспринимаемое изображение кажется вам постоянным и устойчивым. На рис. 6.2 а показано, как двигались глаза одного из участников эксперимента, когда он рассматривал изображение лица. Обратите внимание, что фиксации вовсе не беспорядочны. А теперь представьте, что вы могли бы видеть паттерн, поступающий к зоне V1 этого человека. Он полностью меняется с каждой саккадой. Значит, несколько раз в секунду зрительная зона коры головного мозга получает совершенно новую последовательность сигналов.
Рис. 6.2. а) Траектория саккад при рассматривании лица человека
Возможно, вы подумаете: «Ну ладно, ведь все равно это лицо остается одним и тем же, несмотря на сдвиги». Доля истины в этом есть, но намного меньшая, чем вы себе представляете. Световые рецепторы на сетчатке глаза распределены неравномерно. Их плотность, очень высокая в центральной ямке, постепенно уменьшается по направлению к периферии глаза. А нервные клетки коры головного мозга, напротив, распределены равномерно. В результате изображение, переданное с сетчатки в первичную зрительную зону V1, очень искажено. Если вы, рассматривая одно и то же лицо, направите взгляд на нос, а потом сконцентрируете его на глазе, зрительный входной сигнал будет очень отличаться, как будто вы смотрите на это лицо через немилосердно дергающийся «рыбий глаз». Тем не менее при взгляде на лицо оно не кажется вам искаженным; изображение не «прыгает» у вас перед глазами. Скорее всего, вы вообще не осознаете, что получаемые от сетчатки визуальные сигналы изменяются, более того – так сильно изменяются. Вы просто видите «лицо» (на рис. 6.2 б показан эффект взгляда на прибрежный пейзаж через линзу «рыбий глаз»). По сути, это переформулирование загадки об инвариантном представлении, о которой мы беседовали в главе 4.
Рис. 6.2. 6) искажение, вызванное неравномерным распределением рецепторов в сетчатке глаза
Возможно, вы подумаете: «Ну ладно, ведь все равно это лицо остается одним и тем же, несмотря на сдвиги». Доля истины в этом есть, но намного меньшая, чем вы себе представляете. Световые рецепторы на сетчатке глаза распределены неравномерно. Их плотность, очень высокая в центральной ямке, постепенно уменьшается по направлению к периферии глаза. А нервные клетки коры головного мозга, напротив, распределены равномерно. В результате изображение, переданное с сетчатки в первичную зрительную зону V1, очень искажено. Если вы, рассматривая одно и то же лицо, направите взгляд на нос, а потом сконцентрируете его на глазе, зрительный входной сигнал будет очень отличаться, как будто вы смотрите на это лицо через немилосердно дергающийся «рыбий глаз». Тем не менее при взгляде на лицо оно не кажется вам искаженным; изображение не «прыгает» у вас перед глазами. Скорее всего, вы вообще не осознаете, что получаемые от сетчатки визуальные сигналы изменяются, более того – так сильно изменяются. Вы просто видите «лицо» (на рис. 6.2 б показан эффект взгляда на прибрежный пейзаж через линзу «рыбий глаз»). По сути, это переформулирование загадки об инвариантном представлении, о которой мы беседовали в главе 4.
Вы воспринимаете не то, что видит зона V1. Откуда ваш мозг знает, что вы смотрите на одно и то же лицо, и почему вашему восприятию совершенно не мешает, что входные сигналы постоянно меняются, более того, они очень искажены?
Поместив в зону V1 электрод и наблюдая за «поведением» отдельных клеток, мы обнаружим, что каждый нейрон посылает разряд только в ответ на зрительный сигнал из крошечной части сетчатки. Такой опыт по изучению зрительной функции проводили много раз. Каждый нейрон зоны V1 привязан к своему рецептивному полю, которое является очень ограниченным по сравнению с общим полем зрения. Нервные клетки зоны V1 ничего не знают о лицах, автомобилях, книгах или других объектах, постоянно встречающихся на вашем пути. Все, что они знают, – это крошечная, как укол булавки, часть всего мира перед вашими глазами.
Каждая клетка зоны V1 настроена на восприятие определенных видов входных сигналов. Например, некий нейрон бурно реагирует, когда в его рецептивное поле попадает линия или угол в тридцать градусов. Сам по себе такой угол не имеет особенного значения. Он может быть частью какого угодно предмета – доской паркета, обломком дерева, частью буквы М. При каждой новой фиксации рецептивное поле клетки исследует новую часть видимого пространства. При разных фиксациях поток импульсов, посылаемый клеткой, может быть сильнее или слабее, а может и вовсе отсутствовать, т. е. при каждой саккаде активность клеток в зоне V1 изменяется.
А вот если мы введем электрод в верхнюю зону IT (см. рис. 6.1), то обнаружим нечто совершенно невероятное. Мы увидим, что некоторые клетки указанной зоны возбуждаются и остаются активными, когда в поле зрения человека появляются целые объекты. Например, мы можем найти клетку, энергично реагирующую каждый раз, когда в поле зрения появляется лицо. Эта клетка будет активной до тех пор, пока лицо присутствует в любой точке поля зрения, под любым ракурсом и при любом освещении. Она не включается-выключается при каждой последующей саккаде, как это делают клетки зоны V1. Рецептивное поле такой клетки покрывает большую часть зрительного пространства, и она возбуждается всякий раз, когда человек видит лица.
Остановимся на этом подробнее. Какие изменения характеризуют четыре уровня зон коры головного мозга? По мере продвижения от сетчатки до зоны IT изменчивые, пространственно специфические, ориентированные на распознание мелких деталей нейроны сменяются нейронами высших зон – пространственно неспецифическими, постоянно активными и способными распознавать целые объекты. Нейрон из зоны IT сообщает нам, что где-то в поле нашего зрения присутствует лицо. Эту нервную клетку называют клеткой лица, и она активизируется независимо от того, стоит ли хозяин лица прямо, склонил ли он голову или повернулся к вам в профиль. Это часть инвариантной репрезентации для объекта «лицо».
Да, описать данную схему несложно. Проходим быстренько четыре стадии, и вот вам лицо. Но ни одна компьютерная программа, ни одна математическая формула не в состоянии обеспечить решение подобной задачи с той же надежностью и универсальностью, как это делает человеческий мозг. Нам известно, что мозг решает эту задачу за несколько шагов, значит, разгадка не должна быть слишком сложной. Одной из задач данной главы является поиск объяснения возникновения этой «клетки лица» (а также «клетки Билла Клинтона» и любой другой). Мы достигнем своей цели, но прежде нам следует обработать массу информации. Как говорится, всему свое время.
Как видно из рис. 6.1, по сети обратных связей информация поступает из высших зон неокортекса в низшие. Эти обратные связи представлены пучками аксонов, которые проходят от высшей зоны IT к низшим зонам V4, V2, V1. Примечательно, что количество обратных связей в зрительной коре головного мозга превышает количество восходящих связей.
Долгие годы ученые-нейробиологи игнорировали эти обратные связи, что вполне объяснимо: если вы ограничиваете свои задачи изучением того, как мозг принимает входную информацию, подвергает ее обработке, а потом на основе этого моделирует поведение, то в рассмотрении обратных связей, казалось бы, совсем нет необходимости. В таком случае фокус внимания исследователей прикован к прямым связям – проведению нервных импульсов от сенсорных зон головного мозга в моторные зоны. Однако если принять за основу идею, что ключевой функцией неокортекса является прогнозирование, то без изучения обратных связей не обойтись. Мозгу необходимо отсылать информацию из высших нервных центров обратно к тем зонам, от которых он ее получил: для того чтобы делать прогнозы, надо сравнивать реальные события и ожидания. То, что на самом деле произошло, идет снизу вверх, а то, чего вы ожидаете, спускается сверху вниз.
Подобный круговой процесс происходит во всех сенсорных зонах коры головного мозга. На рис. 6.3 изображены аналогичные «слоеные пироги» для тактильного, слухового и зрительного восприятия. Также показаны высшие или ассоциативные зоны коры головного мозга, которые получают и анализируют информационные стимулы от нескольких органов чувств, в данном случае – слуха, зрения и осязания.
Рис. 6.3. Формирование инвариантных репрезентаций при осязании, слуховом и зрительном восприятии
Если рис. 6.1 представляет общеизвестную взаимосвязь четырех хорошо изученных зон коры головного мозга, то рис. 6.3 – это условная диаграмма, целью которой не является отображение фактических зон неокортекса. В действительности десятки зон коры головного мозга человека взаимосвязаны друг с другом самыми различными способами. Большая часть неокортекса образована ассоциативными зонами. (Я использую схематические рисунки, чтобы помочь вам лучше разобраться в излагаемом материале. И надеюсь, что они не введут вас в заблуждение.)
Переход от быстроменяющихся к медленноменяющимся и от пространственно-специфических к пространственно-инвариантным нейронам был доказан многочисленными результатами исследований зрительного восприятия. В отношении других сенсорных зон данных значительно меньше, но нейробиологи утверждают, что так же устроены и все остальные сенсорные зоны коры головного мозга.
Рассмотрим, например, слуховое восприятие. Когда вы слышите устную речь, изменения звуковых колебаний происходят очень быстро. Так же быстро изменяются паттерны, поступающие в первичную слуховую зону А1. Но если бы мы могли поместить электрод в высшую зону неокортекса, ответственную за слуховое восприятие, то обнаружили бы инвариантные клетки, реагирующие на определенные слова и даже фразы. Вполне вероятно, что в вашей слуховой зоне коры головного мозга существует группа клеток, активизирующихся всякий раз, когда вы слышите слово «спасибо», или группа клеток, реагирующих на приветствие «доброе утро». Такие клетки остаются активными на протяжении всего времени, пока звучит фраза, при условии, конечно, что вы ее воспринимаете. Последовательности сигналов, попадающие в низшую слуховую зону, могут очень сильно отличаться друг от друга. Одно и то же слово можно произнести с разными акцентами, разным тоном и в разном темпе. Чем выше мы поднимаемся по иерархии слуховых зон коры головного мозга, тем менее важными становятся эти низкоуровневые различия. Слово идентифицируется согласно его значению, независимо от акустических эффектов. То же самое справедливо и в отношении музыки. Вы можете услышать одну и ту же песню, сыгранную на фортепиано, на кларнете или в исполнении ребенка. В каждом из перечисленных случаев ваша зона А1 получает совершенно различные звуковые сигналы. Тем не менее электрод, введенный в высшую зону слухового восприятия, подтвердил бы наличие клеток, посылающих нервный разряд всякий раз, когда ваши органы слуха воспринимают данную песню, независимо от инструмента или особенностей исполнения. Отмечу, что такой эксперимент никогда не проводился, это было бы слишком жестоко по отношению к человеку. Но, признавая существование универсального алгоритма функционирования неокортекса, следует признать и наличие подобных клеток. В слуховом восприятии существует точно такая же обратная связь – прогнозирование, построенное на инвариантных представлениях, – как и в зрительном.
Осязание работает по тому же принципу. На людях (по вполне понятным причинам) соответствующие эксперименты никогда не проводились. В настоящее время ученые занимаются подготовкой к проведению таких опытов с использованием исследовательских инструментов, сканирующих мозг обезьяны.
Сейчас, сидя за столом, я держу в руке ручку. Я могу дотронуться до ее колпачка или провести пальцами вдоль металлической скрепки, с помощью которой ручку можно закрепить в нагрудном кармане. По мере того как я проделываю эти движения разными пальцами или даже губами, последовательности сигналов, поступающие в соматосенсорную зону коры головного мозга от рецепторов осязания, постоянно меняются. Будучи столь непохожими, они попадают в разные части первичной соматосенсорной зоны. Тем не менее в зонах, высших по иерархии, наш воображаемый датчик обнаружил бы клетки, которые реагируют на ручку инвариантно. Эти клетки пребывают в активном состоянии до тех пор, пока я прикасаюсь к ручке, независимо от того, какими пальцами (или даже частями тела) я это делаю.
Вдумайтесь: ваш мозг не способен распознать объект на основании единственного мгновенного сигнала. Паттерн, поступающий от ваших органов чувств в какой-то один момент времени, содержит лишь крошечную толику информации, которой недостаточно для того, чтобы определить, что же вы услышали или к чему прикоснулись. Чтобы воспринять серию слуховых паттернов (например, мелодию, слово, хлопок закрывающейся двери) или понять, что за объект у вас в руках – та же ручка, – вам необходимо время. Вы не можете узнать мелодию по одной ноте и распознать предъявленный вам объект с первого прикосновения. Следовательно, нейронная деятельность, обеспечивающая сознательное восприятие объектов окружающей действительности, должна быть более продолжительной по времени, чем каждая отдельно взятая последовательность сигналов. Таким образом, мы опять пришли к выводу: чем выше расположена зона коры головного мозга, тем меньше в ней наблюдается временных изменений.
Зрительное восприятие – зависимый от фактора времени информационный поток, действующий по тому же принципу, что и звуковое восприятие или осязание. Но у зрения есть особенность, которая вносит некоторую путаницу: мы все-таки способны распознавать отдельные объекты с одной фиксации. Это умение распознавать пространственные паттерны «с первого взгляда» долгие годы вводило в заблуждение ученых, занимающихся исследованиями зрительного восприятия животных. Они, как правило, не принимали в расчет фактор времени. Действительно, в лабораторных условиях как люди, так и животные способны распознавать объекты таким образом, однако это не является нормой. Нормальное зрительное восприятие, как, например, чтение этой книги, предполагает постоянные движения глазных яблок.