Несколько лет назад Адам Коутс, поступивший в постдокторантуру Стэнфордского университета, спросил своего наставника Ву Энда: «Что нужно делать, чтобы наши исследования могли изменить мир?» Ву Энда ответил, что для этого нужно пойти в Baidu. Во время этого разговора Адам уже больше года занимал пост директора исследовательского центра Baidu в Кремниевой долине.
В настоящее время никто, вероятно, не сможет отрицать факт, что исследовательский центр играет существенную роль. Но вначале он играл, скорее, роль «транзитной станции» для сотрудников, которые проживали в США.
В 2014 году Baidu впервые раскрыл суть проекта «Baidu Brain». Эта информация отбросила лишь легкую тень в СМИ и не вызвала широкого диссонанса. И только в 2016 после двух лет затишья на конференции «Wuzhen World Internet Conference Baidu» мозг Baidu был впервые представлен широкой публике. Тогда же более 30 000 компаний изъявили желание начать сотрудничество.
Развитие «Baidu Brain» – это тяжелая работа. Но люди, ответственные за исследования и разработки, – это команда вундеркиндов. Многие из них выходцы из неблагополучных семей, где они росли маленькими хулиганами. Места рождения некоторых даже не нанесены на карту Baidu. Некоторые работают над созданием «Baidu Brain», потому что в студенческую эпоху с особенным энтузиазмом относились к сфере медицины. Они занимаются исследованиями, отмечая, что они «тяжелы и глубоки». Но также говорят, что нужно пройти этот опыт до конца. Это крайний подход, который граничит с научной фантастикой.
Многие молодые ученые компании любят смотреть научно-фантастические фильмы. Обычные люди в них видят иллюзию, а докторанты – науку. Например, при просмотре телесериала «Мир Дикого Запада» инженер голосового отдела Highlight сказал: «Только взгляните на развитие сюжета! Я чувствую, что пробуждение, распознавание голосовых отпечатков и другие технологии были разработаны на пределе возможностей. Будущее человеко-компьютерного взаимодействия должно быть таким!»
Строительство мозга Baidu также можно сопоставить с научно-фантастическими элементами. Начнем с его инфраструктуры.
Основным в бизнесе ИИ для компании Baidu является «материальный уровень», в котором используется платформа облачных вычислений на основе графического процессора/FPGA, платформа глубокого обучения и массивы данных. Этот слой обеспечивает эволюционную среду и необходимые для развития инструменты. Верхний уровень SaaS – это множество приложений для искусственного интеллекта.
Между ними находится «базовый технологический уровень ИИ». Когнитивные функции мозга, такие как «речь» (распознавание речи и синтез речи), «видение» (визуальное распознавание) и «чтение и письмо» (обработка естественного языка), находятся на этом уровне, а мозг имеет возможность принятия решений и осуществления движений. На этом уровне также предусмотрены функции контроля и прогнозирования.
Baidu Brain содержит три слоя. Чжан Якин полагает, что сочетание трех слоев отражает всеобъемлющую силу «Baidu Brain».
«Baidu Brain» – основной двигатель развития для облака Baidu. Облако Baidu – это облако мозга Baidu. Оно обеспечивает источник знаний и дает возможность обучать систему, которая, в свою очередь, экспортирует услуги в различные отрасли промышленности через облако.
Baidu является первой компанией в мире, которая использует чипы GPU в больших масштабах для развития искусственного интеллекта, глубокого обучения, а также для масштабирования коммерческих серверов ARM (AcornRISC Machine). Кроме того, компания самостоятельно разработала сервер на основе чипов FPGA. Интеграция множества серверов с разной производительностью, структурой и принципами требует высоких вычислительных возможностей. Благодаря гетерогенной вычислительной технологии, технологии связи 100G RDMA и эффективной серверной технологии с полным стеком, Baidu построила крупнейший в мире гибридный гетерогенный вычислительный кластер с графическим процессором и FPGA, который объединил сотни тысяч серверов. Это позволило сформировать структуру мозга Baidu и обеспечить превосходную вычислительную мощность.
Но одной инфраструктуры недостаточно. Еще есть контент и массивы данных. Это похоже на память человека. PaaS используется поверх IaaS – нашей платформы для искусственного интеллекта. Все ее функции растут на уровне PaaS. В поисковой системе содержатся данные более чем за 10 лет – десятки миллиардов изображений, видео, пользовательских данных. Все они являются постоянным источником питания и обучения мозга Baidu.
Помимо развитых инфраструктуры и памяти, «Baidu Brain» обладает навыками познавательного мышления. С помощью глубокого обучения система имитирует работу нейронов человеческого мозга и совершенствуется с помощью миллиардов образцов, параметров и функций. Это самая большая и глубокая нейронная сеть в мире.
«Базовый технологический уровень ИИ» включает в себя распознавание речи, распознавание образов, обработку естественного языка, карты знаний, бизнес-логику и пользовательские портреты.
Уровень SaaS – щупальца «Baidu Brain», которые проникают в вертикальные отрасли, такие как транспорт, образование и финансы. Для Baidu эти три уровня – это возможности и услуги, предоставляемые клиентам, а также способность создавать интеллектуальную экосистему.
«Baidu Brain» абсолютно превзошел информационные технологии прошлого. Раньше он занимался или вычислениями, или хранением, или созданием сети. Это просто. Теперь эти три уровня органически сплетены в единое целое. Искусственный интеллект обрел душу.
Благодаря работе имеющихся алгоритмов мозг Baidu будет расти, как снежный ком. Он будет все более эффективен при обработке данных, извлечении знаний, понимании пользователей, решении проблем и получении дополнительных знаний для реализации знаний. Каждый положительно завершившийся цикл – это новые данные.
«Интернет-гений» Николас Негропонте сказал: «Когда я услышал о «Baidu Brain», решил, что эти люди сумасшедшие». Создание мозга машины кажется безумной выдумкой научно-фантастической литературы. Но старания ученых все ближе подталкивают «сумасшедшую» идею к реализации. Это происходит точно так же, как происходит рост и развитие в реальной жизни.
Обучение «мозга» похоже на воспитание ребенка. Оно происходит с нуля. Язык изучается практическим методом, а не посредством изучения грамматики. Впечатления от вещей формируются за счет большого количества картинок и образов. Суть заключается в том, чтобы познавать мир методом проб и ошибок. Возможно, Baidu Brain тратит в десятки тысяч раз больше сил и энергии на то, с чем легко справляются годовалые дети. Но, с другой стороны, это общечеловеческий ребенок. Он пытается унаследовать все переживания и воспоминания о существующей цивилизации. Эволюция искусственного интеллекта – это, по сути, эволюция человеческой цивилизации с неограниченным потенциалом.
Недавно компания Baidu объявила о том, что откроет платформу развития «Baidu Brain» ai.baidu.com и бесплатную платформу глубокого обучения с открытым исходным кодом PaddlePaddle. Первая обеспечивает среду программирования алгоритмов для разработчиков. Вторая предоставляет готовый интерфейс искусственного интеллекта Baidu для разработчиков приложений, инженеров и исследователей данных. «Baidu Brain» готов растопить айсберг бизнеса искусственного интеллекта со всеми имеющимися в нем компаниями.