Бизнес-модель: платформа сильного ИИ
Всякий исследовательский проект, особенно такой затратный, как создание сильного ИИ, предполагает возможность вернуть вложенные в него инвестиции сторицей. В нашем случае сценарий монетизации легко себе представить, поскольку искусственная психика – это не что иное, как операционная система нового поколения для роботов.
Существующие ОС, скажем ROS, созданы для программирования поведения роботов. С появлением искусственной психики последние обретут способность обучаться множеству самых разных навыков и осваивать десятки тысяч профессий с минимальным объемом программирования. Оно ограничится алгоритмами обучения и «врожденными рефлексами», необходимыми для эффективного обучения роботов под руководством «наставников» и «воспитателей». Задачей первых будет обучение роботов профессиональным навыкам для работы по той или иной специальности, а вторых – обучение пониманию, чего люди ожидают от них в тех или иных ситуациях, то есть привитие им человеческих ценностей. Наставниками роботов могут быть те самые профессионалы, которых роботы призваны заменить, а воспитателями – пользователи, оценивающие то, насколько поведение роботов соответствует их желаниям и ожиданиям.
Естественно, нет необходимости воспитывать и обучать с нуля каждого робота. В отличие от людей, искусственную психику новым партиям роботов можно будет инсталлировать в готовом виде, однако они смогут получать периодические обновления своей психической «прошивки», как это принято в современных операционных системах. Так что обучение роботов можно будет проводить в многопользовательском режиме – сигналы от многих миллионов пользователей будут суммироваться платформой и совместно формировать обновленную версию «робоэтики».
Единая операционная система для всех типов роботов удобна еще и тем, что они смогут легко обмениваться своими знаниями. При одинаковой архитектуре возможности роботов будут различаться только мощностью их бортовой аппаратуры. Как и в случае со смартфонами, базовые функции могут исполняться на борту, а различные опции – подгружаться из облачной платформы по мере необходимости.
Как мы знаем, наиболее популярные операционные системы, приобретая статус отраслевого стандарта, становятся естественными монополиями. Они являются цифровыми платформами для разработчиков прикладного программного обеспечения, а в мире платформ, как водится, «победитель забирает все». Будущие операционные системы для роботов не будут исключением, так что разработчикам искусственной психики имеет смысл побороться за первенство на этом перспективном и стратегически важном рынке. А первенство будет за теми, кто первым предложит удобную и дешевую цифровую платформу для всех участников этого рынка:
● для компаний – производителей роботов;
● для профессионалов – их наставников;
● для конечных пользователей услуг роботов.
Производителям роботов будет предложена универсальная искусственная психика, разработать которую самостоятельно никто из них не в состоянии. Им хватает проблем с физическими телами роботов – это их сфера компетенций. Для производителей важна именно универсальность искусственной психики, чтобы она подходила к любым телам роботов, какими бы наборами сенсоров и актуаторов они ни обладали. Естественно, под каждое «железо» будут разрабатываться свои драйверы – наборы «врожденных» рефлексов для данного типа роботов. Так, новорожденный жеребенок может практически сразу самостоятельно встать и побежать за матерью. Но за дальнейшее обучение роботов различным профессиональным навыкам и человеческим ценностям производители роботов ответственности не несут. За это отвечают наставники и пользователи.
Наставники роботов – это команды профессионалов, передающие секреты своего ремесла роботам, приходящим им на смену. Они должны быть заинтересованы в этом, например, через участие в будущих прибылях, пропорциональное их вкладу в увеличение производительности роботов. Пусть этот вклад определяется рынком, где наставники будут конкурировать между собой, предлагая предобученные модули универсальной искусственной психики. Соответственно для наставников важны модульная архитектура искусственной психики и рыночная площадка для торговли такими модулями. Ситуация вполне аналогична нынешним операционным системам смартфонов с соответствующими магазинами приложений.
Наконец, компании, использующие роботов, должны иметь возможность платить лишь за конечный результат, оценивая качество полученных ими услуг наиболее понятным и принятым в человеческом обществе способом. Только конечный пользователь способен оценить итоговый результат всей производственной цепочки – разработчиков операционной системы, производителей роботов и их наставников. Соответственно благодарность пользователей в денежном выражении должна распределяться по этой цепочке в качестве обратной связи между потребителями и поставщиками услуг.
Таким образом, мы можем представить себе следующую бизнес-модель, устраивающую всех участников будущего рынка робототехники. Производители роботов специализируются на разработке робоплатформ, аналогичных автомобильным платформам, на основе которых современные автобренды собирают свои модели в самых различных модификациях. Аналогичным образом будущие бренды робототехники будут комплектовать конкретные модели роботов операционной системой с конкретными наборами навыков и поставлять их конечным пользователям в аренду. Пользователи будут платить роботам «зарплату» за их услуги, размер которой будет определяться рынком и зависеть от степени удовлетворения пользователей. Это удобно, так как пользователи не рискуют своими средствами, как при покупке роботов, и не переплачивают за обещанные, но не оказанные услуги.
Цифровая платформа, предоставляющая операционную систему роботов (даром!), обеспечивает все расчеты между пользователями и поставщиками услуг с помощью электронного кошелька робота, являющегося неотъемлемой частью операционной системы. Этот электронный кошелек аналогичен дофаминовой системе мозга, обеспечивая обучение с подкреплением, нацеленное на удовлетворение потребностей конечных пользователей. Собственно, деньги играют в рыночной экономике аналогичную роль, посылая обучающие сигналы всей цепочке создания стоимости.
Бизнес этой платформы строится на небольшом проценте с транзакций между электронными кошельками роботов. Мы можем приблизительно оценить масштаб этого бизнеса. Допустим, внедрение роботов будет происходить с той же скоростью, с которой происходил переход от аграрной экономики к индустриальной, – примерно за век. Если через 100 лет основная часть ВВП будет производиться роботами, то их суммарная годовая зарплата составит порядка $100 трлн. Предположим, что она будет равна нулю в момент создания операционной системы роботов и каждый год станет прирастать на $1 трлн. Если поставщики операционной системы будут отчислять себе 1 % от всех зарплат роботов, то их доход будет каждый год возрастать на $10 млрд, а оценка стоимости компании с самого начала будет примерно $100 млрд. Так что создателям искусственной психики роботов есть за что побороться.
Наконец, last but not least, обсудим вопрос о безопасности будущего роботизированного общества. Чтобы обеспечить мирное сосуществование роботов и людей, Айзек Азимов и его друг и редактор Джон Кэмпбелл предложили в свое время «три закона робототехники» (в порядке их приоритетности):
1. Робот не должен причинить вреда человеку.
2. Робот должен повиноваться приказам человека.
3. Робот должен заботиться о собственной безопасности.
Однако сам же Азимов в своих произведениях неоднократно показывал неоднозначность трактовки этих законов в различных ситуациях. Ведь спасение одного человека может причинить вред другому, а любой словесный приказ содержит множество неявных ограничений, которые робот может и не угадать. Наконец, свою собственную безопасность он может легко связать с необходимостью исполнения уже отданных приказов или оправдать вред, нанесенный конкретным людям, пользой остальному человечеству, как это описано у Артура Кларка в его романе «2001: Космическая одиссея».
Современный научно обоснованный вариант трех законов робототехники предложен Стюартом Расселом, а именно:
1. Единственная цель роботов – максимизировать пользу, оказываемую ими людям.
2. Первоначально роботы не знают, в чем именно эта польза заключается.
3. Роботы обучаются пониманию полезности в процессе общения с людьми.
Как видим, эти законы основаны на формировании у роботов человеческой системы ценностей методом обучения с подкреплением, когда их поведение постоянно оценивается людьми, как это и подразумевается в описанной выше операционной системе роботов.
В отличие от законов Азимова, в этой трактовке у роботов никогда не появляется уверенности в том, что они действительно правильно понимают пользу своих действий, а есть постоянное стремление улучшать свое текущее понимание ценностей и желаний людей, с которыми они взаимодействуют. Эти ценности не программируются, а воспитываются, подобно тому как это происходит у нас, и по этой же причине ценности роботов оказываются теми же самыми ценностями, что и у людей, с тем отличием, что человеческие ценности для роботов оказываются выше их собственных нужд, поскольку инстинкт самосохранения в них намеренно не закладывается.