ИИ-мир искусства и рассказов
Машины делают свои первые шаги в мире искусства. Они учатся самостоятельно рассказывать истории, сочинять музыку и рисовать картины. Если подобное делает человек, мы называем такую деятельность творчеством. Но будет ли нам комфортно говорить то же самое о машине?
Что если есть обезьяна, которая боится бананов? А вдруг человек однажды проснется и станет собакой, которая умеет пользоваться телефоном? Или же где-то появился дом без дверей? What-if Machine (машина «Что, если») наделена активным воображением, почти как мы с вами – мы любим что-то придумывать. Мы рассказываем истории для развлечения, для обмена опытом или понимания чего-либо. Как сказал автор Филип Пуллман: «После питания, пристанища и живого общения, истории – это то, что нам нужно больше всего в жизни».
Однако скоро мы будем не единственными, кто живет историями. What-if Machine, созданная командой Терезы Ллано из Голдсмитского колледжа Лондонского университета, учится фантазировать. В результате могут появиться машины, способные продемонстрировать самый человекоподобный ИИ из существующих. «Мы создаем не искусственных людей, а компьютеры, которые смогли бы лучше понять людей и взаимодействовать с ними, – говорит Тони Вил из Университетского колледжа Дублина (Ирландия), который также участвует в проекте What-if Machine. – Мы любим истории, поэтому хотим наделить этой способностью и наши компьютеры».
Для достижения этой цели необходимо будет научить компьютеры видеть мир таким же, каким видим его мы. И это станет гигантским скачком в области машинного интеллекта. Неудивительно, что многие видят в этом одну из самых сложных задач в искусственном интеллекте. Но мы движемся к своей цели. Такое достижение должно окупиться не только хорошими историями, но и новыми взглядами на мироздание.
Повествование – это всегда непросто. Мы должны представлять себе, что вещи вокруг нас – не такие, какие есть на самом деле. Что есть персонажи и мотивы, и их можно развить. А еще есть сюжетная идея, способная связать все это воедино. И, наконец, хорошая история должна находиться где-то между незамысловатостью и абсолютной неправдоподобностью. «Процесс создания историй возвращает нас к важнейшим проблемам компьютерных наук», – считает Майкл Кук из Университета Фалмута (Великобритания). Сюда можно отнести все, начиная от выбора лучшего персонажа и интересного взгляда на происходящее и заканчивая основной структурой отдельных предложений и естественностью языка.
Первые работы по искусственному генерированию историй появились в 1970-х годах, их центральной проблемой была причинно-следственная связь при создании сюжета. Одной из первых значимых программ была Tale-Spin, разработанная в 1977 году Джеймсом Миханом в Калифорнийском университете в Ирвине.
Программа придумывала истории про животных в стиле басен Эзопа. Пользователь-человек задавал каждому персонажу свою цель и библиотеку планов для достижения этой цели. При правильном сочетании целей и планов поведение персонажей формировало целый сюжет.
Но такие системы были написаны довольно плохо. Их основное улучшение наступило с добавлением приоритетных авторских целей, которые направляли действия персонажей на пути к желаемому результату. Теперь вместо того, чтобы действовать поодиночке, персонажей можно было обучить согласованности общих действий для достижения конечной цели – жить долго и счастливо… или нет, в зависимости от задумки автора.
Но излишняя согласованность приводит к появлению бессмысленных и нереалистичных историй, из-за чего создается впечатление, будто бы персонажей собрали вместе только для достижения цели автора.
Марк Ридл из Технологического института Джорджии, чья работа по искусственному интеллекту-рассказчику была поддержана такими разноплановыми организациями, как Disney и Управление перспективных исследовательских проектов Министерства обороны США (DARPA), пытается решить проблему согласованности, заставляя системы ИИ наделять персонажей мотивацией и избегать иллюзии коллективного сговора.
Срочные новости: боты получают важную информацию
17 марта 2014 года в 6:28 утра газета Los Angeles Times опубликовала статью о землетрясении, которое потрясло Калифорнию три минуты назад. Статья была информативной, но написанной в простом стиле: «По данным Геологической службы США, в понедельник утром в 5 милях от Вествуда, штат Калифорния, произошло землетрясение силой 4,7 балла. Подземные толчки отмечались в 6:25 утра по тихоокеанскому времени на глубине в 5 миль».
Статья вышла с указанием имени автора – Кена Швенке, журналиста и программиста газеты.
Однако благодарить за статью стоит компьютер Швенке, который написал эту историю без участия человека.
И мало кто из читателей заметил разницу. Ранее в этом месяце Кристер Клерволл из Карлстадского университета в Швеции попросил 46 своих студентов прочесть один из двух обзоров футбольного матча в NFL, а затем оценить качество и убедительность прочитанного материала. Студенты не знали о том, что один из обзоров был подготовлен журналистом Los Angeles Times, а другой писался программой.
Почти половина из 27 опрошенных, прочитавших «компьютерную» версию статьи, была уверена в том, что материал писался человеком.
Возрастает популярность молниеносных и основанных на фактах журналистских обзоров, написанных компьютером, ведь новые истории с прямым изложением фактов довольно легко создать автоматически. Творческие работы – это совсем другое дело. Можно рассказать целую историю, используя человеческие ассоциации на повседневные объекты. Возьмем, к примеру, трагедию Хемингуэя из нескольких слов: «Продаются детские ботиночки. Неношеные». Написание такой прозы выходит за рамки новостных сообщений и требует глубокого познания мира.
Еще одной проблемой ранних систем оказалось использование знаний, запрограммированных вручную. Такие знания ограничивали масштаб так называемого «воображения» системы. Именно в этой области началось стремительное развитие новой волны рассказчиков. Например, одна из систем Ридла под названием Scheherazade учится, задавая вопросы. Когда ИИ приходит к выводу о том, что не знает, как поступить (например, как заставить двух персонажей встретиться в ресторане), она публикует вопрос в Интернете. Люди с краудсорсинговых платформ по типу Amazon Mechanical Turk снабжают систему письменными примерами того, как все может происходить при различных сценариях (допустим, первое свидание или ограбление банка). Из этих примеров система узнает о новых ситуациях, которые затем вплетаются в ход сюжета.
Конечно же, хорошая история – это куда больше, чем подробное описание событий. Ощущение радости часто порождается неожиданной подачей чего-то обыденного. Понимание того, какими свойствами обладают объекты или какое культурное значение они несут, имеет решающее значение.
Это позволяет рассказчику становиться более изобретательным, креативным и способным удивлять. «Как нам научить ИИ тому, что чайник можно использовать в качестве оружия, хотя такой сценарий маловероятен?» – спрашивает Кук.
Даже если бы компьютер смог продемонстрировать глубокое понимание существующих систем и значений, он бы все еще испытывал трудности с таким явлением, как фантазия. Одна из хитростей, к которым прибегала What-if Machine, заключалась в том, чтобы, например, зеркально отображать уже известную информацию о мире. Обезьяны любят бананы. А что, если бы они наоборот боялись бананов? В домах есть двери. А что, если бы их не было?
Для определения оригинальности своей работы ИИ сравнивает написанное произведение с уже существующими. «Допустим, вы придумали идею: медведь, который также является и предметом мебели. И вы хотите узнать, насколько нова эта революционная идея о гибриде медведя и стула», – объясняет Кук. Поэтому вы проверяете все известные вам типы медведей и стульев и ищите совпадения.
Но суждения ИИ о новизне сводятся к оценке той базы данных, из которой он черпает знания. «ИИ может придумать новое интересное животное, – говорит Кук. – Птица, которая не умеет летать!» Если все примеры птиц, о которых он знает, могут летать, то такая идея будет иметь высокий рейтинг по шкале оригинальности. Но стоит только добавить в базу данных пингвинов, как идея перестанет быть чем-то новым.
Опять же, в обучении могут помочь люди. Но воображение – это куда больше, чем стулья-медведи и нелетающие птицы. По мнению Ридла, многое из того, что делает историю интересной, сводится к тому, насколько неожиданными окажутся происходящие события. История об ограблении банка, в которой все идет как по шаблону, вряд ли кого-то удивит. Теоретики нарратологии (научного направления, изучающего повествование) часто говорят о том, что история достойна повествования, только если она разрывает устоявшиеся шаблоны. И дело здесь не только в нарушении устоявшихся догм.
Некоторые разрывы шаблонов весьма тривиальны, другие же – абсолютно бессмысленны. Машины не всегда знают, в каком случае нарушение правил окажется полезным, а когда оно принесет вред. Перед тем, как рассуждать о нетипичных вещах, ИИ стоит разобраться с типичностью.
Один из способов выбраться из этой ловушки заключается в обучении компьютеров метафорам. «Метафора – это когнитивный рычаг, который позволяет людям приумножать знания и проецировать их из одной области на другую», – говорит Вил. Например, выражение «жизнь – это игра» расширяет наше понимание «жизни». Чтобы наделить компьютеры такими «рычагами», Вил разработал Metaphor Magnet – программу, которая обучается на общих метафорах из кэшированных текстов Google. Затем с помощью тезауруса программа расшифровывает понятия и находит для них новые определения.
Три вымышленные фабрики
Вы приготовились? Новейшие системы создания историй учатся придумывать рассказы, изучая устройство человеческого мира. Некоторые из них опрашивают краудсорсинговые платформы о различных событиях, например первых свиданиях или ограблениях банков. Другие же (к примеру, ConceptNet) разрабатывают собственные онлайн-базы данных с нужными понятиями. Таким образом, они сначала расширяют свои знания об общих объектах и событиях, а затем превращают их в вымышленные истории. Существует несколько искусственных систем-рассказчиков.
Scheherazade
Scheherazade, разработанная Марком Ридлом из Технологического института Джорджии в Атланте, может рассказать истории о любом мире, про который узнает из Интернета.
Система активно опрашивает краудсорсинговые платформы (Amazon Mechanical Turk и др.) о примерах действий, которые могли бы произойти при различных сценариях (например, при ограблении бланка). Вот отрывок ответа от одного краудвокера:
Джон открыл дверь банка.
Джон вошел в открытую дверь банка.
Джон огляделся вокруг банка.
Салли, кассир банка, заметила Джона.
Джон подошел к Салли.
Салли улыбнулась Джону.
Джон поздоровался с Салли.
Джон сказал Салли, что у него есть пистолет.
Scheherazade связывает воедино множество последовательностей действий. Так она понимает, насколько возможны данные действия и в какой последовательности они должны происходить. Затем программа добавляет фрагменты с действиями в нужный раздел оригинального сюжета. Вот произведение, основанное на сценарии ограбления банка:
Джон сделал еще один глубокий вздох, размышляя о правильности задуманного, и затем вошел в банк. Джон занял место за последним человеком в очереди и ждал. Когда человек перед ним решил свой вопрос и настала очередь Джона, он медленно подошел к Салли. Кассир сказала ему: «Здравствуйте, меня зовут Салли. Чем я могу помочь?» Когда Джон приблизился к кассе, Салли испугалась, потому что он выглядел подозрительно.
Джон вытащил пистолет, который прятал в кармане пиджака. С суровым взглядом Джон направил пистолет на Салли. Салли сильно испугалась и закричала, опасаясь за свою жизнь. Грубым, резким голосом Джон потребовал деньги. Он бросил пустую сумку на стойку. Джон наблюдал, как Салли перекладывала деньги в сумку, а затем, когда сумка была заполнена, Джон выхватил ее у Салли. Салли чувствовала, как по ее лицу текли слезы, когда она разразилась безутешными рыданиями. Джон быстро вышел из банка и сел в машину, бросив сумку с деньгами на пассажирское сидение.
Джон хлопнул дверью грузовика. Под визг шин он выехал с парковки и уехал в неизвестном направлении.
Вот еще одна история, созданная таким же образом. В этот раз она посвящена свиданию в кино:
Джон подъезжал к дому Салли. В предвкушении их первого свидания у Джона потели ладони и быстро билось сердце. Салли в красивом белом платье, развевавшемся на ветру, осторожно села в машину Джона. Джон и Салли поехали в кинотеатр. Джон и Салли припарковали машину на парковке. Чтобы чувствовать себя немного увереннее, Джон заранее купил билеты в кино. Перед входом в кинозал стоял бледный человек. Джон показал билеты, и пара вошла в зал. Салли захотела пить, поэтому Джон поспешил купить напитки перед началом сеанса. Джон и Салли нашли два хороших места на последних рядах. Джон сел и поднял подлокотник, чтобы они с Салли могли прижаться друг к другу. На протяжении всего фильма Джон не отрывал глаз от Салли и нервно потягивал свой напиток. Наконец, набравшись смелости, Джон протянул руку, чтобы обнять Салли. С облегчением и восторгом он почувствовал, как Салли придвигается к нему поближе. Салли встала, чтобы воспользоваться уборной во время сеанса, и застенчиво улыбнулась Джону перед выходом. Джон и Салли держались за руки на протяжении всего фильма, хотя руки Джона постоянно потели. Джон и Салли медленно поднялись со своих мест. Все еще держась за руки, Джон вернулся с Салли обратно к машине, проходя через лабиринт людей, которые спешили выйти из кинотеатра. На выходе из темного кинотеатра яркое солнце на мгновение ослепило Джона. Джон придержал дверь для Салли. Джон отпустил руку Салли и открыл для нее пассажирскую дверь машины. Но вместо того, чтобы войти в машину, она сделала шаг вперед, обняла Джона и поцеловала его. Джон отвез Салли домой.
Flux Capacitor
Команда Тони Вила из Университетского колледжа в Дублине (Ирландия) разработала систему, создающую сюжетные линии персонажей, которые можно использовать для основы истории. Система пользуется генератором метафор для комбинирования различных понятий при «распределении по ролям». Например, противоположные понятия «милый» и «страшный» распределяются по подходящим ролям («милые клоуны» и «страшные колдуны»). Опираясь на базовые представления о мире, система объединяет эти роли в правдоподобную сюжетную линию персонажа. Вот несколько примеров:
• Что заставляет милых клоунов уходить из цирков, изучать некромантию и становиться страшными колдунами?
• Что побуждает недовольных протестующих отказываться от демонстраций протестов в пользу веры и превращаться в покорных фанатиков?
• Почему авторитетные журналисты уходят из новостных изданий, начинают проявлять интерес к подглядываниям и превращаются в озабоченных вуайеристов?
• Что толкает недалеких актеров отказаться от актерской деятельности, начинать собирать толпы и превращаться в набожных проповедников?
• Что заставляет потрепанных попрошаек вновь обретать дома, поступать в медицинскую школу и становиться аккуратными хирургами?
У Flux Capacitor есть собственный профиль в Twitter (@MetaphorMagnet), в котором публикуется вся информация об активности системы. Создатели Flux Capacitor надеются, что обратная связь от подписчиков-людей позволит существенно улучшить систему.
What-if Machine
Тереза Ллано из Голдсмитского колледжа Лондонского университета разрабатывает систему, которая может придумывать истории стиле Кафки и Disney.
What-if Machine создает художественные сценарии с помощью зеркального отображения свойств, которыми мы обычно наделяем объекты и понятия.
Человеческие персонажи
• Что, если бы существовал маленький человечек, который бы забыл, как косить газон?
• Что, если бы существовал маленький юрист, который бы научился не спорить?
• Что, если бы существовал младенец, который бы умел ходить?
• Что, если бы существовал маленький человек, который бы научился уменьшаться?
Животные персонажи
• Что, если бы существовала маленькая обезьянка, которая боялась бы бананов?
• Что, если бы существовала маленькая собачка, которая боялась бы любви?
• Что, если бы существовала маленькая собачка, которая боялась бы костей?
• Что, если бы существовала маленькая змея, которая боялась бы живой мыши?
• Что, если бы существовал маленький крот, который не смог бы найти нору?
• Что, если бы существовала маленькая пчела, которая не смогла бы отыскать мед?
• Что, если бы существовала маленькая овечка, которая не смогла бы найти поле?
Персонажи-объекты
• Что, если бы существовало маленькое колесо, которое потеряло бы тормоз?
• Что, если бы существовала маленькая книга, которая потеряла бы свой рассказ?
• Что, если бы существовал маленький столик, который потерял бы свой стул?
• Что, если бы существовал маленький дом, который потерял бы свою дверь?
• Что, если бы существовала маленькая бомба, которая забыла бы, как ранить людей?
• Что, если бы существовала небольшая звезда, которая не могла бы взорваться?
• Что, если бы существовала небольшая ручка, которая не могла бы писать?
• Что, если бы существовала небольшая мелодия, которая не могла бы развлекать?
• Что, если бы существовал небольшой пистолет, который не мог бы убить?
Персонажи в стиле Кафки
• Что, если бы существовала женщина, которая однажды проснулась бы на ферме и стала говорящей козой?
• Что, если бы существовал человек, который проснулся в поле и стал собакой, умеющей звонить по телефону?
Сюрреализм
• Что, если бы в поле был слуга с лицом репы?
• Что, если бы во дворе был пастух с лицом болгарского перца?
Сценарии
• Что, если бы все поэты перестали писать стихи забавы ради и ушли бы в запой?
• Что, если бы существовала собака, которая обожала бегать, но больше не могла этого делать, и поэтому решила прокатиться на лошади?
• Что, если бы существовал робот, который смог бы понять любовь с помощью теорем?
• Что, если бы существовала танцор, который танцевал бы только на руках?
• Что, если бы существовала лифт, в котором отсутствовали бы тросы, и этот лифт мог бы подняться высоко – до самого неба?
Metaphor Magnet способен вплетать сюжетные линии персонажей в рассказ благодаря анализу связанных и противоположных понятий. Возьмем сериал «Во все тяжкие», в котором главный герой из отца и учителя превращается в наркоторговца и криминального авторитета. Яркий контраст между портретом персонажа в начале и конце истории обусловливает захватывающее повествование.
Создание схожих сюжетных линий Metaphor Magnet начинает с определения пар противоположных понятий (например, «милый» и «страшный»). Затем он ищет роли, к которым можно применить данные понятия. Допустим, «милые клоуны» и «страшные колдуны». Опираясь на небольшие знания о нашем мире, система связывает противоположные понятия в органичный переход, который ложится в основу сюжета: что заставляет милых клоунов уходить из цирков, изучать некромантию и становиться страшными колдунами?
– История о генеральном директоре, который становится председателем правления компании, весьма правдоподобна. Многие генеральные директора близки к тому, чтобы стать председателями, – рассказывает Вил. – Но где же напряжение? История о заносчивом генеральном директоре, который теряет все и превращается в бомжа? Вот теперь сюжет становится куда интереснее.
Попытка разобраться с тем, что именно создает хорошую сюжетную линию, отчасти зависит от понимания интриги. Команда Ридла создала модель, которая связывает интригу с вероятностью того, что план по спасению персонажа от неприятностей сработает. Это позволяет системе Ридла оценить уровень интриги в сюжете.
Части головоломки собираются воедино. Так что же нам делать с подобными системами? Одной из областей практического применения может стать генерирование таких историй, которые окажутся слишком велики для создания людьми. Например, когда Facebook приобрела Oculus Rift (компанию, занимающуюся виртуальной реальностью), то заявила, что хочет создать первую ролевую онлайн-игру с миллиардом пользователей. Виртуальные миры должны быть «заселены» интересными персонажами с интересными поступками. Если игровой мир слишком разрастется, то люди-дизайнеры не смогут создавать персонажей, сюжетные линии и испытания вручную. Будущие системы создания историй обещают стать не просто фабриками по генерированию вымышленных сюжетов. Машины, которые рассказывают истории, смогут понять, как устроен наш мир. Наши компьютеры способны удивлять, развлекать нас, провоцировать дебаты, указывать на тенденции к изменениям, находить парадоксы и противоречия, а также побуждать нас к более активной интеллектуальной вовлеченности.
Ридл верит в то, что ИИ, способный овладеть основами повествования, окажется полезным для фактического анализа. Журналистским расследованиям пригодится способность ИИ создавать предположения о происходящем в реальном мире и подбирать факты для подтверждения или опровержения данных гипотез. Например, сюжеты о том, что могло бы произойти с пропавшим самолетом, облегчили бы поисковые операции.
Интервью. За гранью теста Тьюринга
Марк Ридл – директор лаборатории интеллектуальных развлекательных систем в Школе интерактивного вычисления Технологического университета штата Джорджия в Атланте. Он занимается изучением искусственного интеллекта, виртуальных миров и процесса повествования. Ридл уверен, что тест Тьюринга слишком прост. По словам ученого, именно творчество должно стать эталоном человеческого интеллекта. Поэтому он доработал тест Тьюринга до новой формы – «Тест Лавлейс 2.0».
– Из каких элементов состоит тест Тьюринга?
– Тест Тьюринга представлял собой мысленный эксперимент. Считалось, что если кто-то не сможет отличить человека от компьютера при общении в текстовом чате, то участник, «обхитривший» эксперта, должен признаваться разумным. Когда в 1950 году Алан Тьюринг писал свою оригинальную статью, он не предполагал фактическое проведение теста. Тьюринг пытался убедить людей в том, что компьютеры могут обладать человеческими способностями. Однако Тьюрингу было трудно определить, что же такое разумность.
– Почему вы считаете, что тест нуждается в обновлении?
– К настоящему времени его успешно прошли как минимум три чат-бота, которых исследователи ИИ почти единогласно признали далеко не самыми разумными.
– Верно ли, что эту проблему пыталось решить тестирование 2001 года под названием «Тест Лавлейс»?
– Да. Этот тест был назван в честь выдающегося математика XIX века Ады Лавлейс. Он сводился к следующему: если вы хотите увидеть в ИИ человеческие способности, то не стоит забывать о том, что люди создают что-то новое, и этот процесс требует от нас разумности. Исследователи, разработавшие данный тест, предположили, что можно попросить ИИ что-то создать (допустим, рассказ или стихотворение). И успешным прохождением теста считались лишь те случаи, когда программист ИИ не сможет объяснить, как именно алгоритм придумал свой ответ. Проблема в том, что я не уверен в эффективности теста, поскольку крайне маловероятна ситуация, при которой программист не сможет понять логики созданного им алгоритма.
– Чем отличается ваш «Тест Лавлейс 2.0»?
– В моем тесте эксперт-человек сидит за компьютером. Эксперты знают, что имеют дело с ИИ, и поэтому дают системе задание из двух слагаемых. Во-первых, они просят создать творческий объект: рассказ, поэму или картину. А во-вторых, к задаче добавляются условия. Например: «Расскажи историю о кошке, которая становится героем»; или «Нарисуй человека, который держит пингвина».
– Должны ли объекты быть эстетичными?
– Не обязательно. Я не хотел связывать разумность с умением: обычный человек может сыграть в Pictionary, но не сможет создать шедевр Пикассо. Поэтому мы не должны требовать суперинтеллекта от наших ИИ.
– Что происходит после того, как ИИ представляет свой объект?
– Если эксперт удовлетворен результатом, он придумывает еще одну, более сложную задачу. И так продолжает до тех пор, пока ИИ либо не завалит тест, либо эксперт не убедится, что система продемонстрировала достаточный уровень разумности. Несколько этапов проверки означают, что вы увидите полученные оценки, а не только вердикт «прошел» / «не прошел». И мы можем сохранять задания экспертов для тестирования других ИИ.
– То есть ваш тест – это, скорее, инструмент сравнения искусственных систем?
– Именно так. Я бы не хотел давать точных прогнозов о том, что потребуется от ИИ для достижения человекоподобного интеллекта. Нам опасно говорить о таких вещах.