Книга: Hello World. Как быть человеком в эпоху машин
Назад: Эксперимент с монахинями
Дальше: Проблема данных

Цифровая диагностика

Все это касается не только рака груди. Нейросетям, которые создают Энди Бек и другие ученые, все равно, что разглядывать. Вы можете велеть им расписать по классам что угодно – собак, головные уборы, сыры. Они научатся, лишь бы вы дали им понять, когда они угадали, а когда нет. Теперь, когда алгоритмы этого семейства стали достаточно хороши для практического применения, они вмешиваются в самые разные области современной медицины.

Одно из недавних достижений принадлежит команде проекта Google Brain (“Гугл-мозг”), создавшей программу для скрининга на диабетическую ретинопатию – самую распространенную причину потери зрения, которую, однако, можно предупредить. При этой патологии поражаются сосуды в светочувствительной зоне глаза. Если это осложнение выявлено, зрение удастся спасти с помощью инъекций, но, если его вовремя не обнаружить, последствия будут необратимы. В Индии, где не все могут получить квалифицированную помощь в диагностике этой патологии, 45 % людей с диабетической ретинопатией обречены на частичную потерю зрения еще до того, как они узнают о своем состоянии. Сегодня алгоритм, разработанный сотрудниками Google Brain совместно с индийскими медиками, диагностирует диабетическую ретинопатию не хуже офтальмолога.

Существуют такие же программы для диагностики сердечно-сосудистых заболеваний, эмфиземы легких, инсульта и меланомы. Созданы даже такие системы, которые распознают полипы прямо во время колоноскопии.

Факт тот, что если можно сделать снимок и пометить изображение патологического изменения, то можно и создать алгоритм, который его найдет. Вероятно, тогда удастся поставить диагноз более точно, а может, и раньше, чем это сделает человек.

Но как быть с другими медицинскими данными, подчас имеющими странные форматы? Можно ли расширить возможности алгоритмов, так чтобы они решали не только какие-то конкретные задачи в узких областях? Скажем, можно ли создать программу для расшифровки каракулей вашего доктора? Или такую, которая выловит самые мелкие характерные детали в ваших жалобах на боль?

Как вам такая картина из жанра научно-медицинской фантастики: в приемной врача вас внимательно выслушивает компьютер, и он же изучает вашу историю болезни? Можно ли представить себе машину, в совершенстве владеющую всеми тонкостями самой современной диагностики? Машину, которая ставит точный диагноз и предлагает индивидуально подобранный план лечения?

Иначе говоря, можно ли создать нечто вроде маленького компьютерного доктора Ватсона?

Элементарно, Ватсон!

Однажды в 2004 году Чарльз Ликел ужинал с коллегами в нью-йоркском ресторане. Где-то посередине трапезы он заметил, что народу в зале поубавилось. Чарльз удивился, пошел вслед за всеми и увидел столпившихся перед телевизором людей, увлеченно наблюдавших за популярным шоу Jeopardy!. Знаменитый чемпион Кен Дженнингс, который выигрывал уже полгода кряду, готовился побить собственный рекорд, и зрители не хотели пропустить это событие.

Чарльз Ликел был вице-президентом IBM по программному обеспечению. Прошло несколько лет с тех пор, как Deep Blue обыграл в шахматы Гарри Каспарова, и все это время руководство IBM жаждало получить от Чарльза новую оригинальную идею, достойную внимания корпорации. Там, в нью-йоркском ресторане, видя, с каким азартом его компаньоны следят за победителем телевикторины, Ликел и задумался о том, нельзя ли создать компьютер, который обставил бы Дженнингса.

Задача не из легких. Целых семь лет, с того самого ужина, Чарльз Ликел вынашивал концепцию компьютера, впоследствии получившего название Watson. И в конце концов в специальном выпуске телешоу Watson сразился с Кеном Дженнингсом и одержал уверенную победу над человеком в его же игре. По ходу дела команда IBM твердо решила попытаться сконструировать первый в мире полнофункциональный компьютер-диагност. Скоро мы к этому вернемся. Сначала я объясню вам основной принцип деятельности машины-победителя, который лег в основу алгоритма для медицинской диагностики.

Справка для тех, кто впервые слышит об этой игре: Jeo-pardy! – популярное в Америке телевизионное шоу, так сказать, викторина наоборот, когда трем игрокам задают вопросы в форме толкования слова, то есть как бы ответа, а свои ответы они должны сформулировать в виде вопросов. Например, в теме “Слова, содержащие в себе противоречия”, может быть такой вопрос:



Крепление для соединения вещей; или это могло бы означать “согнуть”, “деформировать при нагревании или силой и нечаянно продавить”.



Чтобы дать верный ответ (What does “buckle” mean?), электронному игроку надо было научиться прорабатывать несколько уровней. Прежде всего компьютеру пришлось бы достаточно хорошо освоить язык, чтобы извлечь какой-то смысл из формулировки задания и понять, что все эти слова: “крепление”, “соединение”, “согнуть”, “деформировать” и “нечаянно продавить” – являются независимыми элементами подсказки. Для алгоритма это уже само по себе большая работа.

Но это только первый шаг. Далее Watson должен был выбрать потенциальные варианты ответа для каждой подсказки. Со словом “крепление” ассоциировались самые разные ответы – зажим, пуговица, штифт, завязки и, в частности, пряжка. Watson должен методично рассмотреть все варианты и сопоставить их с другими подсказками. Вряд ли вы найдете очевидную связь между словами “штифт” и “погнуть” или “деформировать”, а вот пряжка, безусловно, ассоциируется с этими глаголами, поэтому у компьютера больше оснований выбрать этот ответ. В конце концов, собрав воедино все аргументы, Watson должен перейти от слов к делу и выдать однозначный ответ.

Конечно, играть в слова проще, чем разбираться с медицинскими диагнозами, но логическая схема одна и та же. Допустим, вы обратились к врачу с жалобами на беспричинное похудание, боли в животе, да еще с изжогой. Как и в телевизионном шоу, ставится задача определить вероятные диагнозы (ответы), которые объясняли бы симптомы (сведения в вопросе), найти дополнительные аргументы в пользу каждого варианта и, по мере поступления дополнительной информации, отдать предпочтение одному из возможных ответов. В медицине это называется дифференциальной диагностикой. В математике – байесовским выводом.

Не так-то просто было разработать электронного доктора Ватсона, хотя игрок Watson уже существовал и успешно выступил в викторине. Тем не менее IBM объявила о своем намерении заняться медициной и скромничать не стала. Корпорация оповестила весь мир, что Watson исполнит высокую миссию – “искоренит рак”, а рекламировать “один из самых мощных инструментов, когда-либо созданных человечеством”, пригласила известного актера Джона Хэмма.

“Медицинская утопия” должна бы нас воодушевить. Только вот Watson, как вы уже, вероятно, знаете, не выполнил громких обещаний.

Первый престижный контракт был заключен в 2016 году с Онкологическим центром им. М. Д. Андерсона Техасского университета. Ходили слухи, что, несмотря на 62 миллиона долларов инвестиций в разработку технологии и четыре года работы, электронный Ватсон не продвинулся дальше пробных испытаний, которые проводились под жестким контролем. Позже, в сентябре 2017 года, сайт медицинских новостей STAT сообщил, что Watson “не может пока преодолеть первый этап и все еще учится различать формы онкологических заболеваний”.

А жаль.

Справедливости ради надо сказать, что были и успехи. В Японии Watson определил у одной пациентки редкую форму лейкемии, при том что врачи не смогли поставить диагноз. А анализы, которые провел Watson, помогли обнаружить пять генов, связанных с заболеванием двигательных нейронов, боковым амиотрофическим склерозом (БАС). Но в общем и целом программисты IBM не сумели поддержать энтузиазм своего восторженного отдела маркетинга.

Любые попытки создать такую машину всегда вызывают одобрение. Теоретически возможно сделать компьютер, который сможет поставить диагноз – и даже предложить обоснованный план лечения, – и это достойная цель. Но и труднодостижимая. Это гораздо сложнее, чем выиграть в викторине, и несопоставимо сложнее, чем опознать на изображении раковые клетки.

Казалось бы, от уже известных нам алгоритмов распознавания образов, способных видеть рак, до многоцелевой диагностической машины всего один логический шаг, но у тех алгоритмов есть большое преимущество – им предлагают для анализа те самые клетки, которые могут быть причиной болезни. Диагностический компьютер, напротив, получает не первичную, а неоднократно переработанную информацию. Возможно, у пациента покалывает в конечностях, потому что у него возник мышечный спазм, потому что защемило нерв, потому что пациент поднял что-нибудь слишком тяжелое. Или у него кровь в кале, потому что он страдает геморроем, потому что у него запор, потому что он неправильно питается. Для того чтобы поставить верный диагноз, алгоритму (и доктору) надо раскрутить назад всю цепочку, начиная с одного симптома. Что и должен сделать Watson. Невообразимо сложная задача.

А ведь есть и другие трудности.

Помните нейросеть, которая различала волков и собак? Ее легко было обучить. Программистам достаточно было запастись пачкой фотографий с собаками и волками, пометить их и показать компьютеру. Простые данные, не допускающие двоякого толкования. Но, как сказал журналу Массачусетского технологического института MIT Technology Review специалист по компьютерной диагностике, патолог Томас Фукс, “в такой специфической области, как медицина, для того чтобы правильно разметить информацию, которую вы загружаете в компьютер, требуются люди с огромным опытом работы”.

При решении узких задач – скажем, когда в биоптатах, взятых для исследования на рак молочной железы, надо отличить “доброкачественное” новообразование от “опасной формы рака” – это еще можно организовать. Но универсальный диагностический компьютер, такой как Watson, должен разбираться практически во всех без исключения диагнозах. Для этого целая армия “дрессировщиков” самого высокого уровня должна в течение долгого времени снабжать машину информацией о пациентах и разнообразных специфических симптомах их заболеваний. Вообще-то этим людям есть чем заняться – например, спасением жизни других людей.

Итак, мы подходим к последнему препятствию. Его преодолеть сложнее всего.

Назад: Эксперимент с монахинями
Дальше: Проблема данных