Машинное обучение и алгоритмы

Книга: Как вытащить из данных максимум. Навыки аналитики для неспециалистов

Близкая к предыдущей тема – машинное обучение и алгоритмы. Давайте начнем с алгоритмов, это что-то более или менее знакомое.

Алгоритм – это «пошаговая процедура решения задачи или получения результата».

Суть проста: алгоритм производит расчет или серию расчетов для достижения конкретной цели. Алгоритмы используются повсеместно – например, в банковской сфере. Банки и финансовые организации одалживают гражданам и организациям крупные суммы денег. Для этого очень важно определить, платежеспособен ли клиент и вернет ли он долг. Мы, люди, можем оценить «на глаз» платежеспособность потенциального клиента, а затем принять решение. Но почему бы не положиться на возможности алгоритма, чтобы просеять все имеющиеся данные и принять более обоснованное решение? Это хорошая возможность, но и алгоритмы, бывает, ошибаются. Кто составляет алгоритмы? А откуда берутся данные, обрабатываемые алгоритмами?

Я понимаю, что это обобщение, но все же подчеркну: алгоритмы отнюдь не идеальны. Когда люди разрабатывают алгоритм и подбирают для него данные, то при работе алгоритма их собственные предвзятые или просто ошибочные суждения могут повлиять на результат. Это не редкость.

Алгоритмы и машинное обучение – близкие родственники. Термин «машинное обучение» может сбить с толку неосведомленного человека: нужно понимать, что речь идет не про обучение при помощи машины, а про обучение самой машины, самого компьютера. Так что же, компьютер способен чему-то научиться? Да! Процитирую журнал MIT Technology Review: «Алгоритмы машинного обучения (видите, и правда близкая родня! – Прим. авт.) используют статистику для поиска закономерностей в огромных объемах данных».

Investopedia утверждает: «Машинное обучение – это идея, что компьютерная программа способна обучаться и адаптироваться к новым данным без вмешательства человека. Машинное обучение – область искусственного интеллекта (ИИ), обеспечивающая возможность поддерживать встроенные алгоритмы компьютера в актуальном состоянии независимо от перемен в мировой экономике».

Итак, машинное обучение предполагает, что алгоритмы обучаются сами по себе и могут совершенствоваться с теми или иными целями, связанными с данными, анализом и т. д.

В рамках нашей аналитической стратегии и дата-грамотности алгоритмы и машинное обучение занимают важное место, но нужно отдавать себе отчет, что это очень «техническая» область. Хорошо, когда есть работающие на вас компьютеры, которые могут самостоятельно обучаться, но без подготовленных сотрудников, способных должным образом воспользоваться результатами, все это бессмысленно. Только дата-грамотность позволяет коллективу организации успешно применять алгоритмы и пользоваться самообучающимися машинами.

Если мы внедряем стратегию и культуру, основанную на данных, алгоритмы и обучающиеся машины дают человеческому фактору больше времени для интерпретации, постановки вопросов и многого другого. Кроме того, они помогают нам принимать более обоснованные и быстрые решения. Но для этого необходима дата-грамотность. Когда алгоритм прорабатывает данные, выдает результаты и продолжает обучаться, вы – практик – должны суметь воспользоваться этими данными для принятия решений. С этим непосредственно связан третий элемент дата-грамотности – способность анализировать данные.

Если мы хотим, чтобы сотрудники нашей организации научились правильно использовать данные, полученные от самообучающихся машин, или результаты работы алгоритмов, нам нужна схема обучения дата-грамотности. Естественно, также необходимо уметь общаться на языке данных, свободно владеть ими и применять три «С» дата-грамотности. Пользуясь разработанными алгоритмами, мы должны подключать любопытство и задавать вопросы, проявлять креативность и, конечно же, критически осмысливать информацию. Только критическое мышление позволяет распознать, не закралась ли ошибка в результаты работы, возможно, несовершенного алгоритма.

Назад: Искусственный интеллект

Дальше: Большие данные