CSI - Center for Strategic Initiatives

Просторы искусственного интеллекта

Авторы: Дармен Жолтай

1 декабря 2019

Современные технологии еще каких-то 20 лет назад казались выдумкой писателей-фантастов. Сегодня искусственный интеллект, машинное обучение, нейронные сети - уже повседневная реальность. Однако многих такое стремительное развитие все еще пугает. Давайте разберемся, что представляют собой эти термины и что кроется за их названием.

О больших данных, искусственном интеллекте, машинном обучении, нейронных сетях и deep learning-e («глубоком обучении») пишут много, и многие, но зачастую путают эти понятия. Из-за этого путаются и люди, и у многих возникает ложное представление о том, на что способны эти технологии. Мы постараемся найти разумный баланс между описанием технических деталей работы технологий и примерами прикладного использования этих технологий.
Искусственный интеллект
Сейчас у всех «под рукой» Википедия, которая дает такое описание: искусственный интеллект (ИИ; англ. artificial intelligence, AI) – это свойство интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека. При этом в английском языке словосочетание artificial intelligence не имеет антропоморфной окраски, которую оно приобрело в русском переводе: слово intelligence в используемом контексте означает «умение рассуждать разумно», а вовсе не «интеллект» (для которого есть английский аналог intellect).

Проще говоря, искусственный интеллект относится к способности компьютеров выполнять сложные задачи и демонстрировать интеллект, подобный человеческому. Само по себе понятие искусственного интеллекта не уточняет, какая именно технология используется. Сегодня именно машинное обучение определяет возможности и вектор развития искусственного интеллекта, и поэтому эти два термина часто используются как взаимозаменяемые.
Сильный и Слабый ИИ
В СМИ искусственный интеллект часто изображают как автономную «мыслительную машину», обладающую универсальными способностями. Именно такой «саморазвивающийся», действительно «думающий» искусственный интеллект описан многими писателями-фантастами как ужасный технологический монстр, порабощающий человечество. В реальности же такого пока еще не существует.

Поэтому необходимо четко понимать и разграничивать «критерий разумности» машин. Это принято называть делением искусственного интеллекта на сильный и слабый.

Сегодня мы имеем дело со слабым ИИ: это означает, что машина может выполнять одну определенную задачу. например, играть в компьютерные игры, определять, что изображено на картинке или переводить голос в соответствующий текст. Каждый такой ИИ настраивают (обучают) отдельно, и каждый ИИ строго ограничен своей задачей. При этом термин «слабый» не стоит воспринимать, как негативную оценку, это просто уточнение используемых технологий.

Сильный ИИ подразумевает, что компьютер не просто оперирует информацией, а в той или иной степени, понимает ее смысл. Например, если компьютерный переводчик с одного языка на другой просто заменяет одни слова другими по заданным правилам, то это слабый ИИ. Если же он исходит из понимания смысла текста, то он уже ближе к сильному.

Традиционные экспертные системы – пример слабого искусственного интеллекта, базирующегося на заранее запрограммированных правилах ( «if-then», «если… - то…»). Ключевой особенностью современного слабого искусственного интеллекта является его способность решать задачи без четких правил, объяснений того, как это делается, но это все равно не сильный ИИ. Это и есть машинное обучение.
Машинное обучение
Машинное обучение — это набор алгоритмов, позволяющих компьютерам учиться на примерах. Вместо того, чтобы пытаться детально объяснить компьютеру (запрограммировать) как выглядит кошка или собака, можно показать много примеров кошек и собак, чтобы компьютер выяснил это самостоятельно. То же самое можно сказать и о способности прогнозировать продажи магазина в следующем квартале. Мы показываем компьютеру исторические данные по продажам и факторам, от которых эти продажи могут зависит, и ждем, пока машина найдет взаимосвязи и сделает прогноз.

Конечно, в действительности, не все так просто, процесс обучения компьютера (настройка параметров и подбор алгоритма) осуществляется под руководством специалиста по работе с данными. Тем не менее, полученная модель основывается исключительно на данных, а не на явном программировании. Математика, лежащая в основе машинного обучения, давно известна, однако ее практическое применение стало возможным только при наличии больших наборов данных и вычислительных мощностей, что привело к широкому распространению машинного обучения.

Простыми словами - машина смотрит на наши данные, находит в них закономерности и учится предсказывать для нас ответ. Самое интересное, что машины стали находить такие закономерности, о которых люди не догадывались.
Нейронные сети и глубокое обучение
Нейронные сети - популярное семейство алгоритмов машинного обучения. Идея использования нейронных сетей пришла при изучении процессов, протекающих в мозге (соединение нейронов в мозгу), а конкретно, при попытке математически смоделировать эти процессы. Нейронные сети хорошо подходят для решения многих задач, тем не менее, это лишь один из методов машинного обучения.

Глубокое обучение – архитектура «больших, глубоких» нейронных сетей, содержащих много уровней-слоев. Метод хорошо работает для анализа изображений, видео и звуков.
Data Science
Data Science - общий термин, относящийся к применению математических методов для анализа данных. Работа специалиста по анализу данных (Data Scientist) включает в себя использование передовых методов, таких как машинное обучение, но не ограничивающихся только ими. Задачи варьируются от построения моделей глубокого изучения до описательного анализа и визуализации данных. Термин Data Science хорошо подходит для определения работы эксперта по анализу данных, но имеет смысл уточнить сферу задач и используемых технологий, когда речь идет о конкретных случаях использования «науки о данных».
Big Data
Большие данные – это скорее определение инфраструктурной проблемы. Термин «большие данные» относится к аппаратным и программным решениям, необходимым для сбора, хранения и организации доступа к большим массивам данных, с которыми не справляются традиционные средства обработки данных.

Иногда термин используется для обозначения передовых методов анализа данных, а также продуктов и услуг, основанных на них. Однако, с ростом популярности понятия «Искусственного Интеллекта» удобнее придерживаться этого термина, чтобы избежать хаоса в определениях.

Итак, мы определяем, что искусственный интеллект — это название всей области, как биология или химия. Машинное обучение — это раздел искусственного интеллекта, важный, но не единственный. Нейронные сети — один из видов машинного обучения, популярный в последнее время, но есть и другие. Глубокое обучение — архитектура нейронных сетей, один из подходов к их построению и обучению. На практике сегодня мало кто отличает, где глубокие нейросети, а где не очень.

При этом сравнивать можно только вещи одного уровня, иначе получается полный хаос, вроде «что лучше: корова или молоко?». По сути, все эти понятия - изменяющиеся во времени, с поэтапным развитием технологий. На сегодняшний день можно сказать, что «искусственный интеллект» по состоянию на осень 2019 года научное сообщество определяет как «машинное обучение», в частности «Deep Learning». Что будет дальше - узнаем потом.