Классическое машинное обучение

Виртуальная машина
бесплатно навсегда

Забрать

Статья

Время чтения

1 минута

Классическое машинное обучение (Classical Machine Learning, ML) — набор техник и методик анализа данных, позволяющих обучать аналитические системы с помощью решения повторяющихся типовых задач, но без использования программирования.

Машинное обучение базируется на принципе выявления закономерностей или скрытых паттернов и принятия решений с минимальным участием человека. Процесс классического обучения похож на обучение ребенка — чем больше сделано попыток и получено опыта, тем точнее результат. Назначение ML — автоматизация ресурсоемких, сложных процессов с целью повышения скорости и точности операций.

Примечание: Модели ML применяются в разных отраслях. Например, для прогнозирования финансовых рисков, классификации объектов, разработки персональных предложений, поиска мест залегания полезных ископаемых и других задач.

Для обучения необходим набор данных с метками — тренировочные данные, где содержатся примеры решения задач. Алгоритмы искусственного интеллекта изучают их, основываясь на выявленных закономерностях, и, как только способны повторить результат на неразмеченных данных, могут использоваться на практике в схожих ситуациях.

Примечание: Модели машинного обучения не могут быть переучены — для каждой отдельной задачи нужна своя модель.

Типы обучения

Выделяют четыре типа машинного обучения.

  1. Контролируемое обучение или обучение с учителем. Процесс контролируется разработчиком, который отвечает за маркировку данных, установку правил и границ работы алгоритмов. Для обучения используются наборы размеченных данных, которые легко классифицировать.
    Задачи обучения с учителем: классификация и регрессия.
  2. Обучение без учителя. Процесс не контролируется разработчиком, а желаемые результаты обработки неизвестны и определяются алгоритмом. Для обучения используются неразмеченные наборы данных.
    Задачи обучения без учителя: кластеризация, поиск ассоциативных правил, обнаружение аномалий.
  3. Обучение с частичным привлечением учителя. Метод сочетает преимущества контролируемого и неконтролируемого обучения. Процесс разделяется на два этапа:

    • обучение на наборах размеченных данных для настройки и распознавания признаков;
    • самостоятельное обучение модели на наборах неразмеченных данных.
    То есть, модель самостоятельно обучается, придерживаясь изначально заданного набора правил. Метод используется, когда обозначить метки и признаки невозможно.
  4. Обучение с подкреплением. Метод подразумевает обучение с помощью техники исследования и освоения, при которой алгоритмы совершают действия, анализируют полученные результаты и выполняют следующие действия с учетом полученного опыта.

Для решения задач классического машинного обучения важно использовать высокопроизводительные платформы и инструменты, соответствующие целям. Такие, например, предлагает Cloud.ru. Клиенты облачного провайдера могут использовать платформу для совместной ML-разработки с ускорением до +1700 GPU Tesla v100 и A100 ML Space, хаб предобученных моделей, датасетов и контейнеров DataHub ML Space и другие сервисы, повышающие скорость и точность машинного обучения.

Вам может понравиться