Классическое машинное обучение
Статья
Время чтения
1 минута
Классическое машинное обучение (Classical Machine Learning, ML) — набор техник и методик анализа данных, позволяющих обучать аналитические системы с помощью решения повторяющихся типовых задач, но без использования программирования.
Машинное обучение базируется на принципе выявления закономерностей или скрытых паттернов и принятия решений с минимальным участием человека. Процесс классического обучения похож на обучение ребенка — чем больше сделано попыток и получено опыта, тем точнее результат. Назначение ML — автоматизация ресурсоемких, сложных процессов с целью повышения скорости и точности операций.
Примечание: Модели ML применяются в разных отраслях. Например, для прогнозирования финансовых рисков, классификации объектов, разработки персональных предложений, поиска мест залегания полезных ископаемых и других задач.
Для обучения необходим набор данных с метками — тренировочные данные, где содержатся примеры решения задач. Алгоритмы искусственного интеллекта изучают их, основываясь на выявленных закономерностях, и, как только способны повторить результат на неразмеченных данных, могут использоваться на практике в схожих ситуациях.
Примечание: Модели машинного обучения не могут быть переучены — для каждой отдельной задачи нужна своя модель.
Типы обучения
Выделяют четыре типа машинного обучения.
- Контролируемое обучение или обучение с учителем. Процесс контролируется разработчиком, который отвечает за маркировку данных, установку правил и границ работы алгоритмов. Для обучения используются наборы размеченных данных, которые легко классифицировать.
Задачи обучения с учителем: классификация и регрессия. - Обучение без учителя. Процесс не контролируется разработчиком, а желаемые результаты обработки неизвестны и определяются алгоритмом. Для обучения используются неразмеченные наборы данных.
Задачи обучения без учителя: кластеризация, поиск ассоциативных правил, обнаружение аномалий. - Обучение с частичным привлечением учителя. Метод сочетает преимущества контролируемого и неконтролируемого обучения. Процесс разделяется на два этапа:
- обучение на наборах размеченных данных для настройки и распознавания признаков;
- самостоятельное обучение модели на наборах неразмеченных данных.
- Обучение с подкреплением. Метод подразумевает обучение с помощью техники исследования и освоения, при которой алгоритмы совершают действия, анализируют полученные результаты и выполняют следующие действия с учетом полученного опыта.
Для решения задач классического машинного обучения важно использовать высокопроизводительные платформы и инструменты, соответствующие целям. Такие, например, предлагает Cloud.ru. Клиенты облачного провайдера могут использовать платформу для совместной ML-разработки с ускорением до +1700 GPU Tesla v100 и A100 ML Space, хаб предобученных моделей, датасетов и контейнеров DataHub ML Space и другие сервисы, повышающие скорость и точность машинного обучения.