
Machine Learning
Статья
Время чтения
5 минут
Машинное обучение (Machine Learning, ML) — подраздел искусственного интеллекта (ИИ) и специализированный способ обучения компьютера или отдельных программ без использования программирования или строгих инструкций.
Машинное обучение подразумевает анализ данных для выявления в них закономерностей и имитации процесса получения опыта с пошаговым повышением точности.
ML может применяться для классификации данных, построения прогнозов, выявления показателей и других задач.
Примечание: У машинного обучения адаптивный характер, поэтому оно может применяться в сценариях с постоянным изменением данных, запросов или задач. Это делает ML универсальным инструментом для решения бизнес-задач и обеспечивает широкую применяемость — по оценке аналитиков объем рынка машинного обучения уже к 2025 году составит $39.98 млрд.
Обучение алгоритмов ML состоит из 4 этапов:
Сбор и подготовка данных. Объединение доступных данных и проверка на целостность, структурированность и наличие ошибок.
Обучение модели. Разделение данных на две группы: для проверкии обучения.
Проверка модели. Сопоставление соответствия и точности конечной модели данных с предварительно выбранным набором для проверки.
Интерпретация результатов. Изучение полученных данных для разработки аналитики, формирования выводов и прогнозирования результатов.<
Типы машинного обучения
Выделяют два типа машинного обучения:
дедуктивное;
индуктивное.

Дедуктивное обучение подразумевает наличие сформулированных и формализованных знаний, объединенных в базу знаний. В ней указываются условия и соответствующие действия — например, включение кондиционера при повышении температуры выше 25 градусов или увлажнителя при снижении влажности. Дедуктивное обучение применяется для выведения новых правил и взаимосвязей, относящихся к конкретному случаю.
Индуктивное обучение подразумевает выявление закономерностей в эмпирических данных, то есть связано с постоянным анализом. Оно направлено на получение знаний из данных и предназначено для разработки прогнозов на основе выявленных закономерностей. Для индуктивного обучения используются разные методы: контролируемое (с учителем), неконтролируемое (без учителя) и обучение с подкреплением.
Методы машинного обучения

Контролируемое машинное обучение — метод ML с применением наборов размеченных (с установленными закономерностями) данных, которые можно классифицировать и использовать для прогнозирования результатов. При контролируемом обучении задействуются:
нейронные сети;
наивный байесовский классификатор;
логистическая регрессия и другие методы.
Контролируемое ML используется в спам-фильтрах, для распознавания языков, принятия решений о выдаче кредитов.
Неконтролируемое машинное обучение — метод ML, используемый для обучения алгоритмов с применением неразмеченных наборов данных.Такие модели используются, когда нужно без помощи человека выявить закономерности и взаимосвязи в данных.
При контролируемом обучении используются:
сингулярное разложение;
вероятностная кластеризация;
нейросети;
кластеризация методом k-средних и другие методы.
Обученные таким способом модели используются для разноуровневой аналитики, разделения клиентов на сегменты, нахождения шаблонов и распознавания общих признаков.
Машинное обучение с подкреплением — метод ML, сочетающий преимущества контролируемого и неконтролируемого обучения. Процесс разделен на два этапа:
обучение модели на размеченных данных для настройки алгоритма классификации и распознавания признаков;
самостоятельное обучение модели на неразмеченных наборах данных.
То есть, обучаемой модели предоставляется начальный набор правил, по которому модель продолжает обучаться до получения результата.
Метод применяется в логистике, при тактическом планировании задач и разработке маршрутов для механизмов автоматического вождения автомобилей.
Варианты применения ML
Машинное обучение используется в разных сценариях. Распространенные варианты:
Прогнозирование поведения клиентов. Для интеллектуального анализа данных: выявления закономерностей особенностей поведения, причин отказа и других сведений, необходимых для оптимизации стратегии развития компании.
Разработка механизмов рекомендаций. Для изучения паттернов поведения заказчиков и обработки информации об их предпочтениях для персонализации предложений и увеличения числа привлеченных клиентов. Механизмы рекомендаций используются многими, например: Amazon, Netflix, Spotify и другими.
Компьютерное зрение. Для извлечения информации из изображений, видео и других визуальных данных для последующего принятия решений. Например, компьютерное зрение используется для распознавания объектов на картинке, проектирования и других задач.
Оценка рисков. Для анализа исходных данных о человеке и событии и разработке персонализированных прогнозов. Например, ML используется банками для оценки кредитоспособности клиента и принятия решения о выдаче кредита, а также автоматическими банковскими системами для выявления мошеннических операций.
Повышение целостности данных. Для нахождения закономерностей в доступном наборе размеченных или неразмеченных данных для восстановления недостающей или частично поврежденной информации.
Составление прогнозов спроса. Для изучения пользовательского спроса в течение недели, месяца, года или другого периода и прогнозирования объема продаж для подготовки необходимого складского запаса. Такое прогнозирование исключает как неоправданные инвестиции в товар, так и случаи его недостатка на складе.
Повышение безопасности. Для отслеживания и распознавания подозрительных действий или приемов злоумышленников, а также разработки методов противодействия им. В этом случае ML применяется для оптимизации и повышения эффективности корпоративных систем информационной безопасности.
Планирование логистики. Для разработки коротких и безопасных маршрутов доставки товаров, в том числе с учетом данных о загруженности дорог, их состояния, риска аварий и других доступных компании сведений.
Примечание: На облачной платформе Cloud.ru представлен набор инструментов и сервисов, необходимых для применения машинного обучения в разных сценариях,. Среди доступных решений: платформа для совместной ML-разработки ML Space с ускорением до +1700 GPU Tesla v100 и A100 и другие.
Потенциал машинного обучения
Machine Learning имеет практическое значение для разнопрофильных компаний, помогая ускорить анализ данных и принятие решений, повысить точность прогнозов и решать другие задачи — это подтверждает опрос компании Algorithmia.
По итогам 2020 года 34% компаний использовали ML в бизнес-процессах и уже к 2024 году объем рынка машинного обучения составит $30.6 млрд при ежегодном росте сферы на 44%.
Технология машинного обучения продолжает совершенствоваться, а инструменты для ее использования — становятся функциональнее и доступнее. Благодаря этому, можно ожидать, что в ближайшие годы ML перестанет быть инновацией и будет использоваться повсеместно, обеспечивая компаниям конкурентные преимущества.
Вам может понравиться


Команда grep в Linux: как искать строки и шаблоны

PostgreSQL: что это за СУБД и чем она хороша

Что может chmod: как управлять доступами к файлам и папкам в Linux

Как узнать IP-адрес в Linux через командную строку

Как узнать IP-адрес своего компьютера

Система MySQL: что это и для чего нужна

Команды kill и killall в Linux: как завершить ненужные процессы

Работа с файлами в Linux: их создание и организация через терминал

Стандарт Tier III для дата-центра: что значит и почему это круто

Какие новости за декабрь и начало января — дайджест Cloud.ru

Что такое FTP-протокол и как настроить FTP сервер

Белые и серые IP, динамические и статические - в чем различие

Как защищать сайты и приложения в облаке от DDoS-атак

Какие новости за ноябрь — дайджест Cloud.ru

BAT-файлы: что это такое, зачем они нужны и как их создавать

Гайд по протоколу HTTP: расшифровка, структура и механизм работы

Межсетевой экран, firewall и брандмауэр: что это, в чем между ними разница и зачем они нужны

Kubernetes на Cloud.ru Evolution: возможности и преимущества

Какие новости за октябрь — дайджест Cloud.ru

Как создать сетевую архитектуру для размещения межсетевых экранов на платформе Облако VMware

Рассказать про технологии лампово, или Как мы провели конференцию GoCloud Tech для инженеров и...

Какие новости за сентябрь — дайджест Cloud.ru

Высокоресурсные вычисления: роль суперкомпьютеров в жизни и бизнесе

Реферальная программа Cloud.ru: как устроена и как на ней зарабатывать

Сетевая модель OSI: что это такое и зачем она нужна

Какие новости за август — дайджест Cloud.ru

Сетевые протоколы передачи данных — что это такое и какие бывают

Какие новости за июль — дайджест Cloud.ru

Как новые возможности в юридических документах Cloud.ru облегчают работу с договорами и не только

Какие новости за июнь — дайджест Cloud.ru

Как обновления VMware Cloud Director облегчают управление и делают работу с инфраструктурой в ...

Как мы рассчитывали «Панораму российского IT-рынка» за 2022 год

Как снизить риски утечки данных и санкций госрегуляторов: 152-ФЗ в Cloud.ru

Бесплатный курс по работе с Cloud.ru Advanced: рассказываем, в чем польза, кому подойдет и как...

Как модель Anything as a Service упрощает IT-процессы

Снижение рисков на производстве: AI-сервис распознает нарушения ношения СИЗ

Kandinsky 2.1: новый уровень в генерации изображений по текстовому описанию

Облачные сервисы для стартапов: как пройти путь от идеи до цифрового продукта и не разориться

Создать пользователя, настроить 2FA, связаться с поддержкой — новые возможности личного кабине...

VDI: что это, как работает и в чем выгода для бизнеса

Как защитить облачную инфраструктуру — рассказываем на примере межсетевого экрана нового покол...

Как начать использовать AI/ML на практике

Бессерверные вычисления: что это за технология и кому она нужна

Чек-лист: как обеспечить безопасность облачной инфраструктуры

Искусственный интеллект

Что такое IaaS?

Что такое PaaS

Data Science

Машинное обучение без учителя

Классическое машинное обучение

Нейронные сети

Глубокое обучение

Защита персональных данных: как легче соблюдать закон с Cloud.ru и сохранять спокойствие

Как сохранить IT-инфраструктуру и бизнес: руководство к действию

Машинное обучение и Big Data в кибербезопасности

Ответы на актуальные вопросы

Что такое DDoS-атаки, чем они опасны и как от них защититься

Аудит информационной безопасности: что это, зачем и когда его проводить

Межсетевые экраны: UTM, NGFW-системы, NTA, NDR

Обзор межсетевых экранов, систем IPS и IDS

PostgreSQL vs MySQL: какая система подходит вашему бизнесу

Основы резервного копирования

Специальное предложение «180 дней тестового периода резервного копирования» для всех клиентов
Платформа SberCloud Advanced теперь обеспечивает максимальный уровень защиты персональных данных

Что такое объектное хранилище S3 и как его используют

Customer Enablement: как SberCloud работает с клиентами, чтобы сделать миграцию в облако комфо...

Сеть доставки контента CDN: новые функциональные возможности и преимущества

Объясняем на кейсах: польза CDN для бизнеса

Новая Windows Server 2022 в облаке SberCloud — новые возможности клиентов

Запуск нового сервиса Managed OpenShift в облачной среде SberCloud

Как работает технология DNS

SberCloud Advanced запустила третью ресурсную зону доступности для комфортной работы клиентов

PostGIS в PostgreSQL — как можно использовать

GitLab для начинающих: как и для чего используется

Краткий обзор методологии CI/CD: принципы, этапы, плюсы и минусы

Персональные данные: правильно обрабатываем и храним

Кто и зачем использует облачные модели IaaS и PaaS

152-ФЗ в облаке: хранение персональных данных в облаке

Как работает CDN (Content Delivery Network)?

Service Level Agreement (SLA): все о соглашении об уровне сервиса

Что такое «интернет поведения» (IoB)?

Чек-лист: 6 шагов для успешной миграции в облако

Машинное обучение: просто о сложном

Профессия DevOps-инженер: кто это и чем занимается

Гайд по Kubernetes. Эпизод I: k8s для неразработчиков

Публичные, частные и гибридные облака: в чем разница?
