Поиск

    Услуги

    Сервис «Работа.ру» обучил языковую модель на базе ML Space и суперкомпьютера Christofari Neo

    Команда сервиса сократила time-to-market языковой модели HRBert в 10 раз и в результате улучшила качество услуг.

    О компании

    «Работа.ру» — сервис для быстрого поиска работы и подбора персонала, один из лидеров рынка онлайн-рекрутмента. Проект ориентирован на все профессиональные группы соискателей — на сайте представлены массовые позиции, вакансии специалистов, менеджеров среднего звена и топ-менеджеров.

    Цель проекта

    Команда сервиса постоянно работает над улучшениями собственного ИТ-продукта, и на этот раз специалисты задались целью повысить качество предоставляемых услуг за счет обучения языковой модели HRBert на основе open source модели RoBERTa.

    В качестве ресурсов для обучения данной модели планировалось использовать 4 видеокарты NVIDIA GeForce RTX 2080 Ti c 11ГБ памяти, а также Tesla T4 16ГБ. Поскольку объем собранных данных для модели составляет около 2 ТБ, примерное время обучения на этих ресурсах — больше 140 дней. Такой длительный срок обучения срывал планы по обновлению сервиса — требовалось быстрое решение и большее количество мощностей.

    Почему Cloud.ru

    «Работа.ру» уже успешно использует облачную платформу Advanced для построения ИТ-инфраструктуры в облаке, поэтому выбор облачного провайдера в рамках этого проекта был очевиден.

    Команда сервиса обратилась в Cloud.ru за доступом к облачной платформе ML Space для обучения языковой модели.

    Решение

    Перед стартом работы на платформе команда ML Space провела короткую обучающую демо-презентацию, через час после которой специалисты «Работа.ру» уже смогли самостоятельно загрузить данные для обучения HRBert.

    Обучение модели было запущено в сервисе Environments ML Space на мощнейших картах Tesla A100 с 80ГБ памяти суперкомпьютера Christofari Neo.

    Результат

    Команда сервиса переместила процессы ML-разработки в облако в кратчайшие сроки, ускорила обновление собственного ИТ-продукта и осталась довольна качеством обученной модели HRBert.

    Языковая модель помогла улучшить поиск и выстроить рекомендательную систему в сервисе. В итоге клиенты-соискатели могут быстрее находить интересующие их вакансии, а клиенты-работодатели стремительнее подбирать сотрудников по резюме.

    Благодаря ресурсам Cloud.ru «Работа.ру» сократила время обучения модели до 15 дней, то есть почти в 10 раз уменьшила технический time-to-market.

    Дальнейшие планы

    Сейчас команда «Работа.ру» собирает данные для обучения новых моделей и планирует вновь обратиться за ресурсами.

    «Команда Cloud еще в самом начале нашего сотрудничества организовала чат технической поддержки для оперативного решения всех вопросов по платформе и обучению модели. Было даже несколько кейсов, когда мы писали в выходные после девяти вечера, и нам быстро отвечали. Техподдержка правда работает круглосуточно.

    По результатам данного проекта у нас появилось множество идей как улучшить языковую модель, увеличить количество сценариев её применения и повысить качество использования. Мы остались довольны работой на платформе ML Space и мощностями Christofari Neo — планируем и далее обучать модели на платформе, а также оптимизировать сроки обновлений с учетом ресурсов и оперативной техподдержки Cloud» Марк Паненко Руководитель отдела ML, «Работа.ру»
    «Предоставлять клиенту необходимые сервисы и инфраструктуру в кратчайшие сроки для кейсов любого масштаба — наша главная задача. А с учетом социальной значимости использования ML-модели в решении “Работа.ру” мы вдвойне рады возможности помочь с реализацией» Иван Тараскин Руководитель направления по развитию бизнеса в области ИИ, Cloud.ru

    Посмотрите выступление команды «Работа.ру» на конференции GPN Data Science Meetup и узнайте больше про модель HRBert:

    Запросите бесплатную консультацию по вашему проекту

    Оставить заявкуCloud

    Блог: