Задача завершилась с ошибкой OOMKilled

Возможная причина: высокая утилизация памяти на одном или нескольких узлах (воркерах или мастере).

Рекомендации по решению:

  • Используйте типы инстансов с большим объемом оперативной памяти.

  • Оптимизируйте работу с памятью.

  • Уменьшите batch_size в коде обучения.

ML Space