Может конечно показаться скорость медленной, но это тренировка на полноценной, а не сжатой модели через адаптер андистил, и не в BF16, а в FP16 + датасет 61 пик, а с бакетами (а все современные хорошие лоры тренируют именно так) это все 300-350+ изображений.