Агент для обучения нейросетей

Репозиторий ml-intern от Hugging Face представляет собой автономного ИИ-агента с открытым исходным кодом, предназначенного для автоматизации полного цикла задач инженера машинного обучения, включая работу с кодом, документацией и обучением моделей. Построенный на базе фреймворка smolagents, инструмент способен проводить самостоятельные исследования и выполнять до 300 итераций для решения поставленных задач.

Согласно последним тестам (апрель 2026), агент демонстрирует значительное превосходство над другими ИИ-инструментами в специфических задачах обучения моделей. Основные результаты включают:

Научные рассуждения (GPQA): Агент смог поднять точность базовой модели Qwen3-1.7B с 10% до 32% менее чем за 10 часов работы. Для сравнения, лучший результат Claude Code в этой же задаче составил 22.99%.
Здравоохранение (HealthBench): ml-intern проанализировал существующие наборы данных, признал их низкокачественными и самостоятельно сгенерировал 1100 синтетических точек данных. В итоге созданная им модель превзошла OpenAI Codex на 60%.
Математические задачи: Агент успешно реализовал полноценный скрипт обучения с использованием метода GRPO (Group Relative Policy Optimization). Когда в процессе возникла проблема «коллапса вознаграждения» (reward collapse), агент самостоятельно провел серию абляционных исследований и исправил ошибку без участия человека.
Эффективность данных: Инструмент показал способность извлекать максимум производительности из компактных моделей (1.7B параметров), достигая результатов, сопоставимых с более крупными моделями (например, Gemma-3-4B), что часто оказывается сложной задачей даже для опытных исследователей-людей при работе в сжатые сроки.EdTech Innovation Hub +7

github.com

GitHub - huggingface/ml-intern: ðŸ¤— ml-intern: an open-source ML engineer that reads papers, trains models, and ships ML models