Cohere представила North Mini Code — модель для разработчиков и AI-агентов
Cohere представила North Mini Code — модель из 30 млрд параметров для программистов. Она училась на кодировании, работе с терминалом и взаимодействии с инструме
AI-обработка оригинала Hugging Face Blog; редакция Hamidun News
Cohere выпустила North Mini Code — свою первую модель, разработанную специально для программистов. 30-миллиардная модель с 3 миллиардами активных параметров уже доступна на Hugging Face под лицензией Apache 2.0, она обучена на программировании, работе с AI-агентами и терминалом.
Архитектура и производительность
North Mini Code построена на архитектуре Mixture of Experts: 128 экспертов, из которых в каждый момент активны 8. Модель использует механизм внимания в соотношении 3:1 (локальное и глобальное), а также SwiGLU активацию. По качеству кодирования набирает 33.4 балла на Artificial Analysis' Coding Index — обгоняет Qwen3.5 (35B), Gemma 4 (26B) и даже Mistral Small (119B), несмотря на то что те больше по размеру.
Двухэтапное обучение с подкреплением
На первом этапе supervised fine-tuning Cohere акцентировала программирование: 70% данных — это код, 43% — примеры взаимодействия с инструментами (agentic tool-use), 27% — решение конкурсных и научных задач. Второй этап использовал 4.5 миллиарда токенов высочайшего качества для отработки поведения в агентных сценариях.
После этого применили reinforcement learning с проверяемыми наградами (RLVR), тренируя модель на двух типах задач одновременно: Работа с терминалом (bash-команды, обработка вывода и ошибок) Редактирование и отладка кода в файлах * Вызов инструментов через API и стандартный ввод/вывод ## Обучили на разных фреймворках сразу Cohere тренировала North Mini Code не на одном фреймворке агентов, а на трёх сразу — SWE-Agent, mini-SWE-Agent и OpenCode. Это критично: каждый фреймворк требует своего формата команд и обработки результатов. Такой подход делает модель универсальной и надёжной в любых реальных окружениях.
«Мы обучали на нескольких агентных фреймворках вместо оптимизации под один интерфейс, чтобы модель была устойчива к разным инструментам», — объяснили в
Cohere.
Результаты: на 7-8% лучше
После RLVR-обучения модель улучшила результаты на 7.9% на Terminal-Bench v2 и на 3.0% на SWE-Bench (сравнение с базовой версией). Человеческая оценка на 85 примерах показала 66.1% побед в задачах редактирования кода. Модель делает значительно меньше ошибок при работе с инструментами и увереннее справляется с длинными цепочками команд.
Что это значит North Mini Code — это сигнал, что разработчикам больше не нужны общие LLM-модели.
Компании учат модели специально для кода и агентов, потому что это работает лучше. Для разработчиков это означает: можно развернуть мощного AI-помощника прямо у себя, без зависимости от облачных API и платных сервисов.
Хотите не читать про ИИ, а внедрить его?
«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.