Hugging Face Blog→ оригинал

Cohere представила North Mini Code — модель для разработчиков и AI-агентов

Cohere представила North Mini Code — модель из 30 млрд параметров для программистов. Она училась на кодировании, работе с терминалом и взаимодействии с инструме

AI-обработка оригинала Hugging Face Blog; редакция Hamidun News
Cohere представила North Mini Code — модель для разработчиков и AI-агентов
Источник: Hugging Face Blog. Коллаж: Hamidun News.
◐ Слушать статью

Cohere выпустила North Mini Code — свою первую модель, разработанную специально для программистов. 30-миллиардная модель с 3 миллиардами активных параметров уже доступна на Hugging Face под лицензией Apache 2.0, она обучена на программировании, работе с AI-агентами и терминалом.

Архитектура и производительность

North Mini Code построена на архитектуре Mixture of Experts: 128 экспертов, из которых в каждый момент активны 8. Модель использует механизм внимания в соотношении 3:1 (локальное и глобальное), а также SwiGLU активацию. По качеству кодирования набирает 33.4 балла на Artificial Analysis' Coding Index — обгоняет Qwen3.5 (35B), Gemma 4 (26B) и даже Mistral Small (119B), несмотря на то что те больше по размеру.

Двухэтапное обучение с подкреплением

На первом этапе supervised fine-tuning Cohere акцентировала программирование: 70% данных — это код, 43% — примеры взаимодействия с инструментами (agentic tool-use), 27% — решение конкурсных и научных задач. Второй этап использовал 4.5 миллиарда токенов высочайшего качества для отработки поведения в агентных сценариях.

После этого применили reinforcement learning с проверяемыми наградами (RLVR), тренируя модель на двух типах задач одновременно: Работа с терминалом (bash-команды, обработка вывода и ошибок) Редактирование и отладка кода в файлах * Вызов инструментов через API и стандартный ввод/вывод ## Обучили на разных фреймворках сразу Cohere тренировала North Mini Code не на одном фреймворке агентов, а на трёх сразу — SWE-Agent, mini-SWE-Agent и OpenCode. Это критично: каждый фреймворк требует своего формата команд и обработки результатов. Такой подход делает модель универсальной и надёжной в любых реальных окружениях.

«Мы обучали на нескольких агентных фреймворках вместо оптимизации под один интерфейс, чтобы модель была устойчива к разным инструментам», — объяснили в

Cohere.

Результаты: на 7-8% лучше

После RLVR-обучения модель улучшила результаты на 7.9% на Terminal-Bench v2 и на 3.0% на SWE-Bench (сравнение с базовой версией). Человеческая оценка на 85 примерах показала 66.1% побед в задачах редактирования кода. Модель делает значительно меньше ошибок при работе с инструментами и увереннее справляется с длинными цепочками команд.

Что это значит North Mini Code — это сигнал, что разработчикам больше не нужны общие LLM-модели.

Компании учат модели специально для кода и агентов, потому что это работает лучше. Для разработчиков это означает: можно развернуть мощного AI-помощника прямо у себя, без зависимости от облачных API и платных сервисов.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Хотите не читать про ИИ, а внедрить его?

«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.

Что вы думаете?
Загружаем комментарии…