Hugging Face Blog
Источник AI-новостей. Материалы автоматически отбираются и адаптируются редакцией Hamidun News.
Последние публикации

Cohere представила North Mini Code — модель для разработчиков и AI-агентов
Cohere выпустила North Mini Code — 30-миллиардную модель, специально обученную на программировании и работе с AI-агентами. Модель бесплатна и доступна всем.

Голосовые агенты не готовы к двуязычным клиентам. Исследование ServiceNow-AI
Исследование ServiceNow-AI показало, что большинство голосовых систем ещё не готовы обслуживать двуязычных клиентов, хотя ElevenLabs и AssemblyAI демонстрируют лучшие результаты.

Как ускорить модели PyTorch: практическое руководство torch.profiler
Hugging Face рассказала о torch.profiler — встроенном инструменте PyTorch для анализа производительности. Он помогает найти узкие места в обучении и инференсе моделей.

Hugging Face научила TRL доставлять триллион параметров через дельта-веса
Hugging Face добавила Delta Weight Sync в TRL — техника отправляет только изменения весов вместо полных файлов, снижая объём данных в сотни раз при обучении гигантских моделей.

Reachy Mini научили разговаривать локально без облака
Гуманоидный робот Reachy Mini теперь может запускать весь стек распознавания речи локально, без облака и API, благодаря открытым моделям от Hugging Face.

IBM и Artificial Analysis создали бенчмарк: AI-агенты не справились с IT-задачами
Большие языковые модели набрали менее 50% на новом бенчмарке ITBench-AA для оценки способности AI-агентов решать корпоративные IT-задачи. Это показывает, что полная автоматизация IT-работ остаётся далёким будущим.

NVIDIA Nemotron: диффузионные модели генерируют текст в 6 раз быстрее
NVIDIA представила Nemotron-Labs Diffusion — первые языковые модели, которые генерируют текст параллельно вместо последовательного. В режиме самоспекуляции они работают на 6× быстрее обычных моделей благодаря диффузионно

Как маленькая модель обошла GPT-5 и Claude Opus на португальском OCR
Dharma AI обучила 3-миллиардную специализированную модель, которая превзошла все коммерческие frontier-модели в тесте на распознавание текста. И обошла их в цене в 52 раза.

Hugging Face запустила Open Agent Leaderboard для оценки AI-агентов
Hugging Face представила открытый бенчмарк для сравнения полных AI-агентских систем. Оказалось, что архитектура агента важнее выбранной модели.

PaddleOCR 3.5 получил поддержку Transformers от Hugging Face
PaddleOCR обновился с полной поддержкой Hugging Face Transformers как инференс-backend. Теперь распознавание текста и парсинг документов работают в PyTorch-окружении.

NVIDIA показала эффективный способ обучить Cosmos на робо-видео через LoRA
NVIDIA выпустила гайд по fine-tuning модели Cosmos Predict 2.5 через LoRA/DoRA — параметрически эффективный метод адаптации видео-модели к генерации робо-видео за 17 часов на одном GPU.

Ettin Reranker от Hugging Face: 6 моделей для точного переранжирования поиска
Hugging Face выпустила 6 переранжировщиков Ettin на основе ModernBERT с состоянием искусства точностью и скоростью благодаря Flash Attention 2 и оптимизации последовательностей.

OlmoEarth v1.1: Allen AI выпустила спутниковые модели на 3 раза дешевле
Allen AI представила более эффективную версию моделей для анализа спутниковых снимков, сократив вычислительные затраты в 3 раза при сохранении качества.

Как модель Allen AI научилась сама находить специализацию экспертов
Allen AI представила EMO — модель на основе смеси экспертов, которая естественным образом развивает специализацию по областям (здоровье, политика, кино) без явного обучения этим категориям.

CyberSecQwen-4B: как маленькая модель стала экспертом по уязвимостям
Специализированная четырёхмиллиардная модель кибербезопасности превосходит универсальные конкуренты в анализе уязвимостей и работает локально на персональном оборудовании без облачных сервисов.

OncoAgent: ИИ-система для раннего выявления рака на основе приватных данных пациентов
Как алгоритм машинного обучения помогает врачам принимать решения по диагностике рака без нарушения конфиденциальности пациентов

Hugging Face ускорила LLM-инфиренс на 22% через асинхронный батчинг
Параллельная обработка CPU и GPU вместо очередной позволила убить 24% холостого хода GPU и ускорить генерацию токенов почти на четверть без изменений модели.

IBM выпустила Granite Embedding R2 — многоязычную модель для семантического поиска
IBM представила открытую многоязычную модель Granite Embedding R2 для семантического поиска с поддержкой 32K контекста и лучшей производительностью в классе sub-100M моделей.

H Company выпустила Holotron-12B — модель для агентов с двукратным ростом скорости
H Company опубликовала Holotron-12B на Hugging Face: мультимодальная модель для AI-агентов на одном H100 даёт более чем двукратный прирост пропускной способности в задачах работы с интерфейсами.

NVIDIA представила SPEED-Bench — единый бенчмарк для спекулятивного декодирования
NVIDIA опубликовала SPEED-Bench — набор данных и фреймворк измерений, который сравнивает speculative decoding по реальным нагрузкам, длинным контекстам и разным inference-движкам.

IBM выпустила Mellea 0.4.0 и Granite Libraries для проверяемых AI-пайплайнов
IBM Research обновила open-source фреймворк Mellea до версии 0.4.0 и выпустила три Granite Libraries для структурированных, проверяемых и безопасных AI-воркфлоу.

NVIDIA показала, как за день дообучить embedding-модель под свою предметную область
NVIDIA и Hugging Face опубликовали пошаговый рецепт, который за несколько часов превращает базовую embedding-модель в специализированный поиск по внутренним документам.

ServiceNow представила EVA — новый фреймворк для оценки голосовых AI-агентов
ServiceNow выпустила EVA — систему, которая проверяет голосовых AI-агентов не только по успешности задачи, но и по качеству диалога, от краткости ответов до тайминга реплик.

IBM выпустила Granite 4.0 3B Vision для извлечения данных из документов и графиков
IBM представила Granite 4.0 3B Vision — компактную мультимодальную модель для извлечения таблиц, графиков и ключевых полей из документов, которую можно встроить в корпоративные пайплайны с Docling.

H Company представила Holo3 — ИИ-агента для работы за компьютером с рекордом в OSWorld-Verified
H Company выпустила Holo3 — модель для работы за компьютером, которая набрала 78,85% в OSWorld-Verified и училась на синтетических корпоративных сценариях.

Google выпустила Gemma 4 на Hugging Face: мультимодальные модели для локального запуска
Google DeepMind открыла семейство Gemma 4 на Hugging Face: четыре мультимодальные модели с лицензией Apache 2.0, контекстом до 256K и запуском от телефона до рабочей станции.

Hugging Face добавила gradio.Server: свой фронтенд теперь можно подключить к бэкенду Gradio
Новый gradio.Server от Hugging Face превращает Gradio в бэкенд-слой для React, Svelte и обычного HTML/JS, сохраняя очереди запросов, ZeroGPU и совместимость с Spaces.

Hugging Face передаёт Safetensors в PyTorch Foundation для нейтрального управления форматом
Hugging Face объявила, что Safetensors стал проектом PyTorch Foundation: для пользователей ничего не ломается, а развитие формата переходит к нейтральной модели управления.

Overworld выпустила Waypoint-1.5: интерактивные миры 720p для обычных видеокарт
Overworld выпустила Waypoint-1.5 — world model для локального запуска на потребительских видеокартах: до 720p и 60 FPS, плюс облегчённая 360p-версия для более широкого круга ПК и ноутбуков.

Hugging Face выпустила Skill для быстрого переноса моделей Transformers в MLX
Hugging Face представила Skill и отдельный test harness, чтобы почти сразу переносить новые модели из Transformers в mlx-lm на MLX без потока сырых AI-сгенерированных PR.