Поиск
Семантический + лексический поиск по AI‑новостям. Поддержка RU/EN/PT/ES/FR/AR.

Hermes Agent от Nous Research стал лидером по потреблению токенов на OpenRouter
Открытый AI-агент Hermes от Nous Research обогнал закрытую платформу OpenClaw и занял первое место на OpenRouter, генерируя 224 млрд токенов в день. Это произошло всего за три месяца и показывает силу open-source решений

OpenAI выпустила три аудио-модели: перевод, транскрипция и рассуждение в реальном времени
OpenAI расширила Realtime API тремя новыми аудио-моделями для обработки голоса: агентами рассуждения, мультиязычным переводом и потоковой транскрипцией.

OpenAI представила протокол MRC для сетей суперкомпьютеров с миллионами GPU
OpenAI создала новый открытый сетевой протокол MRC для больших AI кластеров, который распределяет данные по сотням путей и восстанавливается от сбоев за микросекунды, позволяя строить суперкомпьютеры с 100+ тысячами GPU.

Как Memori создаёт постоянную память для агентов и мультисессионных LLM
Memori — инфраструктура памяти для LLM-приложений, которая позволяет агентам сохранять контекст между сессиями и работать с несколькими пользователями одновременно.

Langfuse для инженеров LLM: полный пайплайн трейсинга и экспериментов
Langfuse — инструмент для отладки и оптимизации LLM-приложений. Узнайте, как настроить полный пайплайн мониторинга, управления промптами и экспериментов без платных моделей.

Сравнение TTS-моделей 2026: от коммерческих до открытых
В 2026 году выбор TTS-модели зависит от трёх факторов: качество звука, задержка обработки и стоимость. Коммерческие решения выигрывают по естественности, открытые — по контролю и стоимости.

BerriAI выпустила LiteLLM Agent Platform для агентов в production
BerriAI открыла исходный код LiteLLM Agent Platform — инфраструктуры на Kubernetes для запуска AI-агентов в продакшене с изолированными окружениями и сохранением сессий между перезагрузками.

Cohere выпустила Command A+: 218 млрд параметров для агентов на двух видеокартах
Cohere представила открытую модель Command A+ на 218 млрд параметров с многомодальными возможностями, которая работает на двух GPU H100 и поддерживает 48 языков.

StepFun выпустила голосовую модель StepAudio 2.5 Realtime с поддержкой ролеплея
Китайская лаборатория StepFun представила реальную голосовую модель StepAudio 2.5 Realtime, которая лучше конкурентов справляется с естественностью речи и может менять голос по сценарию пользователя.

Microsoft Research выпустила Webwright — агента для браузера, который решает web-задачи на 60%
Microsoft Research представила Webwright — браузер-агента, который выполняет сложные web-задачи лучше, чем большие языковые модели: 60% успеха на Odysseys вместо 33.5% у базового GPT-5.4.

Liquid AI выпустила LFM2.5-8B: компактная MoE-модель с 128K контекстом
Liquid AI представила новую модель LFM2.5-8B-A1B — экономную MoE-модель, которая активирует только 1.5B параметров из 8.3B. Работает на потребительском ПК с контекстом 128K.

ByteDance представила Lance: одна модель для понимания, генерации и редактирования видео
ByteDance выпустила Lance — открытую модель, которая в одном фреймворке работает с изображениями и видео: понимает, генерирует и редактирует контент при использовании всего 3B активных параметров.

Alibaba представила Qwen3.7-Max: агент с миллионным контекстом
Alibaba представила Qwen3.7-Max — самую продвинутую модель-агента от Qwen с 1M-токенным контекстом и режимом рассуждений для сложных многошаговых задач.

CopilotKit переопределяет архитектуру для AI-агентов в 2026
CopilotKit выпустил новый стек для разработчиков agentic AI: AG-UI протокол, платформу тестирования AIMock и сервер Pathfinder — полное решение для production-среды.

Генерация графов знаний из текста: практический гайд с kg-gen и NetworkX
Туториал по автоматическому извлечению сущностей и связей из текста с помощью kg-gen, построению интерактивных графов знаний и их анализу через NetworkX.

EAGLE 3.1: как исправить нестабильность спекулятивного декодирования в LLM
Совместный релиз EAGLE team, vLLM и TorchSpec исправляет критическую проблему спекулятивного декодирования — дрейф внимания, который замедлял инференс больших языковых моделей в production.

SuperClaude Framework помогает структурировать workflow для Claude API
SuperClaude Framework предоставляет разработчикам встроенные компоненты для создания продвинутых AI-workflows: команды, агенты, режимы работы и память сессии — всё в одной системе.

Nous Research ускорила предобучение LLM в 2.5 раза без смены архитектуры
Nous Research разработала Token Superposition Training — метод, который сокращает время предобучения языковых моделей в 2.5 раза, не меняя архитектуру и поведение при инференсе.