MarkTechPost
Источник AI-новостей. Материалы автоматически отбираются и адаптируются редакцией Hamidun News.
Последние публикации

OpenMOSS выпустила MOSS-Audio — открытую аудиомодель, опережающую более крупные аналоги
OpenMOSS представила MOSS-Audio — открытую модель, которая в одной архитектуре понимает речь, музыку и звуки среды, а на общих аудиобенчмарках обходит open-source модели заметно крупнее себя.

Эмбеддинги OpenAI и RL: как собрать агента с долговременной памятью для точных ответов
В туториале показывают, как обучить RL-агента выбирать релевантные записи из долговременной памяти, чтобы LLM точнее отвечала на вопросы по сохранённым фактам.

Как измерить реальный интеллект: главные бенчмарки для ИИ-агентов
Классические тесты больше не отражают реальные способности нейросетей. Разбираемся, какие бенчмарки действительно показывают, готов ли ИИ-агент к работе в реальном мире бизнеса.

Эластичная память для ИИ: как kvcached решает дефицит GPU
Динамическое распределение KV-кэша обещает радикально снизить стоимость хостинга языковых моделей, позволяя эффективно делить память одной видеокарты.

Голосовая модель xAI обошла GPT Realtime в бизнес-задачах
Компания Илона Маска xAI представила grok-voice-think-fast-1.0. Новая модель превзошла решения от OpenAI и Google в управлении сложными рабочими процессами для бизнеса.

GitNexus: Как новый инструмент научил ИИ-агентов структурному пониманию кода
ИИ-помощники отлично пишут локальный код, но часто не понимают глобальную архитектуру проектов. Open-source проект GitNexus решает эту проблему с помощью графов знаний и протокола MCP.

DeepSeek-V4: Как новые алгоритмы сжатия сделали контекст в миллион токенов реальностью
DeepSeek представила четвертое поколение своих моделей. Благодаря радикальному сжатию внимания обработка гигантских объемов данных становится доступной не только техногигантам.

Архитектура Decoupled DiLoCo от DeepMind решает проблему масштабирования ИИ
Обучение передовых ИИ-моделей всегда было заложником аппаратных сбоев: поломка одного чипа останавливала весь кластер. Новая архитектура от Google DeepMind меняет правила игры.

OpenMythos: open-source реконструкция архитектуры Claude Mythos на PyTorch с 770M параметров
Разработчик Kye Gomez воссоздал предполагаемую архитектуру Claude Mythos от Anthropic с нуля — без утечек, только на основе публичных исследований.

OpenAI масштабирует GPT-5.4-Cyber для верифицированных специалистов по кибербезопасности
OpenAI открывает массовый доступ к GPT-5.4-Cyber — донастроенной версии GPT-5.4 без стандартных ограничений для тысяч верифицированных защитников.

Moonshot AI выпустила Kimi K2.6: агентная модель с роем из 300 субагентов
Китайская лаборатория Moonshot AI открыла исходники Kimi K2.6 — мультимодальной агентной модели, координирующей до 300 субагентов и 4000 шагов автономно.

Phi-4-Mini от Microsoft: реализация квантизации, RAG и LoRA в одном Jupyter-ноутбуке
Туториал показывает полный пайплайн на Phi-4-mini-instruct: 4-битная квантизация, потоковая генерация, рассуждение, вызов инструментов, RAG и LoRA fine-tuning в одном ноутбуке.

Qwen 3.6-35B-A3B на практике: мультимодальность, MoE и RAG в одном пайплайне
Подробный разбор реализации Qwen 3.6-35B-A3B: от загрузки модели до RAG, tool calling и сохранения сессий в рабочих сценариях.

NVIDIA представила Nemotron 3 Super — открытую модель со 120 млрд параметров
Новая гибридная модель сочетает архитектуры Mamba и Attention с подходом Mixture-of-Experts, обеспечивая пятикратный прирост производительности для мультиагентных систем. Разрыв между проприетарными и открытыми моделями

Google представила TensorFlow 2.21 и LiteRT для мобильного ИИ
Google представила TensorFlow 2.21 и LiteRT — новый стандарт для запуска нейросетей на смартфонах с поддержкой NPU и ускорением GPU для мобильных платформ.

Google запустила Android Bench для оценки ИИ в мобильной разработке
Google открыла доступ к Android Bench — первому специализированному инструменту для проверки навыков больших языковых моделей в разработке приложений под Android.

OpenAI представила Codex Security для автоматического поиска и исправления уязвимостей в коде
OpenAI запускает Codex Security — интеллектуального агента для анализа безопасности кода, который не только находит ошибки, но и предлагает готовые патчи для их устранения.

Liquid AI выпустила систему для запуска ИИ-агентов полностью на устройстве
Компания Liquid AI представила модель LFM2-24B-A2B и приложение LocalCowork — связку для выполнения сложных рабочих процессов с ИИ-агентами без единого обращения к облаку. Ставка на приватность становится архитектурным п

Yuan 3.0 Ultra: триллион параметров при рекордной эффективности
Китайская YuanLab AI представила открытую мультимодальную модель с триллионом параметров, которая активирует лишь 68,8 млрд из них. Сокращение параметров на треть при росте эффективности обучения на 49% — как это работае

Alibaba выпустила OpenSandbox — единую среду для безопасной работы AI-агентов
Alibaba открыла исходный код OpenSandbox — инструмента, который даёт AI-агентам изолированные песочницы для выполнения кода, веб-сёрфинга и обучения моделей. Это заявка на стандарт всей инфраструктуры агентного AI.

Alibaba выпустила Qwen 3.5 Small — компактные модели для работы прямо на устройствах
Новая серия моделей Alibaba от 0.8 до 9 миллиардов параметров бросает вызов гонке за размером. Философия «больше интеллекта, меньше вычислений» может изменить правила игры для мобильного AI.

SHAP-IQ: новый стандарт объяснимого ИИ выходит на практический уровень
Библиотека SHAP-IQ позволяет не просто оценить важность признаков модели, но и понять, как они взаимодействуют друг с другом. Разбираемся, почему это меняет подход к интерпретации машинного обучения.

Google представила STATIC: ускорение генеративного поиска в 948 раз
Google AI разработала фреймворк на основе разреженных матриц, который ускоряет декодирование в генеративных рекомендательных системах почти в тысячу раз. Это может изменить подход к промышленным рекомендациям.

Alibaba открыла CoPaw — рабочую станцию для масштабирования AI-агентов
Команда Alibaba выпустила open-source фреймворк CoPaw, который превращает локальную машину разработчика в полноценную среду для запуска автономных AI-агентов с памятью и многоканальными рабочими процессами.

Unified Latents: Google DeepMind нашла способ улучшить генерацию ИИ
Новый фреймворк Unified Latents от Google DeepMind решает дилемму между качеством сжатия данных и точностью работы нейросетей.

Sakana AI научилась мгновенно адаптировать языковые модели без дообучения
Токийская лаборатория Sakana AI представила два метода — Doc-to-LoRA и Text-to-LoRA — которые позволяют адаптировать большие языковые модели к новым данным за доли секунды, без классического файн-тюнинга.

Perplexity выпустила pplx-embed: модели эмбеддингов, которые меняют правила поиска
Perplexity представила семейство мультиязычных моделей эмбеддингов pplx-embed на базе Qwen3 с двунаправленным вниманием — и заявляет о новом стандарте качества для поиска в масштабах всего интернета.

Liquid AI бросает вызов гонке размеров: гибридная архитектура LFM2 меняет правила игры
Стартап Liquid AI представил модель на 24 миллиарда параметров, которая сочетает механизм внимания с свёртками. Цель — решить проблемы масштабирования, с которыми столкнулась вся индустрия больших языковых моделей.

Composio открывает код Agent Orchestrator — инструмента для мультиагентных систем за пределами ReAct
Стартап Composio выпустил в открытый доступ оркестратор агентов, который решает главную проблему продакшн-AI: хрупкость простых ReAct-циклов. Новый подход обещает масштабируемые мультиагентные рабочие процессы.

WebSocket-режим OpenAI меняет правила игры для голосового AI
OpenAI представила WebSocket-режим для Realtime API, который устраняет главного врага голосовых AI-агентов — задержку. Три отдельных этапа обработки голоса теперь сжимаются в один поток.