MarkTechPost
Источник AI-новостей. Материалы автоматически отбираются и адаптируются редакцией Hamidun News.
Последние публикации

SuperClaude Framework помогает структурировать workflow для Claude API
SuperClaude Framework предоставляет разработчикам встроенные компоненты для создания продвинутых AI-workflows: команды, агенты, режимы работы и память сессии — всё в одной системе.

Tencent выпустила локальную систему памяти для AI-агентов TencentDB
Tencent открыла исходный код TencentDB Agent Memory — локальной системы памяти для AI-агентов, которая сокращает расход токенов на 61% и повышает точность на 28%.

NVIDIA представила Gated DeltaNet-2: линейное внимание с раздельными вратами памяти
NVIDIA создала новый механизм линейного внимания Gated DeltaNet-2, который улучшает управление памятью в больших языковых моделях благодаря раздельным вратам стирания и записи вместо единого затвора.

Google представила Gemini 3.5 Flash: быстрая и дешёвая модель для кодирования и AI-агентов
На I/O 2026 Google представила Gemini 3.5 Flash — модель, которая на 75% дешевле флагманской версии, работает в 4 раза быстрее и лучше справляется с кодом и автоматизацией.

Alibaba выпустила переводчик с задержкой 2.8 секунды на 60 языках
Alibaba представила модель для реального перевода видео и речи одновременно на 60 языках — с минимальной задержкой и сохранением голоса переводящего.

NVIDIA представила Nemotron-Labs-Diffusion: модель с тройным декодированием
NVIDIA выпустила языковую модель Nemotron-Labs-Diffusion, которая объединяет три режима декодирования и обрабатывает токены в 6 раз быстрее, чем Qwen3-8B.

Генерация графов знаний из текста: практический гайд с kg-gen и NetworkX
Туториал по автоматическому извлечению сущностей и связей из текста с помощью kg-gen, построению интерактивных графов знаний и их анализу через NetworkX.

Turbovec: векторный индекс на Rust с алгоритмом TurboQuant от Google Research
Turbovec использует алгоритм TurboQuant от Google для сжатия векторов в 16 раз без предварительного обучения, упрощая развёртывание RAG-приложений.

Лучшие платформы для агентских AI в 2026 году: рейтинг Salesforce, Microsoft и других
Компании переходят с пилотов на production. MarkTechPost составил рейтинг топ-10 платформ для агентских AI: Salesforce Agentforce, Microsoft Copilot Studio, ServiceNow и другие. Проверенные цены и данные реального внедре

NVIDIA создала метод обучения нейросетей в 4-bit точности
NVIDIA представила NVFP4 — методологию обучения больших моделей с 4-битной точностью вместо стандартной 8-битной, экономя память в 2 раза без потери качества.

OpenAI представила протокол MRC для сетей суперкомпьютеров с миллионами GPU
OpenAI создала новый открытый сетевой протокол MRC для больших AI кластеров, который распределяет данные по сотням путей и восстанавливается от сбоев за микросекунды, позволяя строить суперкомпьютеры с 100+ тысячами GPU.

Meta AI представила NeuralBench — фреймворк для тестирования моделей мозговой активности
Meta выпустила NeuralBench — открытый фреймворк для стандартизированного тестирования AI-моделей на основе ЭЭГ, объединив 36 задач, 94 датасета и 13,603 часов мозговых записей в один интерфейс. *Meta признана экстремист

Как сжать языковую модель в 3 раза: гайд по FP8, GPTQ и SmoothQuant
Разработчики получили пошаговый гайд по сжатию больших языковых моделей с помощью llmcompressor, сравнив эффективность FP8, GPTQ и SmoothQuant квантизации для снижения нагрузки на железо.

OpenAI выпустила три аудио-модели: перевод, транскрипция и рассуждение в реальном времени
OpenAI расширила Realtime API тремя новыми аудио-моделями для обработки голоса: агентами рассуждения, мультиязычным переводом и потоковой транскрипцией.

Anthropic создала инструмент для перевода мыслей Claude на человеческий язык
Anthropic разработала Natural Language Autoencoders — технологию, которая переводит внутренние активации Claude в текстовые объяснения, раскрывая работу нейросети.

NVIDIA запаковала 3 модели в один файл и сэкономила 360× на обучении
NVIDIA представила метод Star Elastic, который упаковывает три модели разных размеров в один checkpoint и обучается в 360 раз эффективнее.

NVIDIA выпустила cuda-oxide: компилятор Rust-кода для GPU
NVIDIA открыла cuda-oxide — инструмент для компиляции Rust-функций напрямую в GPU код PTX. Это упростит разработку CUDA приложений на Rust и сделает параллельные вычисления доступнее.

NadirClaw: экономия на LLM-запросах через умную маршрутизацию промптов
NadirClaw — это инструмент для интеллектуальной маршрутизации промптов, который классифицирует запросы на простые и сложные, направляя их в подходящую модель для экономии на затратах.

Hermes Agent от Nous Research стал лидером по потреблению токенов на OpenRouter
Открытый AI-агент Hermes от Nous Research обогнал закрытую платформу OpenClaw и занял первое место на OpenRouter, генерируя 224 млрд токенов в день. Это произошло всего за три месяца и показывает силу open-source решений

Сравнение векторных БД в 2026: девять систем по цене, масштабу и архитектуре
Девять ведущих векторных БД теперь ключевая инфраструктура для RAG и agential AI. Обзор по архитектуре, цене и масштабируемости помогает выбрать под задачу.

Vercel Labs представила Zero — язык для AI-агентов, чтобы они писали, чинили и шиппили код
Vercel выпустила Zero — язык программирования, где компилятор выдаёт JSON вместо текста, чтобы AI-агенты могли самостоятельно писать, исправлять и развёртывать нативные программы

Как Memori создаёт постоянную память для агентов и мультисессионных LLM
Memori — инфраструктура памяти для LLM-приложений, которая позволяет агентам сохранять контекст между сессиями и работать с несколькими пользователями одновременно.

SHAP для машинного обучения: сравнение explainers и практический гайд
Новый гайд показывает, как выбрать между четырьмя методами SHAP для интерпретации моделей — от быстрого Tree до универсального Kernel.

DeepMind создала AI-мышь на Gemini, чтобы пользователи не переключались на чаты
Google DeepMind представила AI-мышь на основе Gemini, которая анализирует контекст вокруг курсора и позволяет дать команды голосом, не открывая отдельное окно.

Мира Мурати показала первую систему для естественного диалога с ИИ в реальном времени
Thinking Machines Lab представила модель TML-Interaction-Small, которая слушает и отвечает одновременно, обрабатывая речь, видео и текст без задержек — впервые ИИ может разговаривать как человек.

Nous Research представила Lighthouse Attention для ускорения обучения LLM
Nous Research опубликовала новый механизм внимания Lighthouse Attention, который ускоряет обучение больших языковых моделей в 1.4–1.7 раза при работе с длинными контекстами.

GLiGuard от Fastino Labs: модель безопасности, которая на 16x быстрее больших конкурентов
Fastino Labs выпустила открытую модель GLiGuard для проверки безопасности LLM: всего 300M параметров, но работает точнее, чем модели в 90 раз больше.

Теневой AI в 63% компаний: как инструменты обогнали корпоративные политики
Большинство компаний всё ещё не имеют формальных политик управления AI, при этом сотрудники уже активно внедряют инструменты самостоятельно — это создаёт серьёзные риски для безопасности.

Nous Research ускорила предобучение LLM в 2.5 раза без смены архитектуры
Nous Research разработала Token Superposition Training — метод, который сокращает время предобучения языковых моделей в 2.5 раза, не меняя архитектуру и поведение при инференсе.

Zyphra выпустила первую MoE-модель диффузии с ускорением в 7.7x
Zyphra представила ZAYA1-8B-Diffusion-Preview — первую MoE-модель диффузии, конвертированную из языковой модели LLM. Инференс ускорился в 7.7 раз за счёт перераспределения вычислений с памяти на процессор GPU.