Издание · проверено редакцией

MarkTechPost

Источник AI-новостей. Материалы автоматически отбираются и адаптируются редакцией Hamidun News.

220 материалов в Hamidun·Последний: 31 мая· Активен·marktechpost.com ↗

Последние публикации

SuperClaude Framework помогает структурировать workflow для Claude API
LLMMarkTechPost

SuperClaude Framework помогает структурировать workflow для Claude API

SuperClaude Framework предоставляет разработчикам встроенные компоненты для создания продвинутых AI-workflows: команды, агенты, режимы работы и память сессии — всё в одной системе.

2026-05-25·2 мин
Tencent выпустила локальную систему памяти для AI-агентов TencentDB
LLMMarkTechPost

Tencent выпустила локальную систему памяти для AI-агентов TencentDB

Tencent открыла исходный код TencentDB Agent Memory — локальной системы памяти для AI-агентов, которая сокращает расход токенов на 61% и повышает точность на 28%.

2026-05-25·3 мин
NVIDIA представила Gated DeltaNet-2: линейное внимание с раздельными вратами памяти
LLMMarkTechPost

NVIDIA представила Gated DeltaNet-2: линейное внимание с раздельными вратами памяти

NVIDIA создала новый механизм линейного внимания Gated DeltaNet-2, который улучшает управление памятью в больших языковых моделях благодаря раздельным вратам стирания и записи вместо единого затвора.

2026-05-25·3 мин
Google представила Gemini 3.5 Flash: быстрая и дешёвая модель для кодирования и AI-агентов
LLMMarkTechPost

Google представила Gemini 3.5 Flash: быстрая и дешёвая модель для кодирования и AI-агентов

На I/O 2026 Google представила Gemini 3.5 Flash — модель, которая на 75% дешевле флагманской версии, работает в 4 раза быстрее и лучше справляется с кодом и автоматизацией.

2026-05-21·3 мин
Alibaba выпустила переводчик с задержкой 2.8 секунды на 60 языках
LLMMarkTechPost

Alibaba выпустила переводчик с задержкой 2.8 секунды на 60 языках

Alibaba представила модель для реального перевода видео и речи одновременно на 60 языках — с минимальной задержкой и сохранением голоса переводящего.

2026-05-21·2 мин
NVIDIA представила Nemotron-Labs-Diffusion: модель с тройным декодированием
LLMMarkTechPost

NVIDIA представила Nemotron-Labs-Diffusion: модель с тройным декодированием

NVIDIA выпустила языковую модель Nemotron-Labs-Diffusion, которая объединяет три режима декодирования и обрабатывает токены в 6 раз быстрее, чем Qwen3-8B.

2026-05-21·2 мин
Генерация графов знаний из текста: практический гайд с kg-gen и NetworkX
LLMMarkTechPost

Генерация графов знаний из текста: практический гайд с kg-gen и NetworkX

Туториал по автоматическому извлечению сущностей и связей из текста с помощью kg-gen, построению интерактивных графов знаний и их анализу через NetworkX.

2026-05-21·3 мин
Turbovec: векторный индекс на Rust с алгоритмом TurboQuant от Google Research
LLMMarkTechPost

Turbovec: векторный индекс на Rust с алгоритмом TurboQuant от Google Research

Turbovec использует алгоритм TurboQuant от Google для сжатия векторов в 16 раз без предварительного обучения, упрощая развёртывание RAG-приложений.

2026-05-21·2 мин
Лучшие платформы для агентских AI в 2026 году: рейтинг Salesforce, Microsoft и других
LLMMarkTechPost

Лучшие платформы для агентских AI в 2026 году: рейтинг Salesforce, Microsoft и других

Компании переходят с пилотов на production. MarkTechPost составил рейтинг топ-10 платформ для агентских AI: Salesforce Agentforce, Microsoft Copilot Studio, ServiceNow и другие. Проверенные цены и данные реального внедре

2026-05-19·3 мин
NVIDIA создала метод обучения нейросетей в 4-bit точности
LLMMarkTechPost

NVIDIA создала метод обучения нейросетей в 4-bit точности

NVIDIA представила NVFP4 — методологию обучения больших моделей с 4-битной точностью вместо стандартной 8-битной, экономя память в 2 раза без потери качества.

2026-05-19·3 мин
OpenAI представила протокол MRC для сетей суперкомпьютеров с миллионами GPU
LLMMarkTechPost

OpenAI представила протокол MRC для сетей суперкомпьютеров с миллионами GPU

OpenAI создала новый открытый сетевой протокол MRC для больших AI кластеров, который распределяет данные по сотням путей и восстанавливается от сбоев за микросекунды, позволяя строить суперкомпьютеры с 100+ тысячами GPU.

2026-05-17·3 мин
Meta AI представила NeuralBench — фреймворк для тестирования моделей мозговой активности
LLMMarkTechPost

Meta AI представила NeuralBench — фреймворк для тестирования моделей мозговой активности

Meta выпустила NeuralBench — открытый фреймворк для стандартизированного тестирования AI-моделей на основе ЭЭГ, объединив 36 задач, 94 датасета и 13,603 часов мозговых записей в один интерфейс. *Meta признана экстремист

2026-05-17·2 мин
Как сжать языковую модель в 3 раза: гайд по FP8, GPTQ и SmoothQuant
LLMMarkTechPost

Как сжать языковую модель в 3 раза: гайд по FP8, GPTQ и SmoothQuant

Разработчики получили пошаговый гайд по сжатию больших языковых моделей с помощью llmcompressor, сравнив эффективность FP8, GPTQ и SmoothQuant квантизации для снижения нагрузки на железо.

2026-05-17·3 мин
OpenAI выпустила три аудио-модели: перевод, транскрипция и рассуждение в реальном времени
LLMMarkTechPost

OpenAI выпустила три аудио-модели: перевод, транскрипция и рассуждение в реальном времени

OpenAI расширила Realtime API тремя новыми аудио-моделями для обработки голоса: агентами рассуждения, мультиязычным переводом и потоковой транскрипцией.

2026-05-17·2 мин
Anthropic создала инструмент для перевода мыслей Claude на человеческий язык
LLMMarkTechPost

Anthropic создала инструмент для перевода мыслей Claude на человеческий язык

Anthropic разработала Natural Language Autoencoders — технологию, которая переводит внутренние активации Claude в текстовые объяснения, раскрывая работу нейросети.

2026-05-17·2 мин
NVIDIA запаковала 3 модели в один файл и сэкономила 360× на обучении
LLMMarkTechPost

NVIDIA запаковала 3 модели в один файл и сэкономила 360× на обучении

NVIDIA представила метод Star Elastic, который упаковывает три модели разных размеров в один checkpoint и обучается в 360 раз эффективнее.

2026-05-17·3 мин
NVIDIA выпустила cuda-oxide: компилятор Rust-кода для GPU
LLMMarkTechPost

NVIDIA выпустила cuda-oxide: компилятор Rust-кода для GPU

NVIDIA открыла cuda-oxide — инструмент для компиляции Rust-функций напрямую в GPU код PTX. Это упростит разработку CUDA приложений на Rust и сделает параллельные вычисления доступнее.

2026-05-17·1 мин
NadirClaw: экономия на LLM-запросах через умную маршрутизацию промптов
LLMMarkTechPost

NadirClaw: экономия на LLM-запросах через умную маршрутизацию промптов

NadirClaw — это инструмент для интеллектуальной маршрутизации промптов, который классифицирует запросы на простые и сложные, направляя их в подходящую модель для экономии на затратах.

2026-05-17·2 мин
Hermes Agent от Nous Research стал лидером по потреблению токенов на OpenRouter
LLMMarkTechPost

Hermes Agent от Nous Research стал лидером по потреблению токенов на OpenRouter

Открытый AI-агент Hermes от Nous Research обогнал закрытую платформу OpenClaw и занял первое место на OpenRouter, генерируя 224 млрд токенов в день. Это произошло всего за три месяца и показывает силу open-source решений

2026-05-17·3 мин
Сравнение векторных БД в 2026: девять систем по цене, масштабу и архитектуре
LLMMarkTechPost

Сравнение векторных БД в 2026: девять систем по цене, масштабу и архитектуре

Девять ведущих векторных БД теперь ключевая инфраструктура для RAG и agential AI. Обзор по архитектуре, цене и масштабируемости помогает выбрать под задачу.

2026-05-17·2 мин
Vercel Labs представила Zero — язык для AI-агентов, чтобы они писали, чинили и шиппили код
LLMMarkTechPost

Vercel Labs представила Zero — язык для AI-агентов, чтобы они писали, чинили и шиппили код

Vercel выпустила Zero — язык программирования, где компилятор выдаёт JSON вместо текста, чтобы AI-агенты могли самостоятельно писать, исправлять и развёртывать нативные программы

2026-05-17·2 мин
Как Memori создаёт постоянную память для агентов и мультисессионных LLM
LLMMarkTechPost

Как Memori создаёт постоянную память для агентов и мультисессионных LLM

Memori — инфраструктура памяти для LLM-приложений, которая позволяет агентам сохранять контекст между сессиями и работать с несколькими пользователями одновременно.

2026-05-17·2 мин
SHAP для машинного обучения: сравнение explainers и практический гайд
LLMMarkTechPost

SHAP для машинного обучения: сравнение explainers и практический гайд

Новый гайд показывает, как выбрать между четырьмя методами SHAP для интерпретации моделей — от быстрого Tree до универсального Kernel.

2026-05-17·3 мин
DeepMind создала AI-мышь на Gemini, чтобы пользователи не переключались на чаты
LLMMarkTechPost

DeepMind создала AI-мышь на Gemini, чтобы пользователи не переключались на чаты

Google DeepMind представила AI-мышь на основе Gemini, которая анализирует контекст вокруг курсора и позволяет дать команды голосом, не открывая отдельное окно.

2026-05-17·3 мин
Мира Мурати показала первую систему для естественного диалога с ИИ в реальном времени
LLMMarkTechPost

Мира Мурати показала первую систему для естественного диалога с ИИ в реальном времени

Thinking Machines Lab представила модель TML-Interaction-Small, которая слушает и отвечает одновременно, обрабатывая речь, видео и текст без задержек — впервые ИИ может разговаривать как человек.

2026-05-17·2 мин
Nous Research представила Lighthouse Attention для ускорения обучения LLM
LLMMarkTechPost

Nous Research представила Lighthouse Attention для ускорения обучения LLM

Nous Research опубликовала новый механизм внимания Lighthouse Attention, который ускоряет обучение больших языковых моделей в 1.4–1.7 раза при работе с длинными контекстами.

2026-05-17·2 мин
GLiGuard от Fastino Labs: модель безопасности, которая на 16x быстрее больших конкурентов
LLMMarkTechPost

GLiGuard от Fastino Labs: модель безопасности, которая на 16x быстрее больших конкурентов

Fastino Labs выпустила открытую модель GLiGuard для проверки безопасности LLM: всего 300M параметров, но работает точнее, чем модели в 90 раз больше.

2026-05-16·1 мин
Теневой AI в 63% компаний: как инструменты обогнали корпоративные политики
LLMMarkTechPost

Теневой AI в 63% компаний: как инструменты обогнали корпоративные политики

Большинство компаний всё ещё не имеют формальных политик управления AI, при этом сотрудники уже активно внедряют инструменты самостоятельно — это создаёт серьёзные риски для безопасности.

2026-05-16·3 мин
Nous Research ускорила предобучение LLM в 2.5 раза без смены архитектуры
LLMMarkTechPost

Nous Research ускорила предобучение LLM в 2.5 раза без смены архитектуры

Nous Research разработала Token Superposition Training — метод, который сокращает время предобучения языковых моделей в 2.5 раза, не меняя архитектуру и поведение при инференсе.

2026-05-16·3 мин
Zyphra выпустила первую MoE-модель диффузии с ускорением в 7.7x
LLMMarkTechPost

Zyphra выпустила первую MoE-модель диффузии с ускорением в 7.7x

Zyphra представила ZAYA1-8B-Diffusion-Preview — первую MoE-модель диффузии, конвертированную из языковой модели LLM. Инференс ускорился в 7.7 раз за счёт перераспределения вычислений с памяти на процессор GPU.

2026-05-16·3 мин