Издание · проверено редакцией

MarkTechPost

Источник AI-новостей. Материалы автоматически отбираются и адаптируются редакцией Hamidun News.

220 материалов в Hamidun·Последний: 31 мая· Активен·marktechpost.com ↗

Последние публикации

Сравнение TTS-моделей 2026: от коммерческих до открытых
LLMMarkTechPost

Сравнение TTS-моделей 2026: от коммерческих до открытых

В 2026 году выбор TTS-модели зависит от трёх факторов: качество звука, задержка обработки и стоимость. Коммерческие решения выигрывают по естественности, открытые — по контролю и стоимости.

2026-05-31·3 мин
StepFun представила Step 3.7 Flash — Vision-Language модель на 198 миллиардах параметров
LLMMarkTechPost

StepFun представила Step 3.7 Flash — Vision-Language модель на 198 миллиардах параметров

StepFun выпустила Step 3.7 Flash — новую мультимодальную модель с 198 миллиардами параметров, встроенным видением, контекстом в 256K токенов и режимом Advisor для кодовых агентов.

2026-05-31·3 мин
NVIDIA X-Token: дистилляция, которая бьёт GOLD на 3.82 балла
LLMMarkTechPost

NVIDIA X-Token: дистилляция, которая бьёт GOLD на 3.82 балла

NVIDIA выпустила X-Token — метод дистилляции знаний для малых моделей (Llama-3.2-1B), который превосходит GOLD на 3.82 балла и улучшает точность математики с 2.56 до 15.54%.

2026-05-31·2 мин
AgentTrove: как использовать датасет из 1.7М трас агентов в Python
LLMMarkTechPost

AgentTrove: как использовать датасет из 1.7М трас агентов в Python

AgentTrove — самый крупный открытый набор трас взаимодействия агентов: 1.7 млн примеров в формате ShareGPT. Python-туториал показывает, как стримить данные, нормализовать действия агентов и готовить датасет для файнтюнин

2026-05-31·2 мин
Nous Research выпустила Tool Search для Hermes Agent: точность выросла на 49–74% на Opus 4
LLMMarkTechPost

Nous Research выпустила Tool Search для Hermes Agent: точность выросла на 49–74% на Opus 4

Nous Research решила проблему раздувания контекста в MCP, добавив умный поиск инструментов. Система выбирает только релевантные схемы и повышает точность на десятки процентов при работе с Opus 4.

2026-05-31·2 мин
Genesis AI выпустила Genesis World 1.0 — платформу для оценки роботов в 400 раз быстрее
LLMMarkTechPost

Genesis AI выпустила Genesis World 1.0 — платформу для оценки роботов в 400 раз быстрее

Genesis AI выпустила платформу Genesis World 1.0 для симуляции роботов, которая сокращает время оценки с 200 часов до 30 минут и совпадает с реальным поведением на 90%.

2026-05-31·2 мин
NVIDIA выпустила Polar — фреймворк для обучения кодовых агентов
LLMMarkTechPost

NVIDIA выпустила Polar — фреймворк для обучения кодовых агентов

NVIDIA создала Polar — фреймворк для обучения языковых агентов через reinforcement learning, улучшивший производительность на SWE-Bench на 22.6 балла в Codex-окружении.

2026-05-29·2 мин
UC Berkeley создала mKernel: единая библиотека для синхронизации GPU в кластерах
LLMMarkTechPost

UC Berkeley создала mKernel: единая библиотека для синхронизации GPU в кластерах

UC Berkeley выпустила mKernel — новую CUDA-библиотеку для синхронизации тысяч GPU в дата-центрах, объединив локальную и дистанционную коммуникацию в один persistent kernel.

2026-05-29·2 мин
Stability AI выпустила Stable Audio 3 для быстрой генерации музыки
LLMMarkTechPost

Stability AI выпустила Stable Audio 3 для быстрой генерации музыки

Stability AI представила Stable Audio 3 — модели для генерации музыки и звуковых эффектов, которые работают на MacBook и потребительских GPU с 8GB VRAM.

2026-05-29·2 мин
ZeroEntropy представила Zerank-2 — лёгкий переранжировщик для точного поиска
LLMMarkTechPost

ZeroEntropy представила Zerank-2 — лёгкий переранжировщик для точного поиска

ZeroEntropy выпустила Zerank-2, компактный кроссэнкодер на базе Qwen3, который значительно улучшает качество поиска в двухэтапных RAG-системах.

2026-05-29·2 мин
Sakana AI представила DiffusionBlocks: метод обучения нейросетей блоками
LLMMarkTechPost

Sakana AI представила DiffusionBlocks: метод обучения нейросетей блоками

Компания Sakana AI представила DiffusionBlocks — новый метод, который позволяет обучать слои остаточных нейросетей независимо друг от друга, интерпретируя обновления как обратную диффузию.

2026-05-29·3 мин
Векторный поиск в PostgreSQL: полный гайд pgvector для AI-приложений
LLMMarkTechPost

Векторный поиск в PostgreSQL: полный гайд pgvector для AI-приложений

Узнайте, как превратить PostgreSQL в векторную БД с помощью pgvector и использовать её для семантического и гибридного поиска в AI-приложениях — полный гайд с примерами кода.

2026-05-29·3 мин
Perplexity AI опубликовала токенайзер, в 5 раз быстрее стандарта Hugging Face
LLMMarkTechPost

Perplexity AI опубликовала токенайзер, в 5 раз быстрее стандарта Hugging Face

Perplexity AI опубликовала переписанный токенайзер Unigram, который ускоряет обработку текста в 5 раз и сокращает нагрузку на процессор в 5-6 раз в production-среде.

2026-05-29·3 мин
Ученые создали MEMO — фреймворк для расширения памяти LLM без переобучения
LLMMarkTechPost

Ученые создали MEMO — фреймворк для расширения памяти LLM без переобучения

Ученые предложили MEMO — фреймворк, который позволяет LLM учиться на новых данных без переобучения основной модели, используя отдельный модуль памяти.

2026-05-29·3 мин
EAGLE 3.1: как исправить нестабильность спекулятивного декодирования в LLM
LLMMarkTechPost

EAGLE 3.1: как исправить нестабильность спекулятивного декодирования в LLM

Совместный релиз EAGLE team, vLLM и TorchSpec исправляет критическую проблему спекулятивного декодирования — дрейф внимания, который замедлял инференс больших языковых моделей в production.

2026-05-29·2 мин
Anthropic выпустила Claude Opus 4.8 с динамическими workflow'ами и дешёвым fast mode
LLMMarkTechPost

Anthropic выпустила Claude Opus 4.8 с динамическими workflow'ами и дешёвым fast mode

Anthropic представила Claude Opus 4.8 с динамическими рабочими процессами и более дешёвым быстрым режимом. Обновление доступно в исследовательском превью Claude Code.

2026-05-29·3 мин
Liquid AI выпустила LFM2.5-8B: компактная MoE-модель с 128K контекстом
LLMMarkTechPost

Liquid AI выпустила LFM2.5-8B: компактная MoE-модель с 128K контекстом

Liquid AI представила новую модель LFM2.5-8B-A1B — экономную MoE-модель, которая активирует только 1.5B параметров из 8.3B. Работает на потребительском ПК с контекстом 128K.

2026-05-29·2 мин
Hexo Labs опубликовала SIA — агента, который обновляет себя во время работы
LLMMarkTechPost

Hexo Labs опубликовала SIA — агента, который обновляет себя во время работы

Hexo Labs выпустила открытый код SIA — системы, которая улучшает сама себя, обновляя как инструкции агента, так и веса его нейронной сети.

2026-05-29·1 мин
Microsoft Research выпустила Webwright — агента для браузера, который решает web-задачи на 60%
LLMMarkTechPost

Microsoft Research выпустила Webwright — агента для браузера, который решает web-задачи на 60%

Microsoft Research представила Webwright — браузер-агента, который выполняет сложные web-задачи лучше, чем большие языковые модели: 60% успеха на Odysseys вместо 33.5% у базового GPT-5.4.

2026-05-25·2 мин
StepFun выпустила голосовую модель StepAudio 2.5 Realtime с поддержкой ролеплея
LLMMarkTechPost

StepFun выпустила голосовую модель StepAudio 2.5 Realtime с поддержкой ролеплея

Китайская лаборатория StepFun представила реальную голосовую модель StepAudio 2.5 Realtime, которая лучше конкурентов справляется с естественностью речи и может менять голос по сценарию пользователя.

2026-05-25·2 мин
Langfuse для инженеров LLM: полный пайплайн трейсинга и экспериментов
LLMMarkTechPost

Langfuse для инженеров LLM: полный пайплайн трейсинга и экспериментов

Langfuse — инструмент для отладки и оптимизации LLM-приложений. Узнайте, как настроить полный пайплайн мониторинга, управления промптами и экспериментов без платных моделей.

2026-05-25·2 мин
WorkOS представила auth.md — открытый протокол регистрации ИИ-агентов
LLMMarkTechPost

WorkOS представила auth.md — открытый протокол регистрации ИИ-агентов

WorkOS выпустила auth.md — открытый стандарт, который позволяет ИИ-агентам регистрироваться в приложениях через Markdown-файл без участия человека.

2026-05-25·3 мин
ByteDance представила Lance: одна модель для понимания, генерации и редактирования видео
LLMMarkTechPost

ByteDance представила Lance: одна модель для понимания, генерации и редактирования видео

ByteDance выпустила Lance — открытую модель, которая в одном фреймворке работает с изображениями и видео: понимает, генерирует и редактирует контент при использовании всего 3B активных параметров.

2026-05-25·2 мин
Cohere выпустила Command A+: 218 млрд параметров для агентов на двух видеокартах
LLMMarkTechPost

Cohere выпустила Command A+: 218 млрд параметров для агентов на двух видеокартах

Cohere представила открытую модель Command A+ на 218 млрд параметров с многомодальными возможностями, которая работает на двух GPU H100 и поддерживает 48 языков.

2026-05-25·2 мин
Perplexity открыла сканер Bumblebee для защиты разработческих систем
LLMMarkTechPost

Perplexity открыла сканер Bumblebee для защиты разработческих систем

Perplexity опубликовала исходный код Bumblebee — инструмента для сканирования уязвимостей в зависимостях разработческих систем без запуска кода.

2026-05-25·2 мин
Alibaba представила Qwen3.7-Max: агент с миллионным контекстом
LLMMarkTechPost

Alibaba представила Qwen3.7-Max: агент с миллионным контекстом

Alibaba представила Qwen3.7-Max — самую продвинутую модель-агента от Qwen с 1M-токенным контекстом и режимом рассуждений для сложных многошаговых задач.

2026-05-25·3 мин
CopilotKit переопределяет архитектуру для AI-агентов в 2026
LLMMarkTechPost

CopilotKit переопределяет архитектуру для AI-агентов в 2026

CopilotKit выпустил новый стек для разработчиков agentic AI: AG-UI протокол, платформу тестирования AIMock и сервер Pathfinder — полное решение для production-среды.

2026-05-25·3 мин
OpenMythos: создаём продвинутые трансформеры с MLA и GQA в Colab
LLMMarkTechPost

OpenMythos: создаём продвинутые трансформеры с MLA и GQA в Colab

OpenMythos позволяет строить рекуррентные трансформеры в Google Colab, сравнивая архитектуры MLA и GQA. Новый видео-туториал проверяет стабильность моделей через анализ спектральных радиусов injection матриц.

2026-05-25·2 мин
Nous Research представила CNA: управление поведением LLM без переобучения
LLMMarkTechPost

Nous Research представила CNA: управление поведением LLM без переобучения

Компания Nous Research представила метод Contrastive Neuron Attribution (CNA), который позволяет управлять поведением больших языковых моделей, находя и отключая отдельные нейронные цепи без переобучения и изменения весо

2026-05-25·3 мин
Восемь лучших платформ аутентификации для AI-агентов и MCP в 2026
LLMMarkTechPost

Восемь лучших платформ аутентификации для AI-агентов и MCP в 2026

Аутентификация вышла в топ-приоритеты разработки. MCP достиг 97 млн загрузок в месяц, AI-агенты идут в production, и выбор платформы стал критической стратегической задачей.

2026-05-25·2 мин