Издание · проверено редакцией

MarkTechPost

Источник AI-новостей. Материалы автоматически отбираются и адаптируются редакцией Hamidun News.

220 материалов в Hamidun·Последний: 31 мая· Активен·marktechpost.com ↗

Последние публикации

MarkTechPost показал, как собрать LLM-систему с самооценкой, уверенностью и веб-поиском
LLMMarkTechPost

MarkTechPost показал, как собрать LLM-систему с самооценкой, уверенностью и веб-поиском

MarkTechPost показал практическую схему uncertainty-aware LLM: модель сначала отвечает и оценивает уверенность, затем перепроверяет себя и при сомнениях запускает веб-поиск.

2026-04-30·3 мин
GitAgent предлагает единый формат AI-агентов для LangChain, AutoGen и Claude Code
LLMMarkTechPost

GitAgent предлагает единый формат AI-агентов для LangChain, AutoGen и Claude Code

GitAgent предлагает хранить логику, память и правила AI-агента в Git-репозитории, а затем экспортировать одного и того же агента в LangChain, AutoGen, Claude Code и другие среды.

2026-04-30·3 мин
Google выпустила colab-mcp: как агенты автоматизируют ноутбуки Colab в продакшене
LLMMarkTechPost

Google выпустила colab-mcp: как агенты автоматизируют ноутбуки Colab в продакшене

Google показала open-source сервер colab-mcp для управления ноутбуками Colab через MCP: агент может добавлять ячейки, запускать код и собирать устойчивые workflow без ручной рутины.

2026-04-30·3 мин
Ян Лекун представил LeWorldModel — JEPA-модель без коллапса представлений из пикселей
LLMMarkTechPost

Ян Лекун представил LeWorldModel — JEPA-модель без коллапса представлений из пикселей

Команда Яна Лекуна показала LeWorldModel — world model, которая обучается прямо на пикселях с двумя функциями потерь, избегает коллапса представлений и планирует до 48 раз быстрее альтернатив.

2026-04-30·3 мин
HKUDS подробно показала OpenSpace — движок самоэволюции навыков для AI-агентов
LLMMarkTechPost

HKUDS подробно показала OpenSpace — движок самоэволюции навыков для AI-агентов

HKUDS показала, как OpenSpace превращает AI-агентов в самообучающиеся системы: движок сохраняет навыки после каждой задачи, переиспользует их и заметно сокращает расход токенов.

2026-04-30·3 мин
Nvidia представила PivotRL — фреймворк для ИИ-агентов с 4-кратной экономией rollout-шагов
LLMMarkTechPost

Nvidia представила PivotRL — фреймворк для ИИ-агентов с 4-кратной экономией rollout-шагов

Nvidia показала PivotRL — подход к дообучению ИИ-агентов, который сохраняет качество вне обучающего домена и достигает сопоставимой точности с E2E RL при вчетверо меньшем числе rollout-шагов.

2026-04-30·3 мин
Google представила TurboQuant: 6-кратное сжатие KV-кэша LLM без потери точности
LLMMarkTechPost

Google представила TurboQuant: 6-кратное сжатие KV-кэша LLM без потери точности

Google Research показала TurboQuant — алгоритм, который сжимает KV-кэш больших языковых моделей минимум в шесть раз и ускоряет attention до 8 раз без просадки качества.

2026-04-30·3 мин
MolmoWeb-4B от Ai2: веб-агент, который видит сайты как человек, без HTML-парсинга
LLMMarkTechPost

MolmoWeb-4B от Ai2: веб-агент, который видит сайты как человек, без HTML-парсинга

Ai2 выпустила MolmoWeb-4B — открытого мультимодального веб-агента, который управляет браузером только по скриншотам, без доступа к HTML или DOM-дереву.

2026-04-30·2 мин
Tencent открыла Covo-Audio — 7B-модель для голосовых диалогов и аудио-рассуждений
LLMMarkTechPost

Tencent открыла Covo-Audio — 7B-модель для голосовых диалогов и аудио-рассуждений

Tencent AI Lab выложила в open source Covo-Audio — 7B аудиомодель, которая принимает непрерывную речь, отвечает голосом и нацелена на диалоги и рассуждения в реальном времени.

2026-04-30·2 мин
Qwen3.5: запуск reasoning-моделей в gguf и 4-битном формате через Colab
LLMMarkTechPost

Qwen3.5: запуск reasoning-моделей в gguf и 4-битном формате через Colab

Показан Colab-пайплайн для запуска reasoning-моделей Qwen3.5, дистиллированных в стиле Claude: одной настройкой можно переключаться между 27B gguf и лёгкой 2B 4-битной версией.

2026-04-30·2 мин
Google выпустила Gemini 3.1 Flash Live для голосовых AI-агентов и мультимодального диалога
LLMMarkTechPost

Google выпустила Gemini 3.1 Flash Live для голосовых AI-агентов и мультимодального диалога

Google открыла preview-доступ к Gemini 3.1 Flash Live — модели для голосовых и визуальных AI-агентов с низкой задержкой, поддержкой инструментов и более естественным диалогом.

2026-04-30·3 мин
IWE и OpenAI: как превратить markdown-заметки в граф знаний для ИИ-агентов
LLMMarkTechPost

IWE и OpenAI: как превратить markdown-заметки в граф знаний для ИИ-агентов

На примере IWE показали, как собрать локальный граф знаний из markdown, подключить OpenAI function calling и построить agentic RAG с обходом связей между заметками.

2026-04-30·2 мин
Google объяснила разницу между Google-Agent и Googlebot для AI-доступа и индексации
LLMMarkTechPost

Google объяснила разницу между Google-Agent и Googlebot для AI-доступа и индексации

Google описала, чем новый Google-Agent отличается от Googlebot: первый выполняет действия на сайте по запросу пользователя, второй автоматически сканирует веб для индексации.

2026-04-30·2 мин
Связанные с Amazon исследователи представили A-Evolve для автоматической эволюции AI-агентов
LLMMarkTechPost

Связанные с Amazon исследователи представили A-Evolve для автоматической эволюции AI-агентов

Исследователи, связанные с Amazon, представили A-Evolve — систему, которая автоматизирует разработку AI-агентов и заменяет ручную настройку эволюцией состояний и самокоррекцией.

2026-04-30·2 мин
Agent-Infra представила AIO Sandbox — единую среду для AI-агентов с браузером и shell
LLMMarkTechPost

Agent-Infra представила AIO Sandbox — единую среду для AI-агентов с браузером и shell

Agent-Infra выпустила open-source AIO Sandbox — контейнерную среду, где браузер, shell, общий файловый слой и MCP собраны в одном рантайме для AI-агентов.

2026-04-30·2 мин
Cursor выпустила TypeScript SDK для coding-агентов с облачными песочницами и оплатой по токенам
LLMMarkTechPost

Cursor выпустила TypeScript SDK для coding-агентов с облачными песочницами и оплатой по токенам

Cursor открыла публичную бету TypeScript SDK: теперь разработчики могут запускать coding-агентов локально, в облаке и на своих воркерах — с sandboxed VM, subagents, hooks и токенной тарификацией.

2026-04-30·3 мин
Alibaba выпустила Qwen3.5-Omni — нативную мультимодальную модель для текста, аудио и видео
LLMMarkTechPost

Alibaba выпустила Qwen3.5-Omni — нативную мультимодальную модель для текста, аудио и видео

Alibaba представила Qwen3.5-Omni — нативную омнимодальную модель, которая понимает текст, изображения, аудио и видео в одной архитектуре и умеет отвечать голосом в реальном времени.

2026-04-30·3 мин
OpenAI выпустила Privacy Filter: открытая модель для удаления персональных данных
LLMMarkTechPost

OpenAI выпустила Privacy Filter: открытая модель для удаления персональных данных

OpenAI опубликовала Privacy Filter — open-source модель для автоматического обнаружения и замены персональных данных, работающая прямо в браузере без серверной инфраструктуры.

2026-04-30·2 мин
OpenAI и Promptflow: как собрать LLM-пайплайн с трассировкой и оценкой качества
LLMMarkTechPost

OpenAI и Promptflow: как собрать LLM-пайплайн с трассировкой и оценкой качества

В гайде показано, как собрать в Google Colab LLM-пайплайн на Promptflow, Prompty и OpenAI с безопасной настройкой ключей, трассировкой запусков и встроенной оценкой качества.

2026-04-30·3 мин
Meta FAIR выпустила NeuralSet — Python-пакет для связи нейроданных и ИИ-моделей
LLMMarkTechPost

Meta FAIR выпустила NeuralSet — Python-пакет для связи нейроданных и ИИ-моделей

Meta FAIR открыла NeuralSet — Python-фреймворк, который объединяет fMRI, M/EEG, спайки и эмбеддинги Hugging Face в один PyTorch-конвейер для Neuro-AI-исследований. *Meta признана экстремистской организацией и запрещена

2026-04-30·3 мин
Команда Qwen выпустила FlashQLA: ускорение линейного внимания до 3× на NVIDIA Hopper
LLMMarkTechPost

Команда Qwen выпустила FlashQLA: ускорение линейного внимания до 3× на NVIDIA Hopper

QwenLM выпустила FlashQLA — библиотеку CUDA-ядер для Gated Delta Network, которая даёт до 3× прироста производительности на GPU NVIDIA Hopper при предобучении и агентном инференсе.

2026-04-30·2 мин
OpenAI Privacy Filter: как собрать production-пайплайн для поиска и маскировки PII
LLMMarkTechPost

OpenAI Privacy Filter: как собрать production-пайплайн для поиска и маскировки PII

В гайде с OpenAI Privacy Filter разбирается полный конвейер для поиска и маскировки персональных данных — от загрузки модели до автоматического редактирования текста.

2026-04-30·3 мин
DeepSeek, Google и Meta: 10 техник сжатия KV-кэша LLM для снижения памяти на инференсе
LLMMarkTechPost

DeepSeek, Google и Meta: 10 техник сжатия KV-кэша LLM для снижения памяти на инференсе

KV-кэш стал пожирателем GPU-памяти в больших LLM, и новый обзор показывает 10 подходов — от H2O и SnapKV до TurboQuant и MLA DeepSeek — которые уменьшают расход памяти без полной переделки модели.

2026-04-30·3 мин
Poolside выпустила Laguna XS.2 и M.1 — открытые модели для агентного программирования
LLMMarkTechPost

Poolside выпустила Laguna XS.2 и M.1 — открытые модели для агентного программирования

Poolside показала две модели Laguna для агентного кодинга: открытая XS.2 запускается локально, а более мощная M.1 рассчитана на длинные задачи с правками кода, тестами и работой в терминале.

2026-04-29·3 мин
LlamaIndex ParseBench: как тестировать парсинг документов через Python и Hugging Face
LLMMarkTechPost

LlamaIndex ParseBench: как тестировать парсинг документов через Python и Hugging Face

Практический разбор показывает, как на датасете LlamaIndex ParseBench собрать пайплайн оценки парсеров документов: загрузить PDF из Hugging Face, сравнить извлечённый текст и измерить качество.

2026-04-29·3 мин
smol-audio от Deep-unlearning: набор Colab-ноутбуков для дообучения аудио-моделей
LLMMarkTechPost

smol-audio от Deep-unlearning: набор Colab-ноутбуков для дообучения аудио-моделей

Deep-unlearning выпустила smol-audio — коллекцию Colab-совместимых ноутбуков, где можно дообучать Whisper, Parakeet, Voxtral, Granite Speech и другие аудио-модели.

2026-04-29·3 мин
Топ-10 физических AI-моделей, которые управляют реальными роботами в 2026 году
LLMMarkTechPost

Топ-10 физических AI-моделей, которые управляют реальными роботами в 2026 году

За 18 месяцев разрыв между LLM и реальной робототехникой резко сократился: физические AI-модели уже работают на заводах, складах и в исследовательских лабораториях.

2026-04-28·2 мин
Hugging Face и Gemma 3 1B: как собрать готовый к продакшену пайплайн генерации в Colab
LLMMarkTechPost

Hugging Face и Gemma 3 1B: как собрать готовый к продакшену пайплайн генерации в Colab

Разбор показывает, как запустить Gemma 3 1B Instruct в Colab через Hugging Face Transformers: с безопасной авторизацией, chat templates и воспроизводимым inference-пайплайном.

2026-04-28·3 мин
Z.ai выпустила GLM-5V-Turbo — нативную мультимодальную модель для визуального программирования
LLMMarkTechPost

Z.ai выпустила GLM-5V-Turbo — нативную мультимодальную модель для визуального программирования

Китайская лаборатория Z.ai выпустила GLM-5V-Turbo — модель, которая видит архитектурные схемы и скриншоты и сразу генерирует по ним рабочий код для агентных инженерных систем.

2026-04-28·3 мин
Google Gemma 4, NVIDIA и OpenClaw: локальные AI-агенты без оплаты за каждый токен
LLMMarkTechPost

Google Gemma 4, NVIDIA и OpenClaw: локальные AI-агенты без оплаты за каждый токен

Google и NVIDIA продвигают локальный запуск Gemma 4 на RTX, Jetson и DGX Spark, чтобы всегда активные AI-агенты вроде OpenClaw работали быстрее, дешевле и без облачных счетов за токены.

2026-04-28·3 мин