MarkTechPost
Источник AI-новостей. Материалы автоматически отбираются и адаптируются редакцией Hamidun News.
Последние публикации

MarkTechPost показал, как собрать LLM-систему с самооценкой, уверенностью и веб-поиском
MarkTechPost показал практическую схему uncertainty-aware LLM: модель сначала отвечает и оценивает уверенность, затем перепроверяет себя и при сомнениях запускает веб-поиск.

GitAgent предлагает единый формат AI-агентов для LangChain, AutoGen и Claude Code
GitAgent предлагает хранить логику, память и правила AI-агента в Git-репозитории, а затем экспортировать одного и того же агента в LangChain, AutoGen, Claude Code и другие среды.

Google выпустила colab-mcp: как агенты автоматизируют ноутбуки Colab в продакшене
Google показала open-source сервер colab-mcp для управления ноутбуками Colab через MCP: агент может добавлять ячейки, запускать код и собирать устойчивые workflow без ручной рутины.

Ян Лекун представил LeWorldModel — JEPA-модель без коллапса представлений из пикселей
Команда Яна Лекуна показала LeWorldModel — world model, которая обучается прямо на пикселях с двумя функциями потерь, избегает коллапса представлений и планирует до 48 раз быстрее альтернатив.

HKUDS подробно показала OpenSpace — движок самоэволюции навыков для AI-агентов
HKUDS показала, как OpenSpace превращает AI-агентов в самообучающиеся системы: движок сохраняет навыки после каждой задачи, переиспользует их и заметно сокращает расход токенов.

Nvidia представила PivotRL — фреймворк для ИИ-агентов с 4-кратной экономией rollout-шагов
Nvidia показала PivotRL — подход к дообучению ИИ-агентов, который сохраняет качество вне обучающего домена и достигает сопоставимой точности с E2E RL при вчетверо меньшем числе rollout-шагов.

Google представила TurboQuant: 6-кратное сжатие KV-кэша LLM без потери точности
Google Research показала TurboQuant — алгоритм, который сжимает KV-кэш больших языковых моделей минимум в шесть раз и ускоряет attention до 8 раз без просадки качества.

MolmoWeb-4B от Ai2: веб-агент, который видит сайты как человек, без HTML-парсинга
Ai2 выпустила MolmoWeb-4B — открытого мультимодального веб-агента, который управляет браузером только по скриншотам, без доступа к HTML или DOM-дереву.

Tencent открыла Covo-Audio — 7B-модель для голосовых диалогов и аудио-рассуждений
Tencent AI Lab выложила в open source Covo-Audio — 7B аудиомодель, которая принимает непрерывную речь, отвечает голосом и нацелена на диалоги и рассуждения в реальном времени.

Qwen3.5: запуск reasoning-моделей в gguf и 4-битном формате через Colab
Показан Colab-пайплайн для запуска reasoning-моделей Qwen3.5, дистиллированных в стиле Claude: одной настройкой можно переключаться между 27B gguf и лёгкой 2B 4-битной версией.

Google выпустила Gemini 3.1 Flash Live для голосовых AI-агентов и мультимодального диалога
Google открыла preview-доступ к Gemini 3.1 Flash Live — модели для голосовых и визуальных AI-агентов с низкой задержкой, поддержкой инструментов и более естественным диалогом.

IWE и OpenAI: как превратить markdown-заметки в граф знаний для ИИ-агентов
На примере IWE показали, как собрать локальный граф знаний из markdown, подключить OpenAI function calling и построить agentic RAG с обходом связей между заметками.

Google объяснила разницу между Google-Agent и Googlebot для AI-доступа и индексации
Google описала, чем новый Google-Agent отличается от Googlebot: первый выполняет действия на сайте по запросу пользователя, второй автоматически сканирует веб для индексации.

Связанные с Amazon исследователи представили A-Evolve для автоматической эволюции AI-агентов
Исследователи, связанные с Amazon, представили A-Evolve — систему, которая автоматизирует разработку AI-агентов и заменяет ручную настройку эволюцией состояний и самокоррекцией.

Agent-Infra представила AIO Sandbox — единую среду для AI-агентов с браузером и shell
Agent-Infra выпустила open-source AIO Sandbox — контейнерную среду, где браузер, shell, общий файловый слой и MCP собраны в одном рантайме для AI-агентов.

Cursor выпустила TypeScript SDK для coding-агентов с облачными песочницами и оплатой по токенам
Cursor открыла публичную бету TypeScript SDK: теперь разработчики могут запускать coding-агентов локально, в облаке и на своих воркерах — с sandboxed VM, subagents, hooks и токенной тарификацией.

Alibaba выпустила Qwen3.5-Omni — нативную мультимодальную модель для текста, аудио и видео
Alibaba представила Qwen3.5-Omni — нативную омнимодальную модель, которая понимает текст, изображения, аудио и видео в одной архитектуре и умеет отвечать голосом в реальном времени.

OpenAI выпустила Privacy Filter: открытая модель для удаления персональных данных
OpenAI опубликовала Privacy Filter — open-source модель для автоматического обнаружения и замены персональных данных, работающая прямо в браузере без серверной инфраструктуры.

OpenAI и Promptflow: как собрать LLM-пайплайн с трассировкой и оценкой качества
В гайде показано, как собрать в Google Colab LLM-пайплайн на Promptflow, Prompty и OpenAI с безопасной настройкой ключей, трассировкой запусков и встроенной оценкой качества.

Meta FAIR выпустила NeuralSet — Python-пакет для связи нейроданных и ИИ-моделей
Meta FAIR открыла NeuralSet — Python-фреймворк, который объединяет fMRI, M/EEG, спайки и эмбеддинги Hugging Face в один PyTorch-конвейер для Neuro-AI-исследований. *Meta признана экстремистской организацией и запрещена

Команда Qwen выпустила FlashQLA: ускорение линейного внимания до 3× на NVIDIA Hopper
QwenLM выпустила FlashQLA — библиотеку CUDA-ядер для Gated Delta Network, которая даёт до 3× прироста производительности на GPU NVIDIA Hopper при предобучении и агентном инференсе.

OpenAI Privacy Filter: как собрать production-пайплайн для поиска и маскировки PII
В гайде с OpenAI Privacy Filter разбирается полный конвейер для поиска и маскировки персональных данных — от загрузки модели до автоматического редактирования текста.

DeepSeek, Google и Meta: 10 техник сжатия KV-кэша LLM для снижения памяти на инференсе
KV-кэш стал пожирателем GPU-памяти в больших LLM, и новый обзор показывает 10 подходов — от H2O и SnapKV до TurboQuant и MLA DeepSeek — которые уменьшают расход памяти без полной переделки модели.

Poolside выпустила Laguna XS.2 и M.1 — открытые модели для агентного программирования
Poolside показала две модели Laguna для агентного кодинга: открытая XS.2 запускается локально, а более мощная M.1 рассчитана на длинные задачи с правками кода, тестами и работой в терминале.

LlamaIndex ParseBench: как тестировать парсинг документов через Python и Hugging Face
Практический разбор показывает, как на датасете LlamaIndex ParseBench собрать пайплайн оценки парсеров документов: загрузить PDF из Hugging Face, сравнить извлечённый текст и измерить качество.

smol-audio от Deep-unlearning: набор Colab-ноутбуков для дообучения аудио-моделей
Deep-unlearning выпустила smol-audio — коллекцию Colab-совместимых ноутбуков, где можно дообучать Whisper, Parakeet, Voxtral, Granite Speech и другие аудио-модели.

Топ-10 физических AI-моделей, которые управляют реальными роботами в 2026 году
За 18 месяцев разрыв между LLM и реальной робототехникой резко сократился: физические AI-модели уже работают на заводах, складах и в исследовательских лабораториях.

Hugging Face и Gemma 3 1B: как собрать готовый к продакшену пайплайн генерации в Colab
Разбор показывает, как запустить Gemma 3 1B Instruct в Colab через Hugging Face Transformers: с безопасной авторизацией, chat templates и воспроизводимым inference-пайплайном.

Z.ai выпустила GLM-5V-Turbo — нативную мультимодальную модель для визуального программирования
Китайская лаборатория Z.ai выпустила GLM-5V-Turbo — модель, которая видит архитектурные схемы и скриншоты и сразу генерирует по ним рабочий код для агентных инженерных систем.

Google Gemma 4, NVIDIA и OpenClaw: локальные AI-агенты без оплаты за каждый токен
Google и NVIDIA продвигают локальный запуск Gemma 4 на RTX, Jetson и DGX Spark, чтобы всегда активные AI-агенты вроде OpenClaw работали быстрее, дешевле и без облачных счетов за токены.