MarkTechPost
Источник AI-новостей. Материалы автоматически отбираются и адаптируются редакцией Hamidun News.
Последние публикации

Taalas бросает вызов GPU: жёсткая логика вместо гибкости ради 17 000 токенов в секунду
Канадский стартап Taalas делает ставку на то, что индустрия AI-чипов считала ересью — замену программируемых GPU на специализированные микросхемы с жёсткой логикой. Результат: 17 000 токенов в секунду.

TruLens: как перестать доверять LLM вслепую и начать измерять качество
Языковые модели всё ещё остаются чёрными ящиками для большинства разработчиков. TruLens предлагает инструментарий, который делает каждый шаг работы LLM прозрачным и измеримым — от входных данных до финального ответа.

Google предлагает думать глубже, а не дольше — и вдвое снижает затраты на инференс
Исследователи из Google и Университета Вирджинии доказали: длинная цепочка рассуждений не означает качественную. Новая метрика Deep-Thinking Ratio позволяет повысить точность LLM и вдвое сократить вычислительные расходы.

Google DeepMind представила Lyria 3 для создания музыки по фото
Новая модель Lyria 3 от Google DeepMind совершает прорыв в генерации аудио. Теперь ИИ способен создавать полноценные треки с вокалом и текстом, опираясь лишь на фотографии или текстовые описания.

Tavus представила Phoenix-4: видеоаватары с живыми эмоциями и мгновенным откликом
Новая модель Phoenix-4 преодолевает эффект «зловещей долины», добавляя цифровым аватарам эмоциональный интеллект и сокращая задержку генерации до рекордных 600 миллисекунд.

Anthropic представила Claude 4.6 Sonnet с контекстом в миллион токенов
Anthropic вступает в эпоху рассуждающих моделей. Claude 4.6 Sonnet получил контекстное окно в 1 млн токенов и инновационную систему верификации фактов через исполнение кода.

Google DeepMind представила фреймворк для интеллектуального делегирования задач между ИИ-агентами
Исследователи разработали систему для создания безопасного «агентного веба», где автономные программы смогут эффективно взаимодействовать и масштабироваться.

Google представила WebMCP: новый стандарт взаимодействия ИИ-агентов с вебом
Google представила протокол WebMCP, который позволит ИИ-агентам взаимодействовать с сайтами напрямую через структуру кода, минуя медленный и ресурсозатратный анализ скриншотов.

Архитектура памяти: как научить ИИ-агентов помнить важное и мыслить логично
Разбор новой концепции памяти для нейросетей: переход от простого хранения истории диалогов к структурированным базам знаний для глубокого анализа данных.

Гайд по созданию пайплайна синтетических данных с CTGAN и SDV
Узнайте, как построить надежную систему генерации табличных данных, обеспечивающую высокую точность и сохранение всех статистических закономерностей для безопасного обучения нейросетей.

Как обучить ИИ человеческим предпочтениям: гайд по DPO и QLoRA
Новый туториал показывает, как эффективно настраивать языковые модели под человеческие предпочтения без использования тяжеловесных моделей вознаграждения, используя всего одну GPU.

Google Gemini 3 Deep Think: новый рекорд в тестах на общий интеллект
Google представила Gemini 3 Deep Think. Модель показала результат в 84,6% в тесте ARC-AGI-2, приближая индустрию к созданию сильного ИИ через механизмы глубокого логического вывода.

OpenAI представила GPT-5.3-Codex-Spark: революция скорости в разработке ПО
OpenAI выпустила сверхбыструю модель для кодинга. Благодаря чипам Cerebras она выдает 1000 токенов в секунду, что в 15 раз быстрее стандартных версий.

Как обучить эмбеддинги Matryoshka для сверхбыстрого поиска данных
Узнайте, как технология Matryoshka Representation Learning позволяет сократить размер векторов до 64 измерений без существенной потери точности поиска.

NVIDIA представила KVTC: технология сжатия кэша LLM в 20 раз ускорит работу нейросетей
Исследователи NVIDIA представили KVTC — инновационный метод сжатия KV-кэша. Технология позволяет сократить потребление памяти в 20 раз, решая главную проблему масштабирования языковых моделей.

Как упростить разработку нейросетей: руководство по использованию Einops для тензорных вычислений
Библиотека Einops становится стандартом для работы с тензорами в глубоком обучении. Разбираемся, как сделать код чище и избежать ошибок в архитектурах Vision и Attention.

Google представила NAI: адаптивные интерфейсы на базе Gemini для инклюзивного дизайна
Google Research предлагает пересмотреть подход к доступности ПО. Фреймворк NAI использует ИИ-агентов Gemini для мгновенной адаптации интерфейса под физические возможности и контекст пользователя.

Microsoft представила OrbitalBrain: распределенное обучение ИИ прямо в космосе
Исследователи Microsoft предложили архитектуру OrbitalBrain для обучения нейросетей на спутниковых группировках, решая проблему медленной передачи данных на Землю.

OAT: как токенизация действий приближает роботов к возможностям LLM
Новый метод OAT позволяет роботам эффективнее планировать действия, используя подходы, аналогичные большим языковым моделям. Это открывает двери для масштабирования и гибкого управления роботами.

MLflow для LLM: версионирование промптов и регрессионное тестирование
Как обеспечить стабильность больших языковых моделей? MLflow предлагает решение для версионирования промптов и автоматического регрессионного тестирования. Подробности – в статье.

ByteDance выпустила Protenix-v1: Open-Source модель для прогнозирования биомолекулярных структур
ByteDance представила Protenix-v1, open-source модель, стремящуюся к уровню AlphaFold3 в прогнозировании структуры биомолекул. Код и параметры модели доступны под лицензией Apache 2.0.

PaperBanana: Google научила нейросети рисовать графики, за которые не стыдно перед рецензентами
Пока ИИ пишет код и статьи, красивые схемы оставались рутиной. Фреймворк PaperBanana от Google автоматизирует создание научных иллюстраций и графиков. Прощай, ручная отрисовка.

Waymo World Model: беспилотники Google теперь тренируются в собственной «Матрице»
Waymo запустила генеративную модель на базе Genie 3. Теперь беспилотники учатся водить в фотореалистичных мирах, которые нейросеть создает на лету. Больше никаких скучных полигонов.

Claude Opus 4.6: Anthropic учит нейросети думать медленно и работать за вас
Anthropic выкатила Opus 4.6. Пока конкуренты гонятся за хайпом, Дарио Амодеи дает нам миллион токенов контекста и агентов, которые реально пишут код.

GPT-5.3-Codex: OpenAI превращает кодинг в автономный процесс (и делает это быстрее)
OpenAI объединила мощь GPT-5.2 с навыками кодинга в новой модели 5.3-Codex. Она работает на 25% быстрее и метит в роль полноценного автономного агента для вашего компьютера.

Voxtral Transcribe 2: Mistral напомнила, зачем нам всё ещё нужны европейские нейронки
Mistral выпустила Voxtral Transcribe 2 — семейство моделей для распознавания речи. Теперь диаризация и real-time ASR работают в промышленных масштабах без лишних затрат.

Gemini 3 Flash: Google учит нейросети не гадать, а всматриваться
Google внедряет Agentic Vision в Gemini 3 Flash. Теперь модель не просто сканирует картинку, а активно изучает детали. Конец эпохи галлюцинаций в мелких деталях?

Qwen3-Coder-Next: 80 миллиардов параметров, которые влезут в ваш ПК
Команда Qwen снова ломает стереотипы. Новая модель весит как гигант, но бегает как спринтер: из 80 млрд параметров активны только 3 млрд. Идеально для локальных агентов.

Оффлайн-обучение без жертв: как Conservative Q-Learning спасает бюджеты и жизни
Забудьте про бесконечные пробы и ошибки. Новая реализация CQL позволяет обучать агентов на исторических данных, исключая риск катастроф в реальном мире.

Бронежилет для нейросети: почему вашей LLM мало одного фильтра безопасности
Пока хакеры придумывают новые способы обмануть ChatGPT, разработчики строят многослойную оборону. Разбираемся, как защитить модель от адаптивных атак и не сойти с ума.