Издание · проверено редакцией

MarkTechPost

Источник AI-новостей. Материалы автоматически отбираются и адаптируются редакцией Hamidun News.

220 материалов в Hamidun·Последний: 31 мая· Активен·marktechpost.com ↗

Последние публикации

Taalas бросает вызов GPU: жёсткая логика вместо гибкости ради 17 000 токенов в секунду
LLMMarkTechPost

Taalas бросает вызов GPU: жёсткая логика вместо гибкости ради 17 000 токенов в секунду

Канадский стартап Taalas делает ставку на то, что индустрия AI-чипов считала ересью — замену программируемых GPU на специализированные микросхемы с жёсткой логикой. Результат: 17 000 токенов в секунду.

2026-02-23·3 мин
TruLens: как перестать доверять LLM вслепую и начать измерять качество
LLMMarkTechPost

TruLens: как перестать доверять LLM вслепую и начать измерять качество

Языковые модели всё ещё остаются чёрными ящиками для большинства разработчиков. TruLens предлагает инструментарий, который делает каждый шаг работы LLM прозрачным и измеримым — от входных данных до финального ответа.

2026-02-23·3 мин
Google предлагает думать глубже, а не дольше — и вдвое снижает затраты на инференс
LLMMarkTechPost

Google предлагает думать глубже, а не дольше — и вдвое снижает затраты на инференс

Исследователи из Google и Университета Вирджинии доказали: длинная цепочка рассуждений не означает качественную. Новая метрика Deep-Thinking Ratio позволяет повысить точность LLM и вдвое сократить вычислительные расходы.

2026-02-22·3 мин
Google DeepMind представила Lyria 3 для создания музыки по фото
LLMMarkTechPost

Google DeepMind представила Lyria 3 для создания музыки по фото

Новая модель Lyria 3 от Google DeepMind совершает прорыв в генерации аудио. Теперь ИИ способен создавать полноценные треки с вокалом и текстом, опираясь лишь на фотографии или текстовые описания.

2026-02-19·2 мин
Tavus представила Phoenix-4: видеоаватары с живыми эмоциями и мгновенным откликом
LLMMarkTechPost

Tavus представила Phoenix-4: видеоаватары с живыми эмоциями и мгновенным откликом

Новая модель Phoenix-4 преодолевает эффект «зловещей долины», добавляя цифровым аватарам эмоциональный интеллект и сокращая задержку генерации до рекордных 600 миллисекунд.

2026-02-19·2 мин
Anthropic представила Claude 4.6 Sonnet с контекстом в миллион токенов
LLMMarkTechPost

Anthropic представила Claude 4.6 Sonnet с контекстом в миллион токенов

Anthropic вступает в эпоху рассуждающих моделей. Claude 4.6 Sonnet получил контекстное окно в 1 млн токенов и инновационную систему верификации фактов через исполнение кода.

2026-02-18·2 мин
Google DeepMind представила фреймворк для интеллектуального делегирования задач между ИИ-агентами
LLMMarkTechPost

Google DeepMind представила фреймворк для интеллектуального делегирования задач между ИИ-агентами

Исследователи разработали систему для создания безопасного «агентного веба», где автономные программы смогут эффективно взаимодействовать и масштабироваться.

2026-02-16·2 мин
Google представила WebMCP: новый стандарт взаимодействия ИИ-агентов с вебом
LLMMarkTechPost

Google представила WebMCP: новый стандарт взаимодействия ИИ-агентов с вебом

Google представила протокол WebMCP, который позволит ИИ-агентам взаимодействовать с сайтами напрямую через структуру кода, минуя медленный и ресурсозатратный анализ скриншотов.

2026-02-15·2 мин
Архитектура памяти: как научить ИИ-агентов помнить важное и мыслить логично
LLMMarkTechPost

Архитектура памяти: как научить ИИ-агентов помнить важное и мыслить логично

Разбор новой концепции памяти для нейросетей: переход от простого хранения истории диалогов к структурированным базам знаний для глубокого анализа данных.

2026-02-15·2 мин
Гайд по созданию пайплайна синтетических данных с CTGAN и SDV
LLMMarkTechPost

Гайд по созданию пайплайна синтетических данных с CTGAN и SDV

Узнайте, как построить надежную систему генерации табличных данных, обеспечивающую высокую точность и сохранение всех статистических закономерностей для безопасного обучения нейросетей.

2026-02-14·3 мин
Как обучить ИИ человеческим предпочтениям: гайд по DPO и QLoRA
LLMMarkTechPost

Как обучить ИИ человеческим предпочтениям: гайд по DPO и QLoRA

Новый туториал показывает, как эффективно настраивать языковые модели под человеческие предпочтения без использования тяжеловесных моделей вознаграждения, используя всего одну GPU.

2026-02-13·2 мин
Google Gemini 3 Deep Think: новый рекорд в тестах на общий интеллект
LLMMarkTechPost

Google Gemini 3 Deep Think: новый рекорд в тестах на общий интеллект

Google представила Gemini 3 Deep Think. Модель показала результат в 84,6% в тесте ARC-AGI-2, приближая индустрию к созданию сильного ИИ через механизмы глубокого логического вывода.

2026-02-13·2 мин
OpenAI представила GPT-5.3-Codex-Spark: революция скорости в разработке ПО
LLMMarkTechPost

OpenAI представила GPT-5.3-Codex-Spark: революция скорости в разработке ПО

OpenAI выпустила сверхбыструю модель для кодинга. Благодаря чипам Cerebras она выдает 1000 токенов в секунду, что в 15 раз быстрее стандартных версий.

2026-02-13·2 мин
Как обучить эмбеддинги Matryoshka для сверхбыстрого поиска данных
LLMMarkTechPost

Как обучить эмбеддинги Matryoshka для сверхбыстрого поиска данных

Узнайте, как технология Matryoshka Representation Learning позволяет сократить размер векторов до 64 измерений без существенной потери точности поиска.

2026-02-12·2 мин
NVIDIA представила KVTC: технология сжатия кэша LLM в 20 раз ускорит работу нейросетей
LLMMarkTechPost

NVIDIA представила KVTC: технология сжатия кэша LLM в 20 раз ускорит работу нейросетей

Исследователи NVIDIA представили KVTC — инновационный метод сжатия KV-кэша. Технология позволяет сократить потребление памяти в 20 раз, решая главную проблему масштабирования языковых моделей.

2026-02-11·2 мин
Как упростить разработку нейросетей: руководство по использованию Einops для тензорных вычислений
LLMMarkTechPost

Как упростить разработку нейросетей: руководство по использованию Einops для тензорных вычислений

Библиотека Einops становится стандартом для работы с тензорами в глубоком обучении. Разбираемся, как сделать код чище и избежать ошибок в архитектурах Vision и Attention.

2026-02-11·2 мин
Google представила NAI: адаптивные интерфейсы на базе Gemini для инклюзивного дизайна
LLMMarkTechPost

Google представила NAI: адаптивные интерфейсы на базе Gemini для инклюзивного дизайна

Google Research предлагает пересмотреть подход к доступности ПО. Фреймворк NAI использует ИИ-агентов Gemini для мгновенной адаптации интерфейса под физические возможности и контекст пользователя.

2026-02-11·2 мин
Microsoft представила OrbitalBrain: распределенное обучение ИИ прямо в космосе
LLMMarkTechPost

Microsoft представила OrbitalBrain: распределенное обучение ИИ прямо в космосе

Исследователи Microsoft предложили архитектуру OrbitalBrain для обучения нейросетей на спутниковых группировках, решая проблему медленной передачи данных на Землю.

2026-02-10·2 мин
OAT: как токенизация действий приближает роботов к возможностям LLM
LLMMarkTechPost

OAT: как токенизация действий приближает роботов к возможностям LLM

Новый метод OAT позволяет роботам эффективнее планировать действия, используя подходы, аналогичные большим языковым моделям. Это открывает двери для масштабирования и гибкого управления роботами.

2026-02-09·2 мин
MLflow для LLM: версионирование промптов и регрессионное тестирование
LLMMarkTechPost

MLflow для LLM: версионирование промптов и регрессионное тестирование

Как обеспечить стабильность больших языковых моделей? MLflow предлагает решение для версионирования промптов и автоматического регрессионного тестирования. Подробности – в статье.

2026-02-09·1 мин
ByteDance выпустила Protenix-v1: Open-Source модель для прогнозирования биомолекулярных структур
LLMMarkTechPost

ByteDance выпустила Protenix-v1: Open-Source модель для прогнозирования биомолекулярных структур

ByteDance представила Protenix-v1, open-source модель, стремящуюся к уровню AlphaFold3 в прогнозировании структуры биомолекул. Код и параметры модели доступны под лицензией Apache 2.0.

2026-02-08·1 мин
PaperBanana: Google научила нейросети рисовать графики, за которые не стыдно перед рецензентами
LLMMarkTechPost

PaperBanana: Google научила нейросети рисовать графики, за которые не стыдно перед рецензентами

Пока ИИ пишет код и статьи, красивые схемы оставались рутиной. Фреймворк PaperBanana от Google автоматизирует создание научных иллюстраций и графиков. Прощай, ручная отрисовка.

2026-02-07·2 мин
Waymo World Model: беспилотники Google теперь тренируются в собственной «Матрице»
LLMMarkTechPost

Waymo World Model: беспилотники Google теперь тренируются в собственной «Матрице»

Waymo запустила генеративную модель на базе Genie 3. Теперь беспилотники учатся водить в фотореалистичных мирах, которые нейросеть создает на лету. Больше никаких скучных полигонов.

2026-02-07·2 мин
Claude Opus 4.6: Anthropic учит нейросети думать медленно и работать за вас
LLMMarkTechPost

Claude Opus 4.6: Anthropic учит нейросети думать медленно и работать за вас

Anthropic выкатила Opus 4.6. Пока конкуренты гонятся за хайпом, Дарио Амодеи дает нам миллион токенов контекста и агентов, которые реально пишут код.

2026-02-06·2 мин
GPT-5.3-Codex: OpenAI превращает кодинг в автономный процесс (и делает это быстрее)
LLMMarkTechPost

GPT-5.3-Codex: OpenAI превращает кодинг в автономный процесс (и делает это быстрее)

OpenAI объединила мощь GPT-5.2 с навыками кодинга в новой модели 5.3-Codex. Она работает на 25% быстрее и метит в роль полноценного автономного агента для вашего компьютера.

2026-02-05·2 мин
Voxtral Transcribe 2: Mistral напомнила, зачем нам всё ещё нужны европейские нейронки
LLMMarkTechPost

Voxtral Transcribe 2: Mistral напомнила, зачем нам всё ещё нужны европейские нейронки

Mistral выпустила Voxtral Transcribe 2 — семейство моделей для распознавания речи. Теперь диаризация и real-time ASR работают в промышленных масштабах без лишних затрат.

2026-02-05·2 мин
Gemini 3 Flash: Google учит нейросети не гадать, а всматриваться
LLMMarkTechPost

Gemini 3 Flash: Google учит нейросети не гадать, а всматриваться

Google внедряет Agentic Vision в Gemini 3 Flash. Теперь модель не просто сканирует картинку, а активно изучает детали. Конец эпохи галлюцинаций в мелких деталях?

2026-02-05·2 мин
Qwen3-Coder-Next: 80 миллиардов параметров, которые влезут в ваш ПК
LLMMarkTechPost

Qwen3-Coder-Next: 80 миллиардов параметров, которые влезут в ваш ПК

Команда Qwen снова ломает стереотипы. Новая модель весит как гигант, но бегает как спринтер: из 80 млрд параметров активны только 3 млрд. Идеально для локальных агентов.

2026-02-04·2 мин
Оффлайн-обучение без жертв: как Conservative Q-Learning спасает бюджеты и жизни
LLMMarkTechPost

Оффлайн-обучение без жертв: как Conservative Q-Learning спасает бюджеты и жизни

Забудьте про бесконечные пробы и ошибки. Новая реализация CQL позволяет обучать агентов на исторических данных, исключая риск катастроф в реальном мире.

2026-02-04·2 мин
Бронежилет для нейросети: почему вашей LLM мало одного фильтра безопасности
LLMMarkTechPost

Бронежилет для нейросети: почему вашей LLM мало одного фильтра безопасности

Пока хакеры придумывают новые способы обмануть ChatGPT, разработчики строят многослойную оборону. Разбираемся, как защитить модель от адаптивных атак и не сойти с ума.

2026-02-03·2 мин