Поиск
Семантический + лексический поиск по AI‑новостям. Поддержка RU/EN/PT/ES/FR/AR.

Кто честнее с JSON: OpenAI, Gemini и xAI прошли тесты на соблюдение схем
Habr проверил, насколько строго OpenAI, Gemini и xAI соблюдают JSON Schema, и выявил неожиданные ограничения в Structured Outputs.

Локальная Qwen3.6-27B vs облачные модели: почему приватность — не главное
Локальная модель Qwen3.6-27B демонстрирует, что может конкурировать с облачными Claude и GPT. Преимущество локальных моделей простирается гораздо дальше приватности — это контроль, скорость и независимость.

OpenAI запустила /goal в Codex CLI: автономный агент или дорогой способ писать код?
Codex CLI получил /goal — режим автономной разработки. На практике: токены скачут в 5 раз, MCP молча отваливаются, а цена за эту «автоматизацию» остаётся в тени.

Как использовать подписки ChatGPT и Claude в Cursor без платежей за токены
Подписки на ChatGPT и Claude дают 1000$ и 2000$ токенов соответственно, но Cursor не поддерживает их напрямую из-за разных форматов API. Решение — проксирование запросов для маршрутизации через платные подписки без переп

Экосистема AI-агентов в PHP стала альтернативой Python за два года
За два года PHP-разработчики построили полноценную экосистему AI-инструментов: от клиентов моделей до мультиагентных платформ с памятью и workflow — на уровне Python

От LLM к действиям: как создать AI-агента на Go и GigaChat
Разработчик вдохновился докладом про AI-агентов и собрал своего на Go, используя LangChainGo и русский GigaChat. Делится опытом интеграции инструментов, MCP и подводными камнями.

Русский язык в ChatGPT стоит в 2 раза дороже: виновата токенизация
В ChatGPT и других LLM-сервисах русский текст обходится в 2 раза дороже английского, обрабатывается медленнее и вмещает меньше информации — всё из-за особенностей токенизации кириллицы.

Гоблины в GPT-5.1: как фэнтезийная привычка захватила модель OpenAI
В GPT-5.1 обнаружили необычное явление: модель начала постоянно использовать метафоры про гоблинов и гремлинов в своих ответах. Привычка нарастала через поколения обучения.

Spring AI облегчила интеграцию Java-приложений с Claude и другими LLM-провайдерами
Spring AI предоставляет готовые техники для интеграции LLM-провайдеров в Java, включая работу с Claude от Anthropic. Разбирают практические примеры разработки и когда это имеет смысл.

Почему боты на базе защищённых LLM часто взламываются: анализ 14 тысяч GPT
Оказывается, даже если базовая LLM-модель защищена от атак, кастомный бот на её основе может быть уязвим. Анализ 14,904 GPT показал, где именно появляются дыры в безопасности.

Как 15 AI решают поиск оптимального XML-парсера для iOS: результаты бенчмарка
Разработчик загрузил 15 популярных AI-моделей одинаковой задачей по поиску быстрого XML-парсера для iOS и сравнил их результаты со своим трёхчасовым ручным бенчмарком — итоги оказались неожиданными.

Почему RAG-чатботы отлично работают на демо, но выдают бред в продакшене
RAG-боты по внутренней документации блестят на демо, но в реальной работе выдают уверенный бред. История о разрыве между пятью подготовленными вопросами и реальностью продакшена.

Deepseek-agent: как написать свой Claude Code за 2000 строк кода
Разработчик создал полнофункциональный аналог Claude Code для DeepSeek с поддержкой tool use, permissions и memory. Всего 2000 строк Node.js кода и 4 зависимости вместо фреймворков.

Ollama и Open WebUI на VPS без GPU: честный разбор ограничений
Запуск локального LLM на простом сервере — работает, но скорость страдает и нужно выбирать модели под железо.

Как Claude Code и ChatGPT втягивают в дорогие тарифы: выход через мультиагенты
Создатели AI-инструментов используют классическую стратегию: сначала дешевая подписка, потом резкое подорожание. Вот как пользователи выбирают альтернативу из нескольких агентов.

Инженерные агенты вместо разработчиков: полгода революции в коде
За полгода AI-агенты для разработки перешли из экспериментов в стандартный инструмент. То, что в мае казалось революцией, в декабре уже обычный workflow.

Индустрия ИИ прошла все 5 стадий принятия — где мы находимся
От отрицания Google трансформеров в 2017 году до признания того, что ИИ не заменит человека: как индустрия пережила пять стадий психологического принятия инноваций.

Локальный LLM на видеокарте 2017 года: AMD RX 580 + Vulkan + Ollama
Старая AMD RX 580 способна запускать современные языковые модели — с помощью Vulkan и Ollama вы получите 15–35 токенов в секунду прямо на своём компьютере под Fedora.

Ляпунов против системы: как в СССР развивали запрещённую кибернетику
В 1954 году математик Алексей Ляпунов открыл семинар по кибернетике в МГУ, когда её называли реакционной лженаукой. Его смелость помогла спасти идеи, ставшие основой современного ИИ.

Мессенджер MAX запустил AI Hub: 10 моделей и 5900 юзеров за 54 дня
Команда интегрировала 10+ моделей ИИ в мессенджер MAX всего за два месяца: уже 5900+ пользователей и работающая премиум-подписка через ЮКассу.

Архитектурная ошибка корпоративного ИИ: зачем нужен AI Gateway
Встраивание ИИ в каждую систему создаёт зоопарк копилотов с проблемами безопасности и аудита. Нужен отдельный корпоративный слой, где живут модели, управление и ответственность.

Агрегаторы LLM: как выбирать живые free-модели и не врать про результат
Как построить агрегатор, который выбирает стабильные free-модели, переживает сбои провайдеров, и честно рассказывает интерфейсу, какая модель реально ответила.

Безопасность AI-агентов в production: практический гайд по Red Teaming
AI-агенты с доступом к корпоративным данным и инструментами требуют особого подхода к тестированию безопасности. Doubletapp поделилась практическим гайдом по Red Teaming: как найти уязвимости перед запуском в production

Интеграция Zabbix и локальной LLM: как спроектировать архитектуру умных алертов
Третья часть цикла об интеграции Zabbix с LLM: разбираемся в проектировании архитектуры для умных алертов. Какие части HLD делает человек, какие может взять нейросеть. Финальная часть с результатами выходит в ближайшие н

Spring Agent Toolkit: эффективные инструменты для управления AI-агентами
Haulmont представила Spring Agent Toolkit — набор инструментов для разработчиков, которые борются с переработкой токенов и неточностью результатов при работе с AI-агентами в Java-приложениях.

Парадокс цензуры: почему нейросетям запретили генерировать обнаженное тело
На Habr обсуждают философский парадокс: почему AI-системы не могут воспроизводить обнаженное человеческое тело, если оно спокойно выставляется в музеях и используется в образовании?

Google полностью переделала Gemini: уровни мышления вместо Thinking модели
Google обновила Gemini — добавила выбор уровня мышления (fast, balanced, deep) в основной интерфейс, запустила модель Flash Lite и переделала дизайн, но убрала Thinking модель и усилила ограничения Pro подписки.

ICLR 2026 в Рио: что думают исследователи о масштабировании больших моделей
На конференции ICLR в Рио-де-Жанейро исследователи обсудили главные тренды 2026: оптимизацию масштабирования, безопасность ИИ и роль открытых весов в эпоху закрытых корпоративных систем.

Anthropic просит соискателей не использовать ИИ-ассистентов при подаче резюме
Компания-разработчик Claude требует от кандидатов на вакансии маркетолога, финансиста и инженера не пользоваться ИИ при составлении резюме — это сигнал того, что рынок найма столкнулся с кризисом доверия.

ИИ-агент за один день: локальный прототип без облака и разработчиков
Практический гайд для компаний, которые хотят быстро внедрить ИИ-агента без облака, больших бюджетов и штата разработчиков: Ollama, n8n и промпт-инжиниринг за один рабочий день.