Habr AI
Источник AI-новостей. Материалы автоматически отбираются и адаптируются редакцией Hamidun News.
Последние публикации

Как оптимизировать работу с Claude Fable 5: советы Anthropic
Anthropic поделилась двумя ключевыми рекомендациями по использованию модели Fable 5 в production-приложениях.

Как работает ИИ-ревью кода в 2026 году и на какие ошибки оно действительно ловит
ИИ уже может находить пропущенные тесты и типовые уязвимости в коде, но его точность зависит от контекста — разбираемся, где он помогает и где может пропустить регрессию.

Биология встречает кремний: нейросети нетрадиционного вычисления
Нейросети в лабораториях всё чаще вдохновляются биологией — от молекулярных компьютеров до нейроморфных чипов. Исследователи ищут в природе ответы на вызовы AGI.

Telegram-бот с RAG без векторных БД: пример на Cloudflare Workers
Разработчик показал, как создать Telegram-бота с RAG-поиском по базе знаний без векторных БД и платной инфраструктуры. Используются алгоритм Jaccard, Groq API и Cloudflare Workers.

Промпт-конвертер: как скилл превращает идею в готовую инструкцию для AI
Разработчик создал открытый скилл, который автоматически генерирует правильные промпты для Claude, GPT, Gemini и DeepSeek прямо из описания задачи.

Запуск Claude Code и Fable 5 из России: новые способы обойти блокировки
Anthropic обновила Claude Code и Fable, но инструменты перестали работать из России. Разработчики нашли способы преодолеть ограничения через VPS и локальные сервера.

MITRE ATLAS: защита AI и ML-систем от новых угроз кибератак
MITRE ATLAS помогает организациям защитить AI-системы от растущих угроз: предлагает структурированный подход к моделированию атак и выстраиванию защиты через четыре ключевых элемента.

Год спустя Qwen3 держит трон по цене/качеству — батл-тест моделей
Qwen3-235B выпуска июля 2025 года вновь заняла первое место по соотношению цены и качества. Через год конкуренты (Gemini, DeepSeek) не смогли её обогнать.

Как Content AI создала ИИ-ревьюер кода, который находит мелкие баги
Content AI встроила ИИ-ревьюера в GitHub, чтобы ловить мелкие баги и забытые edge cases — и рассказала о первых выводах.

Инфраструктура прежде модели: как бизнес переосмысляет подход к ИИ
Компания столкнулась с аппаратным потолком при разработке AI-агента и придумала AI ready модуль — инфраструктуру, готовую к ИИ до выбора конкретной модели.

LLM пишет, код работает, никто не понимает: почему это происходит
Код работает и тесты зелёные, но читать его невозможно. Проблема не в плохом обучении LLM, а в столкновении двух совсем разных способов мышления человека и модели.

Векторный поиск без перебора: как работают IVF и HNSW
На Habr разобрали два ключевых алгоритма векторного поиска — IVF и HNSW, которые позволяют находить похожие эмбеддинги за миллисекунды вместо секунд и работают в основе вектор-БД.

Цифровые профили и ИИ-учителя: как образование становится персональным
Технологии из фантастики — цифровые профили студентов и ИИ-аватары учителей, говорящие на 70 языках — переходят из пилотов в массовое внедрение в российских и международных вузах.

Welder генерирует вирусные видео для TikTok и Reels без актёров и монтажа
Сервис Welder полностью автоматизирует создание вирусных коротких видео для TikTok, Reels и Shorts из одной идеи — без актёров, камеры, монтажа и лица в кадре.

Как интегрировать AI с T-FLEX: отказ от чат-ботов и переход к контролируемым агентам
Инженеры с Habr показали, почему LLM падают в закрытых САПР и как собрать стабильного AI-агента через контроль сессии, поиск по API и компиляцию кода.

Экосистема AI-агентов в PHP стала альтернативой Python за два года
За два года PHP-разработчики построили полноценную экосистему AI-инструментов: от клиентов моделей до мультиагентных платформ с памятью и workflow — на уровне Python

Домашняя ИИ-лаборатория за 200 тысяч рублей
Как запустить локальный AI-сервер с двумя Tesla V100 и протестировать 128 моделей за одну копейку облака

Как AI Overviews в Google и Яндекс перехватывают трафик в 2026 году
Генеративная выдача в Google и ЯндексНейро перехватывает трафик на нулевом экране — пользователи получают готовый ответ раньше, чем доходят до ссылок. Традиционный SEO теряет актуальность.

Скрытые фичи Claude Code: hooks, память и auto-mode в исходниках
В исходниках Claude Code нашли фичи, которых нет в документации: hooks для команд, автоодобрение операций, постоянная память агентов и самообучающиеся циклы памяти.

ChatGPT вместо часов в PowerPoint: как AI ускорил создание презентации
Инженер использовал ChatGPT для сборки презентации про Physical AI и сэкономил часы ручного оформления — процесс оказался похож на работу с дизайнером.

Как контролировать LLM в ролевой игре: архитектура Beyond The Verge
Разработчики Beyond The Verge решили классическую проблему: отняли у LLM управление механиками и оставили только нарратив. Архитектура на FastAPI и PostgreSQL обеспечивает детерминизм, где модель описывает события, а бэк

ContentAI научила ИИ писать production-код по правилам: история успеха
ContentAI показала, как вайб-кодинг (AI-генерация без строгих правил) можно использовать в production-приложениях. Для этого пришлось добавить дисциплину к интуитивному подходу.

Пеликаны на велосипедах: странный тест Саймона Уиллисона для LLM
Саймон Уиллисон, создатель Django, придумал забавный тест для LLM: просить нейросеть нарисовать SVG-пеликана на велосипеде. Результаты показывают неожиданное многое о способностях ИИ.

Сэм Альтман ошибается: закон Паркинсона защитит работы от ИИ
Несмотря на предсказания Альтмана о том, что ИИ заберет работу, организационный закон Паркинсона защитит должности: люди в системе всегда найдут способ разбухнуть работу, чтобы остаться нужными.

Разработчик создал профессию AI-интегратора: как собрать workflow на n8n
Разработчик интеграций Даниил впервые создал AI-автоматизацию на n8n: события через LLM распределяются по Google Sheets, Telegram и CRM без классического релиза.

NVIDIA Tesla V100 для локальных моделей ИИ: тест на реальных задачах
Tesla V100 16 ГБ из 2017 года справляется с современными LLM-моделями вроде Qwen35B и GPT-OSS-20B. На тестах генерировала сайты, игры и резюме документов со скоростью 38–109 токенов в секунду.

Шардинг в LLM: как распределить вычисления между GPU
Шардинг — техника распределения больших матриц между несколькими GPU. От её качества зависит скорость тренировки и эффективность использования вычислительных ресурсов масштабного кластера.

Почему RAG-чатботы отлично работают на демо, но выдают бред в продакшене
RAG-боты по внутренней документации блестят на демо, но в реальной работе выдают уверенный бред. История о разрыве между пятью подготовленными вопросами и реальностью продакшена.

Google объединила Street View и AI для создания виртуальных тренировочных миров
Google представила Project Genie в новой версии — генеративная модель создаёт 3D-миры, привязанные к реальным координатам Google Street View, что позволяет роботам тренироваться без выхода в реальный мир.

Как разработчик создал навык генерации музыки для Яндекс Алисы
Разработчик из Мельбурна за два вечера добавил в Яндекс Алису навык создания песен по голосовой команде — первый живой пример использования генеративных моделей в российской экосистеме умных колонок.