Поиск
Семантический + лексический поиск по AI‑новостям. Поддержка RU/EN/PT/ES/FR/AR.

Как контролировать LLM в ролевой игре: архитектура Beyond The Verge
Разработчики Beyond The Verge решили классическую проблему: отняли у LLM управление механиками и оставили только нарратив. Архитектура на FastAPI и PostgreSQL обеспечивает детерминизм, где модель описывает события, а бэк

Защита LLM от атак на семантике: почему традиционный firewall неэффективен
Нейросети подвергаются новым типам атак, которые традиционные firewall-ы не защищают. AI/LLM Firewall работает на уровне семантики, блокируя 80+ техник из фреймворка MITRE ATLAS.

Как попасть в ответы ChatGPT: новый SEO для бизнеса
В эпоху LLM-чатов старый Google-SEO работает не полностью. Бизнесам нужна новая тактика видимости в ChatGPT, Perplexity и Claude — иначе сайт останется невидимым для растущего числа поисковиков.

Идеальная сортировка данных в LLM: алгоритмы против наивности
Как заставить LLM эффективно сортировать данные? Сравнение пяти методов на 164 постах Telegram-канала. Результат удивит!

LLM пишут Rust с семью категориями скрытых ошибок, которые компилятор не ловит
После полугода использования Claude, GPT и Cursor для Rust-разработки обнаружено семь категорий ошибок, которые компилятор пропускает, но нарушают безопасность или архитектуру кода.

Open-source LLM для юристов: эксперимент Рег.облака и Raft
Как open-source LLM справляются с юридическими документами? Эксперимент Рег.облака и Raft раскрывает ограничения и инженерные решения.

Интеграция Zabbix и локальной LLM: как спроектировать архитектуру умных алертов
Третья часть цикла об интеграции Zabbix с LLM: разбираемся в проектировании архитектуры для умных алертов. Какие части HLD делает человек, какие может взять нейросеть. Финальная часть с результатами выходит в ближайшие н

Зарубежные против отечественных: как выбрать LLM для реального бизнеса
Выбор языковой модели для продакшена — это не только цифры в бенчмарках. Разбираемся, что важнее: качество генерации или стабильность инфраструктуры.

Как Just AI помогла банку пробить потолок автоматизации с помощью LLM-агентов
Сотни веток NLU-сценария — и процент автоматизации всё равно стоит. Just AI перевела поддержку банка на LLM-агентов и добавила агента-судью против галлюцинаций.

OpenGrall представил архитектуру для роботов с ИИ, где языковая модель отвечает за стратегию
Фреймворк OpenGrall предлагает разделить мышление и управление: LLM отвечает за стратегию, а TinyML — за исполнение и безопасность, снижая задержки даже на слабом железе.

LLM-боты в Telegram взламывают за 6 строк кода: инженер создал сканер и разоблачил проект
Инженер создал сканер BarkingDog и обнаружил, что популярные Telegram-боты на LLM могут писать кейлоггеры и выдавать инструкции по взлому. Все проблемы решаются редактированием системного промпта.

Лемана Тех показала, как объединила LLM, RAG и классический ML в техподдержке
Компания описала гибридную схему поддержки: быстрые ML-классификаторы обрабатывают массовые тикеты, а LLM с RAG подключают там, где нужны ответы по Wiki и умная эскалация.

Яндекс автоматизировал обновление Chromium с помощью LLM-агента
Каждые четыре недели при обновлении Chromium разработчикам Яндекс Браузера приходится разруливать тысячи конфликтов кода. LLM-агент теперь помогает автоматизировать рутину и сокращает человеко-месяцы работы.

От LLM к действиям: как создать AI-агента на Go и GigaChat
Разработчик вдохновился докладом про AI-агентов и собрал своего на Go, используя LangChainGo и русский GigaChat. Делится опытом интеграции инструментов, MCP и подводными камнями.

llms.txt: как помочь ChatGPT, Claude и Perplexity правильно цитировать сайт
llms.txt — файл в корне вашего сайта, который объясняет ChatGPT, Claude и Perplexity, как вас цитировать и что считать канонической информацией.

llm-checker: утилита покажет, какие LLM потянет ваше железо
Новый CLI-инструмент сканирует GPU, RAM и процессор вашего компьютера, а затем честно говорит, какие из 35+ языковых моделей вы сможете запустить локально через Ollama — и насколько комфортно.

Habr AI объяснил, почему LLM не считают, не учатся в диалоге и зависят от инструментов
Habr AI объясняет, что языковые модели сами по себе умеют только работать с текстом, а память, расчеты, поиск, агенты и «цифровые сотрудники» появляются за счет внешних инструментов.

Докинз разговорился с Claude: есть ли у LLM сознание?
Биолог Ричард Докинз опубликовал эссе о возможном сознании языковых моделей на примере Claude. Но люди верят в AI-сознание на основе пустых диалогов, где слова о душе не означают понимания.

Pollux от Sber AI: LLM-судья для оценки русскоязычных моделей
Sber AI открыл доступ к Pollux — специализированной модели для автоматической оценки качества русскоязычных языковых моделей перед внедрением в продакшен.

Могут ли LLM находить flaky-тесты по коду? Исследование говорит нет
Исследование показало, что LLM плохо находят ненадёжные тесты, даже когда метрики датасета говорят об обратном.

Regex из локальной LLM: опыт Bitrix24 без дообучения
Как Mac Mini и локальная языковая модель помогли Bitrix24 автоматизировать создание Regex для анализа логов, сэкономив сотни часов ручной отладки. Подробности в статье.

Архитектура как код: как LLM ускоряют проектирование систем
Команда БКС показала, как перенести архитектурную документацию в код и доверить рутину LLM-ассистентам. Цикл согласования, который раньше занимал недели, теперь укладывается в дни.

Почему текст LLM видно сразу: архитектурные маркеры в архитектуре моделей
LLM-текст узнают за пять секунд благодаря архитектурным маркерам. Это не ошибка, а результат статистики обучающего корпуса. Разбираем, как возникают маркеры и как их ослабить.

LLM не справляются с небезопасным Rust: полгода тестирования показал критические ошибки
Исследователь шесть месяцев давал языковым моделям писать unsafe Rust и обнаружил семь категорий стабильных ошибок — от aliasing до проблем с памятью.

Флаг Софт: бенчмарк «Испытание Дали» помог выбрать LLM по качеству, скорости и цене
Бенчмарк «Испытание Дали» сравнил LLM по трём критериям, которые важны для внедрения в продукт: качеству ответов, скорости работы и итоговой стоимости.

Habr AI: LLM смогут забрать рутину в бизнес-исследованиях, но не стратегию
Автор Habr AI делит продуктовые и маркетинговые исследования на три уровня и считает, что LLM быстро автоматизируют рутину и часть аналитики, но не пересборку самой исследовательской рамки.

MCP LLM-агент в Fusion360: первый тест vibe-design на деревянной лестнице
В Fusion360 выкатили MCP LLM-ассистент — автор Хабра сразу проверил его на деревянной лестнице, которую раньше создавал вручную больше 60 раз.

Как интегрировать AI с T-FLEX: отказ от чат-ботов и переход к контролируемым агентам
Инженеры с Habr показали, почему LLM падают в закрытых САПР и как собрать стабильного AI-агента через контроль сессии, поиск по API и компиляцию кода.

Java-разработчикам показали, как guardrails для LLM блокируют инъекции и токсичные ответы
Разбор о том, почему одного system prompt недостаточно для защиты LLM, и как guardrails в Java перехватывают опасные входы и фильтруют токсичный или нежелательный вывод модели.

LLM в разработке: какие 4 подхода используют команды и чем они отличаются
LLM уже используют не только как автодополнение: материал разбирает четыре режима AI-разработки по двум осям — сколько кода контролирует человек и как команда проверяет результат.