Поиск
Семантический + лексический поиск по AI‑новостям. Поддержка RU/EN/PT/ES/FR/AR.

AprielGuard: Новый рубеж защиты LLM от угроз и атак
Представлена AprielGuard, инновационная система защиты больших языковых моделей (LLM) от уязвимостей и атак. Разбираемся, как она работает и почему это важно.

Как контролировать LLM в ролевой игре: архитектура Beyond The Verge
Разработчики Beyond The Verge решили классическую проблему: отняли у LLM управление механиками и оставили только нарратив. Архитектура на FastAPI и PostgreSQL обеспечивает детерминизм, где модель описывает события, а бэк

ChemEval: Новый эталон для оценки химических больших языковых моделей
Команда из Китайского научно-технического университета и iFlytek представила ChemEval, комплексный набор тестов для оценки способностей больших языковых моделей в области химии.

Безопасны ли передовые большие языковые модели? Новый отчет.
Фуданьский университет и Шанхайский институт креативного интеллекта опубликовали отчет о безопасности шести ведущих больших языковых моделей. Подробности в статье.

ICLR 2026: UIUC нашла способ остановить «чрезмерное обдумывание» LLM одной строкой кода
Исследователи из UIUC (University of Illinois Urbana-Champaign) предложили метод, позволяющий значительно повысить эффективность работы больших языковых моделей (LLM), сократив избыточное потребление вычислительных ресур

Защита LLM от атак на семантике: почему традиционный firewall неэффективен
Нейросети подвергаются новым типам атак, которые традиционные firewall-ы не защищают. AI/LLM Firewall работает на уровне семантики, блокируя 80+ техник из фреймворка MITRE ATLAS.

Как попасть в ответы ChatGPT: новый SEO для бизнеса
В эпоху LLM-чатов старый Google-SEO работает не полностью. Бизнесам нужна новая тактика видимости в ChatGPT, Perplexity и Claude — иначе сайт останется невидимым для растущего числа поисковиков.

Годовщина R1: DeepSeek Model 1 незаметно появляется на горизонте
DeepSeek отмечает годовщину R1 выпуском Model 1. Что это значит для конкуренции в сфере больших языковых моделей? Краткий обзор.

Почему ИИ уязвим для атак с внедрением запросов
Как обмануть большую языковую модель? Атака через внедрение запросов позволяет заставить ИИ делать то, что ему запрещено. Разбираемся, почему это работает и как с этим бороться.

MLflow для LLM: версионирование промптов и регрессионное тестирование
Как обеспечить стабильность больших языковых моделей? MLflow предлагает решение для версионирования промптов и автоматического регрессионного тестирования. Подробности – в статье.

Идеальная сортировка данных в LLM: алгоритмы против наивности
Как заставить LLM эффективно сортировать данные? Сравнение пяти методов на 164 постах Telegram-канала. Результат удивит!

LLM пишут Rust с семью категориями скрытых ошибок, которые компилятор не ловит
После полугода использования Claude, GPT и Cursor для Rust-разработки обнаружено семь категорий ошибок, которые компилятор пропускает, но нарушают безопасность или архитектуру кода.

Open-source LLM для юристов: эксперимент Рег.облака и Raft
Как open-source LLM справляются с юридическими документами? Эксперимент Рег.облака и Raft раскрывает ограничения и инженерные решения.

Интеграция Zabbix и локальной LLM: как спроектировать архитектуру умных алертов
Третья часть цикла об интеграции Zabbix с LLM: разбираемся в проектировании архитектуры для умных алертов. Какие части HLD делает человек, какие может взять нейросеть. Финальная часть с результатами выходит в ближайшие н

Зарубежные против отечественных: как выбрать LLM для реального бизнеса
Выбор языковой модели для продакшена — это не только цифры в бенчмарках. Разбираемся, что важнее: качество генерации или стабильность инфраструктуры.

Новый LLM меняет правила подготовки данных и возглавляет Hugging Face
Инновационный LLM-подход к подготовке данных для обучения нейросетей произвел фурор в сообществе, заняв первое место в рейтинге самых популярных исследований на Hugging Face. Что это значит для будущего AI?

Как Just AI помогла банку пробить потолок автоматизации с помощью LLM-агентов
Сотни веток NLU-сценария — и процент автоматизации всё равно стоит. Just AI перевела поддержку банка на LLM-агентов и добавила агента-судью против галлюцинаций.

LangSmith представил LLM Gateway: контроль расходов и PII для AI-агентов
LangSmith добавил встроенный LLM Gateway для управления расходами и безопасностью LLM-запросов в цикле жизни AI-агентов — с лимитами трат, удалением ПИД и полной трассировкой вызовов.

Anthropic увеличила годовую выручку более чем вдвое до $9 млрд
Разработчик Claude, компания Anthropic, сообщает о значительном росте годовой выручки, которая превысила 9 миллиардов долларов. Компания также планирует привлечь 25 миллиардов долларов инвестиций.

AWS SageMaker добавила полный мониторинг LLM-моделей в production
AWS расширила SageMaker AI инструментами для полного мониторинга LLM-моделей. Новые Grafana-дашборды отслеживают утилизацию GPU, скорость обработки и качество ответов в реальном времени.

TruLens: как перестать доверять LLM вслепую и начать измерять качество
Языковые модели всё ещё остаются чёрными ящиками для большинства разработчиков. TruLens предлагает инструментарий, который делает каждый шаг работы LLM прозрачным и измеримым — от входных данных до финального ответа.

OpenGrall представил архитектуру для роботов с ИИ, где языковая модель отвечает за стратегию
Фреймворк OpenGrall предлагает разделить мышление и управление: LLM отвечает за стратегию, а TinyML — за исполнение и безопасность, снижая задержки даже на слабом железе.

LLM-боты в Telegram взламывают за 6 строк кода: инженер создал сканер и разоблачил проект
Инженер создал сканер BarkingDog и обнаружил, что популярные Telegram-боты на LLM могут писать кейлоггеры и выдавать инструкции по взлому. Все проблемы решаются редактированием системного промпта.

Лемана Тех показала, как объединила LLM, RAG и классический ML в техподдержке
Компания описала гибридную схему поддержки: быстрые ML-классификаторы обрабатывают массовые тикеты, а LLM с RAG подключают там, где нужны ответы по Wiki и умная эскалация.

Яндекс автоматизировал обновление Chromium с помощью LLM-агента
Каждые четыре недели при обновлении Chromium разработчикам Яндекс Браузера приходится разруливать тысячи конфликтов кода. LLM-агент теперь помогает автоматизировать рутину и сокращает человеко-месяцы работы.

От LLM к действиям: как создать AI-агента на Go и GigaChat
Разработчик вдохновился докладом про AI-агентов и собрал своего на Go, используя LangChainGo и русский GigaChat. Делится опытом интеграции инструментов, MCP и подводными камнями.

llms.txt: как помочь ChatGPT, Claude и Perplexity правильно цитировать сайт
llms.txt — файл в корне вашего сайта, который объясняет ChatGPT, Claude и Perplexity, как вас цитировать и что считать канонической информацией.

llm-checker: утилита покажет, какие LLM потянет ваше железо
Новый CLI-инструмент сканирует GPU, RAM и процессор вашего компьютера, а затем честно говорит, какие из 35+ языковых моделей вы сможете запустить локально через Ollama — и насколько комфортно.

Habr AI объяснил, почему LLM не считают, не учатся в диалоге и зависят от инструментов
Habr AI объясняет, что языковые модели сами по себе умеют только работать с текстом, а память, расчеты, поиск, агенты и «цифровые сотрудники» появляются за счет внешних инструментов.

Langfuse для инженеров LLM: полный пайплайн трейсинга и экспериментов
Langfuse — инструмент для отладки и оптимизации LLM-приложений. Узнайте, как настроить полный пайплайн мониторинга, управления промптами и экспериментов без платных моделей.