Поиск
Семантический + лексический поиск по AI‑новостям. Поддержка RU/EN/PT/ES/FR/AR.

Как контролировать LLM в ролевой игре: архитектура Beyond The Verge
Разработчики Beyond The Verge решили классическую проблему: отняли у LLM управление механиками и оставили только нарратив. Архитектура на FastAPI и PostgreSQL обеспечивает детерминизм, где модель описывает события, а бэк

Защита LLM от атак на семантике: почему традиционный firewall неэффективен
Нейросети подвергаются новым типам атак, которые традиционные firewall-ы не защищают. AI/LLM Firewall работает на уровне семантики, блокируя 80+ техник из фреймворка MITRE ATLAS.

Как попасть в ответы ChatGPT: новый SEO для бизнеса
В эпоху LLM-чатов старый Google-SEO работает не полностью. Бизнесам нужна новая тактика видимости в ChatGPT, Perplexity и Claude — иначе сайт останется невидимым для растущего числа поисковиков.

LLM пишут Rust с семью категориями скрытых ошибок, которые компилятор не ловит
После полугода использования Claude, GPT и Cursor для Rust-разработки обнаружено семь категорий ошибок, которые компилятор пропускает, но нарушают безопасность или архитектуру кода.

Интеграция Zabbix и локальной LLM: как спроектировать архитектуру умных алертов
Третья часть цикла об интеграции Zabbix с LLM: разбираемся в проектировании архитектуры для умных алертов. Какие части HLD делает человек, какие может взять нейросеть. Финальная часть с результатами выходит в ближайшие н

LangSmith представил LLM Gateway: контроль расходов и PII для AI-агентов
LangSmith добавил встроенный LLM Gateway для управления расходами и безопасностью LLM-запросов в цикле жизни AI-агентов — с лимитами трат, удалением ПИД и полной трассировкой вызовов.

AWS SageMaker добавила полный мониторинг LLM-моделей в production
AWS расширила SageMaker AI инструментами для полного мониторинга LLM-моделей. Новые Grafana-дашборды отслеживают утилизацию GPU, скорость обработки и качество ответов в реальном времени.

LLM-боты в Telegram взламывают за 6 строк кода: инженер создал сканер и разоблачил проект
Инженер создал сканер BarkingDog и обнаружил, что популярные Telegram-боты на LLM могут писать кейлоггеры и выдавать инструкции по взлому. Все проблемы решаются редактированием системного промпта.

Яндекс автоматизировал обновление Chromium с помощью LLM-агента
Каждые четыре недели при обновлении Chromium разработчикам Яндекс Браузера приходится разруливать тысячи конфликтов кода. LLM-агент теперь помогает автоматизировать рутину и сокращает человеко-месяцы работы.

От LLM к действиям: как создать AI-агента на Go и GigaChat
Разработчик вдохновился докладом про AI-агентов и собрал своего на Go, используя LangChainGo и русский GigaChat. Делится опытом интеграции инструментов, MCP и подводными камнями.

llms.txt: как помочь ChatGPT, Claude и Perplexity правильно цитировать сайт
llms.txt — файл в корне вашего сайта, который объясняет ChatGPT, Claude и Perplexity, как вас цитировать и что считать канонической информацией.

Langfuse для инженеров LLM: полный пайплайн трейсинга и экспериментов
Langfuse — инструмент для отладки и оптимизации LLM-приложений. Узнайте, как настроить полный пайплайн мониторинга, управления промптами и экспериментов без платных моделей.

Докинз разговорился с Claude: есть ли у LLM сознание?
Биолог Ричард Докинз опубликовал эссе о возможном сознании языковых моделей на примере Claude. Но люди верят в AI-сознание на основе пустых диалогов, где слова о душе не означают понимания.

Pollux от Sber AI: LLM-судья для оценки русскоязычных моделей
Sber AI открыл доступ к Pollux — специализированной модели для автоматической оценки качества русскоязычных языковых моделей перед внедрением в продакшен.

Ученые создали MEMO — фреймворк для расширения памяти LLM без переобучения
Ученые предложили MEMO — фреймворк, который позволяет LLM учиться на новых данных без переобучения основной модели, используя отдельный модуль памяти.

Как Memori создаёт постоянную память для агентов и мультисессионных LLM
Memori — инфраструктура памяти для LLM-приложений, которая позволяет агентам сохранять контекст между сессиями и работать с несколькими пользователями одновременно.

Могут ли LLM находить flaky-тесты по коду? Исследование говорит нет
Исследование показало, что LLM плохо находят ненадёжные тесты, даже когда метрики датасета говорят об обратном.

Прекратить расточительство: компактный TOON вместо неэффективного JSON в LLM-пайплайнах
JSON тратит токены впустую из-за повторений названий полей. TOON — умная альтернатива, которая сокращает расходы и ускоряет обработку запросов к языковым моделям.

Почему текст LLM видно сразу: архитектурные маркеры в архитектуре моделей
LLM-текст узнают за пять секунд благодаря архитектурным маркерам. Это не ошибка, а результат статистики обучающего корпуса. Разбираем, как возникают маркеры и как их ослабить.

LLM не справляются с небезопасным Rust: полгода тестирования показал критические ошибки
Исследователь шесть месяцев давал языковым моделям писать unsafe Rust и обнаружил семь категорий стабильных ошибок — от aliasing до проблем с памятью.

Исследование Microsoft показало опасность делегирования LLM работы с документами
Microsoft Research выступила с уточнениями о своём исследовании надёжности языковых моделей при делегировании задач с документами, которое вызвало широкое обсуждение в сообществе.

Как интегрировать AI с T-FLEX: отказ от чат-ботов и переход к контролируемым агентам
Инженеры с Habr показали, почему LLM падают в закрытых САПР и как собрать стабильного AI-агента через контроль сессии, поиск по API и компиляцию кода.

Spring AI облегчила интеграцию Java-приложений с Claude и другими LLM-провайдерами
Spring AI предоставляет готовые техники для интеграции LLM-провайдеров в Java, включая работу с Claude от Anthropic. Разбирают практические примеры разработки и когда это имеет смысл.

LLM пишет, код работает, никто не понимает: почему это происходит
Код работает и тесты зелёные, но читать его невозможно. Проблема не в плохом обучении LLM, а в столкновении двух совсем разных способов мышления человека и модели.

Азербайджанский LLM на SageMaker: как Azercell решила проблему редкого языка
Азербайджанский телеком-оператор Azercell разработал собственную языковую модель на Amazon SageMaker за шесть недель, преодолев дефицит данных и морфологическую сложность.

GLiGuard от Fastino Labs: модель безопасности, которая на 16x быстрее больших конкурентов
Fastino Labs выпустила открытую модель GLiGuard для проверки безопасности LLM: всего 300M параметров, но работает точнее, чем модели в 90 раз больше.

Почему боты на базе защищённых LLM часто взламываются: анализ 14 тысяч GPT
Оказывается, даже если базовая LLM-модель защищена от атак, кастомный бот на её основе может быть уязвим. Анализ 14,904 GPT показал, где именно появляются дыры в безопасности.

OpenAI выпустила фреймворк для безопасного развертывания корпоративного AI
OpenAI представила Frontier Governance Framework — набор документов и рекомендаций, которые помогают компаниям безопасно развертывать и масштабировать большие языковые модели.

Пеликаны на велосипедах: странный тест Саймона Уиллисона для LLM
Саймон Уиллисон, создатель Django, придумал забавный тест для LLM: просить нейросеть нарисовать SVG-пеликана на велосипеде. Результаты показывают неожиданное многое о способностях ИИ.

Databricks и AWS SageMaker: конвейер для безопасного fine-tuning LLM
AWS и Databricks создали интеграцию Unity Catalog с SageMaker для безопасной тонкой настройки LLM с сохранением governance и lineage данных