Поиск
Семантический + лексический поиск по AI‑новостям. Поддержка RU/EN/PT/ES/FR/AR.

AprielGuard: Новый рубеж защиты LLM от угроз и атак
Представлена AprielGuard, инновационная система защиты больших языковых моделей (LLM) от уязвимостей и атак. Разбираемся, как она работает и почему это важно.

ChemEval: Новый эталон для оценки химических больших языковых моделей
Команда из Китайского научно-технического университета и iFlytek представила ChemEval, комплексный набор тестов для оценки способностей больших языковых моделей в области химии.

Безопасны ли передовые большие языковые модели? Новый отчет.
Фуданьский университет и Шанхайский институт креативного интеллекта опубликовали отчет о безопасности шести ведущих больших языковых моделей. Подробности в статье.

ICLR 2026: UIUC нашла способ остановить «чрезмерное обдумывание» LLM одной строкой кода
Исследователи из UIUC (University of Illinois Urbana-Champaign) предложили метод, позволяющий значительно повысить эффективность работы больших языковых моделей (LLM), сократив избыточное потребление вычислительных ресур

Годовщина R1: DeepSeek Model 1 незаметно появляется на горизонте
DeepSeek отмечает годовщину R1 выпуском Model 1. Что это значит для конкуренции в сфере больших языковых моделей? Краткий обзор.

Идеальная сортировка данных в LLM: алгоритмы против наивности
Как заставить LLM эффективно сортировать данные? Сравнение пяти методов на 164 постах Telegram-канала. Результат удивит!

Open-source LLM для юристов: эксперимент Рег.облака и Raft
Как open-source LLM справляются с юридическими документами? Эксперимент Рег.облака и Raft раскрывает ограничения и инженерные решения.

Новый LLM меняет правила подготовки данных и возглавляет Hugging Face
Инновационный LLM-подход к подготовке данных для обучения нейросетей произвел фурор в сообществе, заняв первое место в рейтинге самых популярных исследований на Hugging Face. Что это значит для будущего AI?

TruLens: как перестать доверять LLM вслепую и начать измерять качество
Языковые модели всё ещё остаются чёрными ящиками для большинства разработчиков. TruLens предлагает инструментарий, который делает каждый шаг работы LLM прозрачным и измеримым — от входных данных до финального ответа.

Ян ЛеКун против LLM: ставка на другой подход к ИИ
Основатель сверточных нейросетей Ян ЛеКун критикует LLM и предлагает альтернативный путь развития ИИ. Почему его мнение важно и что он предлагает?

Сравнение LLM Embeddings, TF-IDF и Bag-of-Words в Scikit-learn
Разбираемся, какой метод векторизации текста — от классического TF-IDF до современных эмбеддингов — лучше всего подходит для алгоритмов машинного обучения в Scikit-learn.

Действительно ли нейросети умеют рассуждать? Исследование структурных ошибок в логике LLM
Новый научный анализ ставит под сомнение способность ИИ к логическому мышлению, выявляя критические уязвимости в структуре выводов популярных моделей.

Субъектные AI-агенты: LLM как инструмент, а не хозяин
Новый подход к архитектуре AI-агентов позволяет им осознанно использовать LLM, а не слепо следовать заданным инструкциям. Революция в автономности?

Прорывные Графовые Нейронные Сети: Что Ждать в 2026 Году
Обзор пяти ключевых прорывов в графовых нейронных сетях, которые определят развитие ИИ в ближайшие годы. Интеграция с LLM и научные открытия.

Внутренний диалог LLM: как модели имитируют коллективный разум
Исследователи обнаружили, что современные LLM не просто рассуждают, а ведут внутренний диалог, имитируя многостороннее обсуждение. Что это значит для будущего AI?

LLM-in-Sandbox: Даем нейросети свой компьютер, чтобы она перестала галлюцинировать код
Пока мы спорим о качестве текстов, исследователи запирают ИИ в 'песочнице' и дают полный доступ к ОС. Шаг к настоящим автономным агентам или просто сложный калькулятор?

К 2026 году: Большие языковые модели ждет прорыв в обучении и памяти
Аналитики прогнозируют значительный прогресс больших языковых моделей (LLM) в ближайшие годы. Ожидается прорыв в области обучения с подкреплением, улучшения памяти моделей и оптимизации контекста. Это приблизит нас к AGI

NVIDIA представила KVTC: технология сжатия кэша LLM в 20 раз ускорит работу нейросетей
Исследователи NVIDIA представили KVTC — инновационный метод сжатия KV-кэша. Технология позволяет сократить потребление памяти в 20 раз, решая главную проблему масштабирования языковых моделей.

Google запустила Android Bench для оценки ИИ в мобильной разработке
Google открыла доступ к Android Bench — первому специализированному инструменту для проверки навыков больших языковых моделей в разработке приложений под Android.

Приём заявок на воркшоп CVPR 2026: Безопасность мультимодальных агентов
Открыт приём заявок на шестой воркшоп AdvML@CV, посвящённый безопасности мультимодальных больших языковых моделей-агентов. Исследования в области защиты от атак и повышения надёжности.

OAT: как токенизация действий приближает роботов к возможностям LLM
Новый метод OAT позволяет роботам эффективнее планировать действия, используя подходы, аналогичные большим языковым моделям. Это открывает двери для масштабирования и гибкого управления роботами.

Черный ящик LLM: почему мы до сих пор не понимаем, как они думают
Разбираемся, почему современные языковые модели остаются загадкой даже для создателей и как исследователи пытаются заглянуть им «под капот» через методы интерпретируемости.

Tencent открывает исходный код ключевых технологий AI Infra Hunyuan
Команда Tencent Hunyuan AI Infra представила HPC-Ops, библиотеку ключевых операторов для высокопроизводительного вывода LLM производственного уровня с открытым исходным кодом. Это может значительно повысить эффективность

Бронежилет для нейросети: почему вашей LLM мало одного фильтра безопасности
Пока хакеры придумывают новые способы обмануть ChatGPT, разработчики строят многослойную оборону. Разбираемся, как защитить модель от адаптивных атак и не сойти с ума.

Кембридж и Бэйхан создали систему «бесшумной речи» с ИИ
Новая разработка объединяет носимые датчики, анализирующие вибрации мышц и пульс, с большими языковыми моделями для распознавания речи без звука. Прорыв в области коммуникаций?

Нейросеть как машина времени: зачем LLM учат думать по-старинному
Что если ограничить знания языковой модели рамками конкретной эпохи — скажем, 1650-го или 1912-го года? Оказывается, такой подход открывает неожиданные горизонты для науки, образования и понимания того, как менялось чело

Сублиминальное обучение: нейросети помнят забытое?
Почему дообучение не гарантирует удаления нежелательной информации? Эксперименты показывают: топология весов сохраняется, даже при активном забывании.

Гэри Маркус против Nature: почему слухи о приходе AGI преждевременны
Известный критик ИИ Гэри Маркус утверждает, что современные языковые модели — это лишь сложная статистическая аппроксимация, а не настоящий общий интеллект.

Энтузиаст создал персональный аналог Cursor с помощью Claude и Google
История о том, как отказаться от платных подписок и создать собственный инструмент для разработки, используя только бесплатные API и чат-ботов без написания кода вручную.

Logical Intelligence: Ян Лекун строит AGI без галлюцинаций и LLM
Пока OpenAI и Google сжигают миллиарды на обучение чат-ботов, стартап Logical Intelligence решил, что LLM — это тупик. Они строят разум, который понимает физику мира.