Поиск
Семантический + лексический поиск по AI‑новостям. Поддержка RU/EN/PT/ES/FR/AR.

AprielGuard: Новый рубеж защиты LLM от угроз и атак
Представлена AprielGuard, инновационная система защиты больших языковых моделей (LLM) от уязвимостей и атак. Разбираемся, как она работает и почему это важно.

Безопасны ли передовые большие языковые модели? Новый отчет.
Фуданьский университет и Шанхайский институт креативного интеллекта опубликовали отчет о безопасности шести ведущих больших языковых моделей. Подробности в статье.

Почему ИИ уязвим для атак с внедрением запросов
Как обмануть большую языковую модель? Атака через внедрение запросов позволяет заставить ИИ делать то, что ему запрещено. Разбираемся, почему это работает и как с этим бороться.

Ян ЛеКун против LLM: ставка на другой подход к ИИ
Основатель сверточных нейросетей Ян ЛеКун критикует LLM и предлагает альтернативный путь развития ИИ. Почему его мнение важно и что он предлагает?

ChatGPT Health: сможет ли ИИ заменить «Доктора Google»?
Поиск симптомов в Google уходит в прошлое? На смену приходят языковые модели. Но станет ли от этого лучше? Разбираемся в перспективах и рисках.

Приём заявок на воркшоп CVPR 2026: Безопасность мультимодальных агентов
Открыт приём заявок на шестой воркшоп AdvML@CV, посвящённый безопасности мультимодальных больших языковых моделей-агентов. Исследования в области защиты от атак и повышения надёжности.

LLM-приложения: три всадника апокалипсиса для вашего стартапа
Собрать чат-бота можно за пару часов, но сделать его безопасным — задача на месяцы. Рассказываем о рисках, которые обычно игнорируют до первого крупного скандала.

Черный ящик LLM: почему мы до сих пор не понимаем, как они думают
Разбираемся, почему современные языковые модели остаются загадкой даже для создателей и как исследователи пытаются заглянуть им «под капот» через методы интерпретируемости.

Бронежилет для нейросети: почему вашей LLM мало одного фильтра безопасности
Пока хакеры придумывают новые способы обмануть ChatGPT, разработчики строят многослойную оборону. Разбираемся, как защитить модель от адаптивных атак и не сойти с ума.

Сублиминальное обучение: нейросети помнят забытое?
Почему дообучение не гарантирует удаления нежелательной информации? Эксперименты показывают: топология весов сохраняется, даже при активном забывании.

ИИ в медицине: помощник врача, но не чат-бот?
Новые разработки OpenAI и Anthropic в сфере здравоохранения вызвали дискуссии о роли ИИ в медицине. Станет ли ИИ надежным помощником или останется лишь инструментом?

Гэри Маркус против Nature: почему слухи о приходе AGI преждевременны
Известный критик ИИ Гэри Маркус утверждает, что современные языковые модели — это лишь сложная статистическая аппроксимация, а не настоящий общий интеллект.

Агенты хаоса: почему ИИ с правами администратора стирает серверы
Двадцать специалистов две недели атаковали автономных ИИ-агентов методами социальной инженерии. Результат: удалённые системные файлы, слитые пароли и бесконечные циклы потребления ресурсов. Исследование ставит под вопрос

Почему языковые модели никогда не станут AGI: урок Витгенштейна столетней давности
Австрийский философ Людвиг Витгенштейн сформулировал принцип, который объясняет фундаментальный потолок современных LLM. Разбираемся, почему путь от больших языковых моделей к общему искусственному интеллекту может оказа

2025 год: AI становится массовой рабочей силой
Индустрия AI переходит от помощи к замене интеллектуального труда. Что это значит для рынка и специалистов?

Эффект зеркала: как персонализация превращает ИИ в эхо-камеру
Длительное общение с языковыми моделями заставляет их подстраиваться под мнение человека, что подрывает точность и создает опасный эффект эхо-камеры.

Нобелевская премия для алгоритма: почему ИИ-ученые рискуют убить научный азарт
Пока энтузиасты мечтают о Нобелевке для нейросетей к 2050 году, скептики опасаются заката научной мысли. Разбираемся, смогут ли LLM заменить интуицию и жажду открытий.

Ведущий исследователь безопасности OpenAI перешла в Anthropic
Андреа Валлоне, руководитель исследований безопасности в OpenAI, специализировавшаяся на вопросах психического здоровья в ИИ, перешла в Anthropic. Что это значит для отрасли?

AI-агенты: удобный помощник или открытая дверь для хакеров?
Trail of Bits показали, как превратить полезного агента в инструмент для взлома. RCE через инъекцию промпта — это реально, и ваши regex-фильтры не помогут.

Кризис правды в эпоху LLM: почему ваш ИИ-помощник — патологический лжец
Мы привыкли доверять алгоритмам, но современные нейросети превращают интернет в поле битвы между фактами и убедительной ложью. Разбираемся, почему это происходит именно сейчас.

СМС от налоговой: как нейросети сделали фишинг неотличимым от правды
Пока вы ждете возврат налогов, мошенники используют LLM, чтобы составить идеальное письмо от имени государства. Разбираемся, почему старые методы защиты больше не работают.

Ошибки в рассуждениях ИИ опаснее неверных ответов
Новые исследования показывают, что недостатки в логике ИИ могут иметь серьезные последствия в здравоохранении, юриспруденции и образовании. Проблема глубже, чем просто ошибки.

EmotionThinker: LLM научились объяснять эмоции в речи
Новый подход позволяет моделям речи не просто классифицировать, но и объяснять свои выводы об эмоциях.

Ирония: галлюцинации в статьях NeurIPS, ведущей AI-конференции
Исследование GPTZero выявило случаи галлюцинаций в научных работах, представленных на NeurIPS. Как AI влияет на качество исследований?

Будущее ИИ: безопасные ответы и ускоренное мышление
Выпускники MIT-IBM Watson AI Lab разрабатывают инструменты ИИ, основанные на правде, гибкости и эффективности. Что это значит для индустрии?

Как взломать «душу» ИИ-агента: критическая уязвимость в OpenClaw
Исследователи обнаружили способ перехвата намерений автономных агентов через OpenClaw. Уязвимость позволяет злоумышленникам получить доступ к файлам и API компаний.

Википедия открывает контент для ИИ-компаний по лицензионным соглашениям
Wikimedia Enterprise заключила платные соглашения с Microsoft, Meta, Amazon, Perplexity и Mistral AI, открывая доступ к контенту Википедии для обучения ИИ. *Meta признана экстремистской организацией и запрещена в РФ.

OpenAI усиливает ChatGPT Atlas против prompt-инъекций
OpenAI использует автоматизированное red teaming и машинное обучение для защиты ChatGPT Atlas от атак prompt-инъекций. Проактивный подход к безопасности.

Anthropic и 20 000 украденных песен: музыкальные издатели хотят $3 млрд
Музыкальные гиганты решили не мелочиться и увеличили иск к Anthropic в сорок раз. Теперь создателям Claude припоминают не 500, а 20 000 композиций. Без лицензий и разрешений.

Anthropic и Пентагон спорят об этике использования ИИ Claude
Конфликт между разработчиком и военными возник из-за опасений по поводу массовой слежки и создания автономных систем вооружения на базе языковых моделей.