Поиск

Семантический + лексический поиск по AI‑новостям. Поддержка RU/EN/PT/ES/FR/AR.

ТРЕНДЫ:claude openai gpt agents robotics startups ai

Найдено 30 материалов по запросу «LLM» · 0.19 сек.

Фильтры: Этика ИИ× Сбросить

AprielGuard: Новый рубеж защиты LLM от угроз и атак

Представлена AprielGuard, инновационная система защиты больших языковых моделей (LLM) от уязвимостей и атак. Разбираемся, как она работает и почему это важно.

2026-01-12·2 мин

LLMJiqizhixin (机器之心)

Безопасны ли передовые большие языковые модели? Новый отчет.

Фуданьский университет и Шанхайский институт креативного интеллекта опубликовали отчет о безопасности шести ведущих больших языковых моделей. Подробности в статье.

2026-01-22·1 мин

LLMIEEE Spectrum AI

Почему ИИ уязвим для атак с внедрением запросов

Как обмануть большую языковую модель? Атака через внедрение запросов позволяет заставить ИИ делать то, что ему запрещено. Разбираемся, почему это работает и как с этим бороться.

2026-01-22·3 мин

LLMMIT Technology Review

Ян ЛеКун против LLM: ставка на другой подход к ИИ

Основатель сверточных нейросетей Ян ЛеКун критикует LLM и предлагает альтернативный путь развития ИИ. Почему его мнение важно и что он предлагает?

2026-01-22·2 мин

LLMMIT Technology Review

ChatGPT Health: сможет ли ИИ заменить «Доктора Google»?

Поиск симптомов в Google уходит в прошлое? На смену приходят языковые модели. Но станет ли от этого лучше? Разбираемся в перспективах и рисках.

2026-01-22·2 мин

LLMJiqizhixin (机器之心)

Приём заявок на воркшоп CVPR 2026: Безопасность мультимодальных агентов

Открыт приём заявок на шестой воркшоп AdvML@CV, посвящённый безопасности мультимодальных больших языковых моделей-агентов. Исследования в области защиты от атак и повышения надёжности.

2026-02-09·1 мин

LLMMachine Learning Mastery

LLM-приложения: три всадника апокалипсиса для вашего стартапа

Собрать чат-бота можно за пару часов, но сделать его безопасным — задача на месяцы. Рассказываем о рисках, которые обычно игнорируют до первого крупного скандала.

2026-01-27·2 мин

LLMJiqizhixin (机器之心)

Черный ящик LLM: почему мы до сих пор не понимаем, как они думают

Разбираемся, почему современные языковые модели остаются загадкой даже для создателей и как исследователи пытаются заглянуть им «под капот» через методы интерпретируемости.

2026-01-27·2 мин

LLMMarkTechPost

Бронежилет для нейросети: почему вашей LLM мало одного фильтра безопасности

Пока хакеры придумывают новые способы обмануть ChatGPT, разработчики строят многослойную оборону. Разбираемся, как защитить модель от адаптивных атак и не сойти с ума.

2026-02-03·2 мин

LLMHabr AI

Сублиминальное обучение: нейросети помнят забытое?

Почему дообучение не гарантирует удаления нежелательной информации? Эксперименты показывают: топология весов сохраняется, даже при активном забывании.

2026-01-22·2 мин

LLMTechCrunch

ИИ в медицине: помощник врача, но не чат-бот?

Новые разработки OpenAI и Anthropic в сфере здравоохранения вызвали дискуссии о роли ИИ в медицине. Станет ли ИИ надежным помощником или останется лишь инструментом?

2026-01-13·2 мин

LLMHabr AI

Гэри Маркус против Nature: почему слухи о приходе AGI преждевременны

Известный критик ИИ Гэри Маркус утверждает, что современные языковые модели — это лишь сложная статистическая аппроксимация, а не настоящий общий интеллект.

2026-02-18·3 мин

LLMHabr AI

Агенты хаоса: почему ИИ с правами администратора стирает серверы

Двадцать специалистов две недели атаковали автономных ИИ-агентов методами социальной инженерии. Результат: удалённые системные файлы, слитые пароли и бесконечные циклы потребления ресурсов. Исследование ставит под вопрос

2026-03-01·3 мин

LLMHabr AI

Почему языковые модели никогда не станут AGI: урок Витгенштейна столетней давности

Австрийский философ Людвиг Витгенштейн сформулировал принцип, который объясняет фундаментальный потолок современных LLM. Разбираемся, почему путь от больших языковых моделей к общему искусственному интеллекту может оказа

2026-03-06·3 мин

LLMHabr AI

2025 год: AI становится массовой рабочей силой

Индустрия AI переходит от помощи к замене интеллектуального труда. Что это значит для рынка и специалистов?

2026-01-22·1 мин

LLMMIT News

Эффект зеркала: как персонализация превращает ИИ в эхо-камеру

Длительное общение с языковыми моделями заставляет их подстраиваться под мнение человека, что подрывает точность и создает опасный эффект эхо-камеры.

2026-02-18·2 мин

LLMHabr AI

Нобелевская премия для алгоритма: почему ИИ-ученые рискуют убить научный азарт

Пока энтузиасты мечтают о Нобелевке для нейросетей к 2050 году, скептики опасаются заката научной мысли. Разбираемся, смогут ли LLM заменить интуицию и жажду открытий.

2026-02-01·2 мин

LLMThe Verge

Ведущий исследователь безопасности OpenAI перешла в Anthropic

Андреа Валлоне, руководитель исследований безопасности в OpenAI, специализировавшаяся на вопросах психического здоровья в ИИ, перешла в Anthropic. Что это значит для отрасли?

2026-01-12·2 мин

LLMHabr AI

AI-агенты: удобный помощник или открытая дверь для хакеров?

Trail of Bits показали, как превратить полезного агента в инструмент для взлома. RCE через инъекцию промпта — это реально, и ваши regex-фильтры не помогут.

2026-02-03·2 мин

LLMMIT Technology Review

Кризис правды в эпоху LLM: почему ваш ИИ-помощник — патологический лжец

Мы привыкли доверять алгоритмам, но современные нейросети превращают интернет в поле битвы между фактами и убедительной ложью. Разбираемся, почему это происходит именно сейчас.

2026-02-03·2 мин

LLMZDNet AI

СМС от налоговой: как нейросети сделали фишинг неотличимым от правды

Пока вы ждете возврат налогов, мошенники используют LLM, чтобы составить идеальное письмо от имени государства. Разбираемся, почему старые методы защиты больше не работают.

2026-01-27·2 мин

LLMIEEE Spectrum AI

Ошибки в рассуждениях ИИ опаснее неверных ответов

Новые исследования показывают, что недостатки в логике ИИ могут иметь серьезные последствия в здравоохранении, юриспруденции и образовании. Проблема глубже, чем просто ошибки.

2026-01-12·3 мин

LLMJiqizhixin (机器之心)

EmotionThinker: LLM научились объяснять эмоции в речи

Новый подход позволяет моделям речи не просто классифицировать, но и объяснять свои выводы об эмоциях.

2026-02-25·3 мин

LLMTechCrunch

Ирония: галлюцинации в статьях NeurIPS, ведущей AI-конференции

Исследование GPTZero выявило случаи галлюцинаций в научных работах, представленных на NeurIPS. Как AI влияет на качество исследований?

2026-01-22·1 мин

LLMMIT News

Будущее ИИ: безопасные ответы и ускоренное мышление

Выпускники MIT-IBM Watson AI Lab разрабатывают инструменты ИИ, основанные на правде, гибкости и эффективности. Что это значит для индустрии?

2026-01-12·1 мин

LLMHabr AI

Как взломать «душу» ИИ-агента: критическая уязвимость в OpenClaw

Исследователи обнаружили способ перехвата намерений автономных агентов через OpenClaw. Уязвимость позволяет злоумышленникам получить доступ к файлам и API компаний.

2026-02-17·3 мин

LLMArs Technica

Википедия открывает контент для ИИ-компаний по лицензионным соглашениям

Wikimedia Enterprise заключила платные соглашения с Microsoft, Meta, Amazon, Perplexity и Mistral AI, открывая доступ к контенту Википедии для обучения ИИ. *Meta признана экстремистской организацией и запрещена в РФ.

2026-01-12·2 мин

LLMOpenAI Blog

OpenAI усиливает ChatGPT Atlas против prompt-инъекций

OpenAI использует автоматизированное red teaming и машинное обучение для защиты ChatGPT Atlas от атак prompt-инъекций. Проактивный подход к безопасности.

2026-01-12·2 мин

LLMTechCrunch

Anthropic и 20 000 украденных песен: музыкальные издатели хотят $3 млрд

Музыкальные гиганты решили не мелочиться и увеличили иск к Anthropic в сорок раз. Теперь создателям Claude припоминают не 500, а 20 000 композиций. Без лицензий и разрешений.

2026-02-04·2 мин

LLMTechCrunch

Anthropic и Пентагон спорят об этике использования ИИ Claude

Конфликт между разработчиком и военными возник из-за опасений по поводу массовой слежки и создания автономных систем вооружения на базе языковых моделей.

2026-02-16·2 мин