Поиск

Семантический + лексический поиск по AI‑новостям. Поддержка RU/EN/PT/ES/FR/AR.

RU
ТРЕНДЫ:claudeopenai gptagentsroboticsstartups ai
AI‑ответ · на основе 12 источников

AI пока обучается отвечать на ваш запрос — приходите позже, мы постоянно улучшаем модель.

Источники: Habr AI, MarkTechPost, AWS Machine Learning Blog, +8 ещё
Найдено 30 материалов по запросу «LLM» · 0.19 сек.
Фильтры: Железо× Сбросить
llm-checker: утилита покажет, какие LLM потянет ваше железо
LLMHabr AI

llm-checker: утилита покажет, какие LLM потянет ваше железо

Новый CLI-инструмент сканирует GPU, RAM и процессор вашего компьютера, а затем честно говорит, какие из 35+ языковых моделей вы сможете запустить локально через Ollama — и насколько комфортно.

2026-02-24·3 мин
NVIDIA представила KVTC: технология сжатия кэша LLM в 20 раз ускорит работу нейросетей
LLMMarkTechPost

NVIDIA представила KVTC: технология сжатия кэша LLM в 20 раз ускорит работу нейросетей

Исследователи NVIDIA представили KVTC — инновационный метод сжатия KV-кэша. Технология позволяет сократить потребление памяти в 20 раз, решая главную проблему масштабирования языковых моделей.

2026-02-11·2 мин
AWS обновила контейнер для запуска больших языковых моделей: что изменилось и почему это важно
LLMAWS Machine Learning Blog

AWS обновила контейнер для запуска больших языковых моделей: что изменилось и почему это важно

Amazon Web Services выпустила крупное обновление контейнера Large Model Inference, обещая ощутимый прирост производительности и упрощённый деплой LLM. Разбираемся, что это значит для индустрии.

2026-02-26·3 мин
Большие языковые модели: почему запуск из коробки остаётся иллюзией
LLMHabr AI

Большие языковые модели: почему запуск из коробки остаётся иллюзией

Открытых LLM стало так много, что выбрать «рабочую лошадку» — отдельный квест. Но настоящие проблемы начинаются после скачивания: ни одна крупная модель не заводится без костылей даже на топовом железе.

2026-03-04·2 мин
Своя LLM в облаке: как уложиться в 16 ГБ видеопамяти
LLMHabr AI

Своя LLM в облаке: как уложиться в 16 ГБ видеопамяти

Расходы на API языковых моделей растут лавинообразно. Разработчики всё чаще ищут альтернативу — и находят её в self-hosted решениях, которые умещаются в одну видеокарту среднего класса.

2026-03-06·3 мин
LLM в Kubernetes: как приручить GPU и не разориться на железе
LLMHabr AI

LLM в Kubernetes: как приручить GPU и не разориться на железе

Запускать нейросети в облаке может каждый, а вот приручить собственный кластер — задача для сильных духом. Разбираемся, как Nova AI превращает Kubernetes в идеальный дом для LLM.

2026-02-06·2 мин
Тихая смерть GPU: почему ваша нейросеть убивает видеопамять прямо сейчас
LLMHabr AI

Тихая смерть GPU: почему ваша нейросеть убивает видеопамять прямо сейчас

Пока датчики показывают комфортные температуры, ваша видеопамять может медленно деградировать под нагрузкой LLM. Рассказываем, как Python-утилита спасает дорогое железо.

2026-02-02·2 мин
Qwen2.5 на бесплатном CPU: нейросети для тех, кто не хочет кормить облака
LLMHabr AI

Qwen2.5 на бесплатном CPU: нейросети для тех, кто не хочет кормить облака

Забудьте про дефицит видеокарт и счета за облака. Рассказываем, как запустить Qwen2.5 на бесплатном CPU и получить карманного ассистента за 15 минут.

2026-02-05·2 мин
OpenAI инвестирует $10 млрд в вычислительные мощности Cerebras
LLMTechCrunch

OpenAI инвестирует $10 млрд в вычислительные мощности Cerebras

OpenAI заключила сделку с Cerebras на $10 млрд для ускорения работы своих моделей. Что это значит для пользователей и индустрии?

2026-01-12·2 мин
DGX Spark с Qwen3: тест NVIDIA, который не всё рассказал
LLMHabr AI

DGX Spark с Qwen3: тест NVIDIA, который не всё рассказал

Анализируем возможности нового решения NVIDIA для LLM: когда 128 ГБ памяти — это мало.

2026-02-16·3 мин
DeepMind и «майнинг» функций активации: почему ReLU пора на пенсию
LLMJiqizhixin (机器之心)

DeepMind и «майнинг» функций активации: почему ReLU пора на пенсию

DeepMind превратила поиск математических формул в добычу криптовалюты. Рассказываем, как нейросети теперь сами ищут способ стать умнее и почему это изменит архитектуру LLM.

2026-02-07·2 мин
Pixel 10a: Google фальстартует, но спасет ли ИИ бюджетный сегмент?
LLMZDNet AI

Pixel 10a: Google фальстартует, но спасет ли ИИ бюджетный сегмент?

Google раньше времени засветила Pixel 10a. В эпоху, когда «умный телефон» означает «телефон с LLM», красивых фото уже мало. Разбираем, что нужно новинке для выживания.

2026-02-05·2 мин
NVIDIA QAD: как сжать модель в 4 бита и не потерять мозги
LLMHabr AI

NVIDIA QAD: как сжать модель в 4 бита и не потерять мозги

Новый метод QAD от NVIDIA решает проблему деградации LLM при квантовании. Теперь 4-битные модели сохраняют точность в математике и коде, работая на обычном железе.

2026-02-01·2 мин
Radeon AI PRO R9700: AMD пытается отнять хлеб у NVIDIA (и у нее получается)
LLMHabr AI

Radeon AI PRO R9700: AMD пытается отнять хлеб у NVIDIA (и у нее получается)

AMD выкатила Radeon AI PRO R9700 с 32 Гб памяти. Мы проверили, сможет ли «красный» чип реально потеснить доминирование NVIDIA в задачах LLM и генерации видео. Без купюр и маркетинга.

2026-02-02·2 мин
Siri 2.0: Apple признаёт поражение и зовёт на помощь Google
LLMBloomberg Tech

Siri 2.0: Apple признаёт поражение и зовёт на помощь Google

Apple перекраивает всё: от руководства до самой Siri. В планах — сразу две версии ассистента и неожиданный альянс с Google. Похоже, Тим Кук устал догонять.

2026-01-25·2 мин
Clawdbot: китайский ответ Ollama лишает NVIDIA монополии на запуск нейросетей
LLMJiqizhixin (机器之心)

Clawdbot: китайский ответ Ollama лишает NVIDIA монополии на запуск нейросетей

Локальный запуск LLM перестает быть развлечением для владельцев дорогих Mac. Встречайте китайский Clawdbot, который работает почти на любом железе без лишних капризов.

2026-02-03·2 мин
Ядерные LLM, китайские бенчмарки и политика измерений: главное из Import AI 446
LLMImport AI

Ядерные LLM, китайские бенчмарки и политика измерений: главное из Import AI 446

Новый выпуск влиятельного дайджеста Import AI поднимает три ключевые темы: использование ядерной энергии для дата-центров, амбициозный китайский бенчмарк для ИИ и простой, но эффективный подход к регулированию через изме

2026-02-23·3 мин
Sugon scaleX: 10 000 ускорителей в одной упряжке для китайских нейросетей
LLM36Kr (36氪)

Sugon scaleX: 10 000 ускорителей в одной упряжке для китайских нейросетей

Китайская Sugon переходит от слов к делу. Кластер scaleX на 10 000 карт готов штурмовать большие языковые модели. Рассказываем, почему это важно для мирового рынка.

2026-02-03·3 мин
Конгресс США намерен контролировать экспорт AI-чипов в Китай
LLMBloomberg Tech

Конгресс США намерен контролировать экспорт AI-чипов в Китай

После успеха Nvidia в Китае Конгресс США стремится получить контроль над продажами чипов для ИИ, что может привести к разногласиям с администрацией Трампа.

2026-01-22·2 мин
Китайский рынок на 2 триллиона: алгоритмы захватывают биржи Шанхая и Пекина
LLM36Kr (36氪)

Китайский рынок на 2 триллиона: алгоритмы захватывают биржи Шанхая и Пекина

Торговый оборот в Китае снова перевалил за 2 триллиона юаней. Пока инвесторы считают прибыль, ИИ-системы переваривают терабайты данных. Разбираемся в причинах.

2026-02-03·2 мин
Космический ЦОД Маска: миллион спутников против законов физики и здравого смысла
LLMHuXiu (虎嗅)

Космический ЦОД Маска: миллион спутников против законов физики и здравого смысла

Илон Маск планирует запустить миллион спутников для создания орбитального дата-центра. Разбираемся, зачем ИИ понадобился холодный вакуум и как это изменит индустрию.

2026-02-05·2 мин
Ветераны SpaceX привлекли 50 миллионов долларов на оптическую связь для ИИ
LLMTechCrunch

Ветераны SpaceX привлекли 50 миллионов долларов на оптическую связь для ИИ

Стартап Mesh планирует наладить массовое производство оптических трансиверов, чтобы устранить задержки при передаче данных в современных дата-центрах.

2026-02-17·2 мин
Юань против доллара: почему лишние 37 пунктов бьют по китайскому AI
LLM36Kr (36氪)

Юань против доллара: почему лишние 37 пунктов бьют по китайскому AI

Китайский центробанк снова корректирует курс. Рассказываем, почему падение юаня — это не просто цифры, а скрытый налог на импортные GPU для местных лабораторий.

2026-02-05·2 мин
Linux в 2026 году: почему вы наконец-то удалите Windows
LLMZDNet AI

Linux в 2026 году: почему вы наконец-то удалите Windows

Переход на Linux больше не подвиг ради приватности, а единственный способ заставить локальный ИИ работать быстро. Рассказываю, почему в 2026 году это лучший выбор.

2026-02-06·2 мин
TTT-Discover: Стенфорд и NVIDIA заставляют ИИ «думать» на ходу и обгонять ученых
LLMJiqizhixin (机器之心)

TTT-Discover: Стенфорд и NVIDIA заставляют ИИ «думать» на ходу и обгонять ученых

Стенфорд и NVIDIA представили TTT-Discover — алгоритм, который решает научные задачи вдвое быстрее людей-экспертов, используя дообучение прямо в процессе работы.

2026-01-28·2 мин
Китайский ЦБ заливает рынок ликвидностью: 75 миллиардов юаней на поддержку штанов (и чипов)
LLM36Kr (36氪)

Китайский ЦБ заливает рынок ликвидностью: 75 миллиардов юаней на поддержку штанов (и чипов)

Народный банк Китая (PBOC) продолжает закачивать деньги в систему через обратное репо. Разбираемся, почему это важно для техгигантов и локального рынка AI.

2026-02-02·2 мин
Sunrise S3: китайский ответ на «голод» видеопамяти и дорогую генерацию
LLM36Kr (36氪)

Sunrise S3: китайский ответ на «голод» видеопамяти и дорогую генерацию

Китайская Sunrise выпустила чип S3 с памятью LPDDR6. Обещают десятикратное снижение стоимости токенов для DeepSeek. Кажется, Nvidia придется потесниться на локальном рынке.

2026-01-28·2 мин
Simier: как китайский стартап пересаживает Apple и BYD на «чувствующие» чипы
LLM36Kr (36氪)

Simier: как китайский стартап пересаживает Apple и BYD на «чувствующие» чипы

Пока мир спорит об этике GPT, стартап Simier ломает архитектуру фон Неймана и захватывает заводы техногигантов. Эффективность против хайпа — кто победит в битве за край?

2026-02-03·2 мин
The Line: Саудовская Аравия меняет город-стену на гигантскую ферму GPU
LLMFuturism

The Line: Саудовская Аравия меняет город-стену на гигантскую ферму GPU

Небоскреб длиной 170 километров оказался слишком амбициозным даже для нефтедолларов. Теперь королевство пытается спасти имидж, заливая миллиарды в ИИ-инфраструктуру.

2026-01-28·2 мин
Токены по-китайски: как сэкономить 50% на API, когда рынок вырос в 300 раз
LLMJiqizhixin (机器之心)

Токены по-китайски: как сэкономить 50% на API, когда рынок вырос в 300 раз

Китай поглощает токены с пугающей скоростью, но платить за это готовы не все. Рассказываем, как выходцы из Цинхуа собираются обрушить цены на AI-инфраструктуру.

2026-02-02·2 мин