NVIDIA Developer Blog
Источник AI-новостей. Материалы автоматически отбираются и адаптируются редакцией Hamidun News.
Последние публикации

Google DeepMind представила DiffusionGemma для быстрой генерации текста на NVIDIA
Google DeepMind оптимизировала новую модель DiffusionGemma для NVIDIA платформ, чтобы ускорить real-time генерацию текста в чатах, копилотах и агентах.

NVIDIA MCG Toolkit автоматизирует документацию AI-моделей под новые регуляции
NVIDIA представляет инструмент для автоматизации документации AI-моделей, который помогает командам соответствовать требованиям регуляторов вроде EU AI Act и создавать проверяемые model cards без ручного труда.

NVIDIA представила DynoSim для оптимизации параметров LLM serving
NVIDIA представила DynoSim — инструмент для автоматической оптимизации конфигурации обслуживания больших языковых моделей через симуляцию Pareto frontier.

NVIDIA RTX представила DLSS 4.5 и многоязычных AI-персонажей для игр
NVIDIA представила обновление RTX с поддержкой многоязычных AI-персонажей через ACE и новый DLSS 4.5 для Unreal Engine, упрощая разработку игр с ИИ.

NVIDIA RTX PRO 4500 Blackwell: ускорение геномики и моделирования белков
NVIDIA выпустила видеокарту RTX PRO 4500 Blackwell для ускорения геномных вычислений и моделирования белков — ключевых компонентов точной медицины.

Новый CompileIQ NVIDIA находит скрытый потенциал GPU-ядер через подбор параметров компилятора
NVIDIA представила CompileIQ — инструмент с AI, который автоматически подбирает оптимальные параметры компилятора для максимальной производительности GPU-ядер, находя ускорения там, где ручная оптимизация уже исчерпана.

NVIDIA CUDA 13.3 упрощает разработку на GPU с Tile programming в C++
NVIDIA выпустила CUDA 13.3 с Tile programming в C++, который автоматизирует оптимизацию низкоуровневых операций с памятью GPU для разработчиков.

NVIDIA Blackwell установила рекорд STAC-AI в финансовом AI-трейдинге
Архитектура NVIDIA Blackwell показала лучшую производительность в тесте STAC-AI для финансового AI, обработав больший объём данных быстрее всех конкурентов.

NVIDIA добавила CUDA Tile для оптимизации GPU-ядер на C++
NVIDIA представила встроенную в C++ технологию CUDA Tile для разработки высокопроизводительных GPU-ядер на основе тайл-ориентированного подхода.

NVIDIA Dynamo Snapshot: ускорение запуска моделей на Kubernetes
NVIDIA представила инструмент для сокращения времени загрузки моделей вывода на Kubernetes с минут до секунд — решение для избежания потерь GPU при скачках трафика.

StepFun представила Step 3.7 Flash на GPU NVIDIA для мультимодальной работы
StepFun запустила Step 3.7 Flash — мультимодальную AI-модель на 198 млрд параметров, которая одновременно работает с текстом, изображениями, видео и документами на NVIDIA-ускорителях.

NVIDIA помогает телеком-компаниям развернуть суверенные AI-фабрики с токен-метрингом
Телеком-компании строят суверенные AI-инфраструктуры на архитектуре NVIDIA Cloud Partner, используя token-metering для контролируемого доступа — подход к масштабируемым, высокомаржинальным сервисам для правительств и пре

NVIDIA GB200: экзасфальные вычисления в стойке через умное планирование задач
NVIDIA показала, как максимизировать производительность GB200 NVL72 через Slurm с учётом топологии сети — результаты демонстрируют экзасфальные вычисления на одной стойке.

NVIDIA рассказала, как отслеживать GPU в Kubernetes-кластерах
Большинство команд недоиспользуют GPU в Kubernetes-кластерах, потому что просто не видят, кто ими пользуется, сколько памяти занято и зависают ли контейнеры.

NVIDIA показала, как многоагентные системы находят сигналы на финрынках
Многоагентные системы ИИ помогают исследователям автоматизировать поиск торговых сигналов в рыночных данных, анализируя цены, экономические показатели и альтернативные источники для выявления скрытых паттернов.

NVIDIA открыла инструмент для генерации 3D медицинских снимков
NVIDIA представила фреймворк NV-Generate-CTMR для автоматического синтеза реалистичных 3D медицинских изображений, решая дефицит данных в радиологии и ускоряя обучение обобщённых AI-моделей.

NVIDIA Vera Rubin: как разработчики будут масштабировать агентский ИИ без задержек
NVIDIA представила Vera Rubin — платформу для масштабирования агентского ИИ, которая комбинирует GPU Vera Rubin NVL72 и ускоритель Groq 3 LPX для достижения 400 токенов в секунду на триллион-параметрных моделях.

NVIDIA показала различие между оценкой моделей и оценкой AI-агентов
Бенчмарки моделей и оценка агентов решают разные задачи: первые тестируют понимание языка, вторые — реальное поведение системы в действии.

NVIDIA разработала систему верификации skills для управления AI-агентами
NVIDIA представила подход к верификации и управлению skills — инструкциями, которые использует AI-агент. Это позволяет организациям безопасно масштабировать автономные системы.

NVIDIA выпустила AI-Q для глубоких исследований в агентских фреймворках
NVIDIA представила AI-Q — специализированный компонент для делегирования сложных исследований отдельному backend. Поддерживает корпоративные данные через MCP и работает с Claude Code, Codex и другими агентами.

Как NVIDIA рекомендует адаптировать AI-агентов под специфические задачи
Публикация от NVIDIA разбирает 9 техник кастомизации: универсальную модель нужно адаптировать под логистику, поддержку клиентов, кодогенерацию. Правильная настройка снижает галлюцинации и стоимость.