Поиск
Семантический + лексический поиск по AI‑новостям. Поддержка RU/EN/PT/ES/FR/AR.

Google внедряет генерацию музыки в мобильное приложение Gemini
Google расширяет возможности своего ИИ-помощника: теперь пользователи Gemini могут создавать музыку на основе текстовых запросов, фотографий и даже видеороликов.

Google добавила генератор музыки Lyria 3 в приложение Gemini
Google интегрировала нейросеть Lyria 3 в Gemini, позволяя создавать музыку из текста и видео. Теперь ИИ-помощник умеет писать саундтреки прямо в окне чата.

Gemini научился создавать музыку по текстовому описанию
Google интегрировал модель Lyria 3 в Gemini, позволяя генерировать музыкальные треки.

Gemini на Супербоуле: Google покупает ваше внимание за миллионы долларов
Google выводит Gemini на главную рекламную арену мира. Пока конкуренты спорят о параметрах моделей, поисковый гигант пытается достучаться до обычных людей через телевизоры.

Gemini 3 Deep Think теперь создает готовые модели для 3D-печати
Новая нейросеть от Google научилась генерировать файлы в формате STL. Теперь для создания физического объекта достаточно текстового описания без сложного моделирования.

Реклама в ChatGPT и прорыв Gemini: главные события недели в мире ИИ
OpenAI внедряет рекламу, Google расширяет возможности Gemini, а Z.AI выпускает сверхлегкую модель для кодинга. Разбираем ключевые тренды и релизы третьей недели января 2026 года.

Gemini научился создавать музыку по тексту и фото
Google интегрировала в Gemini модель Lyria 3 — теперь любой пользователь может генерировать 30-секундные треки по описанию или изображению.

Сравнение ИИ-гигантов: кто победил в реальном стресс-тесте?
Забудьте о бенчмарках. Мы проверили ChatGPT 5.2, Gemini 3 Pro и Claude Opus 4.6 в пяти раундах жестких испытаний: от сложной логики до создания игр в одном файле.

Ant Group представила Ming-flash-omni 2.0: открытый мультимодальный прорыв
Ant Group выложила в открытый доступ Ming-flash-omni 2.0. Это первая модель, создающая голос, музыку и звуки в одном потоке, обходя Gemini 2.5 Pro в ключевых тестах.

Ant Group открыла исходный код мультимодальной модели Ming-Flash-Omni 2.0
Ant Group представила Ming-Flash-Omni 2.0. Новая модель с открытым кодом бросает вызов Gemini 2.5 Pro, предлагая продвинутую работу с текстом, изображениями и голосом в единой системе.

От скучных списков к «Вау-эффекту»: как автоматизировать творческий мозговой штурм
Стандартные LLM часто выдают банальные идеи для нейминга и маркетинга. Рассказываем, как преодолеть ограничения ChatGPT и Gemini, чтобы получить по-настоящему оригинальный результат.

ИИ-зоопарк 2026: как не сойти с ума от изобилия инструментов
В 2026 году нейросети стали обыденностью, но выбирать их стало сложнее. Мы разобрали 25 сервисов, чтобы вы не тратили время на цифровой мусор.

Голос вместо текста: ElevenLabs ставит на смерть клавиатуры
Гендиректор ElevenLabs уверен: мы перестанем печатать и начнем говорить. Гиганты вроде Apple и Google уже готовят почву для голосовой революции, а экраны могут стать вторичными.

Видео-стартап Runway AI оценили в 5,3 миллиарда долларов
Runway привлекла 315 миллионов долларов инвестиций. Оценка компании взлетела до 5,3 миллиарда долларов на фоне бума генеративных видеотехнологий и высокого интереса инвесторов к ИИ-сектору.

Luma запускает креативных AI-агентов на базе моделей «единого интеллекта»
Компания Luma представила платформу AI-агентов, способных координировать несколько систем искусственного интеллекта и создавать полноценный контент — от текста и изображений до видео и аудио.

Нейросети-переводчики 2026: как DeepL и GPT-5.2 окончательно похоронили словари
Забудьте про «прохладные истории». В 2026 году ИИ переводит не слова, а контекст и культурные коды. Разбираемся, какие инструменты реально работают, а какие — просто маркетинг.

Prism: LaTeX подружили с GPT-5.2, чтобы ученые наконец-то перестали страдать
Исследователи получили бесплатный воркспейс Prism, где GPT-5.2 пишет код и проверяет логику. Конец эпохи мучительной верстки формул и поиска ошибок в доказательствах близок.

Google Photos: теперь вы диктуете ИИ, как должны оживать ваши снимки
Google открывает текстовое управление видеоэффектами в Photos. Больше никаких случайных анимаций — теперь всё по вашему сценарию.

Инженеры Hugging Face написали практикум по генеративному ИИ: от трансформеров до тонкой настройки
Новая книга от команды Hugging Face обещает превратить генеративный ИИ из чёрного ящика в понятный рабочий инструмент. Разбираем, почему это важно для индустрии и кому стоит читать.

Google Veo 3.1 научился превращать портретные фото в вертикальные видео
Google обновила свою модель генерации видео Veo 3.1: теперь она лучше следует референсным изображениям, поддерживает вертикальный формат и умеет повышать разрешение. Эпоха AI-видео для соцсетей становится реальностью.