«Сбер» представил Kandinsky 2.1 — улучшенную версию своей нейросети, которая позволяет генерировать картинки по текстовым запросам. Кроме того, ИИ способен смешивать несколько изображений, а еще создавать их на основе другого.
Воспользоваться нейросетью можно на сайте «Сбера», а также с помощью команды «Запусти художника» на умных устройствах компании, в приложении «Салют», на платформах ML Space, Fusion Brain и в Telegram-боте.
Модель дополнительно обучили — в предыдущей версии было 2 млрд параметров, а в новой их уже 3,3 млрд. Кроме того, нейросеть стала лучше генерировать картинки в высоком разрешении — это касается, например, лиц и других сложных объектов.
Нейросеть поддерживает запросы на 101 языке, среди которых русский и английский. Ее обучали исследователи Sber AI и ученые из Института искусственного интеллекта AIRI на объединенном датасете Sber AI и SberDevices. «Сбер» представил Kandinsky в июне прошлого года, а в ноябре компания показала версию 2.0.
Почему это актуально?
Недавно компания Midjourney закрыла бесплатный доступ к своей нейросети, которая позволяет создавать изображения. Основатель организации Дэвид Хольц объяснил, что такая мера вызвана «злоупотреблениями» пользователей — они стали массово генерировать фейковые картинки. Бесплатный доступ закрыли до следующих улучшений Midjourney.
Хочешь быть в курсе главных новостей про инновации и технологии? Подписывайся на нашу рассылку и telegram-канал INNOVATIONS!