«Сбер» показал нейросеть, которая создает изображения по текстовому описанию 2 Ноября, Вторник

«Сбер» представил нейросеть ruDALL-E, которая может генерировать изображения на основе текстового описания на русском языке. Об этом пишет «Хабр».

Как объясняют разработчики, ruDALL-E предназначена для создания вариантов дизайна интерьера, стоковых изображений или векторных иллюстраций, материалов для рекламы, копирайтинга, архитектурного и промышленного дизайна. Нейросеть одновременно обучена на двух видах данных — картинках и текстах. Это позволяет ей создавать неограниченное число новых картинок по заданному описанию.

В настоящее время есть два варианта модели этой нейросети: ruDALL-E XL, которая содержит 1,3 миллиарда параметров, и ruDALL-E 12B с 12 миллиардами параметров. Моделью ruDALL-E XL можно пользоваться бесплатно уже сейчас. Она выложена в Github под лицензией Apache License 2.0. Обе модели также вскоре будут доступны на платформе ML Space.

Смотреть
все новости