Tencent выпустила Hunyuan3D — нейросеть для генерации 3D-моделей

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.

Китайская компания Tencent представила открытую модель машинного обучения Hunyuan3D, предназначенную для генерации 3D-моделей. В качестве входных данных можно использовать текстовые запросы или изображения.

Разработчики проекта рассказали, что популярные модели для генерации работают медленно и плохо понимают, что от них хотят. Это одна из причин, по которой их до сих пор не используют повсеместно в работе над реальными проектами. Команда Tencent попыталась решить эту проблему с помощью разделения генерации 3D-модели на несколько этапов.

На первом этапе разработчики используют диффузионную модель, которая генерирует несколько RGB-изображений объекта с разных сторон. Это нужно для того, что зафиксировать детали объекта и понимать, какой должна быть итоговая модель. Как сообщают авторы проекта, этот этап занимает всего четыре секунды, если запускать процесс на подходящем для этого железе.

Второй этап нужен для того, чтобы из нескольких сгенерированных изображений собрать один трёхмерный объект. Нейросеть, которая отвечает за это, учитывает искажения и шумы, которые появляются во время работы диффузионной модели. Отмечается, что в качестве запросов к нейросети можно использовать изображения или текстовые промпты. Запросы можно составлять на английском и китайском языках.

Hunyuan3D можно запустить локально, но для этого потребуется 40 ГБ видеопамяти. Некоторые пользователи отмечают, что нейросеть работает и с 20 ГБ VRAM на Nvidia RTX 3090.

Инференс для генерации на основе текстового запроса:

python3 main.py \
    --text_prompt "a lovely rabbit" \
    --save_folder ./outputs/test/ \
    --max_faces_num 90000 \
    --do_texture_mapping \
    --do_render

Инференс для генерации на основе изображения:

python3 main.py \
    --image_prompt "/path/to/your/image" \
    --save_folder ./outputs/test/ \
    --max_faces_num 90000 \
    --do_texture_mapping \
    --do_render

Источник: https://habr.com/ru/news/857768/


Интересные статьи

Интересные статьи

Сегодня создание и поддержка веб-сайта стали неотъемлемой частью бизнеса. Если вы занимаетесь электронной коммерцией, ведете блог или разрабатываете корпоративный портал, вам потребуется надежная и фу...
Привет, Хабр! Нас давно занимает вопрос, как в компаниях обстоят дела с информационной безопасностью в IT. Так что мы решили спросить у пользователей Хабра: что там у вас с ИБ?
Доброго времени суток. При работе с Bitrix-инфраструктурой в определенный момент вы можете столкнуться с проблемой увеличения времени открытия различных страниц на вашей площадке (сайте), медленн...
Приветствую вас (лично вас, а не всех кто это читает)! Сегодня мы: Создадим приложение (навык) Алисы с использованием нового (октябрь 2019) сервиса Yandex Cloud Functions. Настроим н...
В этой статье мы сделаем детальный обзор возможностей 3CX v16. Новая версия АТС предлагает различные улучшения качества обслуживания клиентов и повышение производительности труда сотрудников. В т...