Google представил исследование «Создание высокоточных изображений с использованием моделей диффузии»



Источник – ai.googleblog.com 

Google представил технологию, которая позволяет повышать разрешение изображения в 16 раз без потери качества. Компания обнаружила, что результаты нового подхода превосходят все существующие технологии.

Специалисты Google Brain Team натренировали модель машинного обучения превращать фотографии низкого разрешения в детализированные изображения практически без потери качества. Новое решение скомбинировало два подхода: SR3 (Super-Resolution via Repeated Refinement) и CDM (class-conditional diffusion model). 

Изображение к новости Google представил исследование «Создание высокоточных изображений с использованием моделей диффузии»

Технология SR3 создает изображение с высоким разрешением из шума, опираясь на исходную картинку с низким разрешением. Модель обучается методам постепенного искажения изображения, а затем алгоритм обращает процесс вспять, постепенно удаляя шум и адаптируя модели денойзера, руководствуясь исходной картинкой с низким разрешением. Наилучшие результаты SR3 демонстрирует при масштабировании портретов и снимков природы.

Далее в процессе масштабирования используется технология CDM. Она дополняет генерируемое изображение высокого разрешения новыми данными и предлагает каскадный подход. Сначала генерирует данные с низким разрешением, а затем постепенно повышает разрешение сгенерированного изображения до самого высокого значения.

Безусловно, это способно в дальнейшем значительно повлиять на качество контента.

Поделиться:

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: