Google представив дослідження «Створення високоточних зображень з використанням моделей дифузії»

Джерело – ai.googleblog .com

Google представив технологію, яка дозволяє підвищувати розширення зображення у 16 разів без втрати якості. Компанія виявила, що результати нового підходу перевершують всі існуючі технології.

Фахівці Google Brain Team натренували модель машинного навчання перетворювати фотографії низької роздільної здатності на деталізовані зображення практично без втрати якості. Нове рішення скомбінувало два підходи: SR3 (Super-Resolution via Repeated Refinement) і CDM (class-conditional diffusion model).

«Створення високоточних зображень з використанням моделей дифузії»

Технологія SR3 створює зображення з високою роздільною здатністю з шуму, спираючись на вихідну картинку з низьким розширенням. Модель навчається методам поступового спотворення зображення, а потім алгоритм звертає процес назад, поступово видаляючи шум і адаптуючи моделі денойзера, керуючись вихідною картинкою з низьким розширенням. Найкращі результати SR3 демонструє при масштабуванні портретів та знімків природи.

Далі в процесі масштабування використовується технологія CDM. Вона доповнює зображення високої роздільної здатності, що генерується, новими даними і пропонує каскадний підхід. Спочатку генерує дані з низьким розширенням, а потім поступово підвищує розширення згенерованого зображення до найвищого значення.

Безумовно, це може в подальшому значно вплинути на якість контенту.

Поділитися

Google представив дослідження «Створення високоточних зображень з використанням моделей дифузії»

Отримувати корисну інформацію