Перцептивно мотивированные функции потерь для компьютерных голографических дисплеев

Блог

ДомДом / Блог / Перцептивно мотивированные функции потерь для компьютерных голографических дисплеев

Jun 11, 2023

Перцептивно мотивированные функции потерь для компьютерных голографических дисплеев

Scientific Reports, том 12, номер статьи: 7709 (2022) Цитировать эту статью 3096 Доступов 2 Подробности об альтметрических метриках Понимание и улучшение воспринимаемого качества реконструированных изображений является ключевым моментом.

Научные отчеты, том 12, Номер статьи: 7709 (2022) Цитировать эту статью

3096 Доступов

2 Альтметрика

Подробности о метриках

Понимание и улучшение воспринимаемого качества реконструированных изображений является ключом к разработке алгоритмов компьютерной голографии для высококачественных голографических дисплеев. Однако современные алгоритмы обычно оптимизируются с использованием среднеквадратической ошибки, которую широко критикуют за плохую корреляцию с качеством восприятия. В нашей работе мы представляем комплексный анализ использования современных показателей качества изображения (IQM) в качестве функций потерь в процессе оптимизации голограмм. Обширная объективная и субъективная оценка экспериментально реконструированных изображений показывает относительную эффективность потерь IQM для оптимизации голограмм. Наши результаты показывают, что воспринимаемое качество изображения значительно улучшается при использовании соответствующей функции потерь IQM, что подчеркивает ценность разработки функций потерь, мотивированных на восприятие, для оптимизации голограмм.

Голография предлагает уникальную возможность управлять светом, что оказывает глубокое влияние на различные приложения: от оптических телекоммуникаций1, хранения данных2, микроскопии3 до двух- и трехмерных дисплеев4,5. Достижения в области алгоритмов и вычислительных мощностей позволили численно рассчитывать компьютерные голограммы (CGH) путем моделирования дифракции света и интерференции. Полученный CGH отображается на пространственном модуляторе света (SLM), который модулирует когерентное освещение для воспроизведения желаемых сцен. Целью алгоритмов CGH является вычисление голограммы, которая может отображаться на SLM и которая создает распределение интенсивности, которое наилучшим образом аппроксимирует желаемое изображение.

CGH обычно отображаются на нематических жидкокристаллических SLM, которые повышают превосходную светоотдачу, но ограничены модуляцией только фазы падающего луча. Чтобы решить ограничение только по фазе, налагаемое этими SLM, методы двойной фазы4,6 и диффузии ошибок7,8,9 напрямую кодируют дифракционные поля комплексной амплитуды в однофазные голограммы. Другой подход, известный как алгоритм одношагового восстановления фазы (OSPR)10,11, отображает несколько голограмм, состоящих только из фазы, в течение короткого интервала времени для статистического усреднения ошибок в поле воспроизведения. Обученные алгоритмы CGH на основе глубокого обучения также используются в качестве неитеративных решений12,13,14. Итерационные алгоритмы CGH, такие как прямой поиск (DS)15 и имитация отжига (SA)16, изменяют отдельные пиксели в голограмме, чтобы найти оптимальную голограмму. Также изучались методы фазового поиска, такие как алгоритм Герхберга-Сакстона (GS)17 и гибридный метод ввода-вывода (HIO)18,19.

Недавно метод градиентного спуска был применен для фазовой оптимизации CGH12,13,14,20,21,22,23,24. Градиент заранее заданной целевой функции рассчитывается и используется для обновления фазы голограммы на каждой итерации. Этот метод можно дополнительно комбинировать с камерой в качестве стратегии оптимизации обратной связи для устранения оптических артефактов в экспериментальных установках13,22. Выбранная конкретная функция потерь важна в этих итеративных подходах к оптимизации, чтобы привести фазу голограммы в оптимальное состояние. Стандартным выбором функции потерь является среднеквадратическая ошибка (MSE) из-за ее простоты использования и ясного физического смысла. Хотя MSE количественно определяет попиксельную ошибку в реконструированном изображении, его широко критикуют за плохую корреляцию с качеством восприятия25,26,27,28.

Многообещающим, но относительно менее используемым подходом является использование показателей качества изображения (IQM) в процессе поэтапной оптимизации CGH. Традиционная роль IQM в цифровой голографии заключается в динамическом мониторинге процесса оптимизации и оценке качества восприятия полученных изображений29,30,31,32. Современная модель IQM оценивает качество зрения на основе априорных знаний о зрительной системе человека или использует изученные модели, обученные на больших наборах данных. Они используют характеристики изображения в соответствующих пространствах восприятия28,33 для оценки качества изображения, но еще не полностью использованы в процессе оптимизации CGH. Здесь мы сосредотачиваемся на использовании IQM в качестве альтернативы повсеместному MSE для потерь обучения с намерением использовать градиент этих показателей восприятия для разработки лучшего алгоритма оптимизации CGH. Использование функций перцептивной мотивированной потери недавно привлекло внимание при фовеальном CGH34,35, уделяя особое внимание подавлению пятен в фовеальной области и периферическому восприятию. Другие приложения для восстановления неголографических изображений также исследовали потери восприятия, хотя замечено, что не существует какой-то одной функции потерь, которая превосходила бы все остальные в различных приложениях36,37,38.