Маскирование данных тепловой съёмки при встраивании цифровых водяных знаков
- Авторы: Козлов Д.А.1
-
Учреждения:
- Самарский университет
- Выпуск: № 1 (16) (2020)
- Страницы: 89-98
- Раздел: Информатика и вычислительная техника
- Дата публикации: 15.12.2020
- URL: https://vmuis.ru/smus/article/view/9266
- ID: 9266
Цитировать
Полный текст
Аннотация
В данной работе проведено сравнение различных методов построения масок «едва различимых искажений» применяемых при встраивании цифровых водяных знаков. Маска «едва различимых искажений» (Just Noticeable Difference, JND) – маска, применяемая при встраивании информации в изображения или кадры видеопоследовательности, с целью минимизировать заметность произведённого встраивания для человеческого зрения, сохранив при этом заданный уровень встроенной информации, обеспечивающий надёжное извлечение. В частности, проведён анализ целесообразности их применения для случая тепловизионных данных. В ходе исследования было получено, что наилучшим образом с точки зрения условия внесения наименьшего количества дополнительных шумов на видеопоследовательность ведут себя JND маски, основанные на методе градиентов, учитывающие структурные особенности кадра.
Ключевые слова
Полный текст
В данной работе основным объектом рассмотрения являются тепловые видео. Данный тип видеосъёмки производится специализированной аппаратурой, фиксирующей тепловое излучение поверхностей, то есть электромагнитное излучение в инфракрасной области спектра. При этом тепловая съёмка отличается, как правило куда большей шумовой составляющей.
Целью и задачей исследования стала разработка программного обеспечения, выполняющего выделение и определение характеристик шума камеры в тепловом диапазоне, а также исследование JND-маскирования теплового видео при встраивании скрытой информации в отфильтрованные от шума кадры теплового видео.
Оценка шума камеры
Для оценки шума камеры выполняется построение среднего кадра по рассматриваемому статичному отрезку видео. Средний кадр формируется как усредненное по времени значение каждого пикселя (рис. 1). Случайный кадр, взятый из этой видеопоследовательности также представлен на рисунке (рис. 2). Можно заметить, что средний кадр менее зашумлен.
Следующим шагом является сохранение в трехмерный массив (оси: ширина, высота, номер кадра) разности кадра с данным номером и среднего кадра.
Таким образом получаем видеопоследовательность, которая в случае со статическим видео, когда визуально изображение не меняется, представляет собой некоторую визуальную оценку шума тепловой камеры (рис. 3-4).
Порядок встраивания скрытой информации
В качестве рассматриваемого метода в данной работе выбран метод E_BLIND/D_LC. Он представляет собой простейшую ЦВЗ-систему с расширением спектра. Данная система позволяет встроить только один бит информации (то есть b ∈ {0,1}) в полутоновой контейнер C размерами N1 × N2. Для встраивания информации формируется шаблон ЦВЗ .
Встраивание ЦВЗ осуществляется по аддитивной формуле. Для извлечения встроенного бита информации рассчитывается значение линейной корреляции принятого носителя информации с шаблоном . После чего полученная величина сравнивается с порогом для принятия решения.
Рис. 1. Пример среднего кадра из видео
Рис. 2. Пример обычного кадра из видео
Рис. 3. Пример кадра, иллюстрирующего шум камеры в отдельном кадре
Рис. 4. Пример кадра, иллюстрирующего усреднённый по всему участку видеопоследовательности шум камеры
Выполнение встраивания
Исходные изображения представлены на рисунках (рис. 1-2). Далее на рисунках приведены примеры встраивания одного бита информации при различных значениях параметра системы α (рис. 5-10). Чем меньше значение α, тем сложнее обнаружить информацию, встроенную в изображение и тем больше риск неудачного извлечения информации.
Поэтому для эффективного встраивания информации необходимо подобрать в некотором смысле оптимальное значение этого параметра.
Так при значениях α = 1 (рис. 5 и 7). факт встраивания информации надежно сокрыт, но извлечение информации происходит не всегда удачно и встречается значительный процент ошибочных извлечений. А при значениях α = 10 (рис. 6 и 8). наличие посторонней шумовой компоненты уже можно заметить невооруженным глазом.
Собственно, в данных экспериментах к оптимальным значениям приблизилось значение α равное корню дисперсии шума. Это значение статистически зависит от шума камеры (рис. 9-10).
Рис. 5. Встраивание единицы в средний кадр при α = 1
Рис. 6. Встраивание единицы в средний кадр при α = 10
Рис. 7. Встраивание единицы в случайный кадр при α = 1
Рис. 8. Встраивание единицы в случайный кадр при α = 10
Рис. 9. Встраивание единицы в средний кадр при α равном корню дисперсии полученного шума (1.9393)
Рис. 10. Встраивание единицы в случайный кадр при α равном корню дисперсии полученного шума (1.9393)
Рис. 11. Результат вычитания из кадра отфильтрованного изображения
Фильтрация шума камеры
В качестве метода фильтрации был рассмотрен фильтр Винера. Для его применения необходимо знать импульсную характеристику шума. Она подбиралась визуально, путём вычитания отфильтрованного изображения из исходного (рис. 11). В результате рассмотрения различных вариантов характеристик шума было выбрано нормальное распределение шума с нулевым средним и дисперсией равной дисперсии отдельного кадра с шумом. Данный вариант даёт наиболее схожий с шумом камеры результат.
JND-маскирование
Маска «едва различимых искажений» (Just Noticeable Difference, JND) используется для достижения разумного компромисса между незаметностью искажений при встраивании ЦВЗ и их стойкостью. Она использует особенности человеческого восприятия визуальной информации. Встраиваемая с помощью данных масок информация концентрируется в областях с существенными перепадами яркости и практически отсутствует в тех областях, где яркость распределяется равномерно.
В рамках данной работы были рассмотрены несколько вариантов таких масок. Далее они будут упоминаться согласно их нумерации.
Первый метод JND-маскирования основан на поиске максимума градиента, вычисляемого при помощи свёртки рассматриваемого изображения с матрицами, более подробно описанными в [1]. Максимум градиента даёт информацию об областях изображения с существенными перепадами яркости (рис. 12).
Второй метод основан на адаптации яркости изображения (рис. 13). И вычисления происходят по следующим формулам, более подробно описанным в [1]:
Третий метод основан на использовании структурной неопределенности, вычисляемой согласно корреляции между соседними пикселями (рис. 14). Структурная неопределённость используется совместно с адаптацией яркости и вычислением градиентов, как в первых двух случаях [2].
Четвертый метод также совмещает в себе первые два (рис. 14). Помимо этого, методом учитывается структурная регулярность изображения [3].
Затем в средний кадр был встроен с применением данных масок шум с нормальным распределением, как имитация встраивания ЦВЗ. Встраивание производилось по аддитивной формуле (рис. 16-19). Для всех полученных данных были вычислены показатели PSNR и SNR.
Также имеет смысл рассматривать в качестве JND-маски маску, получаемую при фильтрации шума на втором этапе (рис. 11). Для данной маски также были измерены показатели PSNR и SNR (рис. 20).
Рис. 12. JND-маска, получаемая первым методом
Рис. 13. JND-маска, получаемая вторым методом
Рис. 14. JND-маска, получаемая третьим методом
Рис. 15. JND-маска, получаемая четвёртым методом
Рис. 16. Результат выполнения имитации встраивания в кадр видеопоследовательности с использованием JND-маски, полученной первым методом
Рис. 17. Результат выполнения имитации встраивания в кадр видеопоследовательности с использованием JND-маски, полученной вторым методом
Рис. 18. Результат выполнения имитации встраивания в кадр видеопоследовательности с использованием JND-маски, полученной третьим методом
Рис. 19. Результат выполнения имитации встраивания в кадр видеопоследовательности с использованием JND-маски, полученной четвёртым методом
Рис. 20. Результат выполнения имитации встраивания в кадр видеопоследовательности с использованием JND-маски, полученной посредством нахождения разности между отбеленным и исходным кадром
Таблица 1
Значения метрик для исходного неизмененного кадра видеопоследовательности
Метрика | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
PSNR | 40,18 | 46,07 | 41,72 | 23,75 | 37,18 | 39,93 | 29,44 | 38,81 | 38,81 |
SNR | 36,71 | 38,88 | 35,02 | 17,53 | 29,32 | 33,93 | 20,65 | 32,67 | 32,67 |
MSE | 6,23 | 1,61 | 4,37 | 274,41 | 12,46 | 6,61 | 73,90 | 8,55 | 8,55 |
Сравнение полученных результатов
В качестве наборов данных для первичного тестирования встраивания информации с использованием JND-маскирования были выбраны 9 тепловых видео. Пять из них найдены в различных источниках, ещё четыре сняты тепловой камерой в НИЛ-55 Самарского университета. Из всех видео для рассмотрения выбран стационарный участок, на котором отсутствует какое-либо ярко выраженное движение. Далее на всех этих стационарных участках определён средний кадр, для использования его в качестве отбеленного кадра.
Также выбран один случайный кадр видео для дальнейших сравнений. И вычислены PSNR (Пиковое отношение сигнала к шуму), SNR (Отношение сигнала к шуму) и MSE (Средний квадрат ошибки) метрики между ними. Для исходных необработанных кадров результаты представлены в таблице (табл. 1). Причём 1-5 видео из открытых источников, а 6-9 сняты в НИЛ-55.
В таблице (табл. 2) представлены рассчитанные метрики для заданного набора данных после имитации встраивания с использованием вышеупомянутых JND-масок.
Так как основная наша задача встроить наибольшее количество информации с достаточной надёжностью извлечения, не допуская искажений превышающих уровень искажений шума камеры, то нам необходимо чтобы отклонение характеристик шума после встраивания было приближено к характеристикам кадра, встраивание в который не производилось. В таблице (табл. 3) приведены разности значений метрик для каждого из методов построения JND-масок с кадром без встраивания. И также представлены суммы их квадратов.
Видно, что видео 4 и 7 сильно выбиваются из общего ряда, причём ещё на этапе, когда встраивание не произведено, возможно выбранные участки недостаточно стационарны. Поэтому при подведении общего итога столбцы относящиеся к этим видео учитывать не будем и получим результат, приведенный в таблице (табл. 4).
Таким образом мы видим, что наиболее успешны методы 1 и 3, причём третий метод даёт лучшие результаты на первой части набора данных, собранный в различных источниках, а первый метод даёт лучшие результаты на результатах, полученных камерой НИЛ-55. Это может быть обусловлено как самой камерой, так и характером съёмки, так как все тестовые видео снимались в помещении, в отличии от найденных наборов данных, в которых преобладают уличные камеры.
Таблица 2
Значения метрик для кадров с выполненной имитацией встраивания
Номер метода построения JND-маски | Метрика | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
PSNR | 38,33 | 43,11 | 42,24 | 41,60 | 42,94 | 41,98 | 41,86 | 43,29 | 43,29 | |
1 | SNR | 34,86 | 35,92 | 35,54 | 35,38 | 35,08 | 35,98 | 33,07 | 37,15 | 37,15 |
MSE | 9,55 | 3,18 | 3,88 | 4,49 | 3,30 | 4,12 | 4,24 | 3,05 | 3,05 | |
PSNR | 34,76 | 33,84 | 32,17 | 32,53 | 31,54 | 36,99 | 31,52 | 37,11 | 37,10 | |
2 | SNR | 31,29 | 26,66 | 25,47 | 26,31 | 23,67 | 30,99 | 22,73 | 30,97 | 30,96 |
MSE | 21,72 | 26,87 | 39,47 | 36,32 | 45,65 | 13,00 | 45,84 | 12,65 | 12,68 | |
PSNR | 40,16 | 43,61 | 40,19 | 39,68 | 38,59 | 43,63 | 42,82 | 49,56 | 49,47 | |
3 | SNR | 36,69 | 36,43 | 33,48 | 33,46 | 30,73 | 37,63 | 34,03 | 43,42 | 43,33 |
MSE | 6,27 | 2,83 | 6,23 | 7,00 | 9,00 | 2,82 | 3,40 | 0,72 | 0,73 | |
PSNR | 32,63 | 33,28 | 32,21 | 31,45 | 31,43 | 32,48 | 29,44 | 35,09 | 35,08 | |
4 | SNR | 29,15 | 26,10 | 25,50 | 25,23 | 23,57 | 26,48 | 20,64 | 28,94 | 28,94 |
MSE | 35,51 | 30,54 | 39,13 | 46,58 | 46,73 | 36,73 | 74,04 | 20,16 | 20,16 |
Таблица 3
Значения разностей метрик для исходного кадра и после выполненной имитации встраивания и сумма их квадратов
Номер метода JND-маски | Метрика | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | Сумма квадратов |
PSNR | 1,85 | 2,96 | -0,52 | -17,86 | -5,76 | -2,05 | -12,41 | -4,48 | -4,48 | 563,02 | |
1 | SNR | 1,85 | 2,96 | -0,52 | -17,86 | -5,76 | -2,05 | -12,41 | -4,48 | -4,48 | 563,02 |
MSE | -3,31 | -1,57 | 0,49 | 269,91 | 9,15 | 2,48 | 69,66 | 5,50 | 5,50 | 77869,23 | |
PSNR | 5,42 | 12,23 | 9,55 | -8,78 | 5,64 | 2,94 | -2,07 | 1,70 | 1,71 | 397,95 | |
2 | SNR | 5,42 | 12,23 | 9,55 | -8,78 | 5,64 | 2,94 | -2,07 | 1,70 | 1,71 | 397,95 |
MSE | -15,49 | -25,26 | -35,10 | 238,09 | -33,19 | -6,39 | 28,05 | -4,11 | -4,13 | 60760,41 | |
PSNR | 0,02 | 2,46 | 1,54 | -15,94 | -1,41 | -3,70 | -13,37 | -10,75 | -10,66 | 685,90 | |
3 | SNR | 0,02 | 2,46 | 1,54 | -15,94 | -1,41 | -3,70 | -13,37 | -10,75 | -10,66 | 685,90 |
MSE | -0,03 | -1,22 | -1,86 | 267,41 | 3,46 | 3,79 | 70,50 | 7,83 | 7,81 | 76631,30 | |
PSNR | 7,56 | 12,78 | 9,52 | -7,70 | 5,74 | 7,45 | 0,01 | 3,73 | 3,73 | 486,70 | |
4 | SNR | 7,56 | 12,78 | 9,52 | -7,70 | 5,74 | 7,45 | 0,01 | 3,73 | 3,73 | 486,70 |
| MSE | -29,28 | -28,93 | -34,75 | 227,83 | -34,28 | -30,13 | -0,15 | -11,61 | -11,62 | 57160,41 |
Таблица 4
Значения разностей метрик для исходного кадра и после выполненной имитации встраивания и сумма их квадратов, без значений для 4 и 7 видео
Номер метода JND-маски | Метрика | 1 | 2 | 3 | 5 | 6 | 8 | 9 | Сумма квадратов |
| PSNR | 1,85 | 2,96 | -0,52 | -5,76 | -2,05 | -4,48 | -4,48 | 90,01 |
1 | SNR | 1,85 | 2,96 | -0,52 | -5,76 | -2,05 | -4,48 | -4,48 | 90,01 |
| MSE | -3,31 | -1,57 | 0,49 | 9,15 | 2,48 | 5,50 | 5,50 | 164,14 |
| PSNR | 5,42 | 12,23 | 9,55 | 5,64 | 2,94 | 1,70 | 1,71 | 316,51 |
2 | SNR | 5,42 | 12,23 | 9,55 | 5,64 | 2,94 | 1,70 | 1,71 | 316,51 |
| MSE | -15,49 | -25,26 | -35,10 | -33,19 | -6,39 | -4,11 | -4,13 | 3286,22 |
| PSNR | 0,02 | 2,46 | 1,54 | -1,41 | -3,70 | -10,75 | -10,66 | 253,16 |
3 | SNR | 0,02 | 2,46 | 1,54 | -1,41 | -3,70 | -10,75 | -10,66 | 253,16 |
| MSE | -0,03 | -1,22 | -1,86 | 3,46 | 3,79 | 7,83 | 7,81 | 153,58 |
| PSNR | 7,56 | 12,78 | 9,52 | 5,74 | 7,45 | 3,73 | 3,73 | 427,37 |
4 | SNR | 7,56 | 12,78 | 9,52 | 5,74 | 7,45 | 3,73 | 3,73 | 427,37 |
| MSE | -29,28 | -28,93 | -34,75 | -34,28 | -30,13 | -11,61 | -11,62 | 5254,15 |
Заключение
В данной работе проделаны следующие этапы для исследования маскирования данных тепловой съёмки при встраивании цифровых водяных знаков, выполнена оценка шума камеры; путём построения оценки кадра – как среднее и последующего вычитания этой оценку из всех кадров стационарного участка видео; проанализированы характеристики шума; выбран один кадр видео для встраивания туда информации методом E_BLIND/D_LC, со значение α, привязанным к найденной дисперсии; сделано тоже самое со средним кадром; сравнены результаты встраивания при оценке качества изображения визуально; сравнена стойкость встроенного ЦВЗ; была разработана методика выделения шумовой составляющей тепловых видео; проанализированы характеристики шумовой составляющей; была разработана методика частичной фильтрации шума; рассмотрены методы построения JND-масок изображений; было произведено исследование характеристик кадра до удаления шума, после фильтрации, а также при имитации встраивания по JND-маске.
Описанные выше задания по обработке видеофайлов были выполнены для различных данных и сравнены друг с другом. В том числе, с данными, полученными в результате проведения тестовой съемки тепловой камерой в НИЛ-55 Самарского университета.
Выводом исследования может стать факт, что для теплового видео наиболее предпочтительными являются методы JND-маскирования, приведенные в данном исследовании под номером 1 и 3.
Об авторах
Даниил Александрович Козлов
Самарский университет
Автор, ответственный за переписку.
Email: djoade100@gmail.com
студент V курса факультета информатики Самарского университета
Россия, 443086, Россия, г. Самара, Московское шоссе, 34