Дискретное изображение. Фурье-обработка цифровых изображений

В предыдущей главе мы изучали линейные пространственно-инвариантные системы в непрерывной двумерной области. На практике мы имеем дело с изображениями, которые имеют ограниченные размеры и в то же время отсчитываются в дискретном наборе точек. Поэтому методы, разработанные до сих пор, необходимо приспособить, расширить и модифицировать так, чтобы их можно было применить и в такой области. Возникает также и несколько новых моментов, требующих аккуратного рассмотрения.

Теорема отсчетов говорит о том, при каких условиях по дискретному набору значений можно точно восстановить непрерывное изображение. Мы также узнаем, что происходит, когда условия ее применимости не выполняются. Все это имеет прямое отношение к разработке зрительных систем.

Методы, требующие перехода к частотной области, стали популярными частично благодаря алгоритмам быстрого вычисления дискретного преобразования Фурье. Однако нужно соблюдать осторожность, поскольку эти методы предполагают наличие периодического сигнала. Мы обсудим, как можно удовлетворить этому требованию и к чему приводит его нарушение.

7.1. Ограничение размеров изображения

На практике изображения всегда имеют конечные размеры. Рассмотрим прямоугольное изображение шириной и высотой Я. Теперь нет необходимости брать интегралы в преобразовании Фурье в бесконечных пределах:

Любопытно, что для восстановления функции нам необязательно знать на всех частотах. Знание того, что при представляет собой жесткое ограничение. Иными словами, функция, отличная от нуля только в ограниченной области плоскости изображения, содержит гораздо меньше информации, чем функция, не обладающая этим свойством.

Чтобы в этом убедиться, представим, что плоскость экрана покрыта копиями заданного изображения. Иными словами, мы расширяем наше изображение до периодической в обоих направлениях функции

Здесь - наибольшее целое число, не превосходящее х. Преобразование Фурье такого размноженного изображения имеет вид

С помощью подходящим образом подобранных множителей сходимости в упр. 7.1 доказывается, что

Следовательно,

откуда мы видим, что равна нулю всюду, кроме дискретного набора частот Таким образом, чтобы найти нам достаточно знать в этих точках. Однако функция получается из простым отсечением участка, для которого . Поэтому, чтобы восстановить нам достаточно знать лишь для всех Это - счетное множество чисел.

Обратите внимание на то, что преобразование периодической функции оказывается дискретным. Обратное преобразование можно представить в виде ряда, поскольку

Алгоритм уплотнения, обеспечивающий очень высокое качество изображения при коэффициенте уплотнения данных более 25:1. Полноцветное 24 разрядное изображение с разрешением 640 x 480 точек (стандарт VGA) обычно требует для своего хранения видеоОЗУ… …

Дискретное вейвлет-преобразование - Пример 1 го уровня дискретного вейвлет преобразования изображения. Вверху оригинальное полноцветное изображение, в середине вейвлет преобразование, сделанное по горизонтали исходного изображения (только канал яркости), внизу вейвлет… … Википедия

RASTER - растр - дискретное изображение, представленное в виде матрицы [из] пикселов … Словарь электронного бизнеса

компьютерная графика - визуализация изображения информации на экране дисплея (монитора). В отличие от воспроизведения изображения на бумаге или ином носителе, изображение, созданное на экране, можно почти немедленно стереть или (и) подправить, сжать или растянуть,… … Энциклопедический словарь

растр - Дискретное изображение, представленное в виде матрицы пикселов на экране или бумажном носителе. Растр характеризуется разрешающей способностью количеством пикселов на единицу длины, размером, глубиной цвета и др. Примеры сочетаний: density… … Справочник технического переводчика

таблица - ▲ массив двумерный таблица двумерный массив; дискретное изображение функции двух переменных; информационная решетка. матрица. табель. | табулирование. строка. строчка. столбец. столбик. колонка. графа. графить. разграфить. ▼ график … Идеографический словарь русского языка

Преобразование Лапласа - Преобразование Лапласа интегральное преобразование, связывающее функцию комплексного переменного (изображение) с функцией вещественного переменного (оригинал). С его помощью исследуются свойства динамических систем и решаются… … Википедия

Лапласа преобразование

Обратное преобразование Лапласа - Преобразование Лапласа интегральное преобразование, связывающее функцию комплексного переменного (изображение) с функцией действительного переменного (оригинал). С его помощью исследуются свойства динамических систем и решаются дифференциальные и … Википедия

ГОСТ Р 52210-2004: Телевидение вещательное цифровое. Термины и определения - Терминология ГОСТ Р 52210 2004: Телевидение вещательное цифровое. Термины и определения оригинал документа: 90 (телевизионный) демультиплексор: Устройство, предназначенное для разделения объединенных потоков данных цифрового телевизионного… … Словарь-справочник терминов нормативно-технической документации

Сжатие видео - (англ. Video compression) уменьшение количества данных, используемых для представления видеопотока. Сжатие видео позволяет эффективно уменьшать поток, необходимый для передачи видео по каналам радиовещания, уменьшать пространство,… … Википедия

Замену непрерывного изображения дискретным можно выполнить различными способами. Можно, например, выбрать какую-либо систему ортогональных функций и, вычислив коэффициенты представления изображения по этой системе (по этому базису), заменить ими изображение. Многообразие базисов дает возможность образования различных дискретных представлений непрерывного изображения. Однако наиболее употребительной является периодическая дискретизация, в частности, как упоминалось выше, дискретизация с прямоугольным растром. Такой способ дискретизации может рассматриваться как один из вариантов применения ортогонального базиса, использующего в качестве своих элементов сдвинутые -функции. Далее, следуя, в основном, , подробно рассмотрим основные особенности прямоугольной дискретизации.

Пусть - непрерывное изображение, а - соответствующее ему дискретное, полученное из непрерывного путем прямоугольной дискретизации. Это означает, что связь между ними определяется выражением:

где - соответственно вертикальный и горизонтальный шаги или интервалы дискретизации. Рис.1.1 иллюстрирует расположение отсчетов на плоскости при прямоугольной дискретизации.

Основной вопрос, который возникает при замене непрерывного изображения дискретным, состоит в определении условий, при которых такая замена является полноценной, т.е. не сопровождается потерей информации, содержащейся в непрерывном сигнале. Потери отсутствуют, если, располагая дискретным сигналом, можно восстановить непрерывный. С математической точки зрения вопрос, таким образом, заключается в восстановлении непрерывного сигнала в двумерных промежутках между узлами, в которых его значения известны или, иными словами, в осуществлении двумерной интерполяции. Ответить на этот вопрос можно, анализируя спектральные свойства непрерывного и дискретного изображений.

Двумерный непрерывный частотный спектр непрерывного сигнала определяется двумерным прямым преобразованием Фурье:

которому отвечает двумерное обратное непрерывное преобразование Фурье:

Последнее соотношение верно при любых значениях , в том числе и в узлах прямоугольной решетки . Поэтому для значений сигнала в узлах, учитывая (1.1), соотношение (1.3) можно записать в виде:

Обозначим для краткости через прямоугольный участок в двумерной частотной области . Вычисление интеграла в (1.4) по всей частотной области можно заменить интегрированием по отдельным участкам и суммированием результатов:

Выполняя замену переменных по правилу , добиваемся независимости области интегрирования от номеров и :

Здесь учтено, что при любых целых значениях и . Данное выражение по своей форме очень близко к обратному преобразованию Фурье. Отличие состоит лишь в неправильном виде экспоненциального множителя. Для придания ему необходимого вида введем нормированные частоты и выполним в соответствии с этим замену переменных. В результате получим:

Теперь выражение (1.5) имеет форму обратного преобразования Фурье, следовательно, стоящая под знаком интеграла функция

(1.6)

является двумерным спектром дискретного изображения. В плоскости ненормированных частот выражение (1.6) имеет вид:

(1.7)

Из (1.7) следует, что двумерный спектр дискретного изображения является прямоугольно периодическим с периодами и по осям частот и соответственно. Спектр дискретного изображения образуется в результате суммирования бесконечного количества спектров непрерывного изображения, отличающихся друг от друга частотными сдвигами и . Рис.1.2 качественно показывает соотношение между двумерными спектрами непрерывного (рис.1.2.а) и дискретного (рис.1.2.б) изображений.

Рис. 1.2. Частотные спектры непрерывного и дискретного изображений

Сам результат суммирования существенно зависит от значений этих частотных сдвигов, или, иными словами, от выбора интервалов дискретизации . Допустим, что спектр непрерывного изображения отличен от нуля в некоторой двумерной области в окрестности нулевой частоты, т. е. описывается двумерной финитной функцией. Если при этом интервалы дискретизации выбраны так, что при , , то наложения отдельных ветвей при формировании суммы (1.7) происходить не будет. Следовательно, в пределах каждого прямоугольного участка от нуля будет отличаться лишь одно слагаемое. В частности, при имеем:

при , . (1.8)

Таким образом, в пределах частотной области спектры непрерывного и дискретного изображений с точностью до постоянного множителя совпадают. При этом спектр дискретного изображения в этой частотной области содержит полную информацию о спектре непрерывного изображения. Подчеркнем, что данное совпадение имеет место лишь при оговоренных условиях, определяемых удачным выбором интервалов дискретизации. Отметим, что выполнение этих условий, согласно (1.8), достигается при достаточно малых значениях интервалов дискретизации , которые должны удовлетворять требованиям:

в которых - граничные частоты двумерного спектра.

Соотношение (1.8) определяет способ получения непрерывного изображения из дискретного . Для этого достаточно выполнить двумерную фильтрацию дискретного изображения низкочастотным фильтром с частотной характеристикой

Спектр изображения на его выходе содержит ненулевые компоненты лишь в частотной области и равняется, согласно (1.8), спектру непрерывного изображения . Это означает, что изображение на выходе идеального фильтра низких частот совпадает с .

Таким образом, идеальное интерполяционное восстановление непрерывного изображения выполняется при помощи двумерного фильтра с прямоугольной частотной характеристикой (1.10). Нетрудно записать в явном виде алгоритм восстановления непрерывного изображения. Двумерная импульсная характеристика восстанавливающего фильтра, которую легко получить при помощи обратного преобразования Фурье от (1.10), имеет вид:

.

Продукт фильтрации может быть определен при помощи двумерной свертки входного изображения и данной импульсной характеристики. Представив входное изображение в виде двумерной последовательности -функций

после выполнения свертки находим:

Полученное соотношение указывает способ точного интерполяционного восстановления непрерывного изображения по известной последовательности его двумерных отсчетов. Согласно этому выражению для точного восстановления в роли интерполирующих функций должны использоваться двумерные функции вида . Соотношение (1.11) представляет собой двумерный вариант теоремы Котельникова-Найквиста.

Подчеркнем еще раз, что эти результаты справедливы, если двумерный спектр сигнала является финитным, а интервалы дискретизации достаточно малы. Справедливость сделанных выводов нарушается, если хотя бы одно из этих условий не выполняется. Реальные изображения редко имеют спектры с ярко выраженными граничными частотами. Одной из причин, приводящих к неограниченности спектра, является ограниченность размеров изображения. Из-за этого при суммировании в (1.7) в каждой из зон проявляется действие слагаемых из соседних спектральных зон. При этом точное восстановление непрерывного изображения становится вообще невозможным. В частности, не приводит к точному восстановлению и использование фильтра с прямоугольной частотной характеристикой.

Особенностью оптимального восстановления изображения в промежутках между отсчетами является использование всех отсчетов дискретного изображения, как это предписывается процедурой (1.11). Это не всегда удобно, часто требуется восстанавливать сигнал в локальной области, опираясь на некоторое небольшое количество имеющихся дискретных значений. В этих случаях целесообразно применять квазиоптимальное восстановление при помощи различных интерполирующих функций. Такого рода задача возникает, например, при решении проблемы привязки двух изображений, когда из-за геометрических расстроек этих изображений имеющиеся отсчеты одного из них могут соответствовать некоторым точкам, находящимся в промежутках между узлами другого. Решение этой задачи более подробно обсуждается в последующих разделах данного пособия.

Рис. 1.3. Влияние интервала дискретизации на восстановление изображения

«Отпечаток пальца»

Рис. 1.3 иллюстрирует влияние интервалов дискретизации на восстановление изображений. Исходное изображение, представляющее собой отпечаток пальца, приведено на рис. 1.3, а, а одно из сечений его нормированного спектра - на рис. 1.3, б. Данное изображение является дискретным, а в качестве граничной частоты использовано значение . Как следует из рис. 1.3, б, значение спектра на этой частоте пренебрежимо мало, что гарантирует качественное восстановление. По сути дела, наблюдаемая на рис. 1.3.а картина и является результатом восстановления непрерывного изображения, а роль восстанавливающего фильтра выполняет устройство визуализации - монитор или принтер. В этом смысле изображение рис. 1.3.а может рассматриваться как непрерывное.

Рис. 1.3, в, г показывают последствия от неправильного выбора интервалов дискретизации. При их получении осуществлялась “дискретизация непрерывного” изображения рис. 1.3.а путем прореживания его отсчетов. Рис. 1.3, в соответствует увеличению шага дискретизации по каждой координате в три, а рис. 1.3, г - в четыре раза. Это было бы допустимо, если бы значения граничных частот были ниже в такое же число раз. В действительности, как видно из рис. 1.3, б, происходит нарушение требований (1.9), особенно грубое при четырехкратном прореживании отсчетов. Поэтому восстановленные при помощи алгоритма (1.11) изображения оказываются не только расфокусированными, но и сильно искажают текстуру отпечатка.

Рис. 1.4. Влияние интервала дискретизации на восстановление изображения «Портрет»

На рис. 1.4 приведена аналогичная серия результатов, полученных для изображения типа “портрет”. Последствия более сильного прореживания (в четыре раза на рис. 1.4.в и в шесть раз на рис. 1.4.г) проявляются в основном в потере четкости. Субъективно потери качества представляются менее значительными, чем на рис. 1.3. Это находит свое объяснение в значительно меньшей ширине спектра, чем у изображения отпечатка пальца. Дискретизация исходного изображения соответствует граничной частоте . Как видно из рис. 1.4.б, это значение намного превышает истинное значение . Поэтому увеличение интервала дискретизации, иллюстрируемое рис. 1.3, в, г, хотя и ухудшает картину, все же не приводит к таким разрушительным последствиям, как в предыдущем примере.

Человек способен воспринимать и хранить информацию в форме образов (зрительных, звуковых, осязательных, вкусовых и обонятельных). Зрительные образы могут быть сохранены в виде изображений (рисунков, фотографий и так далее), а звуковые - зафиксированы на пластинках, магнитных лентах, лазерных дисках и так далее.

Информация, в том числе графическая и звуковая, может быть представлена в аналоговой или дискретной форме. При аналоговом представлении физическая величина принимает бесконечное множество значений, причем ее значения изменяются непрерывно. При дискретном представлении физическая величина принимает конечное множество значений, причем ее величина изменяется скачкообразно.

Примером аналогового представления графической информации может служить, например, живописное полотно, цвет которого изменяется непрерывно, а дискретного– изображение, напечатанное с помощью струйного принтера и состоящее из отдельных точек разного цвета. Примером аналогового хранения звуковой информации является виниловая пластинка (звуковая дорожка изменяет свою форму непрерывно), а дискретного– аудиокомпакт-диск (звуковая дорожка которого содержит участки с различной отражающей способностью).

Преобразование графической и звуковой информации из аналоговой формы в дискретную производится путем дискретизации, то есть разбиения непрерывного графического изображения и непрерывного (аналогового) звукового сигнала на отдельные элементы. В процессе дискретизации производится кодирование, то есть присвоение каждому элементу конкретного значения в форме кода.

Дискретизация – это преобразование непрерывных изображений и звука в набор дискретных значений в форме кодов.

Кодирование изображений

Создавать и хранить графические объекты в компьютере можно двумя способами – как растровое или как векторное изображение. Для каждого типа изображений используется свой способ кодирования.

Кодирование растровых изображений

Растровое изображение представляет собой совокупность точек (пикселей) разных цветов. Пиксель– минимальный участок изображения, цвет которого можно задать независимым образом.

В процессе кодирования изображения производится его пространственная дискретизация. Пространственную дискретизацию изображения можно сравнить с построением изображения из мозаики (большого количества маленьких разноцветных стекол). Изображение разбивается на отдельные маленькие фрагменты (точки), причем каждому фрагменту присваивается значение его цвета, то есть код цвета (красный, зеленый, синий и так далее).

Для черно-белого изображения информационный объем одной точки равен одному биту (либо черная, либо белая – либо 1, либо 0).

Для четырех цветного – 2 бита.

Для 8 цветов необходимо – 3 бита.

Для 16 цветов – 4 бита.

Для 256 цветов – 8 бит (1 байт).

Качество изображения зависит от количества точек (чем меньше размер точки и, соответственно, больше их количество, тем лучше качество) и количества используемых цветов (чем больше цветов, тем качественнее кодируется изображение).

Для представления цвета в виде числового кода используются две обратных друг другу цветовые модели: RGB или CMYK . Модель RGB используется в телевизорах, мониторах, проекторах, сканерах, цифровых фотоаппаратах… Основные цвета в этой модели: красный (Red), зеленый (Green), синий (Blue). Цветовая модель CMYK используется в полиграфии при формировании изображений, предназначенных для печати на бумаге.

Цветные изображения могут иметь различную глубину цвета, которая задается количеством битов, используемых для кодирования цвета точки.

Если кодировать цвет одной точки изображения тремя битами (по одному биту на каждый цвет RGB), то мы получим все восемь различных цветов.

Цвет

Пурпурный

На практике же, для сохранения информации о цвете каждой точки цветного изображения в модели RGB обычно отводится 3 байта (то есть 24 бита) - по 1 байту (то есть по 8 бит) под значение цвета каждой составляющей. Таким образом, каждая RGB-составляющая может принимать значение в диапазоне от 0 до 255 (всего 2 8 =256 значений), а каждая точка изображения, при такой системе кодирования может быть окрашена в один из 16 777 216 цветов. Такой набор цветов принято называть True Color (правдивые цвета), потому что человеческий глаз все равно не в состоянии различить большего разнообразия.

Для того чтобы на экране монитора формировалось изображение, информация о каждой точке (код цвета точки) должна храниться в видеопамяти компьютера. Рассчитаем необходимый объем видеопамяти для одного из графических режимов. В современных компьютерах разрешение экрана обычно составляет 1280х1024 точек. Т.е. всего 1280 * 1024 = 1310720 точек. При глубине цвета 32 бита на точку необходимый объем видеопамяти: 32 * 1310720 = 41943040 бит = 5242880 байт = 5120 Кб = 5 Мб.

Растровые изображения очень чувствительны к масштабированию (увеличению или уменьшению). При уменьшении растрового изображения несколько соседних точек преобразуются в одну, поэтому теряется различимость мелких деталей изображения. При увеличении изображения увеличивается размер каждой точки и появляется ступенчатый эффект, который можно увидеть невооруженным глазом.

Изображения, состоящие из дискретных элементов, каждый из которых может принимать лишь конечное число различимых значений, изменяющихся за конечное время, называют дискретными. Следует подчеркнуть, что элементы дискретного изображения, вообще говоря, могут иметь неравную площадь и каждый из них может иметь неодинаковое число различимых градаций.

Как было показано в первой главе, сетчатка передает в высшие отделы зрительного анализатора дискретные изображения.

Их кажущаяся непрерывность - лишь одна из иллюзий зрения. Это «квантование» первоначально непрерывных изображений определяется не теми ограничениями, которые связаны с разрешающей способностью оптической системы глаза и даже не морфологическими структурными элементами зрительной системы, а функциональной организацией нервных сетей.

Изображение разбивается на дискретные элементы рецептивными полями, объединяющими то или иное число фоторецепторов. Рецептивные поля производят первичное выделение полезного светового сигнала путем пространственной и временной суммации.

Центральная часть сетчатки (фовеа) занята только колбочками, на периферии вне фовеа имеются как колбочки, так и палочки. В условиях ночного зрения колбочковые поля в центральной части сетчатки имеют приблизительно одинаковую величину (порядка 5" в угловой мере). Число таких полей в фовеа, угловые размеры которой порядка 90", около 200. Основную роль в условиях ночного зрения играют палочковые поля, занимающие всю остальную поверхность сетчатки. Они имеют угловой размер порядка 1° по всей поверхности сетчатки. Число таких полей в сетчатке около 3 тыс. Не только обнаружение, но и рассматривание слабо освещенных объектов в этих условиях производится периферийными участками сетчатки.

При увеличении освещенности основную роль начинает играть другая система накопительных ячеек - колбочковые рецептивные поля. В фовеа увеличение освещенности вызывает постепенное уменьшение эффективной величины поля, пока при яркости порядка 100 асб оно не сократится до одной колбочки. На периферии с увеличением освещенности постепенно выключаются (затормаживаются) палочковые поля и вступают в действие колбочковые. Колбочковые поля на периферии подобно фовеальным обладают способностью уменьшаться в зависимости от падающей на них световой энергии. Наибольшее количество колбочек, которое могут иметь колбочковые рецептивные поля с увеличением освещенности, растет от центра к краям сетчатки и на угловом расстоянии 50-60° от центра достигает приблизительно 90.

Можно подсчитать, что в условиях хорошего дневного освещения число рецептивных полей достигает порядка 800 тыс. Эта величина примерно соответствует числу волокон в зрительном нерве человека. Различение (разрешение) объектов при дневном зрении осуществляется главным образом фовеа, где рецептивное поле может сократиться до одной колбочки, а сами колбочки расположены наиболее плотно.

Если число накопительных ячеек сетчатки может быть определено в удовлетворительном приближении, то для определения числа возможных состояний рецептивных полей еще нет достаточных данных. Могут быть сделаны лишь некоторые-оценки на основе изучения дифференциальных порогов рецептивных полей. Пороговый контраст в фовеальных рецептивных полях в определенном рабочем диапазоне освещенности имеет порядок 1. При этом число различимых градаций невелико. Во всем диапазоне перестройки колбочкового фовеального рецептивного поля различается 8-9 градаций.

Период накопления в рецептивном поле - так называемая критическая длительность - определяется в среднем величиной порядка 0.1 сек., но при высоких уровнях освещения может, по-видимому, значительно уменьшаться.

В действительности модель, описывающая дискретную структуру передаваемых изображений, должна быть еще сложнее. Следовало бы учесть взаимосвязь между размерами рецептивного поля, порогами и критической длительностью, а также статистический характер зрительных порогов. Но пока что в этом нет необходимости. Достаточно представить в качестве модели изображения совокупность одинаковых по площади элементов, угловые размеры которых меньше, чем угловые размеры наименьшей разрешаемой глазом детали, число различимых состояний которых больше, чем максимальное число различаемых градаций яркости, а время дискретного изменения которых меньше, чем период мельканий при критической частоте слияния мельканий.

Если заменить изображения реальных непрерывных объектов внешнего мира такими дискретными изображениями, глаз не заметит подмены.* Следовательно, дискретные изображения такого рода содержат по крайней мере не меньше информации, чем воспринимает зрительная система. **

* Цветовые и объемные изображения также можно заменить дискретной моделью.
** Проблема замены непрерывных изображений дискретными имеет важное значение для техники кино и телевидения. Временное квантование лежит в основе этой техники. В импульсно-кодовых телевизионных системах изображение, кроме того, разбивают на дискретные элементы и квантуют по яркости.