Анализ и сжатие изображений с использованием математической 3d морфологии

АНАЛИЗ И СЖАТИЕ ИЗОБРАЖЕНИЙ С ИСПОЛЬЗОВАНИЕМ МАТЕМАТИЧЕСКОЙ 3D МОРФОЛОГИИШтаба М.В., аспирантРостовский государственный строительный университетe-mail: max@shtaba.ru1. ВВЕДЕНИЕ Проблема сжатия информации была, есть и всегда будет актуальной. При известных современных методах, чем больше эффективность сжатия – больше задержка. В каждом конкретном случае выбирается то или иное компромиссное решение. Известно, что для корректной передачи цвета требуется 16 миллионов оттенков (8 бит на каждую из трех цветовых компонент). Таким образом, для описания картинки на экране, содержащей 575 линий по 720 пикселей, требуется 1,240 Мбайта. Для передачи такой информации по B-каналу ISDN, если не используется сжатие, потребуется около 2,5 минут. Эта цифра помогает понять актуальность проблемы сжатия графической информации [1].^ 2. МАТЕМАТИЧЕСКАЯ 3-D МОРФОЛОГИЯ В ОБРАБОТКЕ И СЖАТИИ ИЗОБРАЖЕНИЙ Одной из фундаментальных проблем анализа изображений является создание адекватного математического описания изображений, передающего их содержание, смысл. Иными словами, это описание должно отражать лишь существенные (с точки зрения решаемой задачи) особенности изображения, и не зависеть от несущественных деталей. Методы морфологического анализа являются, таким образом, шагом на пути решения проблемы описания семантики изображений [2]. В основе методов морфологического анализа лежит математическое понятие формы. Под формой изображения понимается максимальный инвариант преобразований изображения, которым оно подвергается при изменении условий наблюдения, изменении параметров регистрирующей аппаратуры и др. [3] Поясним понятие формы изображения сначала на простом примере. Все представленные на рис.1 изображения имеют одну и ту же форму (в обычном понимании) и отличаются лишь условиями регистрации. Формально каждое изображение можно задать как функцию:, определенную на поле зрения X и принимающую два значения: С1 и С2 на его подмножествах А1– "единице" и А2 – "фоне" соответственно, – индикаторная функция: , причем множества А1 и А2 не пересекаются [4].Рис. 1. Примеры изображений «единицы», сравнимых по формеОтсюда следует, что каждое, отдельно взятое подмножество, может быть обработано независимо от остальных, при этом его цвет не имеет значения, имеет значение только форма – семантика изображения. Количество же этих слоев-подмножеств может быть довольно большим и нести в себе значительный объем информации. Основой интеллектуального анализа изображений в данной работе является подход Харалика (Haralick) и Шапиро (Shapiro), интерпретирующий цветное изображение как поверхность в 3-х мерном пространстве. 2-мерное Эвклидово пространство ε2 это естественная область для плоскостного описания формы множеством точек, а также третье измерение z – глубина цвета [5,6].^ 3. ПРАКТИЧЕСКИЕ АСПЕКТЫ ПРИМЕНЕНИЯ ПРЕДЛАГАЕМОЙ КОНЦЕПЦИИ И АЛГОРИТМА Основное преимущество предлагаемого алгоритма и построение новой концепции в работе с изображениями заключается в особенности разбиения на различные информационные слои – подмножества, а также отсутствие жесткой привязки к палитре цветов. То есть изображение, состоящее из двух цветов, красного и синего, фактически будет рассмотрено, как монохромное. А каждое из подмножеств имеет свой смысл, что имеет огромное практическое значение. Предлагаемый алгоритм не является универсальным и показывает хорошие результаты в узких сферах применения. Например, в картографии и разработке геоинформационных систем, с использованием данного алгоритма можно получить растровое изображение хорошего качества, при этом достаточно хорошо сжимаемое при хранении и передаче. В частности при использовании в геоинформационных системах крупных баз данных, особенно если они физически распределены по различным серверам и данные передаются через Интернет, то объемы информации имеют огромное значение. Основное же преимущество заключается в том, что предложенный алгоритм позволяет хранить закодированное цельное изображение местности, однако по запросу пользователя через канал связи возможно передать не громоздкие общие данные, или даже не просто фрагмент изображения, но также интересующие пользователя области и регионы, политические, физические и другие, которые отмечены определенным цветом, а значит выделены в особое подмножество и выполнить такой запрос не составит труда. Экономия времени на передаче данных очевидна, за счет исключения информации не нужной пользователю. Подобные же функции могут быть востребованы и в других сферах, таких как медицина, криминалистика и другие.^ 4. АЛГОРИТМ ОБРАБОТКИ И СЖАТИЯ ИЗОБРАЖЕНИЙ Используя указанный подход можно сформулировать суть предлагаемого анализа, обработки и кодирования изображения, которая заключается в разложении его на цветовые слои – подмножества, путем выделения формы объектов, и кодировании каждого из этих слоев независимо друг от друга в бинарном режиме. Для адекватного анализа цвета в работе рассматриваются три цветовых компоненты: красный, зеленый и синий независимо друг от друга.^ 4.1. Обработка цветов и кодирование подмножеств Алгоритм кодирования выполняется в два прохода: Первый проход. Анализ изображения, обработка цветов. Выделение цветов. Интеллектуальное прореживание, устранение неразличимых оттенков. Определение количества подмножеств – N. Второй проход. Кодирование. Представление двумерных множеств, как одномерные. Определение принадлежности пикселя к соответствующему подмножеству. Послойное кодирование подмножеств с учетом анализа очередного пикселя, для экономии объема. Запись в файл блоков кода переменной длины. На первой стадии производится анализ изображения. Выбираются имеющиеся на изображении цвета, при этом производится прореживание цветов по каждой из трех цветовых компонент для отсеивания неразличимых, неинформативных полутонов. После завершения этой стадии результирующее количество цветов является количеством подмножеств, подготавливаемых для кодирования. Исходя из вышесказанного, мы получаем незакодированное изображение, описываемое как набор подмножеств, описывающих форму объектов: где:здесь это не измененное множество, то есть это те цвета, которые мы видим на изображении, та же точно форма и эти множества друг от друга независимы. На рис.2 отражены 4 представления набора пикселей(сверху вниз): привычное представление в цвете; срез поверхности точек в 3-D пространстве (по функции top-surface) [5]; срез объемной фигуры, отражающей структуру изображения(функция Umbra) [5]; собственный способ представления , повышающий эффективность кодирования. Измененные множества отмечаются как и работать с ними можно также, как и с любыми другими множествами, но они зависят от других слоев, которые должны прорисовываться сверху, поскольку суть представления в том, что если одни цветовые слои включают в себя другие, то нет необходимости запоминать несущественные элементы в более низших слоях, которые в дальнейшем будут затерты более высшими. Таким образом, достигается дополнительное сжатие, отраженное в разнице между последними двумя представлениями. То есть отличие слоя от слоя в пропущенных, сэкономленных пикселях будет нивелировано слоем , который впоследствии затрет несущественную разницу.Рис.2. Разбиение изображения на цветовые слои, срез 3D поверхностиДалее кодируется в последовательность значений – чередующееся количество прозрачных и заполненных пикселей, для каждого, уже измененного, подмножества , которые теперь зависят от последующего слоя. Вследствие чего получаем новые значения. Кроме того, выделяется цвет фона, который не кодируется, а является инверсией к сумме всех подмножеств. При этом коды сгруппированных пикселей могут быть достаточно громоздки, и они должны быть объединены с другой информацией об изображении: данные о цветах, ширине и высоте изображения и т.п. С учетом вышеуказанных требований была предложена структура кодировки (Рис.3). Где Блоки «0:0, 0:1 и т.д.» – это количество чередующихся сгруппированных заполненных либо пустых пикселей, по принципу «есть цвет – нет цвета».^ Объем данных каждого элемента структуры: Ширина изображения 2 байта Высота изображения 2 байта Код цвета 3 байта Блок кодировки 1-4 байта, переменный ^ Рис.3. Структура кодировкиПри таких технических характеристиках обрабатываемое изображение может превышать 500 МегаПикселей. Если повысить количество байт в одном блоке, то величина и качество изображения будет возрастать в геометрической прогрессии. Блок кодировки может принимать значения от 1 до 4 байт, при этом каждый восьмой бит несет в себе информацию, ожидается ли следующий байт текущего блока или начало следующего блока. Порядок закодированных подмножеств (слоев) также имеет значение, что является одной из особенностей алгоритма.^ 4.2. Алгоритм декодирования В алгоритм декодирования входит: Прорисовка фона соответствующим цветом. Переход от слоя к слою Перевод одномерных кодов в двумерные. Раскодирование блочных кодов. Прорисовка слоев на изображении. В основе декодирования лежит прорисовывание одних слоев-подмножеств поверх других, в порядке, зарегистрированном при кодировании. При раскодировании блоки считываются, с учетом их различной длины, кроме того из линейного кода переводятся в двумерные множества на плоскости каждого из слоев, и количество таких слоев равно количеству цветов. При обычной прорисовке изображения можно использовать обычную функцию объединения слоев, не зависимо от того, что теперь мы работаем над измененными слоями : где: Однако мы можем работать с различными множествами независимо друг от друга, в чем и заключается особенность морфологического подхода и разработанной концепции. Эти особенности можно описать примером и показать практический смысл. ^ Рис.4. Схема выделения и передачи отдельных информационных слоев в изображенииДопустим при работе с физической картой местности, в которой цветом отмечены различные высоты, можно по запросу выделить интересующую область по интервалу высот, а «лишние» области изображения не передавать через канал связи (Рис.4.). Что актуально в наше время интернет технологий. В этом случае, для выделения интересующего смыслового слоя нужно найти функцию , где и мы используем алгоритм: 1. где: Получаем , что является суммой всех слоев, выше интересующего слоя k до n. Это множество было взято потому, что теперь с его помощью мы удаляем из те отличия, которые помогли нам более эффективно сжать и закодировать изображение. 2. Теперь мы получили:. Это и есть первоначальный информационный цветовой слой , запрошенный пользователем, объем которого на порядок меньше целого изображения. То есть алгоритм декодирования был выполнен на сервере, выбрав необходимые данные, сэкономив тем самым время передачи данных и время поиска пользователем нужной информации в целом, громоздком изображении.^ 5. РЕАЛИЗАЦИЯ В ПРОГРАММЕ И РЕЗУЛЬТАТЫ Данный алгоритм обработки и сжатия изображений реализован в программном обеспечении на языке Delphi, как дополнение к имеющемуся программному комплексу. С помощью этого программного обеспечения возможно открывать изображения основных графических форматов, обрабатывать их, а затем сохранять, в том числе и в новом, предложенном формате сжатия. В данном программном комплексе изображения сохраняются в файл, но этот алгоритм легко может быть применим и к хранению в базах данных. Программное обеспечение позволило провести практические опыты, определить степень сжатия, а также сравнить с уже имеющимися форматами. При использовании такого метода обеспечивается довольно высокий коэффициент сжатия, он достигает значений 18:1.Таблица 1 Тип тестируемого изображения Без сжатия (BMP) GIF JPG (векторное сжатие) Тестируемый алгоритм Цветное с крупными объектами ~1200 Кб ~44 Кб ~54 Кб ~66 Кб Мелкодисперсное, серое изображение ~415 Кб ~215 Кб ~80 Кб ~150 Кб Как видно из таблицы 1, в сравнении с другими форматами, тестированное изображение не намного уступает по объемам и сам метод сжатия универсальным назвать нельзя, однако методы 3D морфологии для разработки такого подхода позволяют иначе рассматривать изображения. Как уже было написано выше, цветовые слои, из которых состоит изображение, могут нести смысловую нагрузку. Следовательно, область и выбранные по запросу слои будут гораздо более компактными по сравнению с другими форматами только потому, что появляется возможность избавиться от лишней информации, которую не нужно передавать от сервера к пользователю. А при разработке и эксплуатации информационных систем этот метод может сделать работу более удобной, быстрой и разгрузить каналы передачи данных.Литература Семенов Ю.А. Telecommunication technologies – телекоммуникационные технологии; http://book.itep.ru, 2007. Пытьев Ю.П. Морфологический анализ цветных изображений, http://cityref.ru/prosmotr/7518-0.htm, 2005. Пытьев Ю.П. Задачи морфологического анализа изображений. Математические методы исследования природных ресурсов Земли из космоса. – М.: Наука, 1984. Задорожный С.С. Морфологический анализ формы изображений: http://www.butovo.com/~zss/bw_morf.html, 2002. Shapiro L.G., Stockman G.C. Computer Vision. Prentice Hall, 2001. Haralick R.M. and Shapiro L.G. Computer and Robot Vision, vol.2. –P.453-507. –Addison-Wesley, 1992.

Не сдавайте скачаную работу преподавателю!

Данный реферат Вы можете использовать для подготовки курсовых проектов.

Доработать Узнать цену написания по вашей теме

Поделись с друзьями, за репост + 100 мильонов к студенческой карме :

Заказать работу:

!	Курсовая работа
!	Дипломная работа
!	Реферат
!	Решение задач
!	Отчет по практике
!	Контрольная работа

Пишем реферат самостоятельно:

!	Как писать рефераты Практические рекомендации по написанию студенческих рефератов.
!	План реферата Краткий список разделов, отражающий структура и порядок работы над будующим рефератом.
!	Введение реферата Вводная часть работы, в которой отражается цель и обозначается список задач.
!	Заключение реферата В заключении подводятся итоги, описывается была ли достигнута поставленная цель, каковы результаты.
!	Оформление рефератов Методические рекомендации по грамотному оформлению работы по ГОСТ.

Читайте также:

→	Виды рефератов Какими бывают рефераты по своему назначению и структуре.

Другие популярные рефераты:

Реферат	Механические волны
Реферат	Обратная матрица
Реферат	Инверсия и ее применение
Реферат	Социокультурная динамика межпоколенных взаимодействий
Реферат	Расследование преступлений в сфере компьютерной информации
Реферат	Туристско-краеведческая характеристика Калининградской области
Реферат	Организация административно-хозяйственной службы гостиницы
Реферат	Диагностика психологической готовности ребенка к школе 2
Реферат	Модель современного менеджера
Реферат	Условия формирования военно-административной системы Южного Зауралья в XVII - первой половине XIX века

Сейчас смотрят :

Реферат	Культура Казахстана
Реферат	Кредитування підприємств на фоні фінансової кризи 2008-2009 рр на матеріалах ПАТ КБ Приватбанк
Реферат	Алкоголизм хроническое заболевание, вызванное систематическим употреблением спиртных напитков
Реферат	Обоснование выбора пестицидов для борьбы с вредными объектами и разработка технологии их эффективного и безопасного применения
Реферат	Административно-правовое регулирование обеспечения граждан социальным жильем
Реферат	Формирование предпосылок связной речи у детей раннего возраста
Реферат	Арина Петровна и ее сыновья по роману М. Е. Салтыкова-Щедрина Господа Головлевы
Реферат	Природа, властивості та феноменологія сприймання
Реферат	Тибет и Восточный Туркестан в Новое время
Реферат	Gawain Heroes Essay Research Paper Sir Gawain
Реферат	Как научить желать возможного
Реферат	Общий обзор Южной Америки. История формирования материка и полезные ископаемые
Реферат	Что такое инфекционный мононуклеоз
Реферат	Проект изменения электрической части Запорожской АЭС
Реферат	Элементы математической статистики

Реферат по предмету "Разное"

Анализ и сжатие изображений с использованием математической 3d морфологии

Другие популярные рефераты:

Сейчас смотрят :