Оглавление
Введение
AVI - Audio Video Interleaved, файловый формат, введенный фирмой Microsoft для использования систем работы с видеоизображениями в среде Windows. В этом формате сектора видео данных чередуются с секторами звуковых данных таким образом, что видеоплеер мог бы поддерживать минимальную буферизацию данных.
Несмотря на то, что все большее распространение получает формат MPEG (MPEG стандарты включают MPEG-1, MPEG-2, MPEG-4, и MPEG-7), AVI продолжает оставаться самым популярным для аудио/видео данных на PC. В области ввода и редактирования видео AVI остается стандартом де-факто.
Широкое распространение формат AVI получил после выхода Video for Windows для Windows 3.1 в ноябре 1992 года. AVI является специальным случаем формата RIFF (Resource Interchange File Format). RIFF – универсальный формат для обмена мультимедиа данных, совместно разработанный Microsoft и IBM. Фактически, RIFF – аналог формата IFF, созданного Electronic Arts в 1984 году.
Аудио и видео последовательности в AVI файле не содержат временных меток и не создают индексы. Данные упорядочиваются во времени последовательно, согласно их порядку в AVI файле. Приложение (видеоплеер) должно отображать кадры видеопоследовательности и аудиопоток согласно частоте кадров и частоте дискретизации соответственно, указанных в заголовках файла.
В связи с большим количеством ограничений базового стандарта AVI, консорциумом Open Digital Media было разработано расширение формата AVI – OpenDML AVI с учетом особенностей, требуемых для профессионального производства видео. Данные расширения включают поддержку полей (не только кадров), размеры файлов больше 1 Гб, временной код и многие другие особенности.
Глава 1. Теория и терминология
Видео — это обычный ряд записанных друг за другом изображений. Как известно, видео начали записывать задолго до появления первого компьютера, т.е. в аналоговом виде. Это накладывало большие ограничения по его последующей обработке и редактировании. Вплоть до начала 1990-х годов преобладал именно этот тип записи видео. Позже были разработаны цифровые технологии записи и хранения видео. Это дало большой толчок в развитии не только кинематографа, но и домашнего видео. Т.е. запись видеороликов и домашних фильмов стала очень популярным занятием. Все это, на фоне развития компьютерной техники, вынуждало разработчиков совершенствовать технологии записи, хранения и обработки видеоинформации. Вот как раз для хранения такой информации и были разработаны различные видеоформаты (на данный момент их огромное множество и ориентироваться в них очень сложно).
Видео формат определяет структуру видео файла, т.е. то, как хранится файл на носителе информации (CD, DVD или жестком диске).
Из-за большого количество форматов видео, многие стали путать совершенно различные понятия – «стандарт видео», «видео кодек» и «медиаконтейнер».
Кодек (CODEC = COder+DECoder /кодек = кодер + декодер/) — программные или аппаратные средства, преобразующие видеоинформацию в поток уплотнен
ных данных и наоборот.
Медиаконтейнер – формат файла, который хранит в себе информацию о своей внутренней структуре. Медиаконтейнер фактически является метаформатом, так как он хранит данные и информацию о том, как данные будут сохраняться непосредственно внутри файла.
Можно провести некую аналогию между медиаконтейнером и zip-архивом. Т.е. медиаконтейнер содержат видео и аудио файлы внутри себя, как и zip-архив, содержащий JPEG-картинку, которая будет сжата с помощью определенного алгоритма. За сжатие информации в архивах обычно отвечает специальный модуль, а в медиаконтейнрах роль этого модуля выполняет кодек.
Любой видео файл имеет как минимум две характеристики определяющие работу с ним. Это тип медиаконтейнера и кодек (кодеки), которыми закодировано его содержимое.
Тип медиаконтейнера определяет формат записи различных данных (видео данные, аудио данные, субтитры, служебная информация и т. д.) в файл. Зная тип контейнера программа (например, видео плеер) может корректно извлекать из него данные, синхронизировать аудио и видео данные и т.д.
Знание кодека позволяет программе из закодированного потока данных получить аудио и видео информацию, содержащуюся в медиаконтейнере.
Глава 2. Формат AVI 2.1. Общие сведения о формате сжатия AVI
Audio Video Interleave (сокращённо AVI; букв. «чередование аудио и видео») – RIFF-медиаконтейнер, впервые использованный Microsoft в 1992 году в пакете Video for Windows.
Формат файлов с расширением AVI может содержать видео и аудио данные, сжатые с использованием разных комбинаций кодеков, что позволяет синхронно воспроизводить видео со звуком. AVI файл может содержать различные виды компрессированных данных (например, DivX — видео + WMA – аудио или Indeo – видео + PCM – аудио), в зависимости от того, какой кодек используется для кодирования/декодирования. Как и DVD, AVI файлы поддерживают многопотоковое аудиовидео. AVI-файлы могут содержать различные виды сжатых данных, к примеру DivX для видеоинформации и MP3 для аудио.
AVI-файлы – особый случай файлов RIFF (сокращенно от Resource Interchange File Format). Этот формат, изначально предназначавшийся для обмена мультимедийными данными, был разработан Microsoft совместно с IBM. Данный формат является наиболее распространенной формой представления видео на персональных компьютерах. В зависимости от формы представления видеоданных файлы AVI бывают различных стандартов.
AVI (Audio Video Interleaved) – это самый распространенный и наименее сжатый из видеоформатов. Файлы, созданные с использованием этого метода, имеют расширение .avi. Видео- и аудиоданные записываются в один файл на диске следующим образом: все информационные потоки раз
биваются на множество равных частей (chunks) и затем записываются в один файл друг за другом по очереди. Сначала записывается заголовок, а затем 1-я часть видео и 1-я часть звука; затем 2-я часть видео и 2-я часть звука и т. д. Иначе говоря, используется технология чередования видеокадров и звука, которой, собственно, и определяется аббревиатура AVI (Audio Video Interleaved). В среднем одна секунда AVI-изображения занимает при
мерно 2 Мбайт на жестком диске.
Основные характеристики:
Тип – медиаконтейнер
Совместимые кодеки – DivX, Xvid, Indeo и другие (для видео) и MP3, WMA и другие (для аудио)
Расширение файлов – .avi
AVI файлы могут быть проиграны различными плеерами, но плеер должен поддерживать кодек, используемый для кодирования данного видео.
2.2. Представление цвета в формате AVI
В стандарте AVI не все несжатые кадры одинаковы. Существуют различные цветовые представления точек изображения. Некоторые из них являются стандартами и поддерживаются во всех системах, другие требуют специальных драйверов. Большинство компонентов Microsoft Windows идентифицируют представление цвета по четырехсимвольному коду (FOURCC), например, 'RGB8' или 'YUY2', другие, например, DIB, не используют четырехсимвольный код для цветовых форматов.
24-разрядный RGB – наиболее известный формат представления цвета, поддерживаемый всеми основными графическими программами. В 24 битах RGB пиксел представлен как три байта, один байт для красного компонента, один байт для зеленого компонента, и один для синего.
Например:
255 0 0 (яркий красный пиксел)
0 255 0 (яркий зеленый пиксел)
0 0 255 (яркий синий пиксел)
0 0 0 (черный пиксел)
255 255 255 (белый пиксел)
128 128 128 (серый пиксел) и т.д.
Другие цветные форматы:
8 бит полутоновый Y8
9 бит бита YUV9
12 бит BTYUV 4:1:1
12 бит YUV2 4:2:2
8 бит YUV12 16 RGB (использует цветовую палитру)
15 бит RGB (16 бит со значащим разрядным нулем, 5 бит для красного, 5 для зеленого и 5 для синего)
16 бит RGB (16 бит, 5 бит для красного, 6 для зеленого и 5 для синего)
32 бит RGB (значащий байт нулевой, 8 бит для красного, 8 для зеленого и 8 для синего)
YUV – формат представления цвета, используемый в европейском вещании телевизионного стандарта PAL, который был первоначально представлен в Англии и Германии в 1967 году. PAL используется большинством европейских государств и многими странами во всем мире. Соединенные Штаты и Япония используют стандарт NTSC, Франция, Россия и некоторые другие государства – SECAM. Аналоговые видеосистемы, такие как NTSC, PAL и SECAM, передают цветные видеосигналы как сигнал яркости (Y) и два сигнала цветовой разности (U и V). Если, R, G, и B — красные, зеленые, и синие компоненты, то:
Y = 0.299 R + 0.587 G + 0.114 B
U = 0.493 (B — Y)
V = 0.877 (R — Y)
Информация о цвете передается мозгу по трем каналам: каналу яркости, сине-желтому и красно-зеленому каналу. Например, в то время как мы различаем сине-зеленые оттенки, мы никогда не почувствуем оттенок, который является одновременно синим и желтым. Возможно, поэтому YUV настолько распространена. Эта система представления цвета используется такими цветными форматами, как YUV9 или YUV2.
И неподвижные изображения BMP и AVI файлы могут быть сохранены в различных цветных форматах. В то время как 24 бит RGB поддерживается почти повсеместно, нет никакой гарантии, что программное обеспечение или драйверы воспроизведения AVI поддержат менее известные форматы.
2.3. Компьютерный видео-файл AVI
Существует несколько форматов компьютерного видео, из которых наиболее известны AVI (фирма Microsoft), QuickTime (фирма Apple).
Большая часть систем захвата кадров и нелинейного монтажа имеют дело с форматом AVI (Audio Video Interleave – чередование аудио и видео). Этот формат позволяет одновременно хранить изображение и звук. Они записываются попеременно, так что после кадра идет запись звукового сопровождения к нему.
По структуре AVI-формат представляет собой вариант формата RIFF. Файл этого формата состоит из блоков (chunks), которые, в свою очередь, могут содержать другие вложенные блоки. Самый «верхний» блок — RIFF — содержит идентификатор формы «avi_», который собственно и обозначает, что мы имеем дело с *.avi-файлом. Для идентификатора отведено четыре символа, но один из них не используется.
В *.avi-файле есть, по крайней мере, два подблока: подблок заголовка и подблок данных. Первый содержит общую информацию о фильме: разрешение изображения, частота кадров, формат аудио и т.д. В заголовке для записи длины файла отводится 32 байта. Это значит, что максимально возможный размер файла – около 4-х Гб. На самом деле реальная длина *.avi-файла стандартного формата, с которой могут работать программы монтажа, не превышает 2Гб. Во времена возникновения формата это казалось достаточным, поскольку FAT 16 не допускал существования разделов диска, превышающих 2Гб, а длина файла, естественно, не может превышать размер логического диска. С появлением FAT 32 верхняя граница размера раздела значительно отодвинулась.
Подблок данных организован в виде последовательностей записей, каждая из которых состоит из одного кадра и соответствующего звукового сопровождения. Для видео деление на кадры совершенно естественно, но звук представляет собой непрерывный поток, искусственно несчленяемый на фрагменты, соответствующие кадрам. Если для записи как видео, так и звука используется устройство видеоввода – проблем обычно не возникает. Если звук пишется через звуковую карту – точная синхронизация изображения и звука отсутствует и звук может «уходить от изображения».
Изображение в формате AVI поддерживает довольно разнообразные палитры. Их список приводится ниже:
8-битная (256 градаций серого);
9-битная YUV (яркостный сигнал и два цветоразностных);
12-битная YUV, 4:1:1 (здесь, 4:1:1 — дискретизация сигнала, которая вичисляется для конкретного канала как произведение базовой частоты цифрового кодирования на соответствующий коэффициент: 4 для канала Y и 1 для цветоразностных каналов);
16-битная YUY2, 4:2:2;
8-битная цветная (RGB);
15-битная RGB (16-битная с установкой в 0 старшего бита, 5 для красного, 5 для зеленого и 5 для синего);
16-битная RGB (5 бит для красного, 6 для зеленого и 5 для синего);
24-битная RGB (стандартная RGB палитра);
32-битная RGB (по информативности полностью равна 24-битной: старший байт устанавливается в 0, для кодирования каждого из трех цветов отводится 1 байт). 32-битное представление цвета не увеличивает точности цветопередачи. Наиболее информативной палитрой является 24-битная RGB
Запись в формате AVI может производиться без сжатия или с сжатием. Обычно используется Motion JPEG. Также поддерживаются форматы компрессии: Microsoft Video 1 (формат работает только с 8- и 16- битным цветом), Microsoft RLE (только 8-битный цвет), Indeo, Cinepak Editable MPEG, который использует только I-кадры.
Заключение
Как, оказалось разобраться в многообразии существующих сегодня видео форматов очень и очень сложно. Во-первых, существуют десятки различных стандартов видео, которые порой сильно отличаются друг от друга. Во-вторых, из-за «войн форматов» появляются все новые и новые форматы похожие друг на друга, но все же имеющие свои особенности. В-третьих, не все из форматов получили широкое распространение из-за патентов на их использование и т.п. Все это приводит к тому, что сейчас довольно сложно ориентироваться в этом многообразии технологий. Хотя некоторые подвижки в лучшую сторону все же есть (в частности с разработкой стандартов MPEG) и, будем надеяться, что они сохранятся.
Часто возникают проблемы при воспроизведении того или иного ролика, если в системе нет соответствующего кодека для декодирования видеопотока. Это может возникнуть из-за того, что используется плеер, который поставляется с кодеками только одной фирмы, которая не может использовать чужие кодеки из-за патентных запретов. Этого можно избежать, устанавливая, так называемые, кодек-паки.
Список использованной литературы
zoom.cnews.ru/ru/publication/index.php?art_id80=343 Разбираемся с форматами цифрового видео;
www.stereo.ru/whatiswhat.php?article_id=225 Носители цифрового видео;
www.compress.ru/Archive/CP/1999/10/16/#01 Методы сжатия цифрового видео;
www.diapaz.kz/source/tv_format.html Форматы видеозаписи.