Меню

Стандарты сжатия MPEG

Уменьшение цифрового потока видеосигнала за счет сокращения избыточности в изображении осуществляется в цифровом телевидении применением специальных эффективных методов кодирования. Для этого используются стандарты сжатия, разработанные Экспертной группой по движущимся изображениям в кинематографии (Moving Picture Experts Group - MPEG).

MPEG

- это стандарты, определяющие параметры сжатия аудио- и видеофайлов и преобразования их в форматы, более удобные для пересылки. MPEG состоит из трех частей: Audio, Video, System (синхронизация двух других).

По стандарту MPEG-1

потоки видео- и аудиоданных передаются со скоростью 150 Кбайт/с (как в односкоростном CD-ROM-проигрывателе) и управляются путем выборки ключевых видеокадров и заполнением только областей, изменяющихся между кадрами.

MPEG-1

оптимизирован для использования с разрешением: 352 ppl (point per line - точек на линии), 240 lpf (line per frame - линий в кадре), 30 fps (frame per second - кадров в секунду) с цветовой схемой YCBCr (где Y- яркостная составляющая, СB=В-У и Cr=R-Y - цветоразностные) и, к сожалению, обеспечивает качество видеоизображения более низкое, чем видео, передаваемое по телевизионному стандарту.

Перед началом кодирования происходит анализ видеоинформации, выбираются ключевые кадры, которые не будут изменяться при сжатии, а также кадры, при кодировании которых часть информации будет удаляться. Всего выделяется три типа кадров:

кадры типа I (Intra frame) - ключевые кадры, которые сжимаются без изменений;

- кадры типа Р (Predirected frame). При кодировании этих кадров часть информации удаляется, а при воспроизведении используется информация от предыдущих I или Р кадров;

- кадры типа В (Bidirectional frame). При кодировании потери информации еще более значительны, а при воспроизведении используется информация от двух предыдущих I или Р кадров.

Наличие В кадров в видеоролике - тот фактор, благодаря которому MPEG-1 имеет высокий коэффициент сжатия, но не очень высокое качество. При кодировании формируется цепочка кадров разных типов (рис.5). Наиболее типичная последовательность - IBBPBBPBBIBBPBBPBB . Соответственно, очередь воспроизведения по номерам кадров будет выглядеть так: 1423765 .

По окончании разбивки кадров на разные типы начинается процесс подготовки к кодированию. С I кадрами это достаточно просто: кадр просто разбивается на блоки, которые имеют размеры 8x8 пикселей. А вот для того, чтобы сильнее сжать кадры типа Р и В, используется алгоритм предсказания движения.

Рис.5

В качестве входной информации алгоритм предсказания движения получает блок текущего кадра (8x8 пикселей) и аналогичные блоки от предыдущих кадров (I- или Р- типа). После обработки имеется следующая информация:

вектор движения текущего блока относительно предыдущих;

разница между текущим и предыдущими блоками, которая и подвергается дальнейшему кодированию.

Вся избыточная информация удаляется, благодаря чему и достигается столь высокий коэффициент сжатия, но невозможный без потерь. В случае корректного срабатывания алгоритма предсказания движения количество кадров разного типа (I:Р:В) в байтах соотносится примерно как 15:5:2, т.е. уменьшение объема видеоинформации налицо уже на стадии подготовки к кодированию.

Дальше начинается само кодирование. Процесс кодирования содержит в себе 3 стадии:

преобразование Фурье (дискретное косинусное преобразование - Discrete Cosine Transformation - DTC);

квантование (Quantization) - перевод данных из непрерывной формы в дискретную;

преобразование полученных блоков данных в их последовательность (преобразование из матричной формы в линейную).

Кодирование звука осуществляется отдельным звуковым кодером. По мере развития формата MPEG-1, звуковые кодеры неоднократно переделывались, становясь все эффективнее. К моменту окончательной стандартизации формата MPEG-1 было создано три звуковых кодера этого семейства: Layer I, Layer II (иногда называют Musicam по названию стандарта, послужившего прообразом) и Layer III. Принципы кодирования основаны на том, что для человеческого уха в несжатом звуке (CD-audio) передается много избыточной информации. Принцип сжатия работает на "эффектах маскировки" некоторых звуков (например, если идет сильный звук на частоте 1000 Гц, то более слабый звук на частоте 1100 Гц человек уже не слышит, чувствительность слуха падает примерно на 100 мс после окончания сильного звука). Психоакустическая модель (Psycoacustic), используемая в MPEG-1, разбивает весь частотный спектр на части, в которых уровень звука считается одинаковым, а затем удаляет звуки, не воспринимаемые человеком из-за эффектов маскировки.

Перейти на страницу: 1 2 3

Другие статьи:

Система вентиляции Siemens LOGO
Автоматизация является одним из важнейших факторов роста производительности труда в промышленном производстве. Непрерывным условием ускорения темпов роста автоматизации является развития технических средств автоматизации. К т ...

Оценка и анализ структуры системы защиты информации
Информационная безопасность предприятия – это защищенность информации, которой располагает предприятие (производит, передает или получает) от несанкционированного доступа, разрушения, модификации, раскрытия и задержек при пос ...

Синтез частотных характеристик линейных систем автоматического регулирования
частотная разомкнутая система 1. Построить логарифмические частотные характеристики разомкнутой системы по заданным показателям качества. 2. Определить по построенным ЛАХ и ЛФХ запасы устойчивости по усилению и по фазе. ...

(C) 2020 | www.techniformula.ru