Mpeg2 или mpeg4 что лучше: все, что вы хотите знать, здесь

Содержание

MPEG 2 vs. MPEG 4: особенности стандартов сжатия

MPEG-2

 

положительные стороны:

       Существует уже на протяжении более 10 лет.

       Методы MPEG-2 используются с успехом в сравнительно широкополосных системах спутникового и кабельного телевидения.

 

 

отрицательные стороны:

       Ограничения, свойственные этому алгоритму, стали очевидны, как только MPEG-2 приблизился к своему пределу эффективности кодирования в смысле стоимости его применения.

       При дальнейшем развитие цифрового телевидения на основе компрессии MPEG-2 введение ТВЧ экономически неоправданно, так как в данном случае зритель вместо 5 каналов стандартной четкости получит всего один канал высокой четкости. Особенно это касается цифрового наземного телевидения, где особо остро ощущается дефицит полосы частот.

       Большим недостатком MPEG-2 является недостаточное обеспечение эффективной работы аудиовизуальных служб Интернета. На фоне стремительного развития Интернета и средств мобильных коммуникаций (прежде всего — мобильной телефонии) становится ясным, что современным требованиям не удовлетворяют основные принципы телевидения. Требуются принципиальные изменения в техническом обеспечении современного телевизионного вещания.

          Формат представления аудиовизуальных сцен не должен зависеть от метода доставки медиаобъектов. Должно быть обеспечено независимое представление объектов различных типов в сцене, независимый доступ к объектам для обработки, манипуляций и повторного использования. Стандарт должен также определять способы обеспечения помехозащищенности от ошибок, возникающих в каналах с тяжелыми условиями передачи данных (например, в мобильной связи). Необходимо определить способы компоновки аудиовизуальных сцен из объектов разных типов. Надо создать систему описания объектов и событий в сцене, а также обеспечить гиперсвязи и интерактивность. Важный аспект — должна быть предусмотрена защита прав на интеллектуальную собственность, связанную со свойствами и содержанием сцен.

 

 

 

MPEG-4

 

положительные стороны:

        Технология позволяет снизить требуемую полосу пропускания в диапазоне, обеспечивая при этом доставку видео такого же качества или даже выше.

       Развитие методов сжатия контента и удаления артефактов привело к появлению MPEG-4В течение недавнего времени отрасль вещания видео начала постепенный переход на новый формат MPEG-4 AVC (H.264).

       Кодирование по стандарту AVC обеспечивает существенное снижение скорости потоков и выигрыш в эффективности компрессии 30…60% по сравнению с MPEG-2. Это позволяет достичь более высокой производительности в обработке видео, одновременно предоставляя возможность передавать в той же самой полосе частот большее число каналов. Таким образом, сеть на основе нового стандарта кодирования может работать с повышенным числом ТВЧ-каналов и расширенным набором разнообразных услуг.

       Эффективное и оптимальное представление объектов означает не только достижение высокой степени компрессии, но и соответствие другим требованиям, например, помехозащищенность, произвольный доступ, простота редактирования и т. п.

       Данные MPEG-4 могут упаковываться в пакеты транспортного потока MPEG-2, которые передаются в инфраструктуре сетей ТВ-вещания. Данные MPEG-4 могут также инкапсулироваться в пакеты протокола реального времени RTP.

       Существует много различных приложений, в которых целесообразно и выгодно использовать объектно-ориентированные средства MPEG-4. Эти приложения: вещание, дистанционное наблюдение, персональные коммуникации, игры, мобильные мультимедийные системы связи, системы виртуальной реальности и т. п.

       Стандарт позволяет создавать службы, объединяющие три различных модели обслуживания: вещание, оперативное взаимодействие в реальном времени, коммуникации.

       Одна из наиболее действенных форм расширения возможностей телевидения — добавление сопутствующей информации в виде текста, таблиц, диаграмм, фотографий, двумерных или трехмерных графических образов, комментариев на разных языках. Сейчас такая информация, если она вводится, является неотъемлемой частью содержания программы. Она сначала включается в изображения, потом суммарное изображение кодируется и передается. Система MPEG-4 позволяет передавать эту информацию отдельно, предоставляя зрителю возможность выбора — смотреть или не смотреть, а если смотреть — то какую часть сопутствующей информации. Кроме того, дополнительная информация может кодироваться оптимальным образом (для каждого вида информации).

       Зритель программы может приспосабливать воспроизведение дополнительной сопутствующей информации к своим вкусам и желаниям. К некоторым программам, например историческим, научным, или художественным, можно добавлять гораздо больше информации, которая будет появляться по желанию зрителя. Переходить между разными видами информации помогут гиперссылки. Дополнительная информация может передаваться по разным каналам и интегрироваться с основным содержанием программы в приемнике.

       К новым, очень привлекательным возможностям относится выбор точки зрения камеры во время спортивных передач или музыкальных шоу. Можно выбирать каналы звука (например, голос комментатора, шум стадиона, крики игроков во время спортивных программ). В качестве фонового изображения может использоваться дополнительная информация о программе, фильме, субтитры на разных языках, комментарии на выбранном языке. Синтезированная в приемнике «говорящая голова» может обеспечить сурдоперевод для слабослышащих.

       MPEG-4 ориентирован на конвергенцию, которая обусловлена проникновением аудиовизуальной информации во все службы и все типы сетей. Поэтому MPEG-4 — это не некоторый замкнутый и неделимый стандарт, а инструментарий, или комплекс инструментальных средств. Выбор наборов средств для конкретных приложений осуществляется в соответствии с выбранным профилем.

       Интерактивность — одна из наиболее многообещающих функциональных возможностей MPEG-4. Она поддерживается объектно-ориентированным кодированием, управлением поведением объектов с помощью средств BIFS (Binary Format for Scenes – бинарный формат для сцен), гиперсвязей. Интерактивность обеспечивает трансляцию вещательных видеоигр, интерактивных викторин.

 

 

отрицательные стороны:

       В силу того, что оборудование MPEG-2 уже установлено по всему миру в огромном количестве, оно продолжает активно использоваться даже в условиях постепенного внедрения новейших схем кодирования AVC. Таким образом, возникает проблема поддержки одновременно нескольких форматов.

       Наращивание выпуска обновленных абонентских приставок также требует кодирования одновременно в форматах MPEG-2 и AVC тем самым, поднимая и так немалую стоимость абонентских приставок, что существенно затрудняет внедрение цифрового ТВ. Однако если учесть темпы развития цифровых технологий и то, что переход на цифровое ТВ будет проходить несколько лет, то этот недостаток нивелируется в течении 2-3 лет.

Разница между MPEG2 и MPEG4 — Разница Между

Разница Между 2021

Ключевое отличие: MPEG обозначает Группу экспертов по движущимся изображениям. MPEG2 был выпущен в 1995 году и фактически является преемником MPEG1. Он очень похож на MPEG1 и нацелен на улучшение пред

Содержание:

Ключевое отличие: MPEG обозначает Группу экспертов по движущимся изображениям. MPEG2 был выпущен в 1995 году и фактически является преемником MPEG1. Он очень похож на MPEG1 и нацелен на улучшение предыдущего формата. MPEG2 включает в себя общее кодирование движущихся изображений и связанной аудиоинформации. MPEG4 был выпущен в 1999 году и был разработан как метод кодирования для устройств с ограниченными ресурсами, в основном портативных устройств, таких как медиаплееры и мобильные телефоны. Этот формат также часто используется для онлайновых видео- и аудиофайлов, в основном для потоковой передачи мультимедиа, а также для распространения компакт-дисков, телефона, видеофона и вещательного телевидения.

MPEG обозначает Группу экспертов по движущимся изображениям. Это рабочая группа экспертов, которая была сформирована в 1988 году ISO и IEC. Это была совместная инициатива Хироши Ясуда из Nippon Telegraph and Telephone и Леонардо Кьярильоне. Chiariglione служил в качестве председателя группы с момента ее создания.

Целью MPEG было установить стандарты для сжатия и передачи аудио и видео. К 2005 году группа выросла до 350 членов на совещание из различных отраслей, университетов и исследовательских институтов.

Стандарты, установленные MPEG, состоят из разных частей. Каждая часть охватывает определенный аспект всей спецификации. MPEG стандартизировал следующие форматы сжатия и вспомогательные стандарты:

  • MPEG-1 (1993): кодирование движущихся изображений и связанного звука для цифровых носителей со скоростью до 1,5 Мбит / с (ISO / IEC 11172). Предназначен для сжатия необработанного цифрового видео и аудио CD с качеством VHS без чрезмерной потери качества, благодаря чему возможны видео компакт-диски, цифровое кабельное / спутниковое телевидение и цифровое аудиовещание (DAB). Он включает в себя популярный формат сжатия звука MPEG1 Audio Layer III (MP3).
  • MPEG-2 (1995): общее кодирование движущихся изображений и соответствующей аудиоинформации (ISO / IEC 13818). Описывает комбинацию методов сжатия видео с потерями и сжатия аудио данных с потерями, которые позволяют хранить и передавать фильмы с использованием доступных в настоящее время носителей и пропускной способности передачи.
  • MPEG-3: имеет дело со стандартизированным масштабируемым сжатием и сжатием с несколькими разрешениями и был предназначен для сжатия HDTV, но был признан избыточным и был объединен с MPEG2.
  • MPEG-4 (1999): Кодирование аудиовизуальных объектов. Включает сжатие AV-данных для веб-приложений (потоковое мультимедиа) и распространения CD, голосовых (телефон, видеофон) и вещательных телевизионных приложений. Включает MPEG-4 Part 14 (MP4).
  • MPEG-7 (2002): интерфейс описания мультимедийного контента. Не стандарт, который имеет дело с фактическим кодированием движущихся изображений и аудио, таких как MPEG1, MPEG2 и MPEG4. Он использует XML для хранения метаданных и может быть присоединен к временному коду, чтобы пометить определенные события или синхронизировать текст песни с песней.
  • MPEG-21 (2001): мультимедийная структура. Он нацелен на определение открытой платформы для мультимедийных приложений. Основано на определении цифрового элемента и пользователей, взаимодействующих с цифровыми элементами.

MPEG2 был выпущен в 1995 году и фактически является преемником MPEG1. Он очень похож на MPEG1 и нацелен на улучшение предыдущего формата. MPEG2 включает в себя общее кодирование движущихся изображений и связанной аудиоинформации. Это улучшает коэффициент сжатия и расширяет возможности MPEG1, так что MPEG2 в основном используется для DVD-видео, а также для вещания цифрового телевидения, включая эфирное, кабельное и спутниковое.

MPEG2 также представляет собой сжатие с потерями, однако MPEG2 обеспечивает лучшее разрешение. Он также использовал более высокие скорости передачи данных. Сжатие с потерями означает, что при сохранении файла происходит небольшая потеря качества из-за сжатия. При каждом повторном сохранении наблюдается небольшая потеря качества из-за сжатия. Следовательно, это не самый лучший формат, если нужно постоянно вносить многочисленные изменения и повторно сохранять изображение. Тем не менее, если сделать несколько правок и файл сохраняется в формате высокого качества, небольшая потеря качества из-за сжатия в основном незначительна. Преимущество использования этого формата заключается в том, что из-за сжатия файл будет занимать меньше места для хранения данных.

Кроме того, MPEG2 устраняет некоторые недостатки MPEG1, в том числе:

  • Сжатие звука ограничено двумя каналами
  • Нет стандартизированной поддержки чересстрочного видео с плохой компрессией при использовании чересстрочного видео
  • Ограниченный стандартизированный профиль, который был несовместим с видео с более высоким разрешением. Поддержка видео 4k, но нет практического способа кодировать видео для более высоких разрешений
  • Ограниченная идентификация вспомогательного оборудования
  • Поддержка только одного цветового пространства — 4: 2: 0

Кроме того, MPEG2 также включает в себя поддержку переменного квантования и VBR. MPEG2 также имеет более сложный алгоритм кодирования, из-за чего он несовместим с MPEG1. Следовательно, проигрыватели MPEG1 не могут декодировать и воспроизводить файлы MPEG2.

MPEG4 был выпущен в 1999 году и был разработан как метод кодирования для устройств с ограниченными ресурсами, в основном портативных устройств, таких как медиаплееры и мобильные телефоны. Этот формат также часто используется для онлайновых видео- и аудиофайлов, в основном для потоковой передачи мультимедиа, а также для распространения компакт-дисков, телефона, видеофона и вещательного телевидения.

MPEG4 основан на стандартах MPEG-1 и MPEG-2 и, подобно им, является стандартом алгоритма сжатия графики и видео с потерями. Однако файлы MPEG-4 имеют меньший размер и, следовательно, предпочтительнее для потоковой передачи в Интернете или хранения на портативных проигрывателях с ограниченным дисковым пространством. Это происходит главным образом потому, что MPEG-4 основан на вейвлет-технологии, которая может сжимать цветные изображения со скоростью от 20: 1 до 300: 1 и изображения в градациях серого в диапазоне от 20: 1 до 50: 1. Кроме того, механизм сжатия MPEG4 немного сложнее по сравнению с MPEG2. Это связано с тем, что MPEG4 требует более совершенных алгоритмов для сканирования и определения, какие пиксели могут быть отброшены, чтобы еще больше уменьшить размер данных.

Википедия перечисляет следующие особенности MPEG4:

  • MPEG-4 позволяет различным разработчикам программного и аппаратного обеспечения создавать мультимедийные объекты, обладающие лучшими способностями к адаптации и гибкости, для улучшения качества таких услуг и технологий, как цифровое телевидение, анимационная графика, Всемирная паутина и их расширения.
  • Поставщики сетей передачи данных могут использовать MPEG-4 для прозрачности данных. С помощью стандартных процедур данные MPEG-4 могут быть интерпретированы и преобразованы в другие типы сигналов, совместимые с любой доступной сетью.
  • Формат MPEG-4 предоставляет конечным пользователям широкий спектр взаимодействия с различными анимированными объектами.
  • Стандартизированная сигнализация управления цифровыми правами, известная в сообществе MPEG как Управление и защита интеллектуальной собственности (IPMP).

MPEG4 стал довольно популярным за эти годы. Одним из наиболее часто используемых форматов является .mp4. MPEG-4 Part 12 была разработана на основе файла Apple MOV и в итоге привела к MPEG-4 Part 14, который является форматом MP4. MP4 — это контейнерный формат. Это означает, что его можно использовать для хранения аудио- и / или видеоданных. MP4 видео и аудио также могут передаваться через Интернет.

Какой формат использовать для хранения семейного видео в интернете. | Оцифровка — 100 секретов!

Продолжаю цикл статей про цифровые форматы для семейных видеоархивов.
Я уже рассказал про цифровые форматы и формат AVI-DV для редактирования и монтажа (нажмите на текст, чтобы посмотреть).

Сегодня я хочу рассказать об основных цифровых форматах для размещения и хранения видеоархивов на видео платформах и социальных сетях.

Это формат MPEG4.

MPEG-4 — международный стандарт, используемый преимущественно для сжатия цифрового аудио и видео. Он появился в 1998 году и включает в себя группу стандартов сжатия аудио и видео и смежные технологии.
Стандарт MPEG-4 в основном используется для вещания (потоковое видео), записи фильмов на компакт-диск и в видеотелефонии и широковещании, в которых активно используется сжатие цифровых видео и звука.
MPEG-4 включает в себя многие функции MPEG-1, MPEG-2 и других подобных стандартов, добавляя такие функции, как поддержка языка виртуальной разметки VRML для показа 3D-объектов, объектно-ориентированные файлы, поддержка управления правами и разные типы интерактивного медиа. AAC, который был стандартизован как дополнение к MPEG-2 (уровень 3), был также расширен и включен в MPEG-4.

MPEG-4 делится на несколько частей. Ключевыми частями стандарта MPEG-4 являются:
Часть 2 (MPEG-4 part 2), используемый такими кодеками как DivX, Xvid, Nero Digital и 3ivx, а также QuickTime 6.
И часть 10 (MPEG-4 part 10/MPEG-4 AVC/H.264 , используемый такими кодеками, как x264, Nero Digital AVC, QuickTime 7, а также в цифровых дисках, таких как HD DVD и Blu-ray Disc.

Альтернативы с открытыми исходными текстами, позволяющие инкапсулировать аудио/видео:

Контейнеры:

Ogg — создан компанией Xiph Foundation.
OGM — создан на основе Ogg, но не является официальным стандартом фонда Xiph.Org.
Matroska — файлы .mkv и .mka.
NUT — разработан группой MPlayer.

Видеокодеки:

DivX — кодек, основанный на стандарте MPEG-4. Версия 3.11 сходна MPEG-4 и h.263, но имеет отличия.
x264 — H.264 (MPEG-4 part 10) реализация. Свободный кодек.
Xvid — кодек MPEG-4 part 2, совместимый с DivX. Свободный кодек.
FFmpeg-кодеки — кодеки в библиотеке libavcodec из проекта FFmpeg (FFV1, Snow, MPEG-1, MPEG-2, MPEG-4 part 2, MSMPEG-4, H.264, WMV2, SVQ3, MJPEG, HuffYUV, Indeo и другие).
Tarkin — экспериментальный видеокодек, сжимающий с потерями, разрабатываемый Xiph.org Foundation и основанный на 3-D-вейвлет сжатии.
Lagarith — видеокодек без потерь.
Theora — основан на VP3, часть Ogg Project. Свободный кодек.
Dirac — основанный на вейвлетах кодек, созданный BBC.
Huffyuv — кодек без потерь от BenRG.

Надеюсь ответил на вопросы, которые мне задавали и писали в предыдущих статьях о кодеках…

При дальнейшем изложении с целью уменьшения путаницы я буду называть стандарт MPEG-4 (ч. 2) стандартом MPEG-4, а стандарт MPEG-4 (ч.10) – стандартом Н.264.

Теперь рассмотрим основной вопрос, в каком формате лучше кодировать семейное видео из архива — аналоговых и цифровых видеокассет?

Если для хранения на DVD-дисках или внешних накопителях флешках и HDD/SSD для просмотра на телевизоре можно использовать формат MPEG-2, то для размещения в интернете в социальных сетях, на Youtube, Vimeo и т.п. НУЖНО использовать формат MPEG-4!

Рассмотрим основные разрешения формата:

Также надо помнить о системе цветности (PAL / SECAM / NTSC) и соотношении сторон экрана, так как большинство аналоговых и цифровых камер снимало с соотношением 4:3, хотя на некоторых была возможность выбрать 16:9 или псевдо 16:9 (4:3 с черными полями сверху и снизу).

При оцифровки старых архивов надо обязательно учитывать соотношение сторон, чтобы правильно и без потерь оцифровать или скопировать (для цифровых форматов кассет) видео на компьютер, для дальнейшего размещения в интернете!

Если для оцифровки/перезаписи в формат MPEG-2 можно использовать DVD-рекордеры, которые используют этот формат для записи на DVD, то для интернета надо использовать карты видеозахвата

или цифровать в формат AVI-DV по интерфейсу ieee1394.

А затем в видеоредакторе или видеоконверторе, правильно выбрав формат проекта, в зависимости от исходного видео, убрать лишнее и конвертировать/экспортировать в формат MPEG-4 с необходимым разрешением.

Из своего опыта, поделюсь некоторыми «секретами» для размещения на Youtube и ВКонтакте …

Если Ваши видео, снятые на камеру (PAL 50i), с соотношением сторон 4:3, то необходимо кодировать их в SD-формат mpeg4 с разрешением 640х480 (480р) и битрейтом от 2 до 4Мб/с. Система PAL — 25 кадров/сек.
Многие видеоредакторы имеют «пресеты»-настройки для публикации видео на Youtube и других соцсетях. (По умолчанию в некоторых редакторах стоит 3,8Мб/с)
Для цифровых записей с соотношением сторон 16:9 (miniDV или Digital8) я рекомендовал бы кодировать в формат MPEG4 с разрешением 1280х720 (720p)? особенно, если Вы оцифровали эти записи в формат AVI-DV.

Лайфхак. Если же Вы хотите оцифровать в MPEG4 без изменения разрешения, то здесь Вас ждёт «подводный камень». Исходный формат AVI-DV 720×576, где пиксель прямоугольный (задаётся коэффициентом). Можно выбрать соотношению 4:3 или 16:9. При просмотре таких файлов пиксель растягивается в нужном соотношении. Но Если Вы конвертируете такой файл в mpeg4 (720×576) отправите на Youtube или соцсеть, то после обработки Youtube такое видео станет плохого качества!
Необходимо сразу задать разрешение 720х400 или лучше 640х360 (360р)!
Ниже приведена инструкция для видео на Youtube (май 2019).

Звук в MPEG4 надо настроить: 48КГц или 96КГц, битрейт согласно таблицы:

Если Ваше видео с цифровой камеры с соотношением 4:3, то необходимо для конвертации в 720р (16:9) создать файл с полосами по краям:

Сегодня Youtube можно использовать для хранения своих семейных кино и видеоархивов, загружая туда своё видео, ограничивая просмотр опцией «Доступ по ссылке».


Нужно знать! Если Ваш канал будет замечен в нарушении авторских прав: загрузка запрещенного контента или нарушающего авторские права, то после предупреждения — все видео и Ваш канал могут удалить!

Поэтому, прежде чем доверять свои архивы какому-либо видеохостингу: ЧИТАЙТЕ ПРАВИЛА !

Наверняка осталось огромное количество вопросов о цифровых форматах видео, использующих MPEG-4. Расскажу об этом в следующих публикациях!

Подписывайтесь на канал, ставьте ЛАЙК, делитесь информацией в соцсетях. Задавайте вопросы и пишите свой опыт, который будет полезен читателям, в комментариях…

Mpeg 2 что за формат. MPEG2 и MPEG4

На данный момент большинство операторов кабельного и спутникового телевидения используют стандарт MPEG2 для передачи своих сигналов. Стандарт MPEG2 был разработан рабочей группой Moving Pictures Experts Group Международной Организации Стандартизации. MPEG2 опубликован как международный стандарт ISO/IEC 13818. Данный стандарт описывает лишь общие принципы компрессии, оставляя детали для изготовителей кодеров.

В основе алгоритма сжатия заложены особенности восприятия изображения человеком. Например, глаз человека намного лучше воспринимает градации яркости, чем цветности; градации одних цветов воспринимаются лучше, других — хуже.

Кроме того, чаще всего на экране показывается неподвижный фон и несколько движущихся объектов. Поэтому достаточно лишь передать информацию о базовом кадре, а затем передавать кадры, содержащие информацию о движущихся объектах.

Еще один принцип, который применяется при компрессии изображения в стандарте MPEG2 — это отбрасывание малозначимой информации, аналогичный принципам, используемым в графическом формате JPEG.

Но вернемся собственно к теме нашего разговора. Развитием технологий управляет принцип: лучше, красивее, больше c меньшими затратами и по меньшей цене. В нашем случае подразумевается картинка лучшего качества, при меньшей ширине информационного канала (спутникового, кабельного, эфирного). Совершенствование видео кодеков формата MPEG2 привело к тому, что сейчас для передачи изображения требуется канал с пропускной способностью в 2 раза меньше, чем в начале эры цифрового вещания. С течением времени стало очевидным, что новые разработки позволяют значительно уменьшить объем передаваемой информации, но они не соответствуют существующему формату MPEG2. Поэтому перед специалистами встала задача разработки более универсального и соответствующего современным технологиям стандарта.

Для цифрового спутникового телевидения , использующего MPEG2, с разрешением 720 на 576 точек максимальная скорость информационного потока 15 Мбит/сек, а практически используемая скорость потока — 3-4 Мбит/сек. На одном транспондере (приемнике — передатчике) на спутнике обычно умещается 8-12 каналов.

Поскольку HDTV предполагает разрешение 1920 на 1080 точек, т.е. площадь экрана в 5 раз больше по сравнению с обычным телевидением, то для вещания одного канала HDTV в стандарте MPEG2 потребовалось бы арендовать половину транспондера.

Новым шагом в развитии алгоритмов сжатия изображения стал стандарт MPEG4. Идея стандарта MPEG4 заключается не в стандартизации одного продукта, а объединении нескольких подстандартов из которых поставщики могут выбрать один, наиболее соответствующий их задачам.

Наиболее важные подстандарты:

  • ISO 14496-1 (Системы), формат контейнера MP4, анимация/интерактивность (например, DVD меню)
  • ISO 14496-2 (Видео #1), Продвинутый Простой Профайл (Advanced Simple Profile — ASP)
  • ISO 14496-3 (Аудио), Продвинутое Кодирование Аудио (Advanced Audio Coding — AAC)
  • ISO 14496-10 (Видео #2), Продвинутое Кодирование Видео (Advanced Video Coding — AVC), так же известное как H.264.

Я не буду перечислять особенности технологий и алгоритмов, которые применялись при разработке формата MPEG4.
Перейдем к самому важному: совместное применение DVB-S2 (усовершенствованный стандарт цифровой передачи данных) и H.264 позволяет разместить 6-8 каналов в транспондере, но уже HDTV телевидения . Необходимо отметить, что как всегда увеличение качества не проходит бесплатно: значительно возросло количество вычислений как в приемниках так и на передающем оборудовании. К сожалению, это в значительной степени повлияло на стоимость оборудования для потребителей и для вещателей.

За короткое время аббревиатура MPEG стала нам настолько привычной, что нет повода задуматься, как это работает

Анастасия Близнецова

Аналого-цифровое преобразование


Типы предсказания смещения изображения в кадрах


Дискретно-косинусное преобразование

MPEG-2 — это стандарт, предназначенный для кодирования сигналов цифрового вещательного телевидения, так что начинать рассказ о нем надо с истории цифрового видео. Она, как ни странно, связана вовсе не с компьютерами, как кажется сейчас, а с телевещанием, ведь недостатки аналогового сигнала сказывались прежде всего на телевизионной аудитории. Основных проблем две — это стремительное падение качества с каждым новым перезаписыванием (страшно вспомнить, что такое «пятая копия» на VHS) и большие помехи при передаче сигнала, с которыми очень сложно бороться. Первое сказывается на качестве программ, второе — на качестве картинки у зрителя. Способ избавиться от этих недостатков был известен еще с 50-х годов — это перевод сигнала в цифровую форму. Однако технические возможности для оцифровки видео в реальном времени появились лишь около четверти века тому назад, и в 1979 году Европейский Вещательный Союз (EBU) и Общество инженеров кино и телевидения (SMPTE) совместно подготовили проект международного стандарта цифрового кодирования цветного телевизионного сигнала, а в 1982 году стандарт был принят. MPEG-2 базируется именно на этом стандарте ITU-R BT.601.

Как получают цифровой видеосигнал

Известно, что любой из миллионов оттенков, которые различает человек, представим в виде комбинации трех опорных цветов: красного (Red), зеленого (Green) и синего (Blue) — это так называемая цветовая модель RGB. Используя эту модель, цветной аналоговый сигнал (например, изображение, которое «видит» объектив аналоговой видеокамеры) можно разложить на RGBкомпоненты.

Однако для телевидения такое разложение не подходило: при переходе к цветному вещанию требовалось, чтобы цветные передачи можно было смотреть на черно-белых телевизорах, а это невозможно, если сигнал состоит из RGBкомпонент. Решением стало преобразование RGBсигналов в сигнал яркости Y и два цветоразностных сигнала U и V — в этом случае информация о цвете (U и V) передается отдельно от информации о яркости Y, и в черно-белом телевидении используется только сигнал яркости, а в цветном — яркости совместно с цветом. Заодно оказалось возможным уместить цветной телевизионный сигнал в стандартную полосу пропускания: за счет того, что человеческий глаз менее чувствителен к пространственным изменениям цвета, чем к изменениям яркости, информацию о цвете можно «урезать» без ущерба для восприятия.

Для цифрового кодирования одинаково подходят оба разложения.

Итак, для того чтобы сформировать цифровой сигнал, необходимо выполнить над каждой компонентой аналогового сигнала (R, G, B или Y, U, V) следующие операции: дискретизацию, квантование и кодирование.

Дискретизация — это представление непрерывного аналогового сигнала последовательностью значений его амплитуд (так называемых отсчетов). Частота, с которой выбираются значения, называется частотой дискретизации. На схемах справа показаны аналоговый и дискретизированный с частотой 1/T сигналы. Очевидно, что чем больше частота дискретизации, тем точнее будет воспроизведен аналоговый сигнал. Чтобы получить изображение высокого качества, частота дискретизации должна быть не менее 12 МГц (то есть 12 млн отсчетов в секунду). В стандарте цифрового кодирования она выбрана равной 13,5 МГц.

Квантование — округление значений отсчетов. Так как человеческий глаз обладает конечной разрешающей способностью, то передавать абсолютно точно все значения отсчетов нет необходимости. Было придумано заменять величину отсчета ближайшим значением из некоторого набора фиксированных величин, которые называются уровнями квантования, то есть округлять до ближайшего уровня. На схеме справа показан квантованный сигнал. Для создания сигнала нужного качества достаточно 256 уровней квантования.

И наконец, кодирование. Так как квантованный сигнал может принимать только конечное число значений (в соответствии с набором уровней квантования), то для каждого отсчета можно представить его просто числом, равным собственно порядковому номеру уровня квантования. Это число может быть закодировано двоичными символами (например, нулями и единицами). Чтобы закодировать 256 уровней квантования, требуется как минимум восемь бит (28 = 256), то есть значение каждого отсчета передается восемью битами.

В итоге после дискретизации, квантования и кодирования мы получили из аналогового сигнала набор импульсов, принимающих только два значения — 0 и 1, которые уже можно передавать как обычные данные. Это называется аналого-цифровым преобразованием, или АЦП.

Легко посчитать необходимую скорость потока при передаче оцифрованного нами сигнала: умножим восемь бит на количество отсчетов, передаваемых в секунду (не забудем, что у нас три компоненты): 8 [бит] х 13,5 [МГц] х 3 = 324 Мб/с!!! Работать с такими потоками — очень дорогое и почти недоступное удовольствие (для сравнения: стандартный модем передает со средней скоростью 33,2 кб/с, то есть в десять тысяч раз медленнее).

Здесь самое время напомнить о том, что, как и в аналоговом телевидении, при оцифровке Y, U и V можно безболезненно удалить часть информации о цвете, то есть уменьшить в несколько раз частоту дискретизации цветоразностных сигналов. Поэтому кодирование YUV (называемое раздельным) с точки зрения величины потока получается более выгодным, чем RGB. При раздельном кодировании принято указывать соотношение частот дискретизации компонент. Например, 4:2:2 означает, что Y передается в каждом отсчете в каждой строке, а U и V — в каждом втором отсчете в каждой строке (то есть частота дискретизации Y равна 13,5 МГц, а U и V в два раза меньше — 6,75 МГц).

Сжатие

Однако результаты кодирования в отношении величины цифрового потока все равно никого не устраивали. Для вещательного телевидения требуется раздельное кодирование как минимум 4:2:2 — это 216 Мб/с. Даже если не говорить о передаче данных, просто писать такой поток на ленту или на винчестер представляется проблемой.

Выход один: сжатие цифрового видеопотока. К счастью, цифровой видеосигнал по сути своей избыточен и потому для сжатия подходит как нельзя лучше: можно без потерь с точки зрения восприятия сжимать видео даже в 30 раз! Избыточность видеосигнала, во‑первых, вызвана тем, что человеческий глаз не замечает изменений яркости и цвета на небольших участках, то есть мелких деталей. Эта избыточность называется пространственной и удаляется при внутрикадровом кодировании — сокращении информации в пределах одного кадра.

Во-вторых, обычно в пределах нескольких секунд следующие друг за другом кадры слабо отличаются друг от друга — это так называемая временная избыточность. Нет необходимости передавать все кадры полностью, для некоторых достаточно передать только отличия от предыдущих или последующих кадров. Временная избыточность удаляется межкадровым кодированием, при котором сокращается информация о некоторой группе кадров в целом.

Надо сказать, что со времен начала работы с цифровым видео было создано великое множество форматов сжатия: от Cinepak и Intel Indeo до H.263, MJPEG и DV. Часть из них удаляют только пространственную избыточность (как DV или MJPEG), но некоторые алгоритмы (например, Intel Indeo) используют и межкадровую разность.

Жизнь с таким количеством несовместимых друг с другом стандартов оказалась слишком уж сложной, поэтому в 1988 году была создана специальная группа экспертов — Moving Picture Experts Group (MPEG), которая должна была разработать методы сжатия и восстановления цифрового видеосигнала. Над стандартом MPEG2 группа начала работать в 1990 году. Стандарт предназначался специально для цифрового телевидения, то есть для передачи телевизионных изображений высокого качества, и был принят уже в 1994 м. Сегодня это самый распространенный и самый многофункциональный из всех стандартов MPEG.

Как осуществляется сжатие в MPEG-2

Сначала в каждом кадре последовательно выбираются элементы изображения размером 16 х 16 пикселей — это так называемые макроблоки.

В MPEG принято кодирование YUV, поэтому каждый макроблок представлен в виде набора блоков 8 х 8 пикселей — каждый блок несет информацию или о яркости, или о цвете. Например, в формате цветности 4:2:2 потребуется четыре блока 8 х 8 с информацией о яркости и по два блока 8 х 8 с информацией о каждой цветоразностной компоненте, всего восемь блоков. Каждый элемент в блоке яркости или цвета представляет собой значение отсчета. В дальнейшем MPEG-2 работает уже с макроблоками.

В MPEG-2 выделено три типа кадров. I-кадры (Intra) — опорные кадры, кодирование каждого макроблока в которых осуществляется без ссылок на макроблоки в предыдущих или последующих кадрах. По сути, I-кадры закодированы как неподвижные изображения.

Pкадры (Predicted) — кадры, макроблоки в которых закодированы относительно предшествующих I или P-кадров (хотя не все макроблоки могут быть так закодированы, об этом ниже). Изображение в кадре предсказывается с использованием информации предыдущего кадра — так называемое предсказание «вперед». Поэтому Pкадры частично содержат только ссылки на макроблоки в предыдущих кадрах, и, таким образом, сжаты они сильнее, чем I-кадры.

B-кадры (Bidirectionally Predicted) — кадры, макроблоки в которых закодированы относительно или предыдущих, или последующих, или и тех, и тех I или P-кадров. Здесь реализовано двунаправленное предсказание («вперед» и «назад»): изображение в кадре предсказывается с использованием информации из предыдущего и из следующего кадра. То есть считывание кадров декодером должно происходить быстрее их восстановления.

Если оказывается, что макроблок в P-кадре или B-кадре невозможно закодировать со ссылкой на другие кадры (например, в случае, если в кадре появился новый объект), то макроблок кодируется как макроблок в I-кадре.

Кадры объединены в последовательности (Group Of Pictures, GOP), и предсказание всегда осуществляется только в пределах одной группы. Понятно, что при таком условии каждая группа должна начинаться с I-кадра, несущего наиболее полную информацию об изображении, ведь I-кадр является точкой отсчета, относительно которой кодируются остальные кадры. Было бы замечательно, если бы I-кадры всякий раз приходились на начало сюжета, но, к сожалению, все сюжеты имеют разную длительность.

В MPEG-2 определены стандартные типы последовательностей — например, IPBBPBBPBBPBBPBB. Если сюжет почти не меняется от кадра к кадру, то можно кодировать с большим количеством B-кадров, а если требуется очень высокое качество — наоборот, использовать группы, состоящие только из одного I-кадра. В принципе, можно оптимизировать выбор типа кадра — например, при появляющихся больших ошибках предсказания в B-кадрах добавлять I-кадры в последовательность.

Сразу скажем, слово «предсказание» несколько путает — это термин, хотя и устоявшийся, но не очень верный. Мы ничего не предсказываем, мы абсолютно точно определяем, что должно быть в кадре. Для этого вычисляется ошибка предсказания — разница между изображением, взятым из другого кадра, и изображением в текущем кадре, и эта разница используется при декодировании.

Под компенсацией движения понимается учет смещения изображения относительно предыдущих или последующих кадров. Компенсация движения в P и B-кадрах реализуется следующим образом: для каждого найденного в предыдущем/следующем кадре макроблока вычисляется вектор движения, то есть определяется, каково относительное смещение соответствующего макроблока. Таким образом, при предсказании с компенсацией движения декодеру передаются не только ошибки предсказания, но и векторы движения.

Теперь мы подходим к внутрикадровому кодированию. Нам нужно сжать информацию в макроблоках, которые ни на что не ссылаются. Это делается с помощью дискретно-косинусного преобразования (ДКП), в основе которого лежит преобразование Фурье. ДКП отнюдь не прерогатива MPEG, оно применяется при внутрикадровом кодировании очень во многих форматах сжатия — в том числе, для сжатия статических изображений (всем известный JPEG, разработанный для цифровой фотографии группой Joint Photographic Experts Group).

Все основано на том, что человек хорошо различает форму объекта даже при нечетких границах. Поэтому, если сделать контуры менее резкими, зритель ничего не заметит, а вот объем передаваемой информации кардинально уменьшится. В оцифрованном сигнале каждый элемент в блоке есть значение отсчета, а каждый блок — соответственно, матрица значений отсчетов. Применение к матрице отсчетов ДКП позволяет выделить информацию о резких переходах и ее отбросить. То немногое, что остается, кодируется по специальному оптимизирующему алгоритму, в котором используются известные в технике кодирования приемы (и, в том числе, есть способы исправления ошибок при передаче данных).

Небезынтересно будет узнать, что практически все фильтры в графических редакторах построены на операциях над матрицей отсчетов. Примените в Photoshop фильтр, размывающий границы, — увидите ДКП в действии. И, кстати, сможете убедиться, что изображение даже с немного размытыми контурами сжимается JPEG гораздо эффективнее.

Для сжатия движущихся изображений требуются огромные вычислительные мощности, так что для компрессии в реальном времени обычно используются специальные платы и процессоры, то есть сжатие реализуется на аппаратном уровне.

Профили и уровни

Создатели MPEG-2 постарались максимально расширить область применения стандарта, и это было сделано при помощи системы профилей и уровней. Уровень определяет параметры цифрового сигнала: число отсчетов в строке, число кадров в секунду, размер потока и т. п. В профиле задаются параметры кодирования: типы кадров, формат цветности, набор используемых операций по сжатию данных, то есть определяется качество кодирования. Таким образом, стандарт дает пользователю возможность самому выбрать сжатие, подходящее для решения конкретной задачи — например, домашнее или профессиональное видео.

Идея профилей и уровней оказалась настолько плодотворной, что добавлением уровней удалось даже расширить стандарт для кодирования сигналов телевидения высокой четкости (ТВЧ). А ведь первоначально для ТВЧ разрабатывался MPEG-3, который был благополучно забыт, как только в MPEG-2 были введены соответствующие возможности.

Форматы видеозаписи

В стандарте MPEG нигде не определено, каким образом осуществляется непосредственно кодирование, он описывает только, как должен выглядеть результирующий поток данных, поскольку именно это важно для декодеров.

Кодирование может осуществляться как аппаратно, так и программно, и каждая фирма создает свои собственные алгоритмы (принципиально важен, например, алгоритм поиска смещенных макроблоков). При этом разработчики выбирают нужный профиль, уровень, необходимые операции по сжатию данных и, что очень важно при аппаратном кодировании, базу, на которой реализуется алгоритм (специальная плата, процессор и т. п.). Например, фирма Sony создала уже два формата видеозаписи на основе MPEG-2 — это Betacam SX и MPEG IMX. Оба они используют один и тот же профиль 422Р, но для них установлены разные размеры потоков данных и при кодировании используются разные аппаратные средства.

Видеопоследовательности, сжатые в соответствии с форматами MPEG-1 и MPEG-2 , различаются объемом информации и, как следствие, качеством. Хотя алгоритм MPEG-1 может работать с разрешением вплоть до стандарта CCIR-601(720х480),обычно видео кодируется при значительно более низкой интенсивности потока данных, что приводит к худшему качеству воспроизводимого видео. Качество MPEG-1 обычно ассоциируется с качеством VHS только в формате (352х240).При воспроизведении такое изображение “растягивается” аппаратными или программными средствами до полного экрана, и хотя при этом теряется качество, зато остается возможность проигрывать полноэкранное видео даже с двухскоростным CD-ROM.

MPEG-2 поддерживает более высокие разрешения (в том числе и CCIR-601). При этом объем файлов MPEG-2 примерно в четыре раза больше относительно файлов MPEG-1, что позволяет записывать полноэкранные фильмы “вещательного” (Betacam) качества. Этот формат избран для использования в новом поколении видеодисков на основе технологии DVD, а в скором времени станет доминировать и на PC.В отличие от MPEG-1 для MPEG-2 необязательно наличие GOP-групп, и даже при отсутствии GOP-заголовка можно получить прямой доступ к видеофрагменту. Другой ключевой особенностью MPEG-2 является присутствие в нем расширений, которые позволяют при записи разделить видеосигнал на два (ли более) независимо кодируемых потока данных, представляющих видео в различных разрешениях, т.е. с лучшим или худшим качеством изображения. Это делается с целью создания независимых потоков данных определенной интенсивности в рамках одного видеосигнала. Такая функция важна, если необходимо одновременно транслировать ТВЧ и стандартный телевизионный сигнал.

Стандарт MPEG-2 состоит из трех основных частей: системной, видео и звуковой.

Системная часть описывает форматы кодирования для мультиплексирования звуковой, видео и другой информации, рассматривает вопросы комбинирования одного или более потоков данных в один или множество потоков, пригодных для хранения или передачи.

Системное кодирование в соответствии с синтаксическими и семантическими правилами, налагаемыми данным стандартом, обеспечивает необходимую и достаточную информацию, чтобы синхронизировать декодирование без переполнения или «недополнения» буферов декодера при различных условиях приема или восстановления потоков.

Таким образом, системный уровень выполняет пять основных функций:

    Синхронизация нескольких сжатых потоков при воспроизведении

    Объединение нескольких сжатых потоков в единый поток

    Инициализация для начала воспроизведения

    Обслуживание буфера

    Определение временной шкалы

Видеочасть стандарта описывает кодированный битовый поток для высококачественного цифрового видео.MPEG-2 является совместимым расширением MPEG-1, он поддерживает чересстрочный видеоформат и содержит средства для поддержки ТВЧ.

Стандарт MPEG-2 определяется в терминах расширяемых профилей, каждый из которых, являясь частным случаем стандарта, имеет черты, необходимые всем классам приложений. Иерархические масштабируемые профили могут поддерживать такие приложения, как совместимое наземное многопрограммное ТВ (ТВЧ), пакетные сетевые видеосистемы, обратную совместимость с другими стандартами (MPEG-1 и Н.261) и приложениями, использующими многоуровневое кодирование. Такая система позволит потребителю использовать приемник для декодирования как стандартного телевизионного сигнала, так и сигнала ТВЧ из того же вещательного канала.

Звуковая часть стандарта MPEG-2 определяет кодирование многоканального звука. MPEG-2 поддерживает до пяти полных широкополосных каналов плюс дополнительный низкочастотный канал и (или) до семи многоязычных комментаторских каналов. Он также расширяет возможности кодирования моно и стереозвуковых сигналов в MPEG-1 за счет использования половинных частот дискретизации (16; 22,05 и 24 кГц) для улучшения качества при скоростях передачи 64 Кбит/с и ниже.

Применение стандарта MPEG-2 в вещательном телевидении позволяет значительно снизить скорость передачи видео- и звуковых данных и за счет этого передавать несколько цифровых программ в стандартной полосе частот радиоканалов эфирного, кабельного и спутникового телевизионного вещания. Например, большие преимуществаMPEG-2 дает в системах спутникового телевизионного вещания. Сжатие позволяет передать по одному стандартному каналу от одного до пяти цифровых каналов при профессиональном уровне качества видеосигнала. Важно и то, что цифровые каналы по сравнению с аналоговыми предоставляют более широкие возможности для передачи дополнительной информации.

Пропускная способность стандартного спутникового канала при полосе 32 МГц составляет 55 Мбит/с. Для вещания с профессиональным качеством необходима скорость цифрового потока 5 — 8 Мбит/с. Таким образом, один стандартный спутниковый канал позволяет транслировать 4 — 5 телевизионных программ. Возможно использование цифровых каналов с более высокими коэффициентами сжатия. При этом в одном стандартном канале передается до десяти видеопрограмм. Однако в этих случаях заметна потеря качества изображения.

В общем случае переход к цифровому многопрограммному ТВ вещанию предполагает постепенный вывод из эксплуатации аналоговых систем вещания: SECAM, PAL, NTSC, освобождение за счет этого существующих радиоканалов и линий связи, а также их перепрофилирование для цифрового ТВ вещания. При этом система многопрограммного ТВ вещания должны быть встроена в существующий частотный план распределения ТВ каналов, который предусматривает полосу пропускания 8 МГц для эфирного и кабельного ТВ вещания, 27 МГц — для спутниковых систем непосредственного ТВ вещания и 30, 33, 36, 40, 46, 54, 72 МГц — для фиксированных служб спутниковой связи. Необходимо также учитывать сложившуюся взаимосвязь между спутниковыми и наземными системами телевещания, предполагающую использование ТВ каналов кабельных и эфирных сетей вещания также для доведения спутниковых программ до телезрителей.

При цифровом вещании взаимный обмен телепрограммами между наземными и спутниковыми вещательными службами существенно упрощается, если число цифровых ТВ программ в каждом стандартном по полосе пропускания спутниковом, кабельном и эфирном радиоканале будет одинаковым. Это требование было учтено при разработке международных стандартов на методы модуляции и канального кодирования в цифровых спутниковых и наземных каналах связи — DVB-S, DVB-C и DVB-T (Digital Video Broadcasting — Satellite, Cable, Terrestrial) — путем применения для более узкополосных радиоканалов более сложных и эффективных по плотности передачи информации методов модуляции.

При организации многопрограммного цифрового ТВ вещания весьма важно правильно выбрать скорость передачи, поскольку от этого непосредственно зависит качество изображения и звукового сопровождения. Согласно экспертным оценкам, для получения изображения студийного качества, соответствующего Рекомендации 601 МККР, необходимо передавать видеоданные со скоростью около 9 Мбит/с. При этом декодированный видеосигнал будет пригоден для последующей цифровой обработки. Для получения изображения с качеством, соответствующим качеству изображения на экране бытового телевизора, будет достаточна скорость передачи около 6 Мбит/с. В этом случае декодированный видеосигнал будет малопригоден для последующей обработки и повторного кодирования с информационным сжатием.

Необходимо отметить, что качество ТВ изображения при одинаковой скорости передачи видеоданных в
системах телевидения с частотой развертки полей 50 Гц будет выше, чем в системах телевидения с частотой развертки полей 60 Гц.

Несколько слов о скорости передачи звуковых данных. В настоящее время общепринятым эталоном высшего качества звука является качество, получаемое при воспроизведении компакт-дисков. Поэтому в стандарте MPEG-2 предполагается, что в системах цифрового ТВ вещания качество звукового стереосопровождения субъективно не должно отличаться от звука с компакт-диска. Это условие выполняется для принятой в стандарте MPEG-2 системы информационного сжатия звуковых данных MUSICAM при скорости передачи по 128 Кбит/с на каждый моноканал звукового сопровождения. Таким образом, для самого низкого уровня — двухканального стереофонического звукового сопровождения — потребуется скорость передачи цифровых данных, равная 128 Кбит/с х 2 = 256 Кбит/с.

Цифровой поток для передачи дополнительной информации (ДИ) выбирается в зависимости от ее предполагаемого объема. Скорость передачи обычно выбирается кратной скорости цифрового потока телефонного канала — 64 Кбит/с. Для унификации каналов цифровой передачи данных звукового сопровождения и дополнительной информации обычно скорость передачи ДИ выбирается равной 128 Кбит/с. В связи с большой сложностью построения стандарта MPEG-2 стоимость цифрового приемного оборудования выше аналогового. Именно по этой причине аналоговое вещание пока будет существовать наряду с цифровым.

Характеристики форматов, сравнение, история возникновения и развития.

Вступление

Прародитель этого формата — MPEG-1, не колеблясь можно назвать поистине революционным, ведь до него ничего подобного не существовало. Первые видеодиски и спутниковые телепередачи в формате MPEG-1 казались чудом — такое качество при таком относительно низком битрейте. Сжатое цифровое видео имело качество сопоставимое с качеством бытового видеомагнитофона и имело по сравнению с аналоговыми носителями массу преимуществ. Но время шло, прогресс в области цифровых технологий шагал семимильными шагами, и вот старичку MPEG-1 понадобилась существенная доработка, чтобы угнаться за чудесами науки и техники. В результате возник формат MPEG-2, который является не революционным, а скорее, эволюционным форматом, возникнув в результате переделки MPEG-1 под нужды заказчиков. А заказчиками данного формата являлись крупнейшие массмедиа-компании, которые сделали ставку на спутниковое телевидение и нелинейный цифровой видеомонтаж.

Это сейчас формат MPEG-2 ассоциируется в первую очередь с DVD-дисками, а в 1992 году, когда стартовали работы по созданию этого формата, не существовало широко доступных носителей, на которые можно было бы записать видеоинформацию сжатую MPEG-2, но самое главное, компьютерная техника того времени не могла обеспечить нужную полосу пропускания — от 2 до 9 Мбит в секунду. Зато данный канал могло обеспечить спутниковое телевидение с новейшим по тем временам оборудованием. Такие высокие требования к каналу вовсе не означали, что степень сжатия MPEG-2 ниже, чем у MPEG-1, наоборот, значительно выше! А вот разрешение изображения и количество кадров в секунду значительно больше, так как именно высокое качество при разумном битрейте и было той основной целью, которую поставили перед комитетом MPEG заказчики. Именно благодаря MPEG-2 и стало возможно появление телевидения высокого разрешения — HDTV, в котором изображение намного четче, чем у обычного телевидения.

Спустя несколько лет после начала работ, в октябре 1995 года через космический телевизионный спутник «Pan Am Sat» было осуществлено первое 20-канальное ТВ-вещание использующее стандарт MPEG-2. Спутник осуществлял и до сих пор осуществляет трансляцию на территории Скандинавии, Бельгии, Нидерландов, Люксембурга, Ближнего Востока и Африки.
В настоящее время идет широкая экспансия HDTV на Дальнем Востоке — в Японии и Китае.
Видеопотоки сжатые MPEG-2 с битрейтом 9 Мбит в секунду используются при студийной записи и в высококачественном цифровом видеомонтаже.

С появлением первых DVD-проигрывателей, обладающих колоссальной емкостью и относительно доступной ценой, MPEG-2, что вполне естественно был выбран в качестве основного формата компрессии видеоданных за его высокое качество и высокую степень сжатия. Именно фильмы, использующие MPEG-2, до сих пор являются главнейшим аргументом в пользу DVD.

Закончим с ретроспективным обзором MPEG-2 и попытаемся покопаться в его внутренностях. Как уже говорилось, MPEG-2 формат эволюционный, именно поэтому уместно его рассматривать, сравнивая с его именитым прародителем MPEG-1, с указанием, что же нового было внесено в исходный формат.

MPEG-2. Что нового?

Надо сказать, разработчики MPEG-2 подошли к решению поставленной проблемы творчески. Мозговой штурм, развязанный по поводу изыскания возможности удаления лишних битов и байтов из и без того уже сжатого изображения (вспомните, уже существовал MPEG-1, теперь нужно было ужать его) был начат сразу с трех сторон. Помимо улучшения алгоритмов компрессии видео (одна сторона) и аудио (другая) был найден альтернативный путь уменьшения размера конечного файла прежде ранее не использовавшийся.

Как стало известно из исследований комитета MPEG, свыше 95% видеоданных, так или иначе, повторяются в разных кадрах, причем неоднократно. Эти данные являются балластными или, если использовать термин, предложенный комитетом MPEG, избыточными. Избыточные данные удаляются практически без ущерба для изображения, на место повторяющиеся участков при воспроизведении подставляется один единственный оригинальный фрагмент. К уже известным алгоритмам сжатия и удаления избыточной информации, которые встречались нам в формате MPEG-1, добавился еще один, по-видимому, наиболее эффективный. После разбивки видеопотока на фреймы, данный алгоритм анализирует содержимое очередного фрейма на предмет повторяющихся, избыточных данных.

Составляется список оригинальных участков и таблица участков повторяющихся. Оригиналы сохраняются, копии удаляются, а таблица повторяющихся участков используется при декодировании сжатого видеопотока. Результатом работы алгоритма удаления избыточной информации является превосходное высокочеткое изображение при низком битрейте. Подобное соотношение размер/качество до появления MPEG-2 считалось недостижимым.

Но и у этого алгоритма есть ограничения. Например, повторяющиеся фрагменты должны быть достаточно крупными, иначе пришлось бы заводить запись в таблице повторяющихся участков чуть ли не на каждый пиксел, что свело бы пользу от таблицы к нулю, так как ее размер превышал бы размер фрейма. И еще оно обстоятельство делает этот алгоритм менее эффективным — наиболее полезным и эффективным было бы применение этого алгоритма не к отдельным фреймам, а ко всему видеоролику в целом, так как вероятность нахождения повторяющихся участков в большом видеоучастке намного выше, чем в отдельно взятом фрейме. Да и суммарный размер таблиц для всех фреймов намного больше, чем возможный размер одной общей таблицы. Но, к сожалению, MPEG-2 — это потоковый формат, который изначально предназначался для пересылки по спутниковым каналам или по кабельным сетям, поэтому наличие фреймов обязательное условие.

Итак, мы рассмотрели один из подходов, который обеспечил существенное уменьшение размера кодируемого файла, но если бы этот трюк был один, то разработчики никогда не добились бы столь впечатляющих результатов, которые мы увидели в MPEG-2. Разумеется, им пришлось хорошенько попотеть над уже существующими алгоритмами, буквально вылизав их и выжав все до последнего байта. Очень существенной модернизации подверглись алгоритмы сжатия видео.

Изменения в алгоритмах сжатия видеоданных по сравнению с MPEG-1.

Основные изменения коснулись алгоритмов квантования, то есть алгоритмов преобразования непрерывных данных в дискретные. В MPEG-2 используется нелинейный процесс дискретно-косинусного преобразования, который гораздо эффективнее предшественника. Формат MPEG-2 предоставляет пользователям и программистам значительно большую свободу по сравнению с MPEG-1. Так теперь стало возможным в процессе кодирования задавать точность частотных коэффициентов матрицы квантования, что непосредственно влияет на качество получаемого в результате сжатия изображения (и на размер тоже). Используя MPEG-2, пользователь может задавать следующие значения точности квантования — 8, 9, 10 и 11 бит на одно значение элемента, что делает этот формат значительно более гибким по сравнению с MPEG-1, в котором было только одно фиксированное значение — 8 бит на элемент.

Также стало возможным загрузить отдельную матрицу квантования (quantization matrix) непосредственно перед каждым кадром, что позволяет добиться очень высокого качество изображения, хоть это и довольно трудоемко. Как с помощью матрицы квантования улучшить качество изображения? Не секрет что быстро движущиеся участки — традиционно слабое место для семейства MPEG, в то время как статичные участки изображения кодируются очень хорошо. Отсюда следует вывод, что нельзя статику и участки с движением кодировать одинаково. Так как качество изображения зависит от стадии квантования, которая во многом зависит от используемой матрицы квантования, то меняя эти матрицы для разных участков видеоролика можно добиться улучшения качества изображения. Многие кодеки MPEG-2 делают это автоматически, но есть программы, позволяющие помимо этого задавать матрицы квантования вручную, например перекодировщик AVI2MPG2, который можно найти в сети Internet по адресу: http://members.home.net/beyeler/bbmpeg.html .

Не обошли нововведения и алгоритмы предсказания движения. Данная секция обогатилась новыми режимами: 16×8 MC, field MC и Dual Prime. Данные алгоритмы существенно повысили качество картинки и, что немаловажно позволили делать ключевые кадры реже по сравнению с MPEG-1, увеличив, таким образом, количество промежуточных кадров и повысив степень сжатия. Основной размер блоков, на которые разбивается изображение, может быть 8х8 точек, как и MPEG-1, 16х16 и 16х8, что впрочем используется только в режиме 16х8 МС.

Из-за некоторых особенностей реализации алгоритмов предсказания движения в MPEG-2 появились некоторые ограничения на размер картинки. Теперь стало необходимо, чтобы разрешение изображения по вертикали и горизонтали было кратно 16 в режиме покадрового кодирование, и 32 по вертикали в режиме кодирования полей (field-encoder), где каждое поле состоит из двух кадров. Размер фрейма увеличился до 16383*16383.

Было введено еще два соотношения цветовых плоскостей и плоскости освещенности — 4:4:4 и 4:2:2.

Помимо вышеперечисленных улучшений в формат MPEG-2 были введены еще несколько новых нигде ранее не используемых алгоритмов компрессии видеоданных.

Наиболее важные из них — это алгоритмы под названиями Scalable Modes, Spatial scalability, Data Partitioning, Signal to Noise Ratio (SNR) Scalability и Temporal Scalability. Несомненно, эти алгоритмы внесли весьма важный вклад в успех MPEG-2 и заслуживают более подробного рассмотрения.

Scalable Modes — набор алгоритмов, который позволяет определить уровень приоритетов разных слоев видеопотока. Поток видеоданных делится на три слоя — base, middle и high. Наиболее приоритетный на данный момент слой (например, передний план) кодируется в большим битрейтом

Spatial scalability (пространственное масштабирование) — при использовании этого алгоритма, базовый слой кодируется с меньшим разрешением. В дальнейшем полученная в результате кодирования информация ислользуется в алгоритмах предсказания движения более приоритетных слоев.

Data Partitioning (дробление данных) — этот алгоритм дробит блоки размером в 64 элемента матрицы квантования на два потока. Один поток данных, более высокоприоритетный состоит из низкочастотных (наиболее критичные к качеству) компонентов, другой, соответственно менее приоритетный состоит из высокочастотных компонентов. В дальнейшем эти потоки обрабатываются по-разному. Именно поэтому в MPEG-2 и динамические и статистические сцены смотрятся весьма неплохо, в отличие от MPEG-1, где динамические сцены традиционно ужасны.

Signal to Noise Ratio (SNR) Scalability (масштабирование соотношения сигна/шум) — при действии этого алгоритма разные по приоритету слои кодируются с разным качеством. Низкоприоритетные слои более дискретизированны, более грубы, соответственно содержат меньше данных, а высокоприоритетный слой содержит дополнительную информацию, которая при декодировании позволяет восстановить высококачественное изображение.

Temporal Scalability (временное масштабирование) — после действия этого алгоритма у низкоприоритетного слоя уменьшается количество ключевых блоков информации, при этом высокоприоритетный слой, напротив содержит дополнительную информацию, которая позволяют восстановить промежуточные кадры используя для предсказания информацию менее приоритетного слоя.

У всех этих алгоритмов много общего: все они работаю со слоями потока видеоданных, использование этих алгоритмов позволяет достичь высокого сжатия при практически незаметном ухудшении картинки. Но есть еще одно свойство этих алгоритмов, возможно, что и не такое приятное. Использование любого из них, делает видеоролик абсолютно несовместимым с форматом MPEG-1. Поэтому эти алгоритмы были далеко не в каждом кодеке MPEG-2.
В результате появилось множество форматов, разного разрешения, качества, с разной степенью сжатия и с разным соотношением размер/ качество. С целью наведения порядка и окончательной стандартизации MPEG-2 комитетом MPEG были введены понятия уровней и профилей. Именно уровни и профили, а так же их комбинации позволяют однозначно описать практически любой формат из семейства MPEG-2.

Уровни

Название уровня

разрешение

максимальный битрейт

качественное соответствие

CIF, бытовая видео кассета

CCIR 601, студийное TV

4×601, бытовое HDTV

Hi-End видеомонтажное оборудование

Профили

Допустимые комбинации Профилей и Уровней

Main c Spatial Scalability

90% от всех

Main c SNR Scalability

Main c SNR Scalability

Наиболее популярные стандарты

Название

Разрешение

Как работает видеокодек. Часть 2. Что, для чего, как / Блог компании Edison / Хабр

Первая часть: Основы работы с видео и изображениями




Что? Видеокодек — это часть программного/аппаратного обеспечения, сжимающая и/или распаковывающая цифровое видео.

Для чего? Невзирая на определённые ограничения как по пропускной способности так
и по количеству места для хранения данных, рынок требует всё более качественного видео. Припоминаете, как в прошлом посте мы подсчитали необходимый минимум для 30 кадров в секунду, 24 бита на пиксель, с разрешение 480×240? Получили 82,944 Мбит/с без сжатия. Сжатие — это пока единственный способ вообще передавать HD/FullHD/4K на телевизионные экраны и в Интернет. Как это достигается? Сейчас кратко рассмотрим основные методы.


Перевод сделан при поддержке компании EDISON Software.

Мы занимаемся интеграцией систем видеонаблюдения, а также разрабатываем микротомограф.

Кодек vs Контейнер


Распространенная ошибка новичков — путать кодек цифрового видео и контейнер цифрового видео. Контейнер это некий формат. Обёртка, содержащая метаданные видео (и, возможно, аудио). Сжатое видео можно рассматривать как полезную нагрузку контейнера.

Обычно расширение видеофайла указывает на разновидность контейнера. Например, файл video.mp4, вероятно всего, является контейнером MPEG-4 Part 14, а файл с именем video.mkv — это, скорее всего, матрёшка. Чтобы быть полностью уверенным в кодеке и формате контейнера, можно воспользоваться FFmpeg или MediaInfo.

Немного истории


Прежде чем перейдем к Как?, давайте слегка погрузимся в историю, чтобы немного лучше понимать некоторые старые кодеки.

Видеокодек H.261 появился в 1990 году (технически — в 1988) и был создан для работы со скоростью передачи данных 64 Кбит/с. В нём уже использовались такие идеи, как цветовая субдискретизация, макроблоки и т.п. В 1995 году был опубликован стандарт видеокодека H.263, который развивался до 2001 года.

В 2003 году была завершена первая версия H.264/AVC. В том же году компания «TrueMotion» выпустила свой бесплатный видеокодек, сжимающий видео с потерями под названием VP3. В 2008 году Google купил эту компанию, выпустив VP8 в том же году. В декабре 2012 года Google выпустил VP9, ​​и он поддерживается примерно на ¾ рынка браузеров (включая мобильные устройства).

AV1 — это новый бесплатный видеокодек с открытым исходным кодом, разработанный Альянсом за открытые медиа (AOMedia), в состав которого входят известнейшие компании, как-то: Google, Mozilla, Microsoft, Amazon, Netflix, AMD, ARM, NVidia, Intel и Cisco. Первая версия кодека 0.1.0 была опубликована 7 апреля 2016 года.

Рождение AV1


В начале 2015 года Google работал над VP10, Xiph (который принадлежит Mozilla) работал над Daala, а Cisco сделала свой бесплатный видеокодек под названием Thor.

Затем MPEG LA сначала объявила годовые лимиты для HEVC (H.265) и плату, в 8 раз выше, чем за H.264, но вскоре они снова изменили правила:

без годового лимита,
плата за контент (0,5% от выручки) и
плата за единицу продукции примерно в 10 раз выше, чем за H.264.

Альянс за открытые медиа был создан компаниями из разных сфер: производителями оборудования (Intel, AMD, ARM, Nvidia, Cisco), поставщиками контента (Google, Netflix, Amazon), создателями браузеров (Google, Mozilla) и другими.

У компаний была общая цель — видеокодек без лицензионных отчислений. Затем появляется AV1 с гораздо более простой патентной лицензией. Тимоти Б. Терриберри сделал сногсшибательную презентацию, ставшей источником текущей концепции AV1 и её модели лицензии.

Вы будете удивлены, узнав, что можно анализировать кодек AV1 через браузер (заинтересовавшиеся могут перейти по адресу aomanalyzer.org).

Универсальный кодек


Разберём основные механизмы, лежащие в основе универсального видеокодека. Большинство из этих концепций полезны и используются в современных кодеках, таких как VP9, AV1 и HEVC. Предупреждаю, что многие объясняемые вещи будут упрощены. Иногда будут использоваться реальные примеры (как в случае с H.264) для демонстрации технологий.

1-й шаг — разбиение изображения


Первым шагом является разделение кадра на несколько разделов, подразделов и далее.

Для чего? Есть множество причин. Когда дробим картинку, можно точнее прогнозировать вектор движения, используя небольшие разделы для маленьких движущихся частей. В то время как для статического фона можно ограничиться и более крупными разделами.

Обычно кодеки организуют эти разделы в секции (или фрагменты), макроблоки (или блоки дерева кодирования) и множество подразделов. Максимальный размер этих разделов варьируется, HEVC устанавливает 64×64, в то время как AVC использует 16×16, а подразделы могут дробиться до размеров 4×4.

Припоминаете разновидности кадров из прошлой статьи?! Это же можно применить и к блокам, так что, у нас могут быть I-фрагмент, B-блок, P-макроблок и т.п.

Для желающих попрактиковаться — посмотрите как изображение разобъётся на разделы и подразделы. Для этого можно воспользоваться уже упоминаемой в прошлой статье Intel Video Pro Analyzer (тот, что платный, но с бесплатный пробной версией, имеющей ограничение на первые 10 кадров). Здесь проанализированы разделы VP9:

2-й шаг — прогнозирование


Как только у нас появились разделы, мы можем составлять астрологические прогнозы по ним. Для INTER-прогнозирования необходимо передать векторы движения и остаток, а для INTRA-прогнозирования передаётся направление прогноза и остаток.

3-й шаг — преобразование


После того, как получим остаточный блок (предсказанный раздел → реальный раздел), возможно преобразовать его таким образом, чтобы знать, какие пиксели можно отбросить, сохраняя при этом общее качество. Есть некоторые преобразования, обеспечивающие точное поведение.

Хотя есть и другие методы, рассмотрим более подробно дискретное косинусное преобразование (DCT — от discrete cosine transform). Основные функции DCT:

  • Преобразует блоки пикселей в одинаковые по размеру блоки частотных коэффициентов.
  • Уплотняет мощность, помогая устранять пространственную избыточность.
  • Обеспечивает обратимость.

2 февраля 2017 года Синттра Р.Дж. (Cintra, R.J.) и Байер Ф.М. (Bayer F.M.) опубликовали статью про DCT-подобное преобразование для сжатия изображений, требующее только 14 дополнений.

Не переживайте, если не поняли преимуществ каждого пункта. Сейчас на конкретных примерах убедимся в их реальной ценности.

Давайте возьмем такой блок пикселей 8×8:

Этот блок рендерится в следующее изображение 8 на 8 пискелей:

Применим DCT к этому блоку пикселей и получаем блок коэффициентов размером 8×8:

И если отрендерим этот блок коэффициентов, получим такое изображение:

Как видим, это не похоже на исходное изображение. Можно заметить, что первый коэффициент сильно отличается от всех остальных. Этот первый коэффициент известен как DC-коэффициент, представляющий все выборки во входном массиве, нечто похожее на среднее значение.

У этого блока коэффициентов есть интересное свойство: он отделяет высокочастотные компоненты от низкочастотных.

В изображении большая часть мощности сконцентрирована на более низких частотах, поэтому, если преобразовать изображение в его частотные компоненты и отбросить более высокие частотные коэффициенты, можно уменьшить количество данных, необходимых для описания изображения, не слишком жертвуя качеством картинки.

Частота означает, насколько быстро меняется сигнал.
Давайте попробуем применить знания, полученные в тестовом примере, преобразовав исходное изображение в его частоту (блок коэффициентов), используя DCT, а затем отбросив часть наименее важных коэффициентов.

Сначала конвертируем его в частотную область.

Далее отбрасываем часть (67%) коэффициентов, в основном нижнюю правую часть.

Наконец, восстанавливаем изображение из этого отброшенного блока коэффициентов (помните, оно должно быть обратимым) и сравниваем с оригиналом.

Видим, что оно напоминает исходное изображение, но есть много отличий от оригинала. Мы выбросили 67,1875% и все же получили что-то, напоминающее первоисточник. Можно было более продуманно отбросить коэффициенты, чтобы получить изображение ещё лучшего качества, но это уже следующая тема.

Каждый коэффициент формируется с использованием всех пикселей

Важно: каждый коэффициент напрямую не отображается на один пиксель, а представляет собой взвешенную сумму всех пикселей. Этот удивительный график показывает, как рассчитывается первый и второй коэффициент с использованием весов, уникальных для каждого индекса.

Вы также можете попытаться визуализировать DCT, взглянув на простое формирование изображения на его основе. Например, вот символ A, формируемый с использованием каждого веса коэффициента:

4-й шаг — квантование


После того как на предыдущем шаге выбрасываем некоторые коэффициенты, на последнем шаге (преобразование), производим особую форму квантования. На этом этапе допустимо терять информацию. Или, проще говоря, будем квантовать коэффициенты для достижения сжатия.

Как можно квантовать блок коэффициентов? Одним из самых простых методов будет равномерное квантование, когда берём блок, делим его на одно значение (на 10) и округляем то что получилось.

Можем ли обратить этот блок коэффициентов? Да, можем, умножив на то же значение, на которые делили.

Этот подход не самый лучший, поскольку он не учитывает важность каждого коэффициента. Можно было бы использовать матрицу квантователей вместо одного значения, а эта матрица может использовать свойство DCT, квантуя большинство нижних правых и меньшинство верхних левых.

5 шаг — энтропийное кодирование


После того, как мы квантовали данные (блоки изображений, фрагменты, кадры), все еще можем сжимать их без потерь. Существует много алгоритмических способов сжатия данных. Мы собираемся кратко познакомиться с некоторыми из них, для более глубокого понимания вы можете прочитать книгу «Разбираемся со сжатием: сжатие данных для современных разработчиков» («Understanding Compression: Data Compression for Modern Developers»).

Кодирование видео с помощью VLC


Предположим, у нас есть поток символов: a, e, r и t. Вероятность (в пределах от 0 до 1) того, как часто встречается каждый символ в потоке, представлена в этой таблице.Мы можем присвоить уникальные двоичные коды (предпочтительно малые) наиболее вероятным, а более крупные коды — менее вероятным.Сжимаем поток, предполагая, что в итоге потратим 8 бит на каждый символ. Без сжатия на символ понадобилось бы 24 бита. Если каждый символ заменять на его код, то получается экономия!

Первый шаг заключается в кодировании символа e, который равен 10, а второй символ — это a, который добавляется (не математическим способом): [10] [0], и, наконец, третий символ t, который делает наш финальный сжатый битовый поток равным [10] [0] [1110] или же 1001110, для чего требуется всего 7 бит (в 3,4 раза меньше места, чем в оригинале).

Обратите внимание, что каждый код должен быть уникальным кодом с префиксом. Алгоритм Хаффмана поможет найти эти цифры. Хотя данный способ не без изъянов, существуют видеокодеки, которые всё ещё предлагают этот алгоритмический метод для сжатия.

И кодер, и декодер должны иметь доступ к таблице символов со своими бинарными кодами. Поэтому также необходимо отправить во входных данных и таблицу.

Арифметическое кодирование


Предположим, у нас есть поток символов: a, e, r, s и t, и их вероятность представлена этой таблицей.С этой таблицей построим диапазоны, содержащие все возможные символы, отсортированные по наибольшему количеству.

Теперь давайте закодируем поток из трёх символов: eat.

Сначала выбираем первый символ e, который находится в поддиапазоне от 0,3 до 0,6 (не включая). Берём этот поддиапазон и снова делим его в тех же пропорциях, что и ранее, но уже для этого нового диапазона.

Давайте продолжим кодировать наш поток eat. Теперь берём второй символ a, который находится в новом поддиапазоне от 0,3 до 0,39, а затем берём наш последний символ t и, повторяя тот же процесс снова, получаем последний поддиапазон от 0,354 до 0,372.

Нам просто нужно выбрать число в последнем поддиапазоне от 0,354 до 0,372. Давайте выберем 0,36 (но можно выбрать и любое другое число в этом поддиапазоне). Только с этим числом сможем восстановить наш оригинальный поток. Это как если бы мы рисовали линию в пределах диапазонов для кодирования нашего потока.

Обратная операция (то бишь декодирование) так же проста: с нашим числом 0,36 и нашим исходным диапазоном можем запустить тот же процесс. Но теперь, используя это число, выявляем поток, закодированный с помощью этого числа.

С первым диапазоном замечаем, что наше число соответствует срезу, следовательно, это наш первый символ. Теперь снова разделяем этот поддиапазон, выполняя тот же процесс, что и раньше. Тут можно заметить, что 0,36 соответствует символу a, и после повторения процесса мы пришли к последнему символу t (формируя наш исходный кодированный поток eat).

И для кодера и для декодера должна быть в наличии таблица вероятностей символов, поэтому необходимо во входных данных отправить и её.

Довольно элегантно, не так ли? Кто-то, придумавший это решение, был чертовски умён. Некоторые видеокодеки используют эту технику (или, во всяком случае, предлагают её в качестве опции).

Идея состоит в том, чтобы сжать без потерь квантованный битовый поток. Наверняка в этой статье отсутствуют тонны деталей, причин, компромиссов и т.д. Но вы, если являетесь разработчиком, должны знать больше. Новые кодеки пытаются использовать разные алгоритмы энтропийного кодирования, такие как ANS.

6 шаг — формат битового потока


После того, как сделали всё это, осталось распаковать сжатые кадры в контексте выполненных шагов. Необходимо явно информировать декодер о решениях, принятых кодером. Декодеру должна быть предоставлена вся необходимая информация: битовая глубина, цветовое пространство, разрешение, информация о прогнозах (векторы движения, направленное INTER-прогнозирование), профиль, уровень, частота кадров, тип кадра, номер кадра и многое другое.

Мы поверхностно ознакомимся с битовым потоком H.264. Нашим первым шагом является создание минимального битового потока H.264 (FFmpeg по умолчанию добавляет все параметры кодирования, такие как SEI NAL — чуть дальше узнаем, что это такое). Можем сделать это, используя наш собственный репозиторий и FFmpeg.

./s/ffmpeg -i /files/i/minimal.png -pix_fmt yuv420p /files/v/minimal_yuv420.h364

Данная команда сгенерирует необработанный битовый поток H.264 с одним кадром, разрешением 64×64, с цветовым пространством YUV420. При этом используется в качестве кадра следующее изображение.

Битовый поток H.264


Стандарт AVC (H.264) определяет, что информация будет отправляться в макрокадрах (в понимании сети), называемых NAL (это такой уровень абстракции сети). Основной целью NAL является предоставление «дружественного к сети» представления видео. Этот стандарт должен работать на телевизорах (на основе потоков), в Интернете (на основе пакетов).

Существует маркер синхронизации для определения границ элементов NAL. Каждый маркер синхронизации содержит значение 0x00 0x00 0x01, за исключением самого первого, который равен 0x00 0x00 0x00 0x01. Если запустим hexdump для сгенерированного битового потока H.264, то идентифицируем по крайней мере три паттерна NAL в начале файла.

Как говорилось, декодер должен знать не только данные изображения, но также и детали видео, кадра, цвета, используемые параметры и многое другое. Первый байт каждого NAL определяет его категорию и тип.

Обычно первым NAL битового потока является SPS. Этот тип NAL отвечает за информирование об общих переменных кодирования, таких как профиль, уровень, разрешение и прочее.

Если пропустить первый маркер синхронизации, то можем декодировать первый байт, чтобы узнать, какой тип NAL является первым.

Например, первый байт после маркера синхронизации равен 01100111, где первый бит (0) находится в поле forbidden_zero_bit. Следующие 2 бита (11) сообщает нам поле nal_ref_idc, которое указывает, является ли этот NAL ссылочным полем или нет. И остальные 5 бит (00111) сообщает нам поле nal_unit_type, в данном случае это блок SPS (7) NAL.

Второй байт (binary=01100100, hex=0x64, dec=100) в SPS NAL — это поле profile_idc, которое показывает профиль, который использовал кодер. В данном случае использовался ограниченный высокий профиль (т.е. высокий профиль без поддержки двунаправленного B-сегмента).

Если ознакомиться со спецификацией битового потока H.264 для SPS NAL, то обнаружим много значений для имени параметра, категории и описания. Например, давайте посмотрим на поля pic_width_in_mbs_minus_1 и pic_height_in_map_units_minus_1.

Если выполнить некоторые математические операции со значениями этих полей, то получим разрешение. Можно представить 1920 x 1080, используя pic_width_in_mbs_minus_1 со значением 119 ((119 + 1) * macroblock_size = 120 * 16 = 1920). Опять же, экономя место, вместо кодирования 1920 сделали это со 119.

Если продолжить проверку нашего созданного видео в двоичном виде (например: xxd -b -c 11 v/minimal_yuv420.h364), то можно перейти к последнему NAL, который является самим кадром.

Здесь видим его первые 6 байтовых значений: 01100101 10001000 10000100 00000000 00100001 11111111. Поскольку известно, что первый байт указывает на тип NAL, в данном случае (00101) это IDR фрагмент (5), и тогда получится дополнительно исследовать его:

Используя информацию спецификации, получится декодировать тип фрагмента (slice_type) и номер кадра (frame_num) среди других важных полей.

Чтобы получить значения некоторых полей (ue(v), me(v), se(v) или te(v)), нам нужно декодировать фрагмент, используя специальный декодер, основанный на экспоненциальном коде Голомба. Этот метод очень эффективен для кодирования значений переменных, особенно, когда если есть много значений по умолчанию.

Значения slice_type и frame_num этого видео равны 7 (I-фрагмент) и 0 (первый кадр).

Битовый поток можно рассматривать как протокол. Если желаете узнать больше о битовом потоке, стоит обратиться к спецификации ITU H.264. Вот макросхема, показывающая, где находятся данные изображения (YUV в сжатом виде).

Можно исследовать и другие битовые потоки, такие как VP9, H.265 (HEVC) или даже наш новый лучший битовый поток AV1. Все ли они похожи? Нет, но разобравшись хотя бы с одним — гораздо проще понять остальные.

Хотите попрактиковаться? Исследуйте поток битов H.264

Можно сгенерировать однокадровое видео и использовать MediaInfo для исследования потока битов H.264. Фактически, ничто не мешает даже поглядеть исходный код, который анализирует поток битов H.264 (AVC).

Для практики можно использовать Intel Video Pro Analyzer (я уже вроде говорил, что программа платная, но есть бесплатная пробная версия, с ограничением на 10 кадров?).

Обзор


Отметим, что многие современные кодеки используют ту же самую модель, которую только что изучили. Вот, давайте взглянем на блок-схему видеокодека Thor. Она содержит все шаги, нами пройденные. Весь смысл этой заметки в том, чтобы вы, по крайней мере, лучше понимали инновации и документацию из этой области.

Ранее рассчитали, что потребуется 139 Гб дискового пространства для хранения видеофайла длительностью один час при качестве 720p и 30 fps. Если использовать методы, которые разобрали в этой статье (межкадровые и внутренние прогнозы, преобразование, квантование, энтропийное кодирование и т.п.), то можно достичь (исходя из того, что тратим 0,031 бит на пиксель), видео вполне удовлетворительного качества, занимающее всего 367,82 Мб, а не 139 Гб памяти.

Как H.265 достигает лучшей степени сжатия, чем H.264?


Теперь, когда известно больше о том, как работают кодеки, проще разбираться, как новые кодеки способны обеспечивать более высокое разрешение с меньшим количеством битов.

Если сравнивать AVC и HEVC, стоит не забывать, что это почти всегда выбор между большей нагрузкой на CPU и степенью сжатия.

HEVC имеет больше вариантов разделов (и подразделов), чем AVC, больше направлений внутреннего прогнозирования, улучшенное энтропийное кодирование и многое другое. Все эти улучшения сделали H.265 способным сжимать на 50% больше, чем H.264.



Первая часть: Основы работы с видео и изображениями

Какой формат видео лучше

На сегодняшний момент можно насчитать огромное количество разнообразных вариантов хранения и представления информации. Существует множество различных видео форматов, каждый из которых обладает уникальными особенностями. И xотя современный видео конвертер поддерживает множество форматов одновременно, вначале следует выяснить — какой формат видео лучше?

Для того, чтобы перевести любую информацию в цифровой вид, используются специальные программы — кодеки. Они создают особый файл — контейнер, в котором хранятся все данные. Не следует смешивать эти понятия, так как они обозначают принципиально разные вещи.

Кодек — это специальная компьютерная программа, выполняющая превращение потока данных или сигнала для последующего их использования. Кодеки преобразуют имеющуюся информацию с целью более оптимального и компактного ее хранения. При этом основная структура файла (контейнер) остается прежней, меняется лишь способ представления данных. Наиболее популярными кодеками для записи видео являются следующие: DivX, XviD, MPEG2, H.264 и т.д. Если вы решили записать фильм или, например, создать онлайн слайд-шоу, необходимо определиться, какой видео кодек вы будете использовать. Знакомство с основными кодеками позволит определить какой формат видео лучше.

XviD — современный кодек стандарта MPEG4. Позволяет получить высокую четкость изображения на динамических сценах. Поэтому при выборе кодека исходите из особенностей и характеристик самого видеофайла. Это позволит понять, какой формат видео лучше подходит в конкретном случае. В отличие от DivX, XviD является свободной программой, распространяемой по лицензии GNU.

DivX — один из самых популярных видеокодеков. Обеспечивает высокое качество изображения. Файлы, конвертированные с помощью данного кодека, имеют небольшой размер, и их можно просматривать практически на всех современных DVD-плеерах. Начиная с пятой версии, стал платным для кодирования.

H.264. По сравнению с двумя предыдущими видеокодеками, H.264 работает более эффективно и обеспечивает более высокую степень сжатия файлов без ущерба для качества. Однако, как правило, данный кодек отсутствует в компьютере изначально и его приходится устанавливать дополнительно.

MPEG2 — популярный видеостандарт, активно используемый в цифровом телевидении для обеспечения высокоскоростной передачи информации. Помимо этого, кодек MPEG2 используется при записи DVD дисков, а также в системах компрессии видеоизображений.

В Интернет вы можете найти файлы, сжатые с помощью самых разных кодеков — как популярных, так и редко встречающихся. Быстрый и удобный конвертер в 3GP позволит вам открыть и сконвертировать видеоролики из любого формата.

Итак, кодеки преобразуют информацию в специальный файл, который называется контейнером. Контейнер — это своеобразная оболочка, в которой хранится в цифровом виде преобразованная с помощью кодеков информация. Структура контейнера неоднородна и включает несколько компонентов: видеопоток, аудиопоток, разнообразная дополнительная информация (сведения о файле, титры и т.д.). Таким образом, контейнер сам по себе не может конвертировать информацию, он лишь служит для ее хранения. Самыми распространенными контейнерами являются AVI, TS, MP4, MKV. Давайте рассмотрим некоторые из них более подробно, чтобы ответить на вопрос, какой формат видео лучше?

AVI (Audio-Video Interleaved) — дословно означает «чередование аудио и видео». Представляет собой универсальный контейнер для хранения информации различных типов. AVI файл может заключать в себе видео, звук, текстовую информацию и т.д. При чем, аудиопотоков может быть несколько. При создании AVI файла могут быть использованы самые разнообразные кодеки. Данный формат видео лучше аналогичных видеостандартов в силу удобства в использовании и широкому диапазону возможностей записи видео.

MKV — свободно распространяемый контейнер, известный как проект «Matroska». Этот мультимедийный контейнер позволяет хранить огромное количество самой разнообразной информации, включая аудиодорожки на разных языках, субтитры, позволяет создавать специальные главы видео и т.д. Основной особенностью данного формата является открытость кода, что обеспечивает возможность его редактирования и совершенствования программистами всего мира. Если сравнивать AVI с MKV, то последний формат видео лучше первого по большинству параметров. Контейнер MKV обладает всеми необходимыми параметрами для хранения видео файлов и приобретает все большую популярность у пользователей ПК.

Итак, в этой статье мы постарались ответить на вопрос, какой формат видео лучше. Мы определили основные особенности современных форматов, обозначили разницу между кодеками и контейнерами, а какой конкретный формат использовать для записи видео — решать только вам. Прежде всего, исходите из поставленных целей, а также области использования записываемого видео файла.

Разница между mpeg2 и mpeg4

 

Your ads will be inserted here by

Easy Plugin for AdSense.

Please go to the plugin admin page to
Paste your ad code OR
Suppress this ad slot.

ru.natapa.org


MPEG обозначает Группу экспертов по движущимся изображениям. Это рабочая группа экспертов, которая была сформирована в 1988 году ISO и IEC.

Это была совместная инициатива Хироши Ясуда из Nippon Telegraph and Telephone и Леонардо Кьярильоне. Chiariglione служил в качестве председателя группы с момента ее создания.
Целью MPEG было установить стандарты для сжатия и передачи аудио и видео. К 2005 году группа выросла до 350 членов на совещание из различных отраслей, университетов и исследовательских институтов.
Стандарты, установленные MPEG, состоят из разных частей. Каждая часть охватывает определенный аспект всей спецификации. MPEG стандартизировал следующие форматы сжатия и вспомогательные стандарты:

  • MPEG-1 (1993): кодирование движущихся изображений и связанного звука для цифровых носителей со скоростью до 1,5 Мбит / с (ISO / IEC 11172). Предназначен для сжатия необработанного цифрового видео и аудио CD с качеством VHS без чрезмерной потери качества, благодаря чему возможны видео компакт-диски, цифровое кабельное / спутниковое телевидение и цифровое аудиовещание (DAB). Он включает в себя популярный формат сжатия звука MPEG1 Audio Layer III (MP3).
  • MPEG-2 (1995): общее кодирование движущихся изображений и соответствующей аудиоинформации (ISO / IEC 13818). Описывает комбинацию методов сжатия видео с потерями и сжатия аудио данных с потерями, которые позволяют хранить и передавать фильмы с использованием доступных в настоящее время носителей и пропускной способности передачи.
  • MPEG-3: имеет дело со стандартизированным масштабируемым сжатием и сжатием с несколькими разрешениями и был предназначен для сжатия HDTV, но был признан избыточным и был объединен с MPEG2.
  • MPEG-4 (1999): Кодирование аудиовизуальных объектов. Включает сжатие AV-данных для веб-приложений (потоковое мультимедиа) и распространения CD, голосовых (телефон, видеофон) и вещательных телевизионных приложений. Включает MPEG-4 Part 14 (MP4).
  • MPEG-7 (2002): интерфейс описания мультимедийного контента. Не стандарт, который имеет дело с фактическим кодированием движущихся изображений и аудио, таких как MPEG1, MPEG2 и MPEG4. Он использует XML для хранения метаданных и может быть присоединен к временному коду, чтобы пометить определенные события или синхронизировать текст песни с песней.
  • MPEG-21 (2001): мультимедийная структура. Он нацелен на определение открытой платформы для мультимедийных приложений. Основано на определении цифрового элемента и пользователей, взаимодействующих с цифровыми элементами.


Одним из наиболее часто используемых форматов MPEG является .mpg или .mpeg. .mpg является одним из нескольких расширений файлов для сжатия аудио и видео MPEG-1 или MPEG-2. MPEG-1 и MPEG-2 — это стандарт сжатия видео и аудио с потерями.Сжатие с потерями означает, что при сохранении файла происходит небольшая потеря качества из-за сжатия.

Конвертирование VOB в MPEG2

При каждом повторном сохранении наблюдается небольшая потеря качества из-за сжатия. Следовательно, это не самый лучший формат, если нужно постоянно вносить многочисленные изменения и повторно сохранять изображение. Тем не менее, если сделать несколько правок и файл сохраняется в формате высокого качества, небольшая потеря качества из-за сжатия в основном незначительна.

Преимущество использования этого формата заключается в том, что из-за сжатия файл будет занимать меньше места для хранения данных.
Стандарт MPEG-1 состоит из следующих частей:

  • Системы (хранение и синхронизация видео, аудио и других данных вместе)
  • Видео (сжатый видеоконтент)
  • Аудио (сжатый аудиоконтент)
  • Проверка соответствия (тестирование правильности реализации стандарта)
  • Справочное программное обеспечение (пример программного обеспечения, показывающего, как кодировать и декодировать в соответствии со стандартом)

MPEG4 был выпущен в 1999 году и был разработан как метод кодирования для устройств с ограниченными ресурсами, в основном портативных устройств, таких как медиаплееры и мобильные телефоны. Этот формат также часто используется для онлайновых видео- и аудиофайлов, в основном для потоковой передачи мультимедиа, а также для распространения компакт-дисков, телефона, видеофона и вещательного телевидения.
MPEG4 основан на стандартах MPEG-1 и MPEG-2 и, подобно им, является стандартом алгоритма сжатия графики и видео с потерями. Однако файлы MPEG-4 имеют меньший размер и, следовательно, предпочтительнее для потоковой передачи в Интернете или хранения на портативных проигрывателях с ограниченным дисковым пространством.

Это происходит главным образом потому, что MPEG-4 основан на вейвлет-технологии, которая может сжимать цветные изображения со скоростью от 20: 1 до 300: 1 и изображения в градациях серого в диапазоне от 20: 1 до 50: 1. Кроме того, механизм сжатия MPEG4 немного сложнее по сравнению с MPEG2. Это связано с тем, что MPEG4 требует более совершенных алгоритмов для сканирования и определения, какие пиксели могут быть отброшены, чтобы еще больше уменьшить размер данных.
Википедия перечисляет следующие особенности MPEG4:

  • MPEG-4 позволяет различным разработчикам программного и аппаратного обеспечения создавать мультимедийные объекты, обладающие лучшими способностями к адаптации и гибкости, для улучшения качества таких услуг и технологий, как цифровое телевидение, анимационная графика, Всемирная паутина и их расширения.
  • Поставщики сетей передачи данных могут использовать MPEG-4 для прозрачности данных. С помощью стандартных процедур данные MPEG-4 могут быть интерпретированы и преобразованы в другие типы сигналов, совместимые с любой доступной сетью.
  • Формат MPEG-4 предоставляет конечным пользователям широкий спектр взаимодействия с различными анимированными объектами.
  • Стандартизированная сигнализация управления цифровыми правами, известная в сообществе MPEG как Управление и защита интеллектуальной собственности (IPMP).


MPEG4 стал довольно популярным за эти годы. Одним из наиболее часто используемых форматов является .mp4. MPEG-4 Part 12 была разработана на основе файла Apple MOV и в итоге привела к MPEG-4 Part 14, который является форматом MP4.

MP4 — это контейнерный формат. Это означает, что его можно использовать для хранения аудио- и / или видеоданных.

MP4 видео и аудио также могут передаваться через Интернет.

БЕСПЛАТНАЯ ЦИФРА DVB-T2 СО СПУТНИКА!!! КАК ВЗЛОМАТЬ СЕКРЕТНЫЙ ФОРМАТ T2-MI? Что скрывает РТРС???

MPEG2 и MPEG4 2020

Группа экспертов Moving Pictures или MPEG — это орган, отвечающий за стандарты, которые мы часто используем для кодирования видео. MPEG2 — это стандарт, который был создан для кодирования высококачественных видеоизображений, предназначенных для использования на носителе DVD, а затем появляющемся. MPEG4 был разработан значительно позже, в качестве метода кодирования для устройств с ограниченными ресурсами.

Портативные устройства, такие как медиаплееры и мобильные телефоны, используют этот формат, а также интернет-магазины, которые предоставляют наем видео- и аудиофайлов.
MPEG4 является предпочтительным форматом для устройств, поскольку он дает файл, который находится под 1G для большинства полноразмерных фильмов. Это далеко от MPEG2, который может создавать только файлы размером в пять раз.

Сохранение файлов MPEG2 не будет проблемой на DVD-дисках, так как обычная емкость DVD превышает 4 ГБ, но это серьезная проблема с портативными устройствами. MPEG4 также сделал его практичным для покупки и загрузки видео в Интернете, так как видео в формате MPEG2 довольно велико и требуется много времени для загрузки.

Небольшой размер файлов MPEG4 напрямую преобразуется в меньшую пропускную способность, необходимую при потоковой передаче записанных или видео в реальном времени через Интернет.
Установка размера файла в сторону, если учитывать лучший формат, MPEG2 выигрывает в ручном режиме, так как он обеспечивает гораздо более высокое качество изображения. Разница в качестве незначительна при просмотре файлов с помощью крошечного экрана, например, установленных на мобильных телефонах и даже нетбуках, но когда дело доходит до больших дисплеев, как и большинство современных дисплеев HDTV, вы можете четко заметить разницу в окончательном изображении. Мы можем отнести это к количеству потерянных данных, поскольку как MPEG2, так и MPEG4 являются методами сжатия, которые теряют данные.

MPEG4 просто отбрасывает больше информации, что приводит к ухудшению изображения.
MPEG2 сжимает видео, отбрасывая информацию по частям изображения, которые не меняются от одного кадра к другому, и сохраняют только части изображения, в которые добавлена ??новая информация. Механизм сжатия MPEG4 немного сложнее по сравнению с MPEG2, так как ему нужны лучшие алгоритмы для сканирования и определения того, какие пиксели можно отбросить, чтобы еще больше уменьшить данные.
1. MPEG2 — это метод кодирования для DVD-дисков, в то время как MPEG4 — это способ кодирования для портативных устройств и онлайн-использования.
2. Видеофайлы, закодированные в MPEG2, намного больше по сравнению с MPEG4.
3. MPEG2 требует гораздо большую пропускную способность для потоковой передачи по сравнению с MPEG4.
4. MPEG2 обеспечивает лучшее качество видео по сравнению с MPEG4.
5. Сжатие MPEG2 намного проще по сравнению с MPEG4.

 

Преимущества MPEG-4 AVC (h.264) перед MPEG-2

Что такое NTSC PAL

Your ads will be inserted here by

Easy Plugin for AdSense.

Please go to the plugin admin page to
Paste your ad code OR
Suppress this ad slot.

Александр Дзюбенко

Недавно я пообещал рассказать о преимуществах стандарта сжатия MPEG-4 AVC (также называемого MPEG-4 Part 10 или просто h.264) перед устаревшим, но более распространенным MPEG-2. Напомню, что речь идет о выборе стандарта для эфирного цифрового вещания стандартной чёткости. Прикидывая в уме, как лучше написать, я вдруг подумал: а надо ли вообще кому-нибудь доказывать, что MPEG-4 намного лучше, чем MPEG-2?

Разве это не очевидно?
Стандарты сжатия MPEG-2 и MPEG-4 ведь не конкуренты, а старая и новая версия одного и того же. Более новый стандарт учитывает как новые научные наработки в области компрессии движущихся изображений, так и увеличившуюся за прошедшие годы процессорную мощь.
С тех пор, как несколько лет назад получил огромное распространение кодек DivX, базировавшийся на ранней версии MPEG-4, любой школьник знает, что он существенно выигрывает у MPEG-2 в эффективности сжатия, позволяя, в частности, с приемлемыми для непривередливых зрителей потерями уместить DVD-фильм на CD. Формат Flash Video (FLV), являющийся вариантом стандарта h.263, вывел на новый уровень видео в интернете, позволив развиться сервисам наподобие YouTube.

А ведь h.264, появившийся на пять лет позже DivX и h.263, гораздо совершеннее их.
И наконец, практически все (или совсем все?) страны, которые не запустили цифровое эфирное вещание раньше, а делают это сейчас (т.е. население которых не успело купить старые приёмники, понимающие только MPEG-2), выбирают именно h.264, потому что это позволит им сэкономить ценный частотный ресурс, уместив в одном частотном канале больше телевизионных сервисов.
Так что, нет, не надо никого убеждать, что MPEG-4 лучше, все и так это знают.
Но я бы не писал всё это, если бы не находились люди, которые возражают против использования MPEG-4 для цифрового вещания DVB-T. Странные люди.

Мотивируют тем, что ресиверы и энкодеры для MPEG-4 дороже. Не понимают, что сомнительная и незначительная экономия сейчас выльется в огромные, несоизмеримо бОльшие, потери в будущем, ведь решение о формате принимается как минимум на десятилетия.

Ну что ж, оставим это на их совести — думаю, здравый смысл всё равно победит.

Описание форматов сжатия MPEG-2 и MPEG-4

Отличительной особенностью видеоданных является их чрезвычайно большой объем. Специалисты в области сжатия данных, уже на протяжение многих лет работают над улучшением эффективности алгоритмов компрессии видеоизображений.

На рубеже 21 века, с появлением HDTV, назрела острая необходимость передавать большие объемы видеоинформации по спутниковым и кабельным сетям, и встала задача оптимизации способов кодирования видеоданных.
На сегодняшний день MPEG-2 — это стандарт цифрового кодирования аудио и видео сигналов, который используется большинством операторов спутникового телевидения для передачи сигналов абонентам. Данный стандарт был разработан рабочей группой Moving Pictures Experts Group и одобрен Международной Организацией по Стандартизации.

Технические аспекты стандарта MPEG-2

Рабочая группа MPEG описала общие принципы компрессии аудио и видео информации, а разработку деталей оставила для изготовителей кодеков. В основу алгоритма сжатия была положена модель восприятия человеческим глазом видеоизображений и особенности строения человеческого глаза — его способность воспринимать вариации цвета и градации яркости.

Так, например, человеческий глаз способен лучше воспринимать градации яркости, чем цветности.
Задача сводится к определению на экране неподвижного фона и движущихся объектов, на основании этого можно выделить и передать информацию о базовом кадре, а потом уже передавать кадры с информацией о движущихся объектах. В процессе передачи данных происходит отбрасывание малозначимой информации, аналогичной принципам, которые используются в графическом формате JPEG. Реализуется процесс путем разбивки потока видеоинформации на группы видеоизображений, каждая группа состоит из 3-х типов видеокадров.

Обычно используются потоки из 30 кадров в секунду.
Благодаря постоянному совершенствованию видео кодеков формата MPEG-2 операторы спутникового и кабельного вещания получили возможность передавать в 2 раза больший объем информации при той же пропускной способности канала, чем когда то, на заре эволюции цифрового вещания. Стало появляться все большее количество разных видео кодеков, но они уже не соответствовали существующему формату MPEG-2.

Назрела необходимость дальнейшей унификации стандарта.

MPEG-4 и HDTV

Цифровое спутниковое телевидение использует формат MPEG-2, где при разрешении кадра в 720×576 пикселей, скорость информационного потока при 30 кадрах/сек. составляет около 12 Мбит/сек, практически же используется скорость потока около 3 Мбит/сек. При стандартной ширине полосы в 54МГц на одном транспондере спутника обычно умещается 18 каналов.

При вещании в HDTV разрешение изображения составляет 1920×1080 пикселей, что в 5 раз больше по сравнению с обычным SD телевидением, и для вещания одного HDTV канала в стандарте MPEG-2 оператору потребовалось бы арендовать чуть ли не треть транспондера.
Очередным витком в развитии алгоритмов видеокомпрессии стал стандарт MPEG-4. Изначально он предназначался для передачи потокового видео по низкоскоростным каналам, но так же нашел применение и в цифровом телевидении.
Компрессии видео в формате MPEG-4 осуществляется по той же схеме, что и в MPEG-2. При кодировании исходного видеоизображения кодек ищет и сохраняет более значимые кадры, как правило, те, на которых происходит смена сюжета.

Вместо сохранения промежуточных кадров алгоритм обрабатывает и сохраняет данные об изменениях в текущем кадре по отношению к предыдущему, т.е дифференциально. При этом в процессе обработки изображения кодек оперирует с объектами произвольной формы, в отличии от формата MPEG-2, который мог оперировать только прямоугольными областями изображения.

Как смотреть каналы HD качества на старых приемниках с mpeg2

В результате этого, человек, передвигающийся по комнате, будет воспринят форматом MPEG-4, как отдельный объект, перемещающийся относительно неподвижного объекта — заднего плана.
Идея стандарта MPEG-4 заключается в объединении 22 подстандартов, из которых поставщики могут выбрать тот, который более точно отвечает их задачам.
Выделим из них наиболее важные подстандарты:

  • ISO 14496-3- Аудио: набор кодеков для сжатия звука и речи, включая Advanced Audio Coding (AAC)
  • ISO 14496-10- Видео: продвинутое кодирование видео ( Advanced Video Coding — AVC), технически идентичный и известный как кодек H.264


При переходе операторов спутникового телевидения на стандарт DVB-S2 и сжатие данных в MPEG-4 кодеком H.264 позволило в стволе одного транспондера разместить 8-10 HDTV каналов.

 

Разница между кодировщиками MPEG-2 и MPEG-4 | Radiant Communications Corporation

Разница между кодировщиками MPEG-2 и MPEG-4

В мире, где технологии быстро расширяют способы отправки, получения, сжатия и распаковки данных, может быть трудно поддерживать полное понимание форматов и процессов. Когда дело доходит до кодирования видео, один из наиболее распространенных источников путаницы возникает при попытке понять разницу между MPEG-2 и MPEG-4.К счастью, наша команда в Radiant Communications Corporation, одном из лучших мест для покупки кодировщиков MPEG-2 в Интернете, хорошо разбирается в этом вопросе. Чтобы прояснить эту разницу, мы объясним, как кодеры MPEG-2 и MPEG-4 обрабатывают сжатие, размер файла, качество и приложение.

MPEG-2

Кодеры

MPEG-2 существуют с конца 1990-х годов и обеспечивают большие успехи в возможностях кодирования видео по сравнению с их предшественником, MPEG-1.Кодирование видео MPEG-2 использует алгоритм сжатия, который использует блочное дискретное косинусное преобразование (DCT) 8 x 8 и обеспечивает высокое качество, но ограничивает возможность уменьшения размера файла, что стало неотъемлемой частью мира цифровых технологий. мультимедиа. Из-за больших размеров файлов, связанных с кодировщиками MPEG-2, они обычно используются с локальным видео, таким как DVD и кабельное вещание. Хотя качество MPEG-2 более чем способно обрабатывать локальное видео высокой четкости, существует значительное ухудшение качества при применении MPEG-2 к онлайн-потоковой передаче и потоковой передаче на основе устройств.

MPEG-4

После перехода на MPEG-3 формат кодирования видео MPEG-4 был выпущен, что совпало с массовым распространением Интернета, которое произошло в первые несколько лет 21-го века. Одно из наиболее заметных различий между форматами MPEG-2 и MPEG-4 заключается в использовании алгоритма с DCT 16 x 16, обеспечивающего гораздо более высокую степень сжатия. Эта более высокая степень сжатия означает, что размеры файлов могут быть уменьшены вдвое, открывая дверь для уменьшения пропускной способности без потери качества изображения.MPEG-4 — это шаг в естественном развитии методов кодирования, поскольку Интернет создал среду, в которой потоковое видео в Интернете и с мобильных устройств является основными формами потребления видео.

Основы

В конечном итоге и MPEG-2, и MPEG-4 способны поддерживать качество видео высокой четкости. Однако разница заключается в приложении. MPEG-2 более чем способен обрабатывать видеопотоки из локальных источников, таких как DVD и кабельное вещание, но из-за большего размера файла он борется с портативными устройствами и потоковой передачей через Интернет.MPEG-4, с другой стороны, использует высокую степень сжатия и меньшие размеры файлов для обеспечения высококачественного видео и звука в мобильных сетях.

Независимо от того, какой формат вам нужен для вашего бизнеса или MDU, Radiant Communications Corporation — один из лучших ресурсов для покупки кодировщиков h.264 через Интернет. Если у вас остались вопросы, позвоните нам по телефону 1-888-412-0124 или посетите https://www.rccfiber.com/, чтобы узнать больше!

Разница между MPEG2 и MPEG4

MPEG2 против MPEG4

MPEG — это группа экспертов по движущимся изображениям, организация, сотрудничающая с Международной организацией по стандартизации (ISO) в разработке новых стандартов для цифрового аудио и видео.Его первый стандарт MPEG-1 был выпущен в 5 частях в период с 1993 по 1999 год. Этот стандарт привел ко всем современным стандартам сжатия цифрового аудио / видео, принятым ISO. MPEG-2 и MPEG-4 — это два основных выпуска стандартов MPEG.

MPEG-2

MPEG-2 был разработан для преодоления недостатков стандарта MPEG-1. MPEG-1 имел систему сжатия звука, ограниченную двумя каналами (стерео), а для чересстрочного видео имел стандартизованную поддержку с плохим сжатием.Кроме того, у него был только один стандартизованный «профиль» (поток с ограниченными параметрами), который не подходил для видео с более высоким разрешением. MPEG-1 мог поддерживать видео 4k, но кодировать видео для более высоких разрешений было сложно. Были расхождения в идентификации оборудования, которое поддерживало такое кодирование. Кроме того, цвета были ограничены только цветовым пространством 4: 2: 0.

MPEG-1 превратился в MPEG-2, решив указанные выше проблемы. Одиннадцать частей стандарта были выпущены с 1996 по 2004 год, но стандарты все еще обновляются.Часть 8 была заброшена из-за отсутствия интереса к отрасли. Стандарт сжатия видео — H.263 — указан в Части 2, в то время как усовершенствования звука указаны в Части 3 и Части 7. Часть 3 определяет спецификацию многоканальности, а Часть 7 определяет усовершенствованное кодирование звука. Части спецификации, которые определяют различные аспекты, показаны ниже;

• Часть 1-Системы: описание синхронизации и мультиплексирования цифрового аудио и видео.

• Часть 2-Видео: кодер-декодер сжатия (кодек) для медиасигналов с чересстрочной и не чересстрочной разверткой

• Часть 3-Аудио: кодер-декодер сжатия (кодек) для перцептивного кодирования аудиосигналов.Это обеспечивает многоканальное расширение, а также расширяются скорости передачи данных и частоты дискретизации для MPEG-1 Audio Layer I, II и III аудио MPEG-1.

• Часть 4: Методология проверки соответствия.

• Часть 5: Описывает системы для моделирования программного обеспечения.

• Часть 6: Описание расширений для управления и контроля цифровых носителей (DSM-CC).

• Часть 7: Расширенное кодирование звука (AAC).

• Часть 9: Расширение для интерфейсов реального времени.

• Часть 10: Расширения соответствия для управления и контроля цифровых носителей (DSM-CC).

• Часть 11: Управление интеллектуальной собственностью (IPMP)

Стандарт

MPEG-2 используется в форматах DVD и цифрового телевещания (ISDB, DVB, ATSC). Это базовый стандарт для видеоформатов MOD и TOD. XDCAM также основан на MPEG-2.

MPEG-4

MPEG-4 — это последний стандарт, определенный MPEG. Он включает в себя функции MPEG-1 и MPEG-2 с новейшими отраслевыми технологиями и функциями, такими как язык моделирования виртуальной реальности (VRML), 3D-рендеринг, объектно-ориентированные составные файлы, а также упрощает структуру для внешнего управления цифровыми правами.Он был инициирован как стандарт для видеосвязи с низкой скоростью передачи данных, но позже превратился в всеобъемлющий стандарт кодирования мультимедиа. MPEG все еще находится в стадии разработки.

MPEG-4 Part 2 описывает визуальные аспекты и формирует основу Advanced Simple Profile, используемого кодеками, интегрированными в программное обеспечение, например DivX, Xvid, Nero Digital и 3ivx, а также QuickTime 6. MPEG-4 Part 10 описывает аспекты видео стандарта. На этом основаны MPEG-4 AVC / H.264 или Advanced Video Coding, используемые в кодировщике x264, Nero Digital AVC и HD-видео, такие как Blu-ray Disc.Ниже приводится краткое изложение частей, включенных в спецификации стандартов.

• Часть 1: Системы

• Часть 2: Visual

• Часть 3: Аудио

• Часть 4: Тестирование на соответствие

• Часть 5: Справочное программное обеспечение

• Часть 6: Структура интеграции мультимедиа доставки (DMIF)

• Часть 7: Оптимизированное справочное программное обеспечение для кодирования аудиовизуальных объектов

• Часть 8: Передача содержимого ISO / IEC 14496 по IP-сетям

• Часть 9: Описание справочного оборудования

• Часть 10: Расширенное кодирование видео (AVC)

• Часть 11: Описание сцены и механизм приложения

• Часть 12: базовый формат медиафайлов ISO

• Часть 13: Расширения управления и защиты интеллектуальной собственности (IPMP)

• Часть 14: формат файла MP4

• Часть 15: Формат файла Advanced Video Coding (AVC)

• Часть 16. Расширение Animation Framework (AFX)

• Часть 17: Формат потокового текста

• Часть 18: Сжатие шрифтов и потоковая передача

• Часть 19: Синтезированный поток текстур

• Часть 20: Облегченное представление сцены приложения (LASeR) и простой формат агрегирования (SAF)

• Часть 21: Расширения графической среды MPEG-J (GFX)

• Часть 22: Открытый формат шрифта

• Часть 23: Символическое представление музыки (SMR)

• Часть 24: Взаимодействие аудио и систем

• Часть 25: Модель сжатия трехмерной графики

• Часть 26: Соответствие аудио

• Часть 27: Соответствие 3D-графики

• Часть 28: Составное представление шрифта

• Часть 29: Кодирование веб-видео

• Часть 30: Синхронизированный текст и другие визуальные наложения в базовом формате медиафайлов ISO

Части 29 и 30 в настоящее время находятся в разработке.

MPEG-4 обеспечивает качество видео DVD, но потребляет более низкий битрейт; следовательно, можно передавать цифровые видеопотоки по компьютерным сетям.

MPEG2 против MPEG4

• MPEG-2 и MPEG-4 — это две версии стандартов ISO для цифрового аудио и видео. MPEG-4 — это новейший стандарт.

• И MPEG-2, и MPEG-4 используют сжатие с потерями при кодировании. MPEG-2 использует кодировку H.262, а MPEG-4 использует H.264.

• Сжатие MPEG-4 относительно сложно по сравнению с MPEG-2.Методы дискретного косинусного преобразования, векторного квантования и вейвлет-сжатия используются для уменьшения исходного сигнала, что приводит к относительно меньшему размеру файла.

• Файлы MPEG-2 больше, чем MPEG-4; поэтому стандарты MPEG-4 используются при передаче мультимедиа в режиме онлайн / в сети.

• MPEG-2 — качество DVD; качество MPEG-2 превосходит MPEG-4, но не подходит для Интернета или сетевых приложений.

• MPEG-2 может иметь битрейт в диапазоне от 5 до 80 Мбит / с.Битовая скорость MPEG-4 низкая по сравнению с MPEG-2.

(PDF) Оптимизация производительности транскодера видео из MPEG-2 в MPEG-4

Оптимизация производительности видео из MPEG-2 в MPEG-4

Транскодер

Хари Калва, Энтони Ветро и Хуэйфанг Сан

Mitsubishi Electric Research Labs, Murray Hill, NJ

РЕЗЮМЕ

Сжатый цифровой видеоконтент MPEG-2 используется в ряде продуктов, включая DVD, видеокамеры, цифровое телевидение

и HDTV.Возможность доступа к этому широко доступному контенту MPEG-2 на маломощных устройствах конечных пользователей, таких как

, таких как КПК и мобильные телефоны, зависит от эффективных методов транскодирования контента MPEG-2 в более подходящий формат видео с низким битрейтом

. например MPEG-4. В этой статье мы представляем программное обеспечение и алгоритмическую оптимизацию

, выполненную при разработке транскодера видео MPEG-2 в MPEG-4 в реальном времени. Также предоставляется краткий обзор архитектур транскодирования

.

Транскодер был оптимизирован для ПК с Windows и процессорами Intel Pentium-4. Оптимизация, выполненная

, использует параллелизм SIMD, предлагаемый процессорами Intel класса Pentium с поддержкой MMX. Транскодер

состоит из двух отдельных компонентов: видеодекодера MPEG-2 и видеотранскодера MPEG-4. Видеодекодер

MPEG-2 основан на эталонной реализации MPEG-2 Software Simulation Group, в то время как транскодер MPEG-

4 разработан с нуля с частями, взятыми из реализации MOMUSYS кодировщика видео MPEG-4

.Оптимизация включает: 1) общую оптимизацию обработки блоков, которая затронула как декодер MPEG-2

, так и транскодер MPEG-4, и 2) оптимизацию, характерную для декодера видео MPEG-2 и транскодера видео MPEG-4

. Оптимизация привела к значительным улучшениям как в декодировании MPEG-2, так и в транскодировании MPEG-4

. Благодаря оптимизации общее время, затрачиваемое транскодером, было сокращено более чем на 82%, при этом декодирование MPEG-2

уменьшилось более чем на 56%, а транскодирование MPEG-4 уменьшилось более чем на 86%.

Ключевые слова: MPEG-2, MPEG-4, транскодер, оптимизация, процессор Intel, MMX, компилятор Intel C ++

1. ВВЕДЕНИЕ

Сжатие видео MPEG-2, используемое в ряде видео-ориентированных приложений, все больше и больше больше цифрового видео

Контент

становится доступным в формате MPEG-2. Широкое использование видео в формате MPEG-2 также привело к снижению затрат на

, что привело к дальнейшему распространению использования видео в формате MPEG-2. Хотя видео MPEG-2 подходит для ряда приложений цифрового видео с высоким качеством

, оно не подходит для приложений с низким битрейтом.Существует ряд приложений, таких как

, например, видеонаблюдение и мобильные мультимедийные услуги, которые требуют, чтобы такое же высококачественное видео MPEG-2 передавалось

на менее функциональное устройство, такое как КПК или сотовый телефон, через соединение с более низкой пропускной способностью. Сжатие видео MPEG-4

Алгоритм

разработан для видео с низким битрейтом и имеет функции, которые позволяют передавать по менее надежной среде, такой как беспроводные сети

. Перекодирование видео MPEG-2 в формат MPEG-4 требует значительных вычислительных ресурсов.Был разработан набор архитектур транскодирования

, которые используют преимущества сходства в кодировании видео MPEG-2 и MPEG-4 для ускорения процесса перекодирования

[2]. Эти архитектуры перекодирования исключают необходимость полного перекодирования видео MPEG-4

. Анализ качества и сложности этих архитектур представлен в [1].

Настольные ПК становятся все более мощными с каждым поколением ЦП. Начиная с процессора PentiumPro

, Intel начала поддерживать набор инструкций для ускорения обработки мультимедиа и видео.Благодаря усовершенствованию скорости и архитектуры ЦП

теперь можно декодировать и воспроизводить видео MPEG-2 с разрешением HDTV

в реальном времени с помощью программных проигрывателей. Хотя можно транскодировать видео MPEG-2 в MPEG-4 в автономном режиме, существует ряд приложений

, которые требуют транскодирования видео MPEG-2 в реальном времени. Более того, офлайн-транскодирование видео MPEG-2 в формат

MPEG-4 с разными битрейтами и качеством, как того требуют все разные конечные пользователи, невозможно.Мы разработали

программную реализацию транскодера видео из MPEG-2 в MPEG-4 для работы на процессорах Intel Pentium-4

. Цели проекта — перекодировать видео MPEG-2 в реальном времени и максимально увеличить количество видеопотоков MPEG-2

, которые можно перекодировать одновременно. Поддержка программного обеспечения и набора инструкций, доступная для процессоров Pentium-4

, делает его идеальной платформой для разработки приложений транскодирования. Ускорение в основном достигается за счет использования инструкций

MMX, которые работают с набором данных параллельно.

Разница между MPEG2 и MPEG4

Ключевое отличие: MPEG означает группу экспертов по движущимся изображениям. MPEG2 был выпущен в 1995 году и фактически является преемником MPEG1. Он очень похож на MPEG1 и направлен на улучшение предыдущего формата. MPEG2 включает в себя общее кодирование движущихся изображений и связанной с ними звуковой информации. MPEG4 был выпущен в 1999 году и был разработан как метод кодирования для устройств с ограниченными ресурсами, в основном портативных устройств, таких как медиаплееры и мобильные телефоны.Этот формат также часто используется для онлайн-видео и аудиофайлов, в основном потокового мультимедиа, а также для распространения компакт-дисков, телефона, видеофона и приложений телевещания.

MPEG — это группа экспертов по движущимся изображениям. Это рабочая группа экспертов, созданная в 1988 году ISO и IEC. Это была совместная инициатива Хироши Ясуда из Nippon Telegraph and Telephone и Леонардо Кьяриглионе. Кьяриглионе является председателем группы с момента ее создания.

Целью MPEG было установить стандарты сжатия и передачи аудио и видео. К 2005 году группа выросла и теперь включает около 350 участников из различных отраслей, университетов и исследовательских институтов.

Стандарты, установленные MPEG, состоят из разных частей. Каждая часть охватывает определенный аспект всей спецификации. MPEG стандартизировал следующие форматы сжатия и вспомогательные стандарты:

  • MPEG-1 (1993): кодирование движущихся изображений и связанного звука для цифровых носителей с точностью до 1.5 Мбит / с (ISO / IEC 11172). Предназначен для сжатия необработанного цифрового видео и аудио CD с качеством VHS без чрезмерной потери качества, что делает возможным создание видео CD, цифрового кабельного / спутникового телевидения и цифрового аудиовещания (DAB). Он включает популярный формат сжатия звука MPEG1 Audio Layer III (MP3).
  • MPEG-2 (1995): Общее кодирование движущихся изображений и связанной с ними звуковой информации (ISO / IEC 13818). Описывает комбинацию методов сжатия видео с потерями и сжатия аудиоданных с потерями, которые позволяют хранить и передавать фильмы с использованием доступных в настоящее время носителей информации и полосы пропускания передачи.
  • MPEG-3: имел дело со стандартизацией масштабируемого сжатия и сжатия с несколькими разрешениями и предназначался для сжатия HDTV, но оказался избыточным и был объединен с MPEG2.
  • MPEG-4 (1999): Кодирование аудиовизуальных объектов. Включает сжатие AV-данных для Интернета (потоковое мультимедиа) и распространения компакт-дисков, голоса (телефон, видеофон) и приложений телевещания. Он включает MPEG-4 Part 14 (MP4).
  • MPEG-7 (2002): Интерфейс описания мультимедийного контента.Не стандарт, который касается фактического кодирования движущихся изображений и звука, например MPEG1, MPEG2 и MPEG4. Он использует XML для хранения метаданных и может быть прикреплен к тайм-коду, чтобы пометить определенные события или синхронизировать тексты песен с песней.
  • MPEG-21 (2001): Мультимедийный фреймворк. Он направлен на определение открытой структуры для мультимедийных приложений. На основе определения цифрового объекта и пользователей, взаимодействующих с цифровым объектом.

MPEG2 был выпущен в 1995 году и является преемником MPEG1.Он очень похож на MPEG1 и направлен на улучшение предыдущего формата. MPEG2 включает в себя общее кодирование движущихся изображений и связанной с ними звуковой информации. Он улучшает коэффициент сжатия и расширяет возможности MPEG1, так что MPEG2 в основном используется для DVD-видео, а также для цифрового телевещания, включая наземное, кабельное и спутниковое.

MPEG2 также обеспечивает сжатие с потерями, однако MPEG2 обеспечивает лучшее разрешение. Он также использовал более высокие скорости передачи данных. Сжатие с потерями означает, что при сохранении файла происходит небольшая потеря качества из-за сжатия.При каждом пересохранении наблюдается небольшая потеря качества из-за сжатия. Следовательно, это не лучший формат, если нужно постоянно вносить многочисленные правки и пересохранять изображение. Тем не менее, если внести всего несколько изменений и файл будет сохранен в формате высокого качества, небольшая потеря качества из-за сжатия в основном будет незначительной. Преимущество использования этого формата заключается в том, что из-за сжатия файл будет занимать меньше места для хранения данных.

Кроме того, MPEG2 устранил некоторые недостатки MPEG1, в том числе:

  • Сжатие звука ограничено двумя каналами
  • Нет стандартизированной поддержки чересстрочного видео с плохим сжатием при использовании чересстрочного видео
  • Ограниченный стандартизованный профиль, несовместимый с видео с более высоким разрешением.Поддержка видео 4k, но нет практического способа кодирования видео для более высокого разрешения
  • Ограниченная идентификация поддерживающего оборудования
  • Поддержка только одного цветового пространства — 4: 2: 0

Кроме того, MPEG2 также включает поддержку переменного квантования и VBR. MPEG2 также имеет более сложный алгоритм кодирования, из-за чего он несовместим с MPEG1. Следовательно, проигрыватели MPEG1 не могут декодировать и воспроизводить файлы MPEG2.

MPEG4 был выпущен в 1999 году и был разработан как метод кодирования для устройств с ограниченными ресурсами, в основном портативных устройств, таких как медиаплееры и мобильные телефоны.Этот формат также часто используется для онлайн-видео и аудиофайлов, в основном потокового мультимедиа, а также для распространения компакт-дисков, телефона, видеофона и приложений телевещания.

MPEG4 основан на стандартах MPEG-1 и MPEG-2 и, как и они, является стандартом алгоритмов сжатия графики и видео с потерями. Однако файлы MPEG-4 меньше по размеру и поэтому предпочтительны для потоковой передачи в Интернете или хранения на портативных проигрывателях с ограниченным дисковым пространством. В основном это связано с тем, что MPEG-4 основан на вейвлет-технологии, которая может сжимать цветные изображения со скоростью от 20: 1 до 300: 1 и изображения в градациях серого со скоростью от 20: 1 до 50: 1.Кроме того, механизм сжатия MPEG4 немного сложнее по сравнению с MPEG2. Это связано с тем, что MPEG4 требует более совершенных алгоритмов для сканирования и определения пикселей, которые можно отбросить, чтобы еще больше уменьшить размер данных.

Википедия перечисляет следующие особенности MPEG4:

  • MPEG-4 позволяет разработчикам различного программного и аппаратного обеспечения создавать мультимедийные объекты, обладающие лучшими возможностями адаптации и гибкости для улучшения качества таких услуг и технологий, как цифровое телевидение, анимационная графика, Всемирная паутина и их расширения.
  • Провайдеры сетей передачи данных могут использовать MPEG-4 для прозрачности данных. С помощью стандартных процедур данные MPEG-4 могут быть интерпретированы и преобразованы в другие типы сигналов, совместимые с любой доступной сетью.
  • Формат MPEG-4 предоставляет конечным пользователям широкий спектр возможностей взаимодействия с различными анимированными объектами.
  • Стандартизированная сигнализация управления цифровыми правами, также известная в сообществе MPEG как управление и защита интеллектуальной собственности (IPMP).

MPEG4 стал довольно популярным с годами.Один из наиболее часто используемых форматов — .mp4. MPEG-4 Part 12 был разработан на основе файла MOV от Apple и в конечном итоге привел к MPEG-4 Part 14, который является форматом MP4. MP4 — это контейнерный формат. Это означает, что его можно использовать для хранения аудио- и / или видеоданных. Видео и аудио MP4 также можно транслировать через Интернет.

Что означает MPEG2? Бесплатный словарь

Чтобы продемонстрировать эффективность операции введения факторов движения и текстуры, мы провели эксперименты с использованием функций ST_D и необработанных дескрипторов (RD) без факторов движения и текстуры для сжатых видео в формате MPEG2.Существует несколько методов сжатия видео, аудио и данных, но, безусловно, наиболее успешными из них были методы, разработанные группой экспертов по движущимся изображениям [19], они начали с MPEG1, затем они разработали MPEG2, MPEG4 часть 2 и, наконец, часть MPEG4. 10, более известный как h. По словам компании, стандартные методы, такие как MPEG2 и H.264, не удовлетворяют требованиям к сжатию изображений в медицинских приложениях, поэтому Plextek разработал адаптивные методы обработки, которые применяют разные уровни сжатия к разным частям изображения. изображение на основе определенных параметров.Основанные на новейшем высокопроизводительном процессоре ARM Cortex A9, SoC объединяют на одном кристалле функции, необходимые для воспроизведения видео MPEG2, MPEG4 и H.264 HDTV (1920 x 1080 пикселей). O! Play HD2 поддерживает самые популярные форматы. , включая MPEG2 (AVI / VOB), MPEG4 (AVO / Xvid), M2TS (Blu-ray), MKV (H.264), rmvb и DVD, функциональную навигацию по форматам ISO и IFO. адаптивное временное шумоподавление и шумоподавление пленки, как и шумоподавление кодека SD MPEG2, доступно в стандартной комплектации. Оно также работает с различными музыкальными форматами, такими как MP3, WMA, WAV и AAC, как видеоплеер, декодирующий MPEG2, AVI и MP4, или как фотоальбом, который совместим с форматом JPEG.Она также является международным лидером в области оборудования, а также систем тестирования и измерения в дополнение к приборам для новых цифровых форматов передачи, таких как DAB, DVB, ATSC и MPEG2. — TradeArabia News Service Цифровая система должна поддерживать следующие стандартные файлы: mpeg1, mpeg2, mp4, avi, wmv, mov, jpg, png, bmp и swf. Обратите внимание, что эти диски представляют собой DVD-диски с данными, содержащие видеофайлы в формате MPEG2. Ca-Zoom 6.2 включает съемный носитель CompactFlash, возможность записи и воспроизведения более двух часов видео в формате DVD MPEG2 и порт потокового цифрового видео USB.Система D-Scope [R] компании MDDev LLC. EDB Advanced Version 4.5 Workstation and Media Management System (MMS) обеспечивает захват видео в несжатом формате AVI, возможность сохранять видео или подклипы в дополнительных форматах сжатия (WMV, H.264, MPEG2) , а также улучшенный экспорт на карту памяти, устройство записи CD / DVD, презентацию PowerPoint или приложение для редактирования видео. Сжатие

MPEG-4: преимущества

Поскольку вещательные компании смотрят в будущее, многие озабочены разработкой еще более новых схем сжатия.В то время как новые технологии сжатия могут предложить дополнительные преимущества, существует компромисс, связанный с необходимостью реализации этой технологии, возможно, для широкого круга получателей и приложений.

Чтобы дать рекомендации по этой важной теме, редакторы Broadcast Engineering собрали трех экспертов для обсуждения различных аспектов MPEG-4 и связанных систем сжатия. Этот фон послужит хорошим введением в технологию, поскольку поставщики сейчас только начинают выпускать продукты.Для получения дополнительной информации о технологии MPEG посетите веб-сайт отраслевого форума MPEG-4 по адресу www.m4if.org.

Перейти к статье:

Кодирование видео MPEG-4


Расширенное кодирование звука MPEG-4 (AAC) и aacPlus
Расширенное кодирование видео MPEG-4 (AVC)

Кодирование видео MPEG-4

Себастьян Мериц, генеральный директор dicas digital image coding

Несомненно, индустрия вещания (наземного, спутникового и кабельного) резко изменилась за последнее десятилетие с тех пор, как цифровые технологии стали частью уравнения.Конечно, большинство передач по-прежнему следуют традиционным способам и средствам производства и создания, например, телевизионного контента, но наблюдается значительный сдвиг в сторону использования цифровых форматов. Он начался с производства и архивирования, а с DVB, ATSC и других переходов к кодированию, передаче и декодированию цифровых движущихся изображений. В цифровом вещании фактическим (и формальным) стандартом является MPEG-2, известный всем участникам рынка, разработанный для цифрового телевидения, с различным разрешением, называемым профилями.Цифровое телевидение стандартной четкости достигается с использованием основного профиля MPEG-2 на основном уровне, а телевидение высокой четкости использует основной профиль на высоком уровне. Что касается всего этого, MPEG-4 предлагает повышенную эффективность кодирования, которая улучшает качество кодированного видео и звука, особенно при низких скоростях передачи данных.


Рисунок 1: mpegable-транслятор из dicas показывает различные элементы управления, позволяющие пользователям создавать собственные сигналы MPEG-4.

Вещательные компании всегда будут стремиться быть на грани воспринимаемого качества изображения, получая максимальное качество и количество программ из наименьшего количества передаваемых битов.Следовательно, MPEG-4 потенциально будет играть важную роль в области интерактивного цифрового телевидения. Как правило, MPEG-4 применяется при скорости передачи данных менее 2 Мбит / с.

Есть две основные области, в которых кодирование видео MPEG-4 имеет большое значение. Эта первая область находится непосредственно в цепочке производства, архивирования и программирования, где, например, она позволяет вещателям просматривать видеоархивы, при этом простота использования и скорость рендеринга имеют первостепенное значение.

Примером этого является станция приема пищи Snell & Wilcox.SD MPEG-2 автоматически перекодируется с помощью технологии MOLE в MPEG-4 для отображения прокси-сервера с точностью до кадра и / или просмотра версии высококачественного архива MPEG-2. Скорость передачи данных, используемая в таких сценариях, обычно составляет 300 кбит / с и 800 кбит / с. Отображаемое видео имеет высокое качество, особенно когда используется MPEG-4 Visual Advanced Simple Profile, который содержит такие функции, как оценка четверти пикселя.

Во-вторых, вещательные компании заинтересованы в перепрофилировании контента — распространении своего контента не только с помощью традиционных средств вещания, но также через широкополосную связь, IP и мобильные сети.Переориентация цифровых видеоресурсов — это то место, где MPEG-4 с его высокой эффективностью кодирования для низких скоростей передачи данных вступает в свои права. Это достигается, например, с помощью Live Engine, продукта шведской компании Popwire. Live Engine в реальном времени кодирует высококачественный прямой эфир или записанный на магнитную ленту контент на жестком диске с разными скоростями передачи, где контент затем может быть заархивирован в различных профилях для различных целей.

Кроме того, для потоковых приложений, используемых вещательными компаниями, существуют профессиональные инструменты кодирования, такие как mpegable Broadcaster от немецкого поставщика dicas digital image coding, который представляет собой кодировщик в реальном времени для многоадресной потоковой передачи MPEG-4.(См. Рисунок 1.) Кодирование видео MPEG-4 чрезвычайно гибкое. Его можно использовать для низких, средних и высоких скоростей передачи данных, что является большим преимуществом по сравнению с другими стандартами видео.

Кроме того, MPEG-4 предлагает две интересные функции: устойчивость в подверженных ошибкам средах и масштабируемость на основе содержимого. Эти встроенные функции позволяют получить доступ к кодированным данным MPEG-4 в широком диапазоне носителей и с различным качеством с точки зрения временного и пространственного разрешения.

MPEG-4 охватывает широкий спектр приложений, битрейтов, разрешений, качества и услуг, что делает его интересным форматом для доставки мультимедиа по различным технологиям передачи или хранения.

Вернуться к началу

MPEG-4 audio Advanced audio coding (AAC) и aacPlus

Дэвид Фрерихс, вице-президент и GM Операции в США, Coding Technologies AB

MPEG-4 обеспечивает наиболее эффективное и высококачественное кодирование звука доступно сегодня. Аудиокодек MPEG-1 Layer 2 почти с качеством CD (используемый во многих службах цифрового видеовещания) обеспечивает высококачественное стерео со скоростью 128 кбит / с на канал, в то время как MPEG-4 AAC предлагает такое же качество со скоростью 64 кбит / с на канал.MPEG-4 aacPlus обеспечивает стереозвук CD-качества со скоростью 48 Кбит / с и стереозвук превосходного качества со скоростью 32 Кбит / с.

Аудио MPEG-4 по своей сути масштабируемо. Если, например, передача использует подверженный ошибкам канал с ограниченной полосой пропускания, аудиопоток, состоящий из небольшого базового уровня и большего уровня расширения, обеспечивает надежное решение. Надежная защита от ошибок на базовом уровне (добавление лишь небольших накладных расходов к общей скорости передачи данных) гарантирует, что сигнал всегда присутствует, даже при затрудненном приеме. Слой расширения (с небольшой защитой от ошибок) и базовый уровень вместе дают отличное качество в нормальных условиях.Любые ошибки приводят только к незначительному ухудшению качества, но никогда к полному прерыванию аудиопотока.

MPEG-4 aacPlus — это комбинация MPEG AAC и технологии репликации спектрального диапазона (SBR) от Coding Technologies. В июне 2001 года XM Radio стала первой коммерческой системой, развернувшей aacPlus. В конце 2001 года его ценность была признана MPEG, и теперь он готовится стать основным профилем аудио MPEG-4 под названием «High-Efficiency AAC».


Рисунок 2: Структура кодека MPEG-4 aacPlus, демонстрирующая интеграцию репликации спектрального диапазона (SBR) и расширенного кодирования звука (AAC).

MPEG-4 aacPlus не является заменой AAC, а скорее расширяет возможности высококачественного звука MPEG-4 до гораздо более низких скоростей передачи данных. Декодеры MPEG-4 aacPlus будут декодировать как простой AAC, так и расширенный AAC плюс SBR. Результатом является расширение стандарта с обратной совместимостью, которое почти вдвое увеличивает эффективность звука MPEG-4. (См. Рис. 2)

SBR — это уникальный метод расширения полосы пропускания, который позволяет аудиокодекам обеспечивать такое же качество прослушивания при примерно половинной скорости передачи данных.В результате MPEG-4 aacPlus обеспечивает стереозвук CD-качества со скоростью 48 Кбит / с и объемный звук 5.1 со скоростью 128 Кбит / с. Такой уровень эффективности идеален для доставки интернет-контента и принципиально открывает возможности для новых приложений на рынках мобильного и цифрового вещания.

Уникальная способность MPEG-4 aacPlus достигать высокого качества при низкой скорости передачи не только расширяет существующие рынки, но также открывает новые рынки для цифрового звука. Для приложений вещания, мобильного мультимедиа и потоковой передачи в Интернете, где полоса пропускания ограничена, значение «высокоэффективного AAC» (aacPlus) возрастает.

По мере того, как операторы стремятся расширить свои услуги с помощью большего количества каналов или с высоким разрешением, эффективность MPEG-4 aacPlus дает им больше возможностей либо для консолидации полосы пропускания звука, чтобы освободить место для большего количества видео, либо для наложения дополнительных аудиосервисов, таких как многоязычные и 5.1 объемный звук.

Поскольку SBR добавляется к стандарту MPEG-2, а также к стандарту MPEG-4, операторы могут использовать aacPlus независимо от выбора видео или транспорта.

К началу

Расширенное кодирование видео MPEG-4 (AVC)

Фади Малак, менеджер по развитию бизнеса, Harmonic, подразделение конвергентных систем

Консенсус растет в связи с появлением нового стандарта сжатия видео (MPEG-4 AVC / ЧАС.264). Первоначально разработанный Группой экспертов по кодированию видео (VCEG) МСЭ для обеспечения беспроводных однопользовательских видеоуслуг, MPEG-4 AVC / H.264 также предлагает значительные улучшения в технологиях сжатия видео, которые оказались полезными для других основных видеоприложений, таких как развлекательное телевидение (DVD, трансляция, VOD).

Развитие H.264 стало настолько большим, что ITU и ISO согласились разработать стандарт совместно (создавая Joint Video Team, также известную как JVT), и включить H.264 в MPEG как MPEG-4, часть 10. В результате этой совместной разработки один и тот же стандарт известен под разными названиями — MPEG-4 Advanced Video Coding (AVC), H.264, MPEG-4 part 10, H.26L. , а иногда и «кодек JVT». Мы назовем его здесь MPEG-4 AVC. Производительность сжатия, предлагаемая MPEG-4 AVC, превосходит любую другую существующую сегодня технологию, включая MPEG-2, MPEG-4 part 2 и собственные форматы сжатия видео.


Таблица 1: Инструменты кодирования в MPEG-2, MPEG-4, H.263 и H.264

Вместо радикального отхода от стандарта MPEG-2, MPEG-4 AVC представляет собой эволюцию, как и MPEG -2 развился из MPEG-1.MPEG-4 AVC берет многие концепции и инструменты сжатия, найденные в MPEG-2, и улучшает их. Подробный список функций и сравнения между различными стандартами сжатия см. В Таблице 1. MPEG-4 также представляет некоторые новые инструменты для пользователей. К ним относятся:

  • Более широкий выбор размеров блоков и гибкость для динамического выбора размера блока компенсации движения.
  • Улучшенное предсказание векторов движения, позволяющее более эффективно представлять сложную информацию о движении.
  • Расширенное предсказание внутренних коэффициентов AC и DC, позволяющее кодеру более эффективно представлять данные текстуры.
  • Выбор нескольких опорных кадров, позволяющий кодировщику находить наилучшее совпадение для нескольких видеокадров.
  • Фильтрация артефактов в процессе компенсации движения, генерирующая «более чистые» изображения для компенсации движения.
  • Оценка движения на четверть пикселя, рендеринг движения с более высокой степенью точности, даже для непереводных медленно движущихся объектов.MPEG-4 AVC / H.264 дополнительно улучшает воспроизведение движения за счет использования высококачественных интерполяционных фильтров.
  • Более точное разрешение шага квантователя для цветности, чем для блоков яркости, что устраняет проблемы размытия цвета, иногда наблюдаемые при использовании MPEG-2.
  • Энтропийный кодер MPEG-4 AVC, который адаптируется к контексту и использует арифметический кодер, а не кодер Хаффмана MPEG-2.

Одной из самых значительных капитальных затрат развлекательной системы может быть стоимость декодера сжатия.Потребуются новые ресиверы и DVD-плееры с большей вычислительной мощностью для обработки требовательных к обработке аудиоформатов MPEG-4 AVC и High Efficiency AAC. Чем выше эффективность сжатия, тем сложнее кодер и декодер. Большая сложность означает, что для функций кодирования / декодирования требуется больше вычислительной мощности. Все это приводит к более высокой стоимости кремния.

Однако недавние достижения в области полупроводников проложили путь к развертыванию этих революционных технологий, сделав реальностью однокристальный декодер AVC.В настоящее время доступны однокристальные декодеры SD MPEG-4 AVC, а вскоре появится и HD. (См. Таблицу 2)


Таблица 2: Повышение эффективности и сложности MPEG-4 AVC по сравнению с MPEG-2

Эти современные видеотехнологии, такие как адаптивное управление расширенными фильтрами предварительной обработки, обширная видеоанализ и статистическое мультиплексирование с замкнутым контуром составляют примерно две трети эффективности сжатия широковещательных систем MPEG-2, развернутых сегодня.Используя комбинацию этих технологий и новых инструментов сжатия в MPEG-4 AVC, MPEG-4 AVC (основной профиль H.264) потенциально может достичь от 40 до 50 процентов прироста эффективности сжатия по сравнению с сегодняшним современным MPEG- 2 системы. Эти результаты, наконец, достаточно впечатляющие, чтобы заставить отрасль инвестировать в новые технологии и сделать следующий скачок.

Принятие новых видеотехнологий связано с серьезными проблемами. Внедрение новой технологии — это индивидуальное решение, основанное на соображениях потребителей, конкуренции, экономических и даже нормативных требованиях.«Зеленое поле» видеоприложений может привести к трудным бизнес-решениям, но техническая реализация обычно намного проще, учитывая, что проблем с устаревшим оборудованием не существует и что другие аналогичные системы уже были развернуты ранее.

Внедрение MPEG-4 AVC в унаследованные системы ставит как бизнес, так и технические проблемы. Достижение сквозной совместимости для MPEG-2 потребовало многих лет усилий со значительной адаптацией к производителям оборудования. (См. Рисунок 3.) MPEG-4 AVC потребует такого рода усилий для достижения функциональной совместимости, присущей MPEG-2.К счастью, ожидается, что сроки для MPEG-4 AVC будут значительно короче из-за значительного опыта и его сходства с MPEG-2.

Несмотря на то, что стратегии и сроки перехода будут различаться, рассматривается несколько вариантов управления переходом с MPEG-2 на MPEG-4:

  • Выборочный подход, при котором операторы могут выбрать перенос небольшого количества новых услуг, таких как VOD или каналы с оплатой за просмотр в MPEG-4 AVC.
  • Миграция на основе контента, при которой специализированные каналы в зависимости от типа контента (например,грамм. киноканалы) сначала переносятся.
  • Миграция по регионам в зависимости от географического региона абонентов.


Рис. 3. Эффективность кодирования MPEG-2 со временем улучшилась по мере конкуренции. Подобные улучшения могут произойти с более новыми технологиями.

Другим обычно рассматриваемым подходом является одновременная передача, при которой услуги будут транслироваться одновременно в форматах MPEG-2 и MPEG-4 AVC. В зависимости от потребностей бизнеса существующий оператор MPEG-2, вероятно, будет использовать комбинацию этих стратегий.

MPEG-4 AVC может способствовать появлению новых бизнес-моделей, позволяя операторам предлагать видеоуслуги там, где они раньше не могли, или упаковывая больше видеоканалов в дефицитные и дорогие каналы передачи. Со временем он, вероятно, будет принят в традиционных развлекательных видео-приложениях (DVD, кабельное телевидение, спутниковое телевидение, видео через xDSL, цифровое наземное телевидение, HD, VOD), а также в появляющихся персональных ТВ, потоковом видео, беспроводной и беспроводной связи. даже приложения для цифрового кино.

По мере разработки новых приложений для технологии MPEG-4 ожидается более широкое распространение этого решения и продуктов.Инженеры и технические менеджеры не должны опасаться, что технологии сжатия, такие как MPEG-4, являются тупиковой дорогой, которая может ограничить даже дальнейшие улучшения. Скорее, универсальная платформа, которую предоставляет MPEG-4, обеспечивает долгий срок службы продуктов и, при необходимости, будущий переход к большему количеству приложений и решений.

На главную | Вернуться к началу | Напишите нам

MP3 ‘Tech — Mpeg2 / 4-AAC

MP3′ Tech — Mpeg2 / 4-AAC

Что такое MPEG-2 AAC?

MPEG Advanced Audio Coding (AAC), также известный как MPEG-2 NBC (без обратной совместимости) представляет собой актуальное состояние техники кодирования естественного звука.

Он может обрабатывать намного больше каналов, чем MP2 или MP3 (48 полных аудиоканалов и 16 низкочастотных улучшающих каналов по сравнению с 5 полными аудиоканалами и 1 низкочастотное усиление для MP2 или MP3), и он может обрабатывать более высокую дискретизацию частот, чем MP3 (до 96 кГц по сравнению с 48 кГц). Формальное прослушивание MPEG тесты показали, что для 2 каналов он может обеспечить немного лучше качество звука 96 кбит / с, чем уровень-3 при 128 кбит / с или уровень-2 при 192 кбит / с.

Как работает MPEG-2 AAC работает?

AAC использует инструменты кодирования, уже присутствующие в MP3, но использует их лучше способ:

  • Банк фильтров представляет собой чистый MDCT, а не гибридный банк фильтров, как в MP3
  • Длинные окна почти вдвое длиннее, чем у MP3, что обеспечивает лучшую частоту разрешающая способность
  • Короткие окна меньше, чем MP3, что обеспечивает лучшую обработку переходных процессов и меньше предварительного эха
  • Возможность переключения среднего / бокового стерео на основе поддиапазона, а не всего каркасная основа
  • Возможность переключать интенсивность стерео на основе поддиапазона вместо его использования только для непрерывной группы поддиапазона.