José Luis Díaz (logo)

Español | English | Português | 中文

Leituras > Um olhar sobre a compressão de vídeo Inter-Frame Vs Intra-Frame

Um olhar sobre a compressão de vídeo Inter-Frame Vs Intra-Frame

Sam - Elemental Technologies (fevereiro 2008)

Um dos aspectos mais confusos da compressão de vídeo parece ser a diferença entre compressão inter-frame Vs. compressão entra-frame. A seguir, uma breve lição sobre ambas.

O vídeo em seu sentido mais simples pode ser pensado como uma série de imagens inanimadas (daqui que em seus primeiros dias, os filmes eram chamados “Imagens em Movimento” (Moving Pictures) até que algum gênio do marketing comprimiu as palavras e cunho o termo (Movies) “Filmes”. Quando estas imagens se passam o suficientemente rápido, o olho humano interpreta os frames como movimento em vez de quadros inanimados. Do ponto de vista da compressão, entretanto, ainda são somente uma série de imagens reproduzidas em certa ordem específica.

A compressão de vídeo então, concentra-se em como tomar estes frames contigüos e minimizar a quantidade de informação necessária para codificar a imagem. O óbvio primeiro passo é comprimir cada imagem individualmente. Isto é conhecido como compressão INTRA-FRAME, e usa somente informação contida no quadro atual para minimizar o tamanho da imagem. Por exemplo, JPEG (O formato de arquivo padrão usado para imagens na internet) usa uma transformada discreta do cosseno para suprimir os componentes de alta freqüência nas imagens, que geralmente não são recebidos pelo sistema psico-visual humano; ao desprezar esta informação, uma imagem quieta pode codificar-se com muita menos informação. A idéia se refinou com as gerações, com os primeiros formatos padrão como GIF e JPEG formando a base e os alicerces para o desenvolvimento de padrões mais complexos como Motion JPEG e DV, o formato amplamente utilizado em câmaras de vídeo do MiniDV.

À medida que cresceu a demanda de uma melhor qualidade de imagem a menor freqüência de bits (Bit rate), a compressão obtida apenas pela codificação intraframe se tornou insuficiente. A compressão temporária ou codificação INTER-FRAME se introduziu no padrão MPEG-1, e foi após refinada nos codecs MPEG-2, VC-1 e H.264. Estes codecs incluem imagens codificadas com intra-frame (I-frame) como se menciona no parágrafo anterior, mas também contêm frames com CODIFICAÇÃO PREDITIVA (P-frames) e frames com CODIFICAÇÃO PREDICTIVA BIDIRECIONAL (B-frames). Os P-frames dependem de imagens que já se transmitiram anteriormente na seqüência, e usam data desses frames (com algumas mudanças menores) para criar o frame atual.

Os B-frames são similares, mas podem usar data de imagens anteriores e posteriores na seqüência de vídeo. Pode haver muitíssimos P e B-frames entre cada I-frame, e como a maioria das seqüências de vídeo têm imagens similares por longos períodos de tempo, é possível obter uma compressão dramaticamente maior com esta técnica. O numero consecutivo de imagens interframe é referido como duração GOP (Grupo de Imagens) (Group Of Picture Length).

Enquanto major seja o GOP, maior será a distância entre I-frames, por isso os quadros no meio destes, serão reconstruídos com “interpretações” do mesmo já seja com P-frames ou B-frames.

O benefício de utilizar apena compressão intraframe é que é geralmente muito menos “pesado” (em termos de computação) para processar, dado que não requer a utilização repetitiva de múltiplos frames guardados na memória. Também há muita menos latência no processo de codificação, por isso as imagens comprimidas se criam muito mas rápido. É por isso que, historicamente, as video-câmaras digitais capturavam apenas em formatos intraframe (DV, DV50, DVCPRO HD, AVC-Intra). Entretanto, a nova geração de câmaras pessoais com capacidade de armazenamento limitado estão contando com formatos de codificação interframe como o HDV (uma versão do MPEG-2 do GOP mais longo) e AVCHD (uma versão de H.264 do GOP mais longo). Estes formatos permitem que o vídeo de alta definição seja armazenado nas mesmas fitas MiniDV que antes só podiam capturar vídeo com definição padrão. Editar estes formatos com o GOP mais longo é incrivelmente intensivo para o computador, já que por cada imagem reproduzida, necessita-se a decodificação de muitíssimos frames temporalmente adjacentes primeiro.

Link: http://www.elementaltechnologies.com/%3Fp%3D20