Artigo técnico sobre o XAVC

Documento técnico sobre o novo formato de gravação da Sony

Introdução

A tecnologia de codificação avançada de vídeo H.264/MPEG-4 Part-10 está sendo usada predominantemente em sistemas de distribuição de HDTV, como Blu-ray, transmissão digital (terrestre/cabo/satélite) e navegadores da web. Os documentos de padronização iniciais remontam ao ano de 2003 e foram mantidos até 2009 para cobrir muito mais do que os padrões de distribuição de HDTV. Hoje, a família de níveis operacionais abrange uma variedade extremamente ampla de dados de imagem compactada que pode ir desde vários kilobits por segundo a até 1,2 Gbps, com parâmetros extremos que englobam uma amostragem de 14 bits em 4K e 3D, ultrapassando 100 quadros por segundo. A Sony foi um dos membros ativos da JVT (Joint Video Team) que cumpriram o padrão e tem feito esforços significativos para estabelecer o formato AVCHD e ampliar os níveis/perfis de H.264.

Figura 1

Progresso no desenvolvimento da tecnologia CMOS.

Figura 2

Progresso da tecnologia de mídia de gravação SxS.

MídiaSxS ProSxS-1SxS Pro +XQD série NXQD série S
Ano de introdução20072009201320132013
Taxa de dados de gravação constante400 Mbps240 Mbps1,3 Gbps--
Máx. velocidade de leitura1,2 Gbps1,2 Gbps1,6 Gbps1,0 Gbps1,44 Gbps
Capacidade de armazenamento8 GB/16 GB (2007) 32 GB (2008) 64 GB (2011)32 GB (2009) 64 GB (2010)64 GB/128 GB32 GB/64 GB32 GB/64 GB

A extensão do padrão H.264 coincide com a rápida evolução das tecnologias de imagem com alta taxa de quadros/alta resolução (sensores, monitores) e da tecnologia de armazenamento de alta velocidade. Uma tecnologia de compactação eficiente e de alto desempenho como a H.264 desempenha um papel fundamental na codificação de uma grande quantidade de dados de imagens gerados por sensores modernos em um tamanho de arquivo modesto, possibilitando que as imagens possam ser gravadas em cartões de memória acessíveis e editadas ou visualizadas em computadores ou pacotes de software de edição prontamente disponíveis. A Figura 1 mostra o avanço da tecnologia de imagem CMOS, que possibilitou à Sony desenvolver e comercializar um sensor de imagem com taxas de transferência de dados superiores a 30 Gbps. A expectativa é de que as ferramentas de imagem com altas taxas de bits e de quadros e alta resolução tornem-se mais comuns nos próximos anos. A Figura 2) mostra o avanço da tecnologia de cartão de memória SxS e XQD. Observe que os cartões mais recentes garantem gravação em tempo real acima de 1 Gbps e que a capacidade de gravação aumentou significativamente ao longo dos anos. E não apenas mantendo o mesmo fator de forma compacta, mas reduzindo ainda mais o tamanho. Este documento ilustra os atributos e os benefícios do formato XAVC. Ele também explica de que modo o XAVC se encaixa no fluxo de trabalho da produção atual, juntamente com formatos de compactação bem estabelecidos, como arquivos MPEG2, MPEG4 SSTP e vários RAW da câmera. A Sony desenvolveu e comercializou um sensor de imagem com taxas de transferência de dados de mais de 30 Gbps. A expectativa é de que as ferramentas de imagem com altas taxas de bits e de quadros e alta resolução tornem-se mais comuns nos próximos anos. A Figura 2 mostra o avanço da tecnologia de cartão de memória SxS e XQD. Observe que os cartões mais recentes garantem gravação em tempo real acima de 1 Gbps e que a capacidade de gravação aumentou significativamente ao longo dos anos. E não apenas mantendo o mesmo fator de forma compacta, mas reduzindo ainda mais o tamanho. Este documento ilustra os atributos e os benefícios do formato XAVC. Ele também explica de que modo o XAVC se encaixa no fluxo de trabalho da produção atual, juntamente com formatos de compactação bem estabelecidos, como arquivos MPEG2, MPEG4 SSTP e vários RAW da câmera.

O formato XAVC

O formato XAVC da Sony está em conformidade com o nível 5.2 da H.264, no qual a essência do vídeo é encapsulada em um finalizador MXF OP-1a padrão da indústria, acompanhada por elementos de áudio e metadados. O objetivo principal da adoção do formato XAVC é desenvolver uma família de ferramentas de produção profissional que sejam facilmente compatíveis com formatos de imagem em 4K e HD com alta taxa de quadros (High-Frame-Rate – HFR). A Figura 3 mostra o alcance da extensão do formato XAVC. Observe que esta tabela do formato descreve o alcance total de extensão do formato XAVC e que a implementação real do produto pode se restringir a uma determinada parte dessa tabela. Por outro lado, este gráfico exclui qualquer capacidade de gravação em velocidade fora do normal (overcranking e undercranking) que alguns produtos podem oferecer. Além disso, o formato de finalização MP4 também é introduzido e marcado como XAVC S para atender o mercado consumidor. Essa expansão incentivará o crescimento do conteúdo 4K no mercado consumidor.

XAVC e 4K

O uso de sistemas de imagem digital em movimento em 4K é atualmente restrito ao domínio do cinema digital, onde o padrão da DCI (Digital Cinema Initiative) para apresentações cinematográficas é definido a 4096 x 2160 @24Fps com arquivos JPEG2000 MXF comprimidos. Como a história se repete, muitos fabricantes e consumidores de telas iniciaram o marketing da tela plana da 4K e dos sistemas de projeção para entretenimento em casa. Embora ainda possa levar mais alguns anos até que os serviços de transmissão 4K terrestre sejam iniciados, vários operadores de cabo/satélite/rede e provedores de conteúdo consideram o 4K uma nova oportunidade de negócio para a entrega de conteúdo. O conteúdo HDTV atual pode se beneficiar de monitores 4K, uma vez que o processo interno de conversão up ajudará a reduzir efeitos de linha e de estrutura de pixel em monitores grandes e múltiplos fluxos de HDTV podem ser exibidos simultaneamente em resolução máxima. Atualmente, a maioria das câmeras fotográficas digitais, até mesmo as dos aparelhos de telefone celular, possui uma resolução nativa superior à da HDTV. A tela em 4K pode servir como uma moldura digital de qualidade irretocável.

Figura 3

Visão geral do formato XAVC.

IntervaloResoluçãoTaxa de quadrosCoresTaxa de bits máximaIntra/Long
4K4096 x 2160
3840 x 2160
23.98p a 59.94p4:2:0/8 bits a 4:4:4/12 bits 960 MbpsIntra
Long
HD2048 x 1080
1920 x 1080
1440 x 1080
1280 x 720
23.98p a 59.94p
50i/59.94i
4:2:0/8 bits a 4:4:4/12 bits440 MbpsIntra
Long
Proxy23.98p a 59.94p4:2:0/8 bits28 MbpsLong

Devido à grande variedade de pontos de operação que o formato XAVC oferece, a largura de banda das imagens 4K pode ser reduzida para menos de 100 Mbps, dependendo da estrutura de GOP, da taxa de quadros e da amostragem de cores. Essa seleção eficiente de pontos de operação, incorporada a determinadas aplicações B2B onde imagens de alta resolução são primordiais, deverá aumentar significativamente a experiência de entretenimento doméstico. A contagem de pixels ativos da maioria dos monitores domésticos 4K será restrita a 3840 x 2160, um quádruplo de 1920 x 1080. (Quad HD ou QFHD), que difere do padrão de apresentação cinematográfica, que tem 4.096 pixels em todo o plano de imagem. O formato XAVC abrange formatos 4096 e 3840 de amostragem horizontal, permitindo o uso das ferramentas de produção XAVC em aplicações de cinema e televisão. A nova câmera Sony PMW-F55 grava intraquadros XAVC 4K em pontos de operação de 240 Mbps (@24P) a 600 Mbps (@60P) com a câmera. O servidor PWS-4400 é compatível com esses pontos operacionais, assim como também com a plataforma de produção ao vivo da 4K. A taxa de bits para a 4K foi a discussão principal durante o desenvolvimento. 100 Mbps para 1080i é considerada a taxa de bits razoável por ser amplamente utilizada na indústria. Teoricamente, a quantidade suficiente de taxa de bits para 4K 60p, quatro vezes a resolução e duas vezes requer oito vezes mais dados. A soma é de 800 Mbps, entretanto, 25% dos dados pode ser reduzido com base na eficiência de codificação para quadros progressivos em comparação aos entrelaçados. Para possibilitar a gravação dessas altas taxas de dados através de uma mídia compacta e econômica, a Sony desenvolveu a família de cartões de memória SxS Pro+. Os cartões de memória SxS Pro+ são compatíveis com todos os dispositivos que possuem um slot para cartão SxS e alcançam uma taxa de dados de gravação sustentada até 1,3 Gbps. Em um único cartão de memória SxS Pro+ de 128 GB, a PMW-F55 grava até 50 minutos em 4K/24P ou 20 minutos em 4K/60P.

Fluxo de trabalho em XAVC, RAW e ACES

A comunidade de produção de cinema digital está a caminho da padronização de um conjunto comum de parâmetros de imagem que engloba imagens geradas em filme, câmeras digitais e computadores. Espera-se que o ACES (Academy Colour Encoding System) estabeleça condições comuns para imagens de origens diferentes, ofereça o máximo de espaço para a manipulação de imagens (ajuste de cores) e obtenha uma aparência consistente em diferentes conjuntos de ferramentas e provedores de serviços. A Sony é uma participante ativa na iniciativa da ACES e criou várias IDTs (Input Device Transforms) para permitir que câmeras avançadas se encaixem no fluxo de trabalho da ACES. A profundidade de bit de meia flutuação de 16 bits dos arquivos do ACES obtém o melhor dos elementos CGI e das imagens de câmeras de última geração, oferecendo máxima flexibilidade para a gradação de cores no conjunto DI (Digital Intermediate). É por isso que as mais recentes câmeras da Sony (F65+SR-R4, PMW-F55+AXS-R5, PMW-F5+AXS-R5) têm a capacidade de gravar arquivos RAW lineares de 16 bits através de gravação compacta integrada.

Figura 4

Comparação de tamanho do arquivo.

Enquanto as câmeras PMW-F5/F55 gravam os arquivos RAW da câmera através do dispositivo de gravação integrado AXS-R5, os slots de cartão SxS na câmera podem gravar simultaneamente arquivos XAVC em resolução HD, o que combina perfeitamente os arquivos RAW com relação aos pontos de saída e entrada de gravação, ao áudio, ao código de tempo e a outros metadados, incluindo nomes de arquivo. Os arquivos XAVC complementam os arquivos RAW como arquivos editoriais que permitem que o processo de edição inicie imediatamente após os cartões SxS serem removidos das câmeras. Para graduar cores e editar imagens derivadas de arquivos RAW da câmera, é necessária uma etapa adicional no processamento de imagens (normalmente chamada de “debayering” ou “demosaicing”). Embora os arquivos RAW da câmera ofereçam máxima liberdade criativa, o que é fundamental para o sofisticado trabalho de pós-produção, pode haver restrições de tempo ou orçamento. Os arquivos XAVC 4K podem ser considerados uma alternativa econômica aos arquivos RAW da câmera. Conforme mostrado na Figura 5, o tamanho do arquivo XAVC 4K é semelhante ao dos arquivos com resolução HD normalmente utilizados hoje em dia. Espera-se que os arquivos XAVC 4K sejam um dos principais impulsionadores da expansão da produção em 4K.

XAVC e HDTV

É frequentemente descrito que os algoritmos de compactação recentemente desenvolvidos são mais eficientes que seus antecessores. Embora isto seja verdade no sentido de que uma determinada qualidade de imagem pode ser alcançada com menor quantidade de dados de imagem (ou taxa de bits), o aumento da complexidade dos esquemas de codificação modernos exige maior potência computacional, o que pode ser um grande desafio ao migrar a infraestrutura da produção e o fluxo de trabalho associado para a geração seguinte. A quantidade de requisitos de poder de processamento para decodificar um certo fluxo de bits compactados é extremamente crítica quando vários arquivos são usados simultaneamente em uma sessão de edição.

Figura 5

Comparação de velocidade de decodificação de software.

Atualmente, a maior parte do setor de transmissão e TV realidade funciona com o formato de GOP longo MPEG2 HD (50 Mbps ou 35 Mbps) para a produção de HDTV devido ao seu tamanho reduzido de arquivo, à alta qualidade da imagem e à economia de requisitos computacionais. Das últimas notícias a reality shows e eventos esportivos de primeira linha, a taxa de dados de 35 a 50 Mbps é o ponto ideal para operar uma infraestrutura HDTV baseada em arquivos. A Figura 6 mostra como diferentes fluxos de vídeo compactados podem ser decodificados em uma determinada plataforma de computador, sem recorrer a aceleradores de hardware ou GPUs. A escala horizontal representa o número de quadros por segundo e, obviamente, o MPEG2 de 50 Mbps é mais rápido (ou mais eficiente) entre todos os formatos. Recentemente, várias emissoras começaram a demonstrar interesse em adotar o formato H.264 como principal formato para uso interno devido aos seguintes motivos:

  • Consolidação de todos os arquivos de programa, desde a programação de horário nobre até os noticiários, em um único codec contido em um finalizador comum padrão da indústria
  • Amostragem de 10 bits em relação à de 8 bits em MPEG-2
  • Qualidade de imagem MPEG-2 50 Mbps percebida como insuficiente para substituir os formatos de fita atuais, como o HDCAM
  • O espaço de armazenamento, a largura de banda de rede e o poder de processamento estão se tornando cada vez menos problemáticos para fluxos múltiplos com altas taxas de bits

Para a operação HDTV de 50p/60p, o XAVC Intra é compatível com até 440 Mbps e pode ser considerado o formato intermediário entre o formato de qualidade de masterização (MPEG4 SStP ou HDCAM-SR) e o MPEG2. O XAVC também desempenha um papel fundamental ao possibilitar o uso de uma filmadora portátil com extrema capacidade de alta taxa de quadros em resolução HDTV. A PMW-F55 grava imagens 4:2:2 de 10 bits com resolução total de 1920 x 1080 e até 180 quadros por segundo em cartões de memória internos SxS Pro+. Ao inserir cartões de 128 GB nas duas entradas para cartão de memória, o tempo de recodificação contínua é aumentado para aproximadamente 40 minutos a 180 Fps. A necessidade pela manutenção de um tamanho de arquivo reduzido o suficiente para ser executado através do atual canal de 35-50Mbps, mesmo no fluxo de trabalho operacional de 1080-50p/60p, continuará existindo. O uso de GOP longo é a técnica preferencial para atender a essa necessidade, pois reduz o tamanho do arquivo sem afetar a qualidade da imagem. Conforme mostrado na Figura 6, abaixo, o desempenho da decodificação é bastante equivalente, variando de 50 Mbps de GOP longo e 100 Mbps de Intra, embora sejam necessários mais cálculos.

Figura 6

Visão geral do formato de compressão HDTV.

A tecnologia facilitadora do XAVC

O formato XAVC está em conformidade com as especificações do formato H.264, e a Sony tem se esforçado para melhorar a qualidade da imagem, mantendo a interoperabilidade do arquivo com produtos fornecidos por outros fabricantes. A Figura 7 mostra o fluxo de bits do XAVC com base em uma estrutura KLV tradicional. Um elemento crucial neste fluxo de bits é a integração quadro a quadro de SPS (Sequence Parameter Set) e PPS (Imagem Parameter Set) ao fluxo de bits. Isso permite ao dispositivo de gravação otimizar dinamicamente a qualidade da imagem por quadro de imagem, e o valor de ajuste da imagem otimizada permanecerá anexado ao arquivo da imagem após a edição. A integração também ajuda a otimizar a qualidade da imagem durante a reprodução de acesso aleatório. O codificador do XAVC tem um mecanismo de pré-codificação, o que ajuda a obter o máximo de dados, permitindo a compactação de cada quadro ou fluxo da imagem. O mecanismo de pré-codificação é integrado aos codificadores de software e hardware. Este processo de codificação de dois estágios ocorre em gravações com altas taxas de dados e gravações em 4K. Para a produção de filmadoras portáteis com consumo de energia modesto, a Sony desenvolveu um conjunto personalizado de circuitos integrados para hardware, que executa o processo de codificação e decodificação do XAVC. Além disso, o conjunto de circuitos integrados possui também a capacidade de codificar/decodificar MPEG2. A capacidade para múltiplos codecs deverá aumentar significativamente a vida útil do produto. Ela permitirá aos proprietários de instalações/equipamentos criar uma infraestrutura de serviço capaz de efetuar facilmente a conversão entre MPEG2 e XAVC. O primeiro produto a fazer pleno uso dessa capacidade para múltiplos codecs é a filmadora portátil PMW-F5/F55 que processa MPEG4 SStP e RAW, além de XAVC e MPEG2. Para atender de forma eficiente as crescentes demandas de produção e cumprir o orçamento do projeto, é extremamente importante selecionar o formato e o ponto de operação ideais. O formato XAVC eleva as possibilidades criativas a um novo nível, oferecendo qualidade e eficiência ao mesmo tempo.

Figura 7:  Empresas que utilizam XAVC

Figure 7: XAVC bit stream structure.

Figure 8: XAVC supporters.

Entre em contato conosco para obter mais informações