White paper su XAVC

White paper tecnico sul nuovo formato di registrazione di Sony

Introduzione

Il formato H.264/MPEG-4 AVC (Advanced Video Coding Part 10) è usato prevalentemente nei sistemi di distribuzione HDTV, come il Blu-ray, il broadcasting digitale (terrestre/via cavo/satellitare) e i web browser. I primi documenti relativi a questo standard risalgono al 2003, e sono stati rielaborati fino al 2009 per estendere il loro ambito di applicazione oltre gli standard di distribuzione HDTV. Oggi, la famiglia dei livelli operativi copre una vastissima gamma di dati video compressi, da diversi kilobit per secondo fino a 1,2 Gbps, con parametri estremi che comprendono la risoluzione 4K, il 3D, il campionamento a 14 bit e valori di frame rate superiori a 100 fps. Sony ha partecipato attivamente al gruppo JVT (Joint Video Team) che ha messo a punto lo standard, e ha intrapreso numerose iniziative per promuovere il formato AVCHD ed espandere i livelli/profili dell’H.264.

Figura 1

Evoluzione nello sviluppo di tecnologie CMOS.

Figura 2

Evoluzione tecnologica dei supporti di registrazione SxS.

L’estensione dello standard H.264 coincide con la rapida evoluzione delle tecnologie di imaging ad alta risoluzione e/o a elevato frame rate (sensori, display) e con i progressi delle tecnologie di memorizzazione ad alta velocità. Una tecnologia ad alte prestazioni e, al contempo, efficiente come il formato H.264 permette di codificare l’enorme quantità di dati di imaging generati dai moderni sensori in un file di dimensioni contenute; ciò significa che le immagini possono essere registrate su memory card economiche, mentre le operazioni di modifica/visualizzazione possono essere eseguite su computer/software di editing comunemente disponibili in commercio. La Figura 1 mostra l’evoluzione delle tecnologie dei sensori di immagine CMOS, a cui Sony ha contribuito con lo sviluppo e la commercializzazione di un sensore con velocità di trasferimento dei dati superiore a 30 Gbps. Nei prossimi anni si prevede una crescente diffusione di strumenti di imaging caratterizzati da alti livelli di risoluzione, frame rate elevati e velocità di trasferimento superiori. La Figura 2) mostra l’evoluzione tecnologica delle memory card SxS e XQD. Si osservi che le schede di ultima generazione consentono la registrazione in tempo reale a velocità di oltre 1 Gbps e che la capacità di registrazione è aumentata considerevolmente nel corso degli anni. Inoltre, hanno ulteriormente ridotto il loro già compatto fattore di forma. Questo documento illustra le caratteristiche e i vantaggi del formato XAVC. Spiega inoltre come XAVC si inserisca nell’attuale workflow di produzione insieme a formati di compressione molto diffusi come MPEG2, MPEG4 SStP e i file RAW delle telecamere. Sony ha sviluppato e commercializzato una sensore dell’immagine con velocità di trasferimento dati superiore a 30 Gbps. Nei prossimi anni si prevede una crescente diffusione di strumenti di imaging caratterizzati da alti livelli di risoluzione, frame rate elevati e velocità di trasferimento superiori. La Figura 2 mostra l’evoluzione tecnologica delle memory card SxS e XQD. Si osservi che le schede di ultima generazione consentono la registrazione in tempo reale a velocità di oltre 1 Gbps e che la capacità di registrazione è aumentata considerevolmente nel corso degli anni. Inoltre, hanno ulteriormente ridotto il loro già compatto fattore di forma. Questo documento illustra le caratteristiche e i vantaggi del formato XAVC. Spiega inoltre come XAVC si inserisca nell’attuale workflow di produzione insieme a formati di compressione molto diffusi come MPEG2, MPEG4 SStP e i file RAW delle telecamere.

Il formato XAVC

Il formato XAVC di Sony è conforme allo standard H.264 livello 5.2, in base al quale il contenuto video è incapsulato in un wrapper MXF OP-1a standard ed è accompagnato da elementi audio e metadati. L’obiettivo principale dell’adozione del formato XAVC è quello di sviluppare una famiglia di strumenti di produzione professionali che possano gestire in modo economico i formati di imaging 4K e HD HFR (High-Frame-Rate). La Figura 3 mostra l’ambito di applicazione del formato XAVC. Si osservi che questa tabella descrive l’ambito di applicazione generale del formato XAVC, e che l’implementazione effettiva di prodotti può essere limitata a una certa parte di questa tabella. D’altra parte, questo schema esclude le funzioni di registrazione a velocità modificata (over/under cranking) che alcuni prodotti possono offrire. Inoltre, per soddisfare le esigenze del mercato consumer, il formato wrapper MP4 verrà introdotto con il marchio “XAVC S”. Questo stimolerà la crescita dei contenuti 4K nel mercato consumer.

XAVC e 4K

L’uso dei sistemi di imaging 4K è attualmente limitato al settore del cinema digitale, dove lo standard DCI (Digital Cinema Initiative) per la proiezione in sala prevede una risoluzione di 4096 x 2160 a 24 fps con file MXF JPEG2000 compressi. Poiché la storia si ripete, diversi produttori di display di fascia consumer hanno iniziato a commercializzare schermi piatti e sistemi di proiezione 4K per l’home entertainment. Anche se probabilmente occorreranno alcuni anni per l’arrivo dei servizi di broadcasting terrestre 4K, diversi fornitori di contenuti e vari operatori di servizi via cavo/satellite/rete vedono nel 4K una nuova opportunità commerciale per la distribuzione dei contenuti. Gli odierni contenuti HDTV possono beneficiare dei display 4K, poiché il processo di conversione interna contribuisce a ridurre gli effetti di granularità delle linee e dei pixel negli schermi di grandi dimensioni; un altro vantaggio è la possibilità di visualizzare simultaneamente più flussi HDTV alla massima risoluzione. Oggi la maggior parte delle fotocamere, perfino quelle incorporate nei telefoni cellulari, vantano una risoluzione nativa superiore a quella dello standard HDTV. I pannelli 4K per l’home entertainment possono essere utilizzati come cornici fotografiche digitali di eccellente qualità.

Figura 3

Panoramica del formato XAVC.

Grazie alla vasta gamma di punti operativi offerta dal formato XAVC, è possibile ridurre la larghezza di banda delle immagini 4K a meno di 100 Mbps in funzione della struttura GOP, del frame rate e del campionamento dei colori. La selezione efficiente dei punti operativi dovrebbe migliorare sensibilmente l’esperienza dell’home entertainment, e sarà probabilmente implementata in diverse applicazioni B2B in cui l’imaging ad alta risoluzione è una priorità importante. Nella maggior parte dei display 4K per l’home entertainment, il numero dei pixel attivi sarà limitato a 3840 x 2160, il quadruplo di 1920 x 1080 (Quad HD o QFHD); sarà perciò diverso dallo standard di presentazione cinematografica, che prevede 4096 pixel sull’intero piano dell’immagine. Il formato XAVC supporta entrambi i formati di campionamento orizzontale 4096 e 3840, permettendo perciò di utilizzare gli strumenti di produzione XAVC sia nelle applicazioni cinematografiche che in quelle televisive. La telecamera PMW-F55 di Sony supporta la registrazione Intra-frame XAVC 4K con punti operativi compresi tra 240 Mbps (a 24P) e 600 Mbps (a 60P) all’interno della telecamera. Il server PWS-4400 supporta questi punti operativi ed è adatto alla piattaforma di produzione 4K dal vivo. Il bitrate per il 4K è stato il punto di discussione principale in tutta la fase di sviluppo. 100 Mbps per 1080i è considerato un bitrate ragionevole, poiché è stato ampiamente utilizzato nell’industria broadcast. In teoria, affinché il bit rate sia sufficiente per il 4K 60p (che ha risoluzione quadrupla e frame rate doppio), i dati devono essere moltiplicati per otto. Il risultato è 800 Mbps; tuttavia, il 25% dei dati può essere ridotto codificando in modo efficiente i frame progressivi rispetto a quelli interlacciati. Per consentire una registrazione sicura a queste elevate velocità di dati usando un supporto compatto e di costo contenuto, Sony ha sviluppato la famiglia di memory card SxS Pro+. Le memory card SxS Pro+ sono compatibili con tutti i dispositivi dotati di uno slot per schede SxS e possono raggiungere una velocità di registrazione sostenuta fino a 1,3 Gbps. Con una singola memory card SxS Pro+ da 128 GB, la telecamera PMW-F55 permette di registrare fino a 50 minuti in formato 4K/24P o circa 20 minuti in modalità 4K/60P.

Workflow XAVC, RAW e ACES

Il mondo della produzione cinematografica digitale sta lavorando per standardizzare un insieme comune di parametri video che possano essere applicati alle immagini create su pellicola, riprese con telecamere digitali o generate dai computer. Il sistema ACES (Academy Color Encoding System) dovrebbe rappresentare una piattaforma comune per immagini di provenienza diversa, offrire ampi margini per la manipolazione delle immagini (gradazione dei colori) e consentire di ottenere un aspetto omogeneo con l’uso di strumenti e servizi di diversi fornitori. Sony è una delle aziende che partecipano attivamente all’iniziativa ACES e ha creato vari IDT (Input Device Transforms) per consentire alle telecamere high-end di inserirsi nel workflow ACES. I 16 bit di profondità half-float dei file ACES permettono di ottenere il meglio dalle immagini riprese con telecamere high-end e dagli elementi CGI, oltre a offrire la massima flessibilità per la gradazione dei colori nelle suite DI (Digital Intermediate). Ecco perché le telecamere Sony di recente produzione (F65+SR-R4, PMW-F55+AXS-R5, PMW-F5+AXS-R5) hanno la possibilità di registrare file RAW lineari a 16 bit mediante registratori integrati compatti.

Figura 4

Confronto tra le dimensioni dei file.

Mentre le telecamere PMW-F5/F55 registrano i file RAW usando il registratore integrato AXS-R5, gli slot per schede SxS incorporati nelle telecamere permettono di registrare simultaneamente file XAVC con risoluzione HD che corrispondono perfettamente ai file RAW per quanto riguarda la registrazione dei punti In/Out, dei dati audio, dei timecode e di altri metadati, inclusi i nomi dei file. I file XAVC si aggiungono ai file RAW come file di editing, e offrono la possibilità di iniziare immediatamente il processo di editing rimuovendo le schede SxS dalla telecamera. Per le operazioni di gradazione dei colori e di editing delle immagini provenienti dai file RAW della telecamera è richiesto un passaggio aggiuntivo di elaborazione video (noto come de-bayering, o de-mosaicking). Benché i file RAW della telecamera offrano la massima libertà creativa, un requisito indispensabile per le sofisticate attività di post-produzione, possono esistere limiti di tempo e/o di budget. I file XAVC 4K possono essere considerati un’alternativa economica ai file RAW delle telecamere. Come si può osservare nella Figura 5, i file XAVC 4K hanno una dimensione simile a quella dei file con risoluzione HD oggi molto diffusi. È probabile perciò che i file XAVC 4K possano rappresentare un importante elemento di traino per l’espansione della produzione 4K.

XAVC e HDTV

È opinione comune che gli algoritmi di compressione sviluppati recentemente siano più efficienti dei loro predecessori. Questo può essere in parte vero, nel senso che una data qualità video può essere ottenuta con una minore quantità di dati sulle immagini (o bit rate), ma la maggiore complessità degli schemi di codifica moderni richiede in realtà una maggiore potenza di elaborazione, un fattore che può rappresentare una difficoltà non indifferente quando si tratta di migrare l’infrastruttura di produzione e il relativo workflow su attrezzature di nuova generazione. La potenza di elaborazione richiesta per la decodifica di un determinato bitstream compresso è estremamente importante quando si utilizzano più file simultaneamente in una stessa sessione di editing.

Figura 5

Confronto tra le velocità di decodifica software.

Oggi, il settore del broadcast e dei reality utilizza prevalentemente il formato MPEG2 HD Long GOP (50 Mbps o 35 Mbps) per le produzioni HDTV, che viene scelto per le dimensioni compatte dei file, l’alta qualità delle immagini e i requisiti di potenza di elaborazione piuttosto contenuti. Dai notiziari ai reality show fino agli eventi sportivi di grande richiamo, una velocità di trasferimento dei dati di 35-50 Mbps rappresenta un presupposto ottimale per l’utilizzo di un’infrastruttura HDTV basata su file. La Figura 6 mostra come si possano decodificare diversi flussi video compressi su una data piattaforma informatica senza ricorrere ad acceleratori hardware o GPU. L’asse orizzontale rappresenta i frame per secondo, e a questo riguardo il formato MPEG2 50 Mbps è naturalmente il più veloce (o il più efficiente). Ultimamente, diversi broadcaster hanno iniziato a mostrare interesse per l’adozione del formato H.264 come formato interno principale, per le seguenti ragioni.

  • La possibilità di unificare tutti i file dei programmi, dalla programmazione prime-time ai notiziari, in un singolo codec contenuto in un wrapper standard
  • L’uso del campionamento a 10 bit anziché a 8 bit su MPEG2
  • La qualità delle immagini MPEG2 a 50 Mbps viene percepita come insufficiente per sostituire gli attuali formati su nastro come HDCAM
  • Lo spazio di memorizzazione, la larghezza di banda della rete e la potenza di elaborazione stanno diventando un problema minore per la gestione di più flussi di dati a bit rate elevati

Per le produzioni HDTV a 50p/60p, XAVC Intra supporta fino a 440 Mbps e può essere considerato un formato di livello intermedio, che colma il divario tra i formati con qualità di masterizzazione (MPEG4 SStP o HDCAM-SR) e MPEG2. XAVC svolge anche un ruolo cruciale nel rendere possibile l’utilizzo di camcorder portatili con frame rate estremamente elevati in risoluzione HDTV. La telecamera PMW-F55 permette di registrare immagini 4:2:2 a 10 bit con risoluzione di 1920 x 1080 a un frame rate di 180 fps sulle memory card SxS Pro+ interne. Occupando i due slot per memory card con schede da 128 GB, la durata di registrazione continua viene prolungata a circa 40 minuti a 180 fps. La domanda per mantenere le dimensioni dei file abbastanza ridotte da consentirne l’esecuzione alle attuali velocità comprese tra 35 e 50 Mbps, persino nel workflow operativo a 1080-50p/60p, non cesserà. Per soddisfare questa esigenza, il formato da preferire è Long GOP, che consente di ridurre le dimensioni dei file senza ripercussioni sulla qualità delle immagini. Come illustrato nella figura 6 qui sotto, Long GOP a 50 Mbps offre quasi le stesse prestazioni di decodifica di Intra a 100 Mbps, sebbene richieda maggiore potenza di elaborazione.

Figura 6

Panoramica sul formato di compressione HDTV.

Tecnologia XAVC

Contattaci per maggiori informazioni