Sony XAVC Technologie de codage vidéo AVC (Advanced Video Coding) pour la production et la distribution de contenus en HD et en résolution supérieure. Introduction, format, XAVC et le 4K, Workflow XAVC, XAVC et la HDTV, la structure du codec XAVC :
Introduction :
Le codec AVC H.264/MPEG-4 Part 10 est principalement utilisé dans les systèmes de distribution HDTV, comme le Blu-ray, la diffusion de programmes télévisés (TNT, câble et satellite) et les navigateurs Internet. Les premiers documents de standardisation datent de 2003 et ils n’ont cessé d’être modifiés jusqu’en 2009 pour inclure bien plus que les normes de distribution HDTV. Aujourd’hui, le monde du broadcast couvre un spectre très étendu de données d’images compressées, avec des débits commençant à quelques kilobits par seconde pour atteindre 1,2 Gbit/s. Les paramètres variés incluent le 4K, la 3D, l’échantillonnage 14 bits, et des fréquences supérieures à 100 images par seconde. Sony faisait partie des membres actifs de l’équipe JVT (Joint Video Team) qui a mis au point cette norme, et a redoublé d’efforts pour établir le format AVCHD destiné à élargir les niveaux et les profils du codec H.264.
L’extension du standard H.264 coïncide avec le développement rapide des technologies d’imagerie haute résolution et HFR (High Frame Rate) telles que les capteurs et les écrans, ainsi que les technologies de stockage toujours plus rapides. Une technologie de compression aussi performante que le H.264 joue un rôle essentiel dans l’encodage des données d’imagerie générées par les capteurs de dernière génération dans des fichiers de taille plus modeste. Cela permet d’enregistrer les images sur des cartes mémoire abordables, puis de les éditer et de les afficher sur des ordinateurs ou à l’aide de logiciels de montage grand public.
Progrès de la technologie CMOS
La figure 1 montre les progrès de la technologie d’imagerie CMOS, notamment les capteurs de Sony offrant des fréquences de transfert supérieures à 30 Gbit/s. Au cours des prochaines années, l’industrie s’attend à une hausse importante du développement de ces capteurs haute résolution, offrant des fréquences et des débits élevés.
Progrès des technologies utilisées par les cartes SxS
La figure 2 montre les progrès des technologies utilisées par les cartes mémoire SxS. Remarque : les cartes les plus récentes permettent un enregistrement en temps réel à 1 Gbit/s et plus, et leur capacité n’a cessé d’augmenter au fil des années, tout en maintenant un niveau de compression optimal.
Ce document décrit les spécifications et les avantages du format XAVC. Il explique également l’intégration du XAVC aux workflows de production actuels, aux côtés des formats de compression existants tels que MPEG2, MPEG4 SStP et des différents fichiers RAW des fabricants.
Le format XAVC :
Le format XAVC de Sony est conforme à la norme H.264 niveau 5.2. L’essence vidéo est encapsulée dans un wrapper standard MXF OP-1a, et s’accompagne de métadatas et d’éléments audio. L’objectif premier du format XAVC est de disposer d’une gamme d’outils de production professionnels abordables qui prennent en charge les formats 4K, HD et HFR (High Frame Rate). La figure 3 illustre les possibilités offertes par le format XAVC. Ce tableau indique la compatibilité générale du format XAVC et les spécifications des produits actuels ne permettent pas forcément l’implémentation de toutes les caractéristiques offertes. Les informations fournies excluent également certaines options d’enregistrement en accéléré et au ralenti (undercranking et overcranking) incluses sur certains produits.
Le XAVC et le 4K :
Présentation du format XAVC
L’utilisation des capteurs numériques 4K se limite aujourd’hui au secteur du cinéma numérique où le standard du DCI (Digital Cinema Initiative) équivaut à 4096 x 2160 à 24 ips avec des fichiers MXF utilisant la compression JPEG2000. Plusieurs fabricants de technologies d’affichage grand public ont commencé à commercialiser des écrans plats et des systèmes de projection 4K pour le Home Cinéma. Même si la diffusion terrestre 4K prendra certainement plusieurs années à atteindre le petit écran, certains fournisseurs de contenu et diffuseurs par réseau/satellite/câble perçoivent le 4K comme une opportunité commerciale majeure. Le contenu HDTV peut déjà bénéficier des écrans 4K, car le processus d’up-conversion interne réduit les effets de lignes apparentes et de pixellisation sur les grands écrans. Par ailleurs, plusieurs flux HDTV peuvent être affichés simultanément en pleine résolution. La plupart des appareils photos actuels, même ceux intégrés aux téléphones portables, offrent une résolution native supérieure à la HDTV. A la maison, l’écran 4K peut servir de cadre photo numérique haut de gamme.
Grâce aux nombreuses configurations offertes par le format XAVC, la bande passante 4K peut passer en dessous des 100 Mbit/s selon la structure des GOP (Group of images), la fréquence d’image et l’échantillonnage des couleurs. Une sélection si efficace des différents paramètres permettra d’améliorer considérablement la qualité de l’expérience Home Cinéma. La même chose s’applique au secteur B2B pour lesquelles la haute résolution est au cœur de toutes les applications.
Le nombre de pixels actifs de la plupart des écrans 4K destinés à un usage grand public sera limité à 3840 x 2160 (Quad HD ou QFHD), soit quatre fois plus que la Full HD et ses 1920 x 1080 pixels. Cela diffère de la norme cinématographique qui offre 4 096 pixels sur toute la surface de l’image. Le format XAVC couvre les formats d’échantillonnage horizontaux 4096 et 3840, assurant la compatibilité des outils de production XAVC avec les applications cinématographiques et télévisuelles.
La nouvelle caméra PMW-F55 de Sony enregistre au format 4K XAVC INTRA à des fréquences situées entre 240 Mbit/s (à 24P) et 600 Mbit/s (à 60P) à l’intérieur de la caméra. Afin d’enregistrer de tels débits de données sur un support abordable et compact, Sony a conçu la nouvelle gamme de cartes SxS Pro+. Les cartes mémoire SxS Pro+ sont compatibles avec tous les appareils dotés d’un slot SxS et offrent un débit de 1,3 Gbit/s. La PMW-F55 peut enregistrer jusqu’à 50 minutes au format 4K/24P ou environ 20 minutes au format 4K/60P, sur une seule carte mémoire SxS Pro+ de 128 Go.
Workflows XAVC, RAW et ACES
Comparaison de la taille des fichiers : Unité : Gigabit par image
La communauté de production cinématographique numérique est en passe de standardiser un ensemble commun de paramètres qui rassemblent les images générées sur film, en numérique et celles créés sur les ordinateurs. L’ACES (Academy Color Encoding System) est une spécification destinée à trouver un terrain d’entente pour les images de diverses origines. Elle offre une marge de manœuvre maximale pour la manipulation des images (étalonnage des couleurs) et permet d’assurer une finition homogène quels que soient les outils et les fournisseurs de service utilisés. Sony participe activement à l’initiative ACES et a créé plusieurs IDT (Input Device Transforms) pour permettre aux caméras haut de gamme de s’intégrer au workflow ACES. La profondeur 16 bits à virgule semi-flottante des fichiers ACES optimise les performances des images provenant de caméras haut de gamme et d’éléments CGI, tout en offrant une flexibilité optimale pour l’étalonnage des couleurs dans la suite DI (Digital Intermediate). C’est la raison pour laquelle les caméras récentes de Sony (F65+SR-R4, PMW-F55+AXS-R5, PMW-F5+AXS-R5) permettent d’enregistrer des fichiers RAW linéaires 16 bits via des enregistreurs externes.
Pendant que les caméras PMW-F5/F55 enregistrent des fichiers RAW sur l’enregistreur externe AXS-R5, les deux cartes SxS de la caméra permettent d’enregistrer simultanément des fichiers XAVC en résolution HD, en synchronisation parfaite avec les fichiers RAW pour l’enregistrement de marqueurs de début et de fin, de l’audio, du timecode et d’autres métadatas comme les noms des fichiers. Les fichiers XAVC sont donc des fichiers complémentaires du format RAW, et permettent de lancer immédiatement le processus de montage lorsque les cartes SxS sont retirées des caméras.
Pour procéder à l’étalonnage des couleurs et au montage des images issues des fichiers RAW, il est nécessaire d’ajouter une étape de dématriçage supplémentaire appelée « débayerisation » ou encore « demosaicing ». Même si les fichiers RAW offrent une créativité hors pair, essentielle pour la post-production, il peut y avoir des contraintes de temps et de budget. Les fichiers XAVC 4K peuvent donc servir d’alternative abordable aux fichiers RAW. Comme le montre la figure 4, la taille du fichier XAVC 4K est similaire à celle des fichiers HD utilisés communément aujourd’hui. Les fichiers XAVC 4K deviendront l’un des moteurs principaux de l’essor de la production en 4K.
Le XAVC et la HDTV :
Comparaison de la vitesse de décodage par logiciel Unité : images par seconde
Selon toute logique, les nouveaux algorithmes de compression sont toujours plus performants que leurs prédécesseurs. Même si cela est vrai car la même qualité d’image peut être obtenue avec une quantité moins importante de données ou un débit moins élevé, la complexité croissante des techniques d’encodage modernes nécessite plus de puissance informatique, ce qui représente un défi majeur lors de la migration des infrastructures de production et des workflows associés d’une génération à l’autre. La puissance de traitement nécessaire au décodage d’un flux de données compressées est un critère essentiel lorsque plusieurs fichiers sont utilisés simultanément au cours d’une session de montage.
La plupart des grands diffuseurs et producteurs d’émissions de téléréalité travaillent actuellement avec le format MPEG2 HD Long GOP (50 Mbit/s ou 35 Mbit/s) pour la production HDTV car il s’agit d’un format compact qui offre une haute qualité d’image et fonctionne avec un ordinateur standard. Qu’il s’agisse de journaux télévisés, de programmes de téléréalité ou d’événements sportifs, une fréquence de 35 à 50 Mbit/s est la plage idéale pour la production HDTV dématérialisée.
Présentation du format de compression HDTV
La figure illustre les différentes méthodes de décodage des flux vidéo compressés sur une plateforme informatique donnée, sans avoir recours à l’accélération GPU. L’échelle horizontale représente le nombre d’images par seconde et il est clair que le format MPEG2 50 Mbit/s est le plus rapide (ou le plus performant) parmi ses concurrents.
Plusieurs diffuseurs ont récemment exprimé leur intérêt à adopter le format H.264 Intra comme format principal en interne pour les raisons suivantes :
. Consolidation de tous les fichiers des programmes, du prime time au journal télévisé, en un codec unique encapsulé dans un wrapper standard, commun au sein de l’industrie ;
. Echantillonnage 10 bits comparé aux 8 bits du MPEG-2 ;
. Qualité d’image de 50 Mbit/s considérée comme non suffisante pour remplacer les formats sur cassettes tels que le HDCAM ;
. L’espace de stockage, la bande passante du réseau et la puissance de traitement ne sont plus un problème pour gérer plusieurs flux à haut débit.
Pour les opérations HDTV, le XAVC peut servir de format intermédiaire qui viendrait combler le vide entre le format de mastérisation (MPEG4 SStP ou HDCAM-SR) et le MPEG2 comme le montre la figure 6.
Le format XAVC joue également un rôle essentiel car il offre à un caméscope portable une capacité HFR en résolution HDTV. La PMW-F55 enregistre des images Full HD 1920 x 1080 10 bits 4:2:2 à une fréquence allant jusqu’à 180 images par seconde sur les cartes mémoire internes SxS Pro+. Deux cartes mémoire de 128 Go insérées dans les slots prévus à cet effet allongent la durée d’enregistrement jusqu’à environ 40 minutes à 180 ips.
La structure du codec XAVC :
Structure du flux d’octets XAVC
Le format XAVC est conforme aux spécifications du format H.264 et Sony a toujours eu pour objectif d’améliorer la qualité de l’image, tout en préservant l’interopérabilité des fichiers avec les produits d’autres fabricants. La figure 7 montre le flux d’octets XAVC basé sur la structure KLV classique. L’un des éléments clés de ce flux d’octets est l’intégration image par image des SPS (Sequence Parameter Set) et des PPS (Picture Parameter Set) au flux général. Cela permet une optimisation dynamique de la qualité de l’image pendant l’enregistrement et la valeur de l’image optimisée restera « attachée » au fichier image après le montage. De plus, la qualité de l’image est grandement améliorée pendant les opérations de playback, avec accès aléatoire. En cas de traitement en Long-GOP, les paramètres SPS et PPS apparaissent au début de chaque GOP.
L’encodeur XAVC dispose d’un mécanisme de préencodage (figure 8) qui permet d’optimiser l’utilisation des données relatives à la compression de chaque image ou flux de données. Ce mécanisme de préencodage est intégré dans les encodeurs logiciels et matériels. Ce processus d’encodage en deux étapes a lieu pendant les enregistrements en HFR et 4K.
Mécanisme de préencodage
Afin de permettre la production de caméscopes portables offrant une consommation électrique relativement modeste, Sony a développé un chipset qui réalise les processus d’encodage et de décodage du XAVC. Ce chipset réalise également l’encodage et le décodage du MPEG2. Cette capacité multi-codec est censée accroître la valeur du produit tout au long de sa durée de vie. Elle permettra aussi aux exploitants de créer une infrastructure de services qui facilitera la conversion entre MPEG2 et XAVC. Les premiers produits à exploiter cette capacité multi-codec sont les caméras PMW-F5 et PMW-F55, qui prennent également en charge le MPEG4 SStP et le RAW, en plus des formats XAVC et MPEG2.
Afin de répondre aux exigences toujours plus grandes des sociétés de production, tout en restant dans les limites budgétaires prévues, il est primordial de choisir le format et la fréquence les mieux adaptés. Le format XAVC apporte une nouvelle dimension créative aux professionnels tout en garantissant une qualité et des performances remarquables.