Les formats audio et vidéo

, par Equipe de rédaction

Dans le domaine de la culture informatique, on consultera aussi avec un énorme intérêt Le Jargon Français (dictionnaire d’informatique généraliste qui contient 15 863 définitions parmi 18 678 articles).

Avant-propos

Le terme format est employé pour désigner aussi bien un fichier de données que son contenu. D’où des confusions. Une vidéo est constituée d’un fichier vidéo et d’un fichier audio. Chacun de ces fichiers est un ensemble de données qui sont encodées. L’encodage consiste à plus ou moins compresser les données sans nuire à la qualité. L’outil qui sert à l’encodage est un codec. Selon le type d’encodage utilisé on obtient un format spécifique : format vidéo et format audio. Afin de permettre la lecture simultanée de l’image et du son (formats audio/vidéo), de la transmission, ces flux sont encapsulés dans un fichier conteneur. Chaque fichier conteneur a sa spécificité. Par exemple un fichier MTS est dédié exclusivement au Mpeg4, en revanche, un fichier MKV peut contenir divers formats avec des fichiers sous-titres. L’inconvénient d’un fichier conteneur est de ne pouvoir être reconnu par certains lecteurs ou logiciels. La finalisation n’est autre que l’exportation du film au format de son choix (DV-AVI, MPEG 2, MPEG4 (H264), FLV, DivX...). Après exportation on obtient une piste vidéo et une piste audio comportant chacune un seul élément. Ainsi le film pourra être exploité dans un autre projet, gravé sur DVD, sauvegardé dans un répertoire...).

L’exportation implique souvent une conversion. Pour une sauvegarde, pour graver un DVD, pour exporter vers le Web, pour lire sur un périphérique (iPod, MP4...) correspond un format particulier. Des logiciels spécifiques permettent d’analyser le contenu d’un fichier vidéo/audio (fichier conteneur, format, codec utilisé, durée, poids) : AVIcodec, GSpot, MediaInfo, VidéoInspector. Il est toutefois possible de remettre le fichier transformé dans son format originel mais il ne n’aura pas la même qualité que le fichier source (avant la compression).

Les fichiers conteneurs

Un fichier conteneur est un fichier qui contient les flux vidéo et/ou audio et des métadonnées (titres, sous-titres, chapitres, menus...). Le nom du fichier est suivi d’une extension ".xxx". Le choix du conteneur a une influence sur son utilisation : certains ne contiennent que le flux audio/vidéo.

Quelques exemples de fichiers conteneurs :

ASF (.asf) : contient le format Windows Media Video (WMV) format propriétaire de Microsoft.

AVI (.avi) : peut contenir la plupart des formats vidéo et audio.

AIFF (.aiff, .aif, .aifc) fichier audio qui contient des formats non compressés (PCM, IFF).

MKV (.mkv, .mka, .mks) : Le Matroska Multimedia Container peut contenir diverses métadonnées en plus des flux audio/vidéo.

MOV (.mov) contient le format QuickTime de Apple et différents formats dont Mpeg2, Mpeg4.

MPEG (.mpg) : contient exclusivement des flux (formats MPEG vidéo et audio).

MP4 (.mp4) : fichier standard audio et vidéo pour le MPEG4 partie 14.

M2TS (.mts) : fichier standard pour le MPEG4 AVC/H264 .

M4v (.m4v) : fichier standard de iPod, PSP et de vidéos en lignes (iTunes) contenant du Mpeg4.

Ogg (.ogg) fichier libre et Open source contenant Vorbis (audio) et Théora (vidéo)

OGM ou Ogg Media (.ogm) : fichier pouvant contenir les formats DivX, Xvid et en audio le le format ogg V orbis.

RealMedia (.rm) standard des formats RealVideo et RealAudio.

VOB (.vob) : pour DVD, contient généralement Mpeg2 (vidéo) et AC3 ou DTS (audio) (.3gp ou 3g2) : pour téléphone mobile de 3ème génération, contient du Mpeg4 partie 14 (mp4) en basse résolution.

Les formats vidéo (liste non exhaustive)

AVCHD (Mpeg4 AVC/H264) : format de haute définition fortement compressé. Exige pour le montage vidéo une configuration de l’ordinateur ayant de très hautes performances. L’AVCHD lite adopte une résolution inférieure : 720p. Ces formats peuvent être gravés sur DVD en m2ts.

DivX : basé sur le Mpeg4, le DivX permet de compresser fortement sans perte notable de qualité. Par exemple un de DVD (4,7 Go) compressé en DivX pourra contenir sur un CD (700 Mo). Plus adapté pour sauvegarder ou stocker sur DVD.

DV (DV-AVI) : norme de la vidéo numérisée faiblement comressée et sans perte de qualité. C’est le standard idéal pour le montage virtuel. Une exportation en DV-AVI est utile pour retravailler une vidéo.

FLV (ON2 VP6, Orenson : Le format Adobe Flash Vidéo permet d’insérer facilement une image vidéo sur une page WEB, dan un format lisible par presque tous les internautes (avec Flash player).

GIF animé : animation à partir d’une succession d’images au format GIF. Le GIF animé est adapté aux animations graphiques de couleur unie et de petite taille, par exemple un logo. Il convient mieux aux images de synthèse qu’à la vidéo classique.

HDV (Mpeg2 4:2:0). Ce format adopte une résolution de 1440x1080 avec un rapport de 1,77 (16/9). Le Mperg24:2:2 adopte la résolution de 1920x1080.

MOV : .mov est en réalité l’extension du fichier QuickTime format propriétaire de Apple, concurrent de Flash Vidéo.

MPEG1 : standard vidéo utilisant la résolusion 352x240 (NTSC) ou 352x288 (PAL/SECAM) pour être diffusé sur un CD-ROM. La variante MPEG1-VCD est pour les VCD. La qualité est proche de VHS.

MPEG2 : standard vidéo de qualité DV pouvant être utilisé sous différentes résolutions. L’emploi le plus courant est le DVD.

MPEG4 : standard vidéo pour des applications multimédias (avec codec DivX) ou pour la haute définiton utilisant notamment le codec H264.

Théora : codec gratuit et Open source, qui avec OGG (audio), sont dans un conteneur Vorbis.

WMV : Windows Media Video, développé par Microsoft, est un format propriétaire. C’est le principal format utilisé par le lecteur Windows Media.

Xvid : logiciel libre et gratuit, implémentation du Mpeg4, de meilleure qualité que son principal concurrent le DivX. Pour la sauvegarde de fichiers vidéo.

Les formats audio (liste non exhaustive)

AAC (Advenced Audio Coding) : format utilisé principalement sur les iPod.

AC3 : format Dolby Digital dont le standard de codage numérique est le 5.1.

AIFF : format audio non compréssé pour Apple.

DD+ (Dolby Digital Plus) : format audio haute résolution, compression avec perte

DTHD (Dolby True HD) : format audio multicanal haute définition, compression
sans perte offrant une richesse acoustique allant jusqu’au 7.1

DTS HD (DTS HD Master Audio), format audio de haute résolution concurrent et équivalennt du DTHD. Ce format n’est pas décodé ou supporté par tous les lecteurs de Blu-Ray Disc.

FLAC (Free Lossless Audio Codec) : format audio libre et de compression sans perte.

LPCM (Linear pulse code modulation) : format audio multicanal haute définition, non compressé, norme de la plus haute qualité. Il peut contenir jusqu’à 8 canaux.

OGG Vorbis : technologie d’encodage, de lecture et de diffusion de données audio. (Open source) avec une qualité supérieure au MP3.

MP3 : (MPEG 1/2 Audio Layer 3) format de compression (avec perte) développé par ISO. Il permet de compresser au taux de 1:12 les formats habituels.

WAV (WAVE) : format audio sans compression mis au point par Microsoft et IBM.

WMA : format de compression de données audio (avec perte), développé par Microsoft. Il permet en outre de protéger l’encodage contre les copies illégales.

Les formats images (liste non exhaustive)

BMP : (bitmap) format d’image numérique développé par Microsoft et IBM, constitué d’une multitude de pixels. ne convient pas pour l’agrandissement.

GIF : (Graphics Interchange Format), format généralement utilisé pour afficher des graphiques et des images à couleurs indexées dans des documents HTML (Hypertext Markup Language) sur le Web et d’autres services en ligne. Le format GIF est un format compressé LZW conçu pour réduire à la fois la taille du fichier et le temps de transfert électronique. Il préserve les transparences des images à couleurs indexées, mais il ne prend pas en charge les couches alpha.

JPEG : (Joint Photographic Experts Group) format généralement utilisé pour afficher les photographies et autres images à tons continus de documents HTML (Hypertext Markup Language) sur le Web et d’autres services en lignes. Le format JPEG prend en charge les modes CMJN, RVB et Niveaux de gris, mais pas les couches alpha. À la différence du format GIF, le format JPEG conserve les informations chromatiques d’une image RVB, mais il compresse la taille des fichiers en éliminant des données de façon sélective, c’est donc une compression destructrice.

PNG : format d’image numérique, libre de droits. Le format PNG a été crée comme alternative du format GIF et, comme lui, est utilisé pour afficher des images sur le Web. PNG préserve toutes les informations relatives à la couleur et les couches alpha d’une image et utilise un procédé de compression sans perte pour réduire la taille du fichier.

PSD : format Photoshop . C’est un format de document volumineux (PSB), le seul format à prendre en charge la plupart des fonctionnalités de Photoshop. Il est reconnu par d’autres logiciels.

RAW : format haute résolution non compressé, offrant la meilleure qualité de l’image, très utilisé par les photographes professionnels et amateurs experts, permet un traitement de l’image de qualité. Cependant tous les logiciels ne prennent pas en charge ce format qui n’est
pas un standard.

Les formats images (suite)

TGA : Le format Targa (TGA) est conçu pour les systèmes utilisant une carte vidéo Truevision et est généralement pris en charge par les applications couleur MS-DOS. Ce format prend en charge les images RVB 16 bits (5 bits x 3 couches de couleur, plus un bit non utilisé), les images RVB 24 bits (8 bits x 3 couches de couleur) et les images RVB 32 bits (8 bits x 3 couches de couleur plus une seule couche alpha 8 bits). Le format Targa prend également en charge les images à couleurs indexées et en niveaux de gris sans couche alpha. Lors de l’enregistrement d’une image RVB dans ce format, vous pouvez choisir une profondeur de pixel et sélectionner le codage RLE pour compresser l’image.

TIFF : (Tagged-Image File) ce format s’utilise pour l’échange de fichiers entre applications et plates-formes informatiques. TIFF est un format d’image bitmap souple pris en charge par la plupart des applications de dessin, de retouche d’images et de mise en page. La quasi-totalité des scanners de bureau peuvent produire des images TIFF. La taille maximale des documents TIFF est de 4 Go.

Conversion

On entend par conversion le transcodage d’un format audio/vidéo en un autre, que ce soit, pour la vidéo, d’un simple changement de résolution ou d’un codage par l’intermédiaire d’un autre codec, par exemple du MPEG2 en DivX. La conversion n’est à envisager que pour répondre à un but précis, notamment pour pouvoir diffuser sur une page du web, pour exporter vers un iPod ou MP4, pour graver un DVD, un Blu-ray Disc. Le transcodage doit tenir compte de la finalité et de l’évolution technologique (apparition de nouveaux codecs). Pour un archivage, le choix d’un transcodage non destructif permet de faire face aux évolutions ( possibilité de transcoder plus tard avec un nouveau codec). Pour une diffusion sur le Net, le transcodage très destructif ne permet pas un retour en arrière. L’outil qui permet l’encodage/décodage d’un format audio/vidéo, que ce soit pour le créer ou le convertir, est le codec. Un codec ne peut, en aucun cas, modifier un fichier conteneur. Il s’agit donc d’une aberration de prétendre convertir un fichier conteneur en un autre, comme on le voit souvent dans des forums ou publicités pour des convertisseurs. Après plusieurs générations du format DV-AVI, il peut se produire une désinchronisation audio/vidéo. Après plusieurs générations d’un format dont le codec est avec perte de données, par exemple MPEG2, il y a perte de qualité de l’image. Les logiciels de montage vidéo permettent de choisir en exportation différents formats vidéo (choix plus ou moins important selon le logiciel). Néanmoins, vous pouvez utiliser des convertisseurs tiers. La qualité d’un encodeur peut varier d’un logiciel à l’autre.

Complément d’information sur la vidéo

À savoir l’œil perçoit les images d’une vidéo à une vitesse de 25 images par seconde (IPS). Pour visionner un film vidéo il faut 25 fois la même image sinon il y aura un phénomène de saccade (ralentissement par à-coup). Un format standard d’un DVD du commerce est d’environ 60 images (en France) par seconde donc pas nécessaire d’avoir autant d’image. Nous pouvons donc le compresser afin de garder juste ce qu’il nous faut. Les codecs nous seront utiles pour compresser la vidéo et ainsi fabriquer notre nouveau fichier vidéo. Les codecs sont fait pour compresser une vidéo et donc retirer des images (au lieu des 60 du format originel MPEG2/MPEG4...) il en gardera que 25, il gardera les images meilleures qualités pour ne pas dénaturer l’aspect de la vidéo. Il est donc possible de compresser une vidéo de 8 Go environ pour obtenir une vidéo de 700 Mo (pratique pour transformer sa vidéo faite avec le caméscope). Un fichier MPEG2 ou MPEG4 (format DVD du commerce) et constitué de 2 fichiers 1 pour le son (Audio TS) et l’autre pour la vidéo (MTS ou VidéoTS). Si nous voulons compresser la vidéo en XVID/DIVX ... les 2 fichiers seront assemblés pour en faire qu’un. Seul le logiciel de compression (VLC) synchronisera l’image avec le son pour ne pas avoir de décalage entre le son et l’image. Il y a plusieurs standards le PAL (en Europe) et le NTSC U/J (U pour les États-Unis et J pour le Japon).

Pour aller plus loin

Cette partie est complémentaire pour aider à comprendre un peu mieux la vidéo dans sa généralité. Le désentrelacement vidéo, c’est quand il y a un effet de peigne sur l’image notamment sur les séquences rapides. Le procédé qui permet d’afficher en balayage progressif une image transmise en mode entrelacé.

https://www.atreid.com/entrelacement-comment-eviter-les-effets-de-trames-en-video.html

Fiche Wikipédia : Désentrelacement

Source Internet :

Détail des formats « audio et vidéo ». À la fin des liens pour convertisseurs audio et vidéo)
http://www.gypsevideo.fr/index.php?option=com_content&view=article&id=123:exportation&catid=51

Marc et Fred.