Accueil Floss Manuals francophone

Ardour

Qu'est-ce que l'Audio-Numérique ?

Comme nous allons utiliser Ardour pour enregistrer et éditer du son, il peut être utile de revoir comment l'audio-numérique fonctionne.

Analogue_Digital_Conversion_en

Un diagramme montrant comment le son se ballade à travers votre ordinateur. Les "Conversion Analogique vers Numérique" et la "Conversion Numérique vers Analogique" sont réalisées par votre carte son ou votre interface audio. Le "Système Numérique" dans ce cas est Ardour.

Source : http://en.wikipedia.org/wiki/Image:Analogue_Digital_Conversion.png

Fréquence et Gain

Imaginez un haut-parleur. Pour faire bouger l'air face à lui et produire le son, la membrane du haut-parleur doit vibrer depuis la position centrale (au repos) en arrière et en avant. Le nombre de fois où la membrane vibre par seconde détermine la Fréquence (la note, tonalité ou pitch) du son que vous entendez. La distance que la membrane parcourt depuis sa position de repos détermine l'Amplitude (le volume ou l'intensité) du son. Habituellement, nous mesurons la Fréquence en Hertz (Hz) et l'Amplitude en Décibels (dB).

speaker_en

Un microphone fonctionne comme un haut-parleur à l'envers—les vibrations de l'air provoque la vibration de sa membrane. Le microphone transforme ces vibrations acoustiques en courant électrique. Si vous branchez votre microphone dans une carte son d'un ordinateur et lancer un enregistrement, la carte son fera des milliers de mesures de ce courant électrique par seconde et les enregistrera en tant que nombres. Le nombre d'Échantillons (c'est à dire : mesures ou Samples) réalisés en une seconde est appelé Fréquence d'Échantillonnage (Sample Rate), et le nombre de valeurs possibles de chaque Échantillon qui peuvent être obtenus est appelé Résolution (Bit depth). La combinaison de la Fréquence d'échantillonnage et de la Résolution indique comment précisément le signal numérique peut reproduire le son qui a été enregistré.

Pics et Sautes-de-son (Peaks and Clipping)

Quand Ardour affiche les Échantillons qui ont été enregistrés, ils apparaissent comme la Forme d'Onde (WaveForm) que nous voyons ci-dessous. La ligne horizontale du centre représente la membrane du haut-parleur au repos, et les Pics de la Forme d'Onde représente l'Amplitude maximum.

resized_600x225_digital_audio_01_2_en

Si nous prenons la même Forme d'Onde et augmentons son Amplitude de 6 Décibels, alors certains des Pics seront en dehors de la gamme que l'ordinateur peut représenter numériquement. L'incapacité de l'ordinateur de représenter les Pics en dehors de la gamme d'Amplitude est appelé Saute-de-son, (Clipping) qui engendre une perte permanente de l'information numérique, autant qu'un changement dans la qualité du son qui est reconnaissable par une Distorsion. Ardour marque les Pics "saute-de-son" avec une couleur rouge, comme nous pouvons le voir dans l'image ci-dessous.

resized_600x210_digital_audio_02_3_en

Dans les 2 images images, on peut aussi voir la Tranche de Mixage (Mixer Strip) tout à gauche, qui donne une mesure courante des Pics et également une indication en haut du Vue-mètre des Pics (Peak Meters) qui le Pic maximum actuel.

La différence du nombre de décibels entre le pic maximum de la région et le point de saute-de-son est référencée communément la Marge de sécurité (Headroom) et, une pratique habituelle d'enregistrement, est de garder approximativement trois à six Décibels de Marge de sécurité entre le maximum de votre signal et le point de saute-de-son, avec le point de saute-de-son lui-même étant représenté à 0 dB (zéro Décibels). En d'autres termes, une région audio avec une taille confortable de Marge de sécurité (Headroom) doit avoir son pic maximum entre −6 dB et −3 dB.

D'autre part, les Pics du signal audio s'additionnant les uns aux autres, une attention doit être prise lorsque l'on Mixe plusieurs sources ensemble, afin d'empêcher l'apparition de Sautes-de-son dans le signal mixé.

Fréquence d'Échantillonnage et Résolution (Sample Rate and Bit Depth)

Pour rendre l'audio lisible sur un CD par exemple, l'ordinateur doit générer 44,100 Échantillons par seconde. La Fréquence d'Échantillonnage détermine la plus haute fréquence pouvant être enregistrée ou jouée par l'ordinateur. Une fréquence d'échantillonnage de 44.1 kHz signifie que la plus haute fréquence pouvant être représentée est juste en dessous de 22.05 kHz. Étant donné que l'oreille humaine entend une gamme de fréquence entre approximativement 20 Hz et 20 kHz, c'est communément accepté comme une Fréquence d'Échantillonnage raisonnable. D'autres Fréquences d'Échantillonnage communément utilisées sont 48 kHz (enregistreurs DAT) et 96 kHz (DVD audio).

Chaque Échantillon est enregistré comme un nombre 16-bit. Un Bit est un morceau d'information qui peut être 0 ou 1. Si vous avez 16 bits ensemble pour définir un échantillon, alors, vous avez 216 (65,536) valeurs possibles pour chaque échantillon.

Ainsi, nous pouvons dire que la qualité-CD de l'audio a une Fréquence d'Échantillonnage de 44.1 kHz et une Résolution de 16 bits. Les enregistrements de musique professionnels sont usuellement mixés en utilisant 24 bits pour préserver de maximum de quantité de détail avant d'être mis à plat (mixed down) à 16 bits pour le CD. Les anciens jeux d'ordinateur ont un son typiquement rugueux, utilisant seulement 8 bits. En augmentant la Fréquence d'Échantillonnage, nous sommes capables d'enregistrer des plus grandes fréquences soniques, et en augmentant la Résolution, nous sommes capables d'utiliser une plus grande Portée Dynamique (Dynamic Range) (la différence entre le plus léger et le plus lourd des sons possibles d'enregistrer et de jouer).