Qu'est ce qu'un son ?

Un son est une onde issue de la vibration de l'air, et que nous entendons grâce à des appareils qui y sont particulièrement sensibles : nos oreilles. Pour bien comprendre ce phénomène, imaginons un son très simple et assez courant : un claquement de main. En se frappant l'une l'autre, les mains engendrent un onde d'air pressurisé qui se déplace à 340 mètres par secondes (la fameuse vitesse du son). Lorsque cette onde atteint une oreille, elle génère une légère pression sur le tympan, dont la vibration produite restitue le son initial.

Forme donde du clap 

Un claquement de mains est un événement court causant une onde simple qui s'évanouit rapidement. Cette forme d'onde est représentée par l'image précédente.

D'autres ondes sonores peuvent durer plus longtemps. Un carillon est un excellent exemple. Lorsqu'il est actionné, sa cloche vibre à une fréquence donnée, faisant vibrer l'air environnant, ce qui engendre une onde continue de même fréquence. L'onde de pression ressemble alors au schéma suivant :

Forme donde du carillon 

Ces deux types d'ondes sont appelées ondes sonores, ou encore ondes acoustiques.

Enregistrement numérique et restitution

Un microphone consiste en une fine membrane qui vibre lorsqu'elle rencontre des ondes acoustiques. Les mouvements de la membrane sont alors transformés en signaux électriques. Fondamentalement, il s'agit donc d'un convertisseur d'ondes acoustiques en ondes électriques.

Examinons la forme de l'onde électrique issue du microphone :

Forme donde du courant généré 

Vous remarquerez qu'elle est très proche de celle que nous venons de voir précédemment. La différence principale est que nous mesurons ici non plus une pression, mais un courant électrique. Nous pourrions même dire que la forme de ce dernier signal est analogue à celle du signal original. C'est la raison pour laquelle les ondes électriques qui représentent une onde sonore sont appelées des ondes analogiques.

L'outil principal utilisé pour enregistrement numérique est un convertisseur analogique-numérique (CAN, ou, en anflais, ADC - Analog-to-Digital Converter). Le CAN mesure la tension d'une onde électrique plusieurs milliers de fois par secondes, puis utilise ces mesures pour créer une carte du signal électrique :

Échantillonage 

Chaque point sur la figure précédente représente un échantillon. Seuls les valeurs de ces points discrets son conservées, et tout le signal original compris entre deux points est abandonné. Ainsi, plus le nombre d'échantillon, pour une période donnée, est important, plus l'enregistrement numérique est précis.

La restitution d'un signal audio-numérique utilise un mécanisme inverse appelé convertisseur numérique-analogique (CNA, ou, en anglais, DAC - Digital-to-Analog Converter). Il génère, à partir de l'échantillon numérique, une onde électrique. Dans un ordinateur, cette onde est transmise à une carte son, puis à un casque ou des haut-parleurs qui recréent l'onde sonore originale par la vibration de leurs membranes.

La carte son d'un ordinateur est équipée d'un convertisseur analogique-numérique pour l'enregistrement, et d'un convertisseur numérique-analogique pour lire les fichiers audio. Le système d'exploitation (Windows, Mac OS X, Linux, etc.) sert généralement d'interface entre la carte son et les applications dédiées à la capture, l'édition ou la restitution des fichiers audio.

Qualité

Deux facteurs déterminent la qualité d'un enregistrement numérique :

  • Le taux d'échantillonnage, qui représente le taux avec lequel l'ADC effectue l'enregistrement des échantillons et le DAC les rejoue. Le taux d'échantillonnage est mesuré en Hertz (Hz), ou échantillons par secondes. Un CD audio utilise un taux de 44 100 Hz (souvent noté de façon raccourcie 44 kHz).
  • Le format d'échantillonnage, ou taille d'échantillonnage, qui détermine le nombre de bits utilisés pour représenter chaque échantillon. Le taux d'échantillonnage peut être considéré comme une précision horizontale, et le format d'échantillonnage comme une précision verticale. Un CD audio a une précision de 16 bits.

Les taux d'échantillonnage les plus élevés permettent un enregistrement numérique plus précis sur les fréquences les plus hautes.

Les formats d'échantillonnage les plus élevés offrent une meilleure dynamique d'amplitude et une meilleure reproduction des sons forts et faibles.

Formats de fichier audio

Les deux principaux types de fichiers audio disponibles sur un ordinateur sont les suivants :

  • Les fichiers PCM (Pulse Code Modulation, soit en français modulation d'impulsion codée). Il s'agit d'une technique pour laquelle chaque nombre, dans le fichier audio numérique, représente exactement un échantillon de la forme d'onde. Les formats les plus courants de fichiers PCM sont WAV (WAVEform audio format), AIFF (Audio Interchange File Format) et Sound Designer II.
  • Les fichiers audio compressés. Les fichiers de ce types utilisent, pour les plus modernes d'entre eux, des algorithmes psycho-acoustiques sophistiqués pour représenter les fréquences essentielles du signal audio dans un espace moindre comparé à un fichier PCM. Il s'agit par exemple des formats MP3 (MPEG-1/2 Audio Layer 3), Ogg Vorbis, et WMA (Windows Media Audio). L'utilisation de ces formats est économique en espace disque, mais diminue la qualité du son.