On a tous déjà vu ça : quand on filme une voiture, on a parfois l’impression que les roues tournent en sens inverse. Cette impression est présente en filmant n’importe quel objet en rotation, comme les pales de cet hélicoptère, qui semblent s’être arrêtés :
Alors, hélicoptère anti-gravité ou vaisseau extra-terrestre ?
Une histoire de cadence fixe
Ce qui se passe ici est très purement mécanique : la caméra ne capture pas le mouvement dans son intégralité, mais elle prend des photos à intervalles réguliers qu’il met ensuite bout à bout.
Généralement, elle prend 24 images par secondes. On dit que l’échantillonnage de la caméra se fait à 24 Hz. Chaque image est donc censée couvrir 1/24ᵉ de seconde dans la vidéo finale, soit 41 ms.
Ceci est nécessaire pour donner au cerveau l’illusion qu’une série de 24 photographies prises les une à la suite des autres constituent un mouvement fluide pendant 1 seconde.
41 millisecondes est une durée assez courte pour faire croire à notre cerveau qu’un mouvement est fluide, mais ça reste suffisamment long pour que les objets continuent de se déplacer.
Ainsi, pour un hélicoptère dont les pales tournent à 500 tours par minutes, cet intervalle de temps permet à chaque pâle de faire le tiers d’un tour complet, ce qui est loin d’être négligeable.
Il suffit alors que la vitesse de rotation de l’hélice soit une fraction exacte de la cadence de capture d’image de la caméra pour donner l’impression que les pales tournent étrangement.
Pour comprendre, prenons la trotteuse d’une pendule, qui bouge toutes les secondes.
Imaginons que nous prenions une photo toutes les 59 secondes en commençant à minuit, soit à 00:00:00. Les photos seront donc prises aux horaires suivantes :
Image | heure |
1 | 00:00:59 |
2 | 00:01:58 |
3 | 00:02:57 |
4 | 00:03:56 |
5 | 00:04:55 |
… | … |
Pour le moment il n’y a rien d’extra ordinaire, mais si on observe seulement les secondes, alors on a l’impression que la trotteuse, en rouge, recule :
Si on avait pris une photo toutes les 60 secondes, alors on aurait eu des photos où la trotteuse se trouvait toujours au même endroit (sur le 12).
Et si on avait pris une photo toutes les 15 secondes, alors on aurait eu des photos où la trotteuse serait uniquement sur le 12, 3, le 6 et le 9.
Il se passe la même chose en filmant une roue qui tourne à une vitesse proche de la cadence de prise d’images de la caméra : les figures sur la jante prennent des positions spécifiques sur chaque photo, qui donnent alors l’illusion de tourner à l’envers.
Mathématiquement
Cet effet est observé à chaque fois que deux phénomènes périodiques sont superposés : celui qui est observé : le mouvement de la roue, et celui qui observe : la cadence de capture d’images de la caméra.
Les deux phénomènes périodiques n’étant pas en phase, il apparaît un décalage qui est ensuite mal interprété par le cerveau.
On l’a vu sur des images avec l’hélicoptère ; on l’observe également en audio.
Sur le graphique suivant, le son à enregistrer (en rouge) a une fréquence de 9 Hz. L’enregistrement (en bleu) se fait à une cadence de 10 Hz :
Bien-sûr, les points de captures effectués tous les 0,1 s (en noir) sont présentes sur les deux courbes, mais le système de traitement logiciel ne saura reconstituer que la courbe bleue. Pour lui, les deux signaux (rouge et bleu) apparaissent de la même façon, et il ne garde par défaut que celle de plus basse fréquence, même si c’est la mauvaise.
Le son aigu apparaît donc grave : c’est un effet similaire, qui est à l’audio ce que la roue tournant en sens inversé est à l’image.
Cette transformation des sons aigus en son grave, c’est ce qu’on appelle le repliement du spectre : les fréquences trop hautes sont divisées (repliées) et devienne des fréquences plus basses.
La solution : le théorème de Shannon
Pour capturer convenablement un signal d’une fréquence donnée, l’échantillonnage doit se faire à une fréquence supérieure au double de celle du signal : c’est le théorème de Nyquist-Shannon.
Pour l’enregistrement audio (en MP3, par exemple), on utilise en général une capture à 41 kHz, à 44,1 kHz voire à 48 kHz.
Ceci permet d’inclure tout le spectre jusqu’à 20 kHz voire un peu plus, ce qui constitue la limite audible pour les humains. On enregistre donc bien à plus du double de la fréquence maximale qu’on veut enregistrer, et donc aussi de toutes les fréquences en dessous.
Pour enregistrer convenablement 3 pales d’hélicoptère tournant à 500 tours/minute (8 tours par seconde), il faut une cadence de capture supérieure à $8\times3\times2 = 48$ images par seconde. En prenant une cadence de 50 FPS, alors on n’aura plus l’impression d’avoir des pales tournant dans le mauvais sens.
Voir aussi
Voir aussi : mon article sur le rolling shutter effect, l’effet où les images sont toutes distordues quand on prend une photo d’un objet en mouvement.