Approche de la prise de son
Christian Canonville
Pour qui entretient le désir de filmer, les instruments et appareils de production sont de plus en plus accessibles en termes de coût, de disponibilité, d’ergonomie, de qualité, etc.. C’est une évidence pratique 1. Il reste que le mode d’emploi ne suffit pas, car ces outils nécessitent connaissances et savoir-faire instrumentaux sans lesquels la qualité risque de ne pas être à la hauteur des intentions. Il en va ainsi sur toute la chaîne depuis la conception jusqu’à la diffusion d’un film, en particulier documentaire, puisque réalisé en petite équipe. Si la captation du son demande à l’opérateur un certain type d’écoute, une certaine attention pour différencier l’utile de l’inutile, elle exige en plus une bonne connaissance des étapes qui la suivent (montage et mixage).
Le sonore est déjà là sur le lieu du tournage, entre formes discrètes, bien dessinées, et sons encombrants, inutiles voire gênants pour l’intelligibilité de la parole. Car c’est bien de cela dont il s’agit : comment privilégier l’intelligibilité ou, corrélativement, comment se défaire d’un trop plein sonore, d’un excès masquant et donc gênant ? L’intelligibilité de la parole est en grande partie liée à la restitution des composantes transitoires de la voix, données par les consonnes (l’ar-ti-cu-la-tion). Malheureusement ces consonnes sont des frottements d’air de bien faible puissance devant les voyelles. Ayant tenu mille conversations dans un environnement bruyant, chacun sait qu’il est possible de reconstituer –dans une certaine mesure– le contenu d’un message verbal, mais c’est seulement par un effort soutenu : on arrive à restaurer les éléments masqués “..e …ou … é…ou. té, …ai …e …ai pas c…pri… ce que …ent …ai..”, en focalisant au maximum l’attention vers l’interlocuteur et en suivant le mouvement de ses lèvres “je vous ai écouté, mais je n’ai pas compris ce que j’entendais”.
Si l’on devait placer un microphone à ce point d’écoute, la voix apparaîtrait alors noyée dans une bouillie sonore inextricable. C’est que le microphone –contrairement au zoom– ne peut focaliser la source visée et atténuer les sons environnants. Sa membrane reçoit un mélange omnidirectionnel touffu, toutes sources confondues. C’est aussi que le haut-parleur monophonique –ce “hublot” vibrant– ne restitue guère l’espace d’origine ! Loin de reproduire les différents emplacements des sources, il tend plutôt à les compacter en un point. Mélangées, ces sources superposent leurs multiples vibrations sur la membrane du haut-parleur. Les sons à front raide (d’attaque très brève, donc à forte énergie), acquièrent une sur-présence, soit un mordant exagéré qui s’étale sur les autres sons à énergie moindre (la parole en l’occurrence) et les submerge. L’impact des fourchettes sur les assiettes, le tintement des verres, le déplacement des talons sur le pavé, toutes les percutantes, en fait, paraissent démesurées. C’est du reste l’un des soucis du preneur de son de rééquilibrer ce rapport entre les éléments percussifs et non percussifs (comme la voix), car il est le seul à entendre cet effet (purement monophonique) dans son casque.
Dès lors, plus l’environnement est bruyant, plus la nécessité de rapprocher le microphone de la source va s’imposer, si l’on souhaite capter les moindres détails et contours de la parole. Il en va de même dans ces grands espaces où la réverbération risque de brouiller ou de flouter la source écoutée. En rapprochant le capteur (en deçà de la distance critique 2), on favorise l’énergie directe au détriment du timbre certes, mais au bénéfice de la compréhension.
C’est bien la recherche de la netteté des paroles qui, le plus souvent, dicte l’emplacement du microphone jusqu’à obliger parfois à cadrer le personnage en plan (trop) serré. Miniature et aisément dissimulable, le microphone “cravate” est alors d’un recours efficace. Malgré un rendu des timbres inexact et une grosseur figée du plan sonore, convenablement fixé sur le personnage, à l’abri du vent et isolé des frottements contre les vêtements, il sauve l’intelligibilité. À condition, comme il a déjà été mentionné, que la voix soit suffisamment articulée.
Contrairement à ce qui se dit parfois, il n’est pas possible dans un enregistrement de séparer le son utile du son gênant, de se débarrasser des bruits en excès. Tout au plus peut-on les atténuer par un filtrage localisé dans le bas du spectre sonore. En effet, la zone fréquentielle la plus gênante –par effet masquant– se situe dans les graves. 3 Une correction fréquentielle semble ainsi être une solution abordable mais elle risque d’entamer le timbre de la voix et de nuire à sa lisibilité dans la mesure où les fréquences filtrées (atténuées) sont communes à la parole.
Lorsque le bruit gênant est localisé dans une direction précise de l’environnement (une avenue à grande circulation, un chantier, une fontaine bruyante, etc.), il est possible de l’atténuer en positionnant le microphone à un mètre de hauteur, de manière à ce que le corps de la personne constitue une sorte d’écran vis-à-vis de la source bruyante, comme si le microphone ne la “voyait” pas.
Prudence cependant : la réflexion de ladite source sur une paroi (un mur, une façade d’immeuble), ramenée à l’arrière ou à l’avant du microphone peut être également gênante au point qu’il sera nécessaire là encore de se rapprocher de la bouche du locuteur. L’atténuation du bruit ambiant serait évidemment accentuée par l’usage d’un microphone à directivité prononcée (hypercardioïde) microphone qui prend surtout le son venu de face et affaiblit ce qui provient des arrières.
Notons qu’en position basse, le capteur se situe dans la zone d’activité des mains de la personne qui parle et que cela peut entraver la liberté de mouvement. En revanche, que l’on soit en position haute (au-dessus des cheveux) ou en position basse (près de la ceinture), l’intelligibilité de la parole est préservée, même si le timbre final est différent.
Au positionnement particulièrement soigné du microphone devant la source, il faut ajouter la recherche de continuité sonore sur toute la séquence. Si les sauts de point de vue engendrés par les changements d’axe et de grosseur de plan de l’image sont acceptés par l’observation visuelle, une telle discontinuité ne saurait être admise pour la restitution sonore. La recherche de la constance des timbres, du maintien des niveaux ou des plans sonores, orientent à tout instant le positionnement de la perche, sa mobilité silencieuse.
Dans la pratique et dès le début du cinéma parlant, deux “écoles” se sont dégagées pour régler les problèmes de cohérence entre le sonore et la profondeur de l’image : l’une partisane du “double exact”, l’autre du “net partout”. La première, avec un plan sonore variable, tente de “coller” à la perspective de l’image (dont la triple géométrie –de position, de grandeur et d’orientation– augmentée de la densité photographique, se charge d’imiter les apparences lumineuses) ; la seconde, avec un plan sonore constant, très rapproché, évacue tout conflit de profondeur avec l’image en s’orientant vers une intelligibilité maximale (effaçant de la sorte toute représentation réaliste de l’espace au profit des voix prises en proximité, à distance constante).
C’est ce timbre de voix, né du choix des techniciens hollywoodiens à la fin des années 1930 –privilégiant les dialogues– qui s’est imposé comme “plausible” et qui fait toujours référence. Ainsi, même dans une perspective “naturaliste”, les voix sont en général captées en deçà de la distance critique (plus d’énergie directe, moins de réflexions de la salle et de bruits ambiants) afin de gagner en intelligibilité, en confort auditif.
En d’autres termes, un changement trop important de distance source/micro, d’un plan à un autre, entraînera une saute instantanée du point d’écoute, comme si l’on s’était reculé ou avancé soudainement. 4 En pratique, il s’agit de garder cette distance la plus égale possible de plan à plan, si l’on veut préserver la stabilité en niveau, en timbre et en rapport énergie directe/énergie réfléchie (réverbération). En outre, cette distance doit être maintenue à l’identique tout au long de la prise, quels que soient les mouvements et les déplacements de la source. L’idéal serait de placer le microphone continûment dans la direction du visage du locuteur, légèrement au-dessus du front, et de conserver cet emplacement quelle que soit l’évolution de sa position dans l’espace de tournage, sur le “grand plateau du réel”.
On peut alors imaginer la difficulté qu’il y a à suivre un ou plusieurs personnages avec la fameuse perche télescopique portée à bout de bras. Malgré le rayonnement inhomogène de la parole (du grave à l’aigu), l’expérience montre qu’il existe une aire optimale de prise de son pour la voix, sans modification importante de timbre, à condition que le microphone reste dirigé vers la bouche du locuteur, à une distance constante, avec les coordonnées spatiales que voici : verticalement, légèrement au-dessus du visage, à l’intérieur d’un angle qui va du dessus du front, sans le dépasser vers l’arrière, jusqu’à environ 45° vers l’avant, sans descendre plus bas au risque de capter un timbre plus plein, certes, mais de se retrouver avec le microphone dans le champ de la caméra ; horizontalement, à l’intérieur d’un angle total d’environ 130°, réparti par moitié de part et d’autre du visage. Ce qui laisse tout de même une certaine latitude au preneur de son pour éviter des déplacements trop brutaux de la perche lors de mouvements de tête rapides du locuteur.
La prise de son d’une voix à partir d’un microphone fixé sur la caméra ne donne que rarement des résultats satisfaisants, excepté dans certaines conditions où l’environnement sonore reste calme, notamment en plein air, à faible distance. En intérieur, si le local est très réverbérant ou trop bruyant, on devra se rapprocher du personnage, le “coller” quasiment, ce qui n’est pas toujours possible. On préférera le microphone fixé à l’extrémité d’une perche, micro muni des accessoires ad hoc pour éviter les effets désastreux du vent, certains bruits mécaniques… La suspension élastique, la bonnette anti-vent sont donc indispensables. Un rapport de complicité, avec des codes préalables, est naturellement essentiel entre le cadreur (souvent réalisateur) et le preneur de son, de sorte que ce dernier sache à quel moment la caméra tourne, à quel endroit la perche, son ombre ou son reflet, risquent de s’introduire dans le champ.
Certaines conditions de tournage documentaire imposent l’usage d’un microphone additionnel (en appoint ou supplémentaire, microphone cravate). La difficulté est alors de garder l’équilibre de niveau entre les deux, équilibre qui pourra être solutionné au mixage dans le cas où les signaux ont été enregistrés séparément, sur les deux canaux son de la caméra.
Par ailleurs, en complément des sources captées en synchronisme avec l’image, il est très souvent utile d’enregistrer d’autres sons afin d’enrichir la palette sonore du film : ambiances, sons complémentaires, fonds d’air, sans oublier les silences, ces fameux “silences plateau” (assez étendus pour lisser les raccords de plans tout au long d’une même séquence. Est-il nécessaire de rappeler que les réglages préalables de niveau électrique devant la source sont évidemment la base d’une bonne prise de son : l’on connaît les effets indésirables d’un son sur-modulé (écrêtage, distorsion) et pareillement les conséquences d’une sous-modulation (bruit de fond électronique). 5 L’on sait aussi que plus le microphone est proche de la source, plus il est difficile de maîtriser les excursions imprévues du niveau sonore.
En choisissant un microphone et en réglant la distance de travail selon l’acoustique ou le bruit ambiant, le preneur de son définit la netteté des contours et cisèle les traits de la source sonore. Encore doit-il couvrir toute la séquence régulièrement, avec obstination, malgré la discontinuité mécanique des plans et des prises. Avec la souplesse du chat, il lui faut louvoyer silencieusement entre les obstacles, ne pas entrer dans le cadre de l’image, ne pas créer d’ombres portées sur les murs, échapper aux reflets, ne pas heurter la perche, etc. Son activité relève à la fois de celle du chasseur de papillon qui doit capter son lépidoptère sans le détruire, ni le blesser, ni l’abîmer, et celle du calligraphe qui, avec l’intelligence de l’entière surface sur laquelle il va œuvrer, pratique un art stylé du mouvement. Le preneur de son, tout en positionnant à chaque instant son (ses) microphone(s) pour réaliser une “balance” satisfaisante entre le son utile et les autres, doit comme le calligraphe, anticiper le trajet de la source et accompagner son déplacement dans ses moindres mouvements, sans heurt et d’un seul trait, en ayant à l’esprit l’ensemble de la scène, du début jusqu’à la fin.
Il va sans dire que ce qui entoure le tournage participe pleinement du projet, de sa réussite. Le preneur de son doit effectuer un repérage des lieux et des environnements sonores, dans les conditions les plus proches de celles où le tournage sera réalisé, afin d’adopter la procédure instrumentale la plus efficace, et parfois, la plus discrète. Éviter par exemple de repérer un dimanche matin quand les activités sociales, industrielles, urbaines, familiales, etc. sont, en occident, si particulières. Malgré tout, le “plateau du réel” révèle ses aléas qu’il est parfois difficile de prendre en compte (surprises bruyantes, changements inopinés du niveau sonore, mouvements imprévisibles…). Il n’y a pas que des anges sur le terrain du documentaire.
Si une vérification minutieuse des outils de prise de son est un préalable indispensable et souvent salutaire –ah, les piles, les batteries, les soudures !– l’adaptation aux conditions de tournage reste nécessaire. La vivacité d’une mise en place technique –du prêt à tourner– n’est pas la moindre.
Enfin, la discrétion du dispositif technique et l’effacement personnel participent du mutuel apprivoisement entre équipe de tournage et personnes filmées. On sait combien un micro peut intimider, ou comment une personne peut se sentir inhibée ou perturbée par un objet suspendu tout prêt d’elle, avec cette perche qui la suit partout. Le microphone cravate est souvent préféré pour cette raison. Lors de la pose de cette cravate qui n’en est pas une, l’ingénieur du son peut participer à la mise en confiance ou rassurer la personne sur son image, le ton juste de ses paroles, ou même aider à l’expression vocale. Bref, mettre tout le monde à l’aise pour que la parole circule.
Une bonne prise de son doit donc tenir compte autant des aspects techniques, acoustiques, que de ceux relevant de la psychologie et du respect, et à tout le moins, des rapports humains. Sans oublier la connivence permanente avec le cinéaste : le son, l’image, la réalisation convergent vers un même but. Mais c’est le preneur de son qui, par la qualité professionnelle de son écoute, est le plus à même d’évaluer in situ le résultat monophonique –voire stéréophonique– de chaque prise, de rechercher incessamment le meilleur rendu, tout en restant dans l’esprit du film.
- Force est de constater que les enregistreurs sur disque dur ou carte mémoire flash, les caméscopes DV sont de plus en plus nombreux, à des prix abordables : les formats d’enregistrement approchent les qualités professionnelles.
- Distance à la source où l’énergie du son direct est équivalente à l’énergie des sons indirects, réverbérés par les parois.
- C’est le cas du bruit de fond urbain chargé de fréquences graves, riche en événements bruyants, voire perçants.
- Le microphone capte en priorité l’énergie directe, laquelle décroît avec le carré de la distance (1/d2), tandis que l’image diminue dans le même temps en 1/d, ce qui n’est pas sans poser de problème quant au raccord de profondeur entre image et son.
- En fait, ces réglages sont au nombre de trois : le réglage de la sensibilité électrique à l’entrée de la mixette (en fonction de l’intensité acoustique de la source sonore) ; le contrôle de la modulation, en temps réel, pour éviter une sous-ou sur-modulation ; l’adaptation du niveau de sortie de la mixette à celui de l’entrée de la caméra (calibrage).
Publiée dans La Revue Documentaires n°21 – Le son documenté (page 9, 3e trimestre 2007)
Disponible sur Cairn.info (https://doi.org/10.3917/docu.021.0009, accès libre)