L’instrumental en solo

Claude Bailblé

Il y a au moins trois manières d’aborder la technique et la pratique instrumentale lors des tournages documentaires en solo, sous condition d’utiliser un matériel portatif et relativement léger.

La première consiste à laisser agir les réglages automatiques de la caméra de façon à libérer entièrement les ressources mentales du cinéaste sur la relation filmant/filmés, avec toute la proximité et l’attention requises 1. Les malfaçons ou les artefacts obtenus dans le champ-image (qu’il soit visuel ou auditif) sont alors tenus pour négligeables – voire intéressants – devant l’intensité ou la singularité de ce qui se joue dans le champ-objet, résultat de l’interaction forte entre cinéaste et personnes/situations enregistrées. Simplement le tournage laissera ses traces dans l’image et dans le son : certains rushes (flous, saccadés ou bruyants, réverbérants) seront de fait inutilisables ; d’autres seront exceptionnels.

La deuxième consiste à surveiller et même débrancher certains automatismes (autofocus, exposition, réglage du son…) tout en utilisant monopode, microphones, écouteurs – aussi discrètement que possible – de façon à contourner certains effets – artificiels – de la modulation lumineuse ou sonore, sans cesser de privilégier la relation aux acteurs de la scène documentaire. Cela suppose de préparer le dispositif technique avant de déclencher la caméra, et aussi de vérifier encore assez souvent le cadre, la lumière ou l’intelligibilité des voix. Une certaine gymnastique mentale s’impose, donc, mais sans oubli de l’essentiel, malgré le partage obligé de l’attention.

La troisième attitude consiste à imiter au mieux le travail d’une équipe, au cadre et à la lumière, à la perche et à la modulation, ainsi qu’à la mise en scène. C’est alors le risque d’une « prise de tête » avec la technique, lors des mises en place (exposition et éclairage, pied de caméra, perche et mixette, magnétophone numérique) ou pendant l’enregistrement (mise au point et modulation) au détriment d’une présence entière à ce qui se joue. Sans doute cela est-il plus facile dans des situations de tournage statiques, sans mouvements. Mais le dispositif technique fera forcément écran. Pour quels résultats ? Les limites seront vite atteintes avec les tournages de nuit, en ambiance bruyante, ou à plusieurs intervenants. Et que dire des situations mouvantes, instables ou imprévisibles, parfois recherchées comme telles par les « solitaires » ?

On peut toujours mêler la première attitude à la seconde, bref s’adapter aux contextes ou aux personnes. Cependant construire une relation filmant-filmés au plus près, sans que s’interpose un appareillage imposant servi par des collaborateurs (cadreur et ingénieur du son), cela veut dire en contre-partie maîtriser a minima la technique de deux instruments. Pourquoi deux ? Simplement parce que la petite caméra, aussi discrète soit-elle, est également un enregistreur de sons. Deux en un. Certes, il est loisible d’utiliser l’une indépendamment de l’autre et de dissocier ainsi les captations. Mais destinés à l’écran, les images et les sons « miniatures » du tournage n’en seront pas moins reçus « en grand » dans la salle de projection, et comme tels, devront être exempts – si possible – de certaines erreurs techniques ou même débarrassés de certaines approximations liées aux automatismes de l’appareil numérique. Reste que le plus important se passe encore devant et derrière la caméra, ou plus exactement dans la relation réciproque qui précède, soutient et suit l’enregistrement.

De fait, si le cinéaste travaille en soliste sur le « champ image » créé par la caméra, il se trouve confronté à plusieurs intervenants dans le « champ objet » de la scène filmée ! L’accès aux personnes, le temps passé avec elles, le choix des situations et des moments, la disponibilité aux évènements, tout cela excède largement la durée du tournage des plans 2… Même si parfois, il lui faut décider très vite, sans savoir exactement ce qui va se passer, en restant prêt à tourner sans délai. Ou au contraire ne sortir la caméra qu’au dernier moment. Dans d’autres circonstances, il s’agit de relancer un dialogue qui s’épuise, d’évaluer attentivement les intentions et les réactions, de s’adapter à une situation imprévue, ou de revenir au thème initial…

D’une manière générale, le monde réel – illimité, en tant que tel – est dépourvu d’apparences visuelles et auditives préalablement constituées puisqu’il est seulement empli d’objets en volume et de sources en vibration : pas d’images possibles sans le regard ou l’écoute qui leur donne forme originaire 3. « Tourner un plan » requiert donc un point de vue dans l’espace et un point d’existence dans le temps, soit une inscription subjective : une démarche, des rencontres, un projet. Cette prise de position dans une toute petite partie du monde réel manifeste ainsi la présence intentionnelle du cinéaste et de ses appareils 4. C’est en effet dans ce monde rapproché et limité que le documentariste choisit les multiples emplacements de son objectif et de ses micros : l’œil de verre y copie l’œil de chair ; la membrane du micro y double la peau du tympan. Mais le choix du point de vue et la sélection du moment restent principalement dépendants de la recherche des situations scéniques et des relations que le cinéaste aura su nouer avec les personnes approchées. La restitution ultérieure – au montage – de cette relation réussie présuppose – comme on va le voir ci-après – une certaine maîtrise des instruments, tant à l’image qu’au son 5.

L’image

Le champ visuel est aussi vaste qu’hétérogène : net en son milieu, indistinct dès que l’on quitte la zone du regard ; tandis que l’objectif est homogène, du moins dans le rectangle délimité par son format. Le regard du cinéaste détaille donc l’écran de contrôle pour vérifier l’ensemble de l’image, et au besoin recadrer le champ. Son attention circule aussi dans la profondeur, mais cette profondeur, une fois aplatie par la perspective, fait surgir de nouveaux rapports figures/fonds 6. Le rectangle-plan de l’image impose ainsi une composition, car le cinéaste sait bien qu’il va proposer au spectateur – en un temps plus limité – un ou plusieurs points de regard à poser tant dans la largeur que dans la profondeur du plan. Cependant, si l’acte de cadrer installe une « fenêtre d’examen », il y ajoute « un alentour aveugle » (mais pas si sourd) de sorte que l’image résultante n’est sûrement pas une « baie ouverte sur le monde », mais plutôt un point de vue ayant délimité sa fenêtre d’attention, tant spatiale que temporelle. Les choix du cadrage découlent de ce positionnement : quel axe choisir ? À quelle distance se placer ? Où couper et laisser de l’air ? Où placer l’horizon, le plan de sol ? Centrer ou décentrer ? Jouer de la netteté et du flou ? Comment se servir de la lumière et du contraste disponibles ? Quel suivi des mouvements ou des déplacements des personnages ? Comment découper la scène, choisir les durées ou les moments significatifs ? Tout ceci donne un aperçu sommaire des tâches nombreuses et précises qui attendent l’opérateur vidéo-ciné-aste ! Peut-on les confier – au moins en partie – aux automatismes de la caméra ?

1/ Autofocus : le cristallin de l’œil est remplacé par un automate de mise au point, mais ce point peut glisser sur les différents plans de l’image lorsque les personnages bougent et se déplacent dans le cadre, notamment en basse lumière. Préférer autant que possible la mise au point manuelle sur les yeux des personnages, ajustée grâce au follow-focus. Il s’agit d’orienter l’intérêt (et l’accommodation) sur l’un ou l’autre des protagonistes, selon les moments.

2/ Diaph automatique : l’image s’inscrit dans l’intervalle des luminosités admissibles (4 à 5 diaphs, voire plus) mais la lumière entrante est mesurée globalement par la cellule. Ce réglage interne mobilise aussi bien le diaph, la sensibilité en ISO que la vitesse d’obturation, se modifiant au cours d’un panoramique, d’un contre-jour ou même d’un travelling : la constance de clarté est perturbée. Préférer si possible le diaph manuel, avec une profondeur de champ choisie et non imposée par les réglages internes. L’axe de lumière et son jeu d’ombres, le contraste et son modelé conserveront alors toute leur importance. S’agit-il de faire ressortir les yeux et de rendre lisibles les traits du visage en évitant les ombres trop dures ? Ou de profiter du noir et blanc (sous-ex et sur-ex) artificiellement produits ? L’axe de caméra se choisira en tenant compte de l’axe de lumière principal (soleil, ciel gris ou autre) et du constraste ombre-jour disponible, éventuellement atténué par la mise en œuvre de diffuseurs et de réflecteurs…

3/ Horizontalité : la ligne d’horizon reste stable lorsqu’on penche la tête, ce qui n’est pas le cas lorsqu’on incline la caméra. Difficile en projection de retrouver l’assiette horizontale de l’image dans un écran. Le penché de la caméra a-t-il encore un sens ? Préférer le « bullage au débullage », ou utiliser l’horizon artificiel dans le viseur.

4/ Balance des blancs : en général bien assurée par la caméra, mais beaucoup moins par l’éclairage – parfois inhomogène – de la scène. Rechercher la même température de couleur en chaque plan, notamment entre la lumière du dehors et celle du dedans : soit 5 600°K le jour (il est absurde de filtrer en bleu une lampe à 3 200°K) et 3 200°K la nuit (éclairage artificiel). Les gélatines – ambres ou bleues – permettent des corrections progressives (1/8, 1/4, 1/2, full), en vue de « refroidir » ou « réchauffer » les sources. Côté autonomie, certains éclairages à LED, très pratiques, fonctionnent sur batteries rechargeables (vérifier néanmoins la qualité du blanc qu’elles émettent).

5/ Zooming : le zoom est souvent très utile en reportage pour rattraper un cadrage, aller vite à une scène frontale ou retrouver un contexte élargi. Sans doute la focale fixe de l’œil – 24 mm – ignore le travelling optique, mais le « travelling mental » de l’attention visuelle est incessant ! Faut-il alors préférer le plan fixe, avec un rendu proche de celui de l’œil ?

6/ Mouvements de l’attention : le cadre est une « fenêtre d’attention » offerte au regard, soit ! Couvre t-elle un ou plusieurs « épicentres » visuels ? Doit-on alors imiter les recadrages incessants du regard ? Décadrer subitement comme dans un coup d’œil ? Scruter (zoom avant) ou ouvrir le champ (zoom arrière) ? Faut-il suivre un peu, beaucoup, pas du tout le déplacement des corps ou le bougé des visages ? Se retourner pour un contre-champ ? À quel moment reserrer en gros plan ou élargir en plan taille ? Où et quand décadrer ? Quel est l’importance des plans larges (contexte) ? Ces questions intéressent évidemment plus la mise en scène, le découpage in situ que la seule technique. D’autant que ce découpage oriente déjà par avance les possibilités du montage (points d’entrée et de sortie).

7/ Stabilité : le champ visuel est stabilisé par des signaux de compensation issus du cervelet. Ce dernier intègre tous les mouvements du corps, de la tête et des yeux, afin de créer un espace visuel stable, aussi stable et exact que l’espace-objet, quels que soient les mouvements de l’image sur la rétine. La caméra au poignet, très pratique, ne peut compenser les bougés du cadre ressentis par le spectateur assis, immobile : on peut lui préférer le monopode, avec son petit trépied dépliant, instantanément déplaçable (façon steadycam). La stabilité verticale est assurée ; restent le tanguage et le roulis, déjà bien amortis. La crosse d’épaule est également très pratique pour la caméra portée 7.

8/ Écran de contrôle : difficile d’apprécier la mise au point et les détails du cadrage sur un petit viseur éclairé par la lumière ambiante. Si les conditions le permettent, adjoindre à la caméra un petit moniteur HD étalonné, relié à la sortie HDMI et protégé de la lumière ambiante par un cache noir.

Le son

Alors que la caméra imite l’œil (la cornée y est remplacée par l’objectif, la rétine par le capteur et ses pixels), le microphone ressemble plutôt à un tympan dépourvu d’oreille et de cerveau : une simple membrane répétant électriquement les vibrations touffues et emmêlées reçues au point de capture. Or, dans l’expérience courante, le champ auditif – comme le champ visuel – est partitionné : il y a la zone écoutée, focalisée par l’attention, et la zone inécoutée – la plus importante – atténuée par des mécanismes corticaux. Sous-entendue, en quelque sorte, exactement comme est sous-aperçue la zone visuelle hors du point de regard. Sous aperçus, sous entendus, ces hors-champs de l’attention, discrètement surveillés par le pré-conscient, déclenchent – en cas de bruits ou de mouvements imprévus – un changement de focalisation : ils nous font tourner la tête vers l’intrus.

Cette réorientation corporelle dans la bonne direction s’appuie évidemment sur une mise en espace déjà installée par le sens auditif, par nature omnidirectionnel : l’analyse des différences de captation entre oreille gauche et oreille droite lui permet en effet de spatialiser les sources, de se tourner vers elles et, les focalisant, d’augmenter leur intelligibilité, leur présence à la conscience. Tandis que dans le même temps, le bruit ambiant se trouve comme pondéré, filtré en précision, atténué en présence.

Avec la captation monophonique, au contraire, tout se mélange, tout « s’intermasque » sur la membrane du micro : il faut d’une part approcher le capteur de la source, d’autre part travailler en ambiance peu bruyante ou peu réverbérante. C’est que l’espace restitué par la monophonie se réduit deux fois de suite à un point : une première fois sur la membrane du micro, une seconde fois sur la membrane du haut-parleur. Comment dès lors départager les sons compactés qui y affluent ? Et obtenir la netteté souhaitée voire l’intelligibilité requise pour la compréhension parlée, si le pouvoir sélectif de l’attention ne peut plus s’exercer, faute d’étalement spatial ? Qu’espérer du micro placé sur la caméra, compte tenu des conditions acoustiques souvent difficiles du direct ? Est-il possible d’enregistrer plusieurs personnes qui parlent en même temps ? Comment stabiliser le timbre et le volume des voix qu’on enregistre, trouver la bonne distance, le bon plan sonore, sans pour autant perturber ou intimider les acteurs du documentaire ? Autant de problèmes à résoudre !

1/ La partition auditive : Personne ne peut écouter omnidirectionnellement, à 360° ! Chacun s’oriente et se focalise sur la source sonore intéressante. L’attention, le plus souvent audito-visuelle, sélectionne et investit ainsi la zone écoutée 8. Ce faisant, on continue d’entendre – de “sous entendre” – amoindri et filtré, le son ambiant. Écoute focale versus écoute ambiante. Comment recomposer cette partition tellement habituelle qu’on ne la remarque plus ? Idéalement en séparant un à un les éléments sonores par une prise de son fractionnée, voire par une prise de sons multimicros/multipistes 9. Les sons séparément et isolément enregistrés seront réunis synchrones (ou non), convenablement dosés et allégés, lors du mixage final, en une session de réassemblage et de composition sonore.

On enregistrera donc, outre les sons principaux (les voix), plusieurs sons d’ambiance (sons seuls) destinés à soutenir la continuité des séquences, mais aussi des sons précis (les effets) disponibles à l’entour, dans leur temporalité propre, en vue de compléter ultérieurement le in et le off.

2/ La balance entre son principal et son ambiant. Il importe que les sons ambiants, surtout s’ils sont denses ou masquants, soient tenus à bonne distance pour ne pas nuire à l’intelligibilité des paroles données au microphone. Trouver des lieux calmes n’est pas toujours possible, et l’on est jamais à l’abri d’un surgissement bruyant de graves ou de percutantes recouvrant certains mots, certaines syllabes. De fait, les lieux de vie ont rarement des « acoustiques d’auditoriums » adaptées à la captation microphonique, mais plutôt des acoustiques quelconques, tout juste adaptées à l’écoute binaurale ! Imposer des lieux peu réverbérants ou silencieux – décalés, donc – pourrait modifier fortement la relation patiemment établie avec les personnes filmées. De plus, les sons principaux se chevauchent souvent dans les dialogues : imposer une séparation/succession dans les prises de parole pourrait casser complètement une atmosphère, briser la spontanéité d’un groupe, fausser complètement le tournage.

C’est pourtant un enjeu important : en mono, la claire intelligibilité diminue la gêne et la fatigue auditives. Aussi cherche-t-on quand même à éliminer les bruits masquants en approchant le micro des lèvres, ce qui permet de diminuer le gain de l’enregistreur, et, du même coup, de faire tomber le niveau relatif des sons ambiants. Le vent sera aussi annihilé par l’emploi – obligatoire – de « petits bonnets poilus », des pare-brises (…) entourant le microphone. Noter qu’il faut savoir arrêter le tournage si le son est trop mauvais : chercher alors d’autres emplacements, essayer une autre configuration.

3/ La modulation à l’enregistrement : entre trop faible et trop forte, la modulation doit trouver sa place, un peu comme l’image doit trouver la sienne entre sous-ex et sur-ex. Le gain automatique (avec limiteur) est pratique pour la voix humaine, bien que les attaques soient comprimées et que les instants de silence laissent place à la remontée d’un son ambiant progressivement réenvahissant puis chutant à la reprise de parole. Préférer le réglage manuel, effectué juste avant la prise, avec, par précaution, le limiteur en service. Il existe maintenant des enregistreurs stéréophoniques à double échelle : l’une est réglée au maximum, l’autre suit avec un réglage pondéré de moins six décibels, soit une réserve de dynamique, ce qui évite les graves inconvénients d’une saturation numérique imprévue.

4/ Stabilité des sources : dans la réalité, les sources sonores bougent, se réorientent, s’approchent ou s’éloignent quelque peu. Ordinairement, cela ne s’entend pas, car l’appareil auditif (sous-cortex et cortex) se charge de stabiliser le monde qui nous entoure : la « boîte auditive » est comme réencodée dans la « boîte visuelle », de manière à éviter des perceptions différentes par les oreilles et par les yeux. En somme, le monde sonore est stabilisé par les constances perceptives, tant en timbre qu’en niveaux. C’est habituellement au perchman de jouer avec son micro à la « constance de captation », constance qui tente d’imiter avec un seul capteur passif la « constance de perception » habituellement obtenue grâce aux deux oreilles et au cerveau. Que faire alors quand il n’y a plus de perchman, sinon accepter la fluctuation des timbres, des plans sonores et des niveaux ? Où placer alors ses micros ? Il y a plusieurs solutions selon les situations (cf. infra), mais n’espérons pas trop de la directivité des micros, assez limitée et si peu comparable aux zooms optiques 10.

5/ Plan sonore, timbre : en champ semi-réverbérant (local fermé et silencieux), on remarque qu’il existe une « distance critique » dc, soit une distance optimale entre micro et source pour obtenir le plan sonore moyen, c’est-à-dire l’équilibre entre son direct et sons indirects réfléchis par les murs de la salle. Cela se règle à l’oreille en écoutant la prise avec un casque bien isolé des sons extérieurs. Cette distance de est reliée à l’acoustique du lieu mais aussi à l’émission – resserrée ou large – de la source sonore dans l’espace, émission sollicitant – peu ou beaucoup – les résonances de salle. Pour la même raison, la sélectivité spatiale du micro autorise un certain recul de la distance de travail, (cardioïde : dc x 1,7 ; hypercardio : dc x 2 ; semi-canon : dc x 2,5), mais cet éloignement reste encore très relatif. 11

Par ailleurs, la voix émet ses aiguës principalement vers l’avant : on connaît le rôle des consonnes dans l’expression et l’intelligibilité du langage. En conséquence, le micro devrait rester dans la zone où se projettent les aigües de la voix, maintenu à distance constante, quels que soient les mouvements de la tête, quels que soient les déplacements – prévus ou imprévus – des personnages. Pas facile !

6/ La surimpression : plusieurs sources sont mélangeables si l’acoustique qui les enveloppe est compatible et si leur coprésence est vraisemblable : c’est la base du mixage dit « réaliste ». On peut les hiérarchiser (par dosage : balance dynamique ou spectrale), les spatialiser (en largeur et profondeur), les écourter ou allonger, dès lors qu’elles comportent une période durable de sons identiques ou quasi identiques. Le mixage, préparé par le montage-son, naviguera ainsi dans un temps élastique (faussement continu), entre ellipses et surimpressions (soustractions et additions), espace off et espace in (recomposés). Se rappeler que le narratif concentre et intensifie, mais tout autant simplifie, stylise et allège le monde sonore, simulant ainsi les mécanismes de l’écoute focale. (Cependant, on peut considérer aussi bien que tout le cinéma documentaire n’est pas voué au narratif, ni même à l’imitation stricte de l’écoute directe ! Cf. infra « l’écart fait trace »).

7/ L’écran de contrôle : il est prudent d’écouter attentivement le résultat des différents réglages effectués avant de commencer une prise de son – à savoir : l’emplacement des micros, la modulation automatique ou manuelle, l’image auditive obtenue – avec un casque fermé et bien isolé : c’est la seule façon d’entendre le son réellement enregistré. Un petit écouteur intra-auriculaire plus discret permettra de surveiller ensuite la bonne marche de l’enregistrement.

Montage/Mixage/Étalonnage

Après le “scénario” d’enquête (préparation) et le “scénario” de contact (tournage), vient le temps du “scénario” final (montage et mixage)…

1/ Préparer le montage dès la prise de vues : multiplier les axes et les distances, les plans larges et les plans serrés, les changements d’angles et d’aspects ; ne pas oublier les entrées et les sorties de champ ; privilégier les vues de face du visage : les yeux et les lèvres participent à l’intelligibilité. La liste est longue… mais on peut aimer aussi les heurts et les collisions poétiques… ou l’improvisation. Coupes et raccords : visualiser in situ les possibles points d’entrée et de sortie du plan (mouvements des yeux ou de la tête, par exemple) ; éviter aussi le « plan tunnel », sauf cas particulier.

2/ Établir les trois fils conducteurs dans la succession des plans :

  1. la fluidité formelle des raccords visuels et sonores ou au contraire le choc des successions ;
  2. les implications de plan à plan – les chaînes causales – qu’elles soient produites par le mouvement des corps, du visage ou par l’énergie du geste vocal ou par des relations plus souterraines, retardées ou anticipées ;
  3. le discours des points de vue lié à l’enchaînement des plans, que celui-ci paraisse dirigé par les actions et les paroles des personnages ou conduit plus ostensiblement par l’agencement intentionnel du cinéaste.

3/ Montage son : rechercher – en son seul – des objets susceptibles de compléter la scène visuelle, de nourrir l’imagination contextuelle pour toute la séquence, ou de renforcer une action donnée par l’énergie propre du sonore. Enlever les sons superflus ou gênants. Travailler le 1 + 1 = 3 (un son + une image non synchrones déclenchent une signification tierce, une mise en relation inattendue).

4/ Mixage : le réglage potentiométrique est ici à l’ouvrage pour établir une pseudo-continuité narrative – ou discursive – en effaçant les ellipses 12 : le temps est élastique, dès lors qu’il sollicite les représentations mentales. À l’inverse, il peut jouer de la discontinuité pour échafauder un contraste à plusieurs voix, créer un rythme, une émotion. Établir aussi un espace en échelonnant les sources tant dans la profondeur que dans la largeur du champ sonore (in et off). Affirmer ou gommer les transitions de séquence à séquence. Une idée forte n’a pas besoin d’un son fort, un son faible et grenu attire aussi bien l’attention.

Se rappeler qu’il est difficile – voire impossible – d’enlever un son gênant mêlé à la parole (bruits, réverbération excessive, vent) surtout si le son masquant est « large bande » ou « percussif ». Le masquage temporel (son flou ou englué dans la réverbération, micro trop lointain) semble – aux dires des spectateurs – le plus fatiguant.

5/ Étalonnage : de nombreux logiciels permettent de « rattraper » une image à problèmes. Stabilisation des à-coups et des bougés, redressement horizontal, recadrages, rehaussement lumineux ou densification des zones claires, balance des blancs… mais cela se fera parfois au détriment de la définition, des teintes ou des nuances. Le flou se corrige peu, contrairement à la couleur ou à la luminosité. Noter qu’une image hétérogène en éclairage (inégale température de couleur des sources) n’est guère étalonnable. C’est donc à la prise de vues qu’il faut assurer au mieux la qualité et l’homogénéité des rushes.

L’écart fait trace

La réussite d’un cinéma techniquement non-professionnel, ne dispense pas le cinéaste d’une rigueur dans la démarche, quand bien même serait-elle livrée à une apparente improvisation. Il y a confrontation incessante entre le scénario mental imaginé (l’idée motrice et sa projection par le désir) et le scénario en marche révélé jour après jour par le tournage (l’interaction avec les situations et les personnages). Le cinéaste doit se défaire et simultanément se refaire le film, consciemment ou non, en reprenant le processus de connaissances et d’émotions qui l’a conduit au projet, jusqu’à la clôture du montage définitif.

Quels écarts nouveaux découlent des petites caméras numériques ? Il est clair qu’on ne saurait tout filmer et tout enregistrer avec un instrumental réduit au plus simple, instrumental qui montre déjà ses limites dans les situations ordinaires, notamment au niveau du son. Mais qu’en revanche la maniabilité et la discrétion de cet appareillage prédispose à certains types de tournages et de dispositifs : il facilite grandement la relation entre cinéaste et acteurs ou éléments du réel. Avec un matériel plus conséquent, l’équipe prend souvent trop de temps à s’installer – se positionner – ou à partager des considérations techniques qui polluent ou font perdre de précieux instants.

Les erreurs ou les écarts apportés par un tel matériel portatif et discret ne sont donc pas tous inintéressants 13. Le rapprochement entre filmeur et filmés autorise des confidences, des sincérités et des émotions qu’un appareillage plus imposant aurait probablement empêchés. La rapidité de mise en place et la réactivité instantanée du matériel permettent de s’insérer sans délai dans une situation changeante. À cet égard, il me semble utile de rappeler que la vidéo légère (parfois pas si légère !) avait déjà exploré le terrain (voir l’article de Thierry Nouel dans ce même numéro).

Des solutions pour la prise de sons

Il n’y a pas de recette miracle : les solutions techniques découlent des situations acoustiques très variées rencontrées lors d’un tournage : voix criée, voix projetée, voix parlée, voix marmonnée, voix chuchotée ? Masculine ou féminine ? Un ou plusieurs personnages ? Avec ou sans la voix du cinéaste ? Réverbération excessive ou faible, colorée ? Entourage calme ou bruyant, avec percutantes ou éclats de sons, avec bruits passagers ou rumeur continue 14 ? Avec ou sans vent ?

Sans perche ni modulation manuelle

a/ Ambiance très calme, quasi-silencieuse, le cinéaste en tête à tête avec son personnage : deux pistes d’enregistrement à répartir (en dual mono). Un micro-cravate pour le cinéaste sur une piste, le micro hypercardio de la caméra sur l’autre. Attention de ne pas inverser la perspective sonore entre cinéaste et personnage. Ou un micro omnidirectionnel sur la caméra prenant les deux voix (attention encore à la balance acoustique avant-arrière). La distance de travail est à moins de deux mètres – en plein air – voire plus rapprochée encore en champ semi-réverbérant. On utilise de préférence des micros électrostatiques alimentés en « fantôme » (48 V) depuis la caméra.

b/ Ambiance importante dans le grave : la même chose mais en approchant les sources, ce qui veut dire une caméra toute proche, avec en plus filtrage des basses, pour éviter le masquage des voix. Les voix féminines passent mieux, mais la bonne articulation des syllabes est dans tous les cas souhaitable.

c/ Ambiance chargée et envahissante : petits micros cravates miniatures épinglés de part et d’autre (on ne se soucie plus du micro dans le champ). Ou seulement des gros plans avec le micro de la caméra au plus proche.

Avec une perchette (ou un pied de micro)

a/ On approche le micro en limite du cadre, afin d’obtenir la bonne balance entre le son ambiant et la parole enregistrée. La deuxième piste reste utilisable pour les interventions du cinéaste.

b/ On approche un petit enregistreur (avec son micro stéréo XY incorporé) fixé en bout de perchette (attention aux bruits mécaniques et à l’orientation du XY), le réglage devant être effectué avec la télécommande filaire avant et pendant la prise (télécommande fixée en entrée de perchette). Les micros de la caméra restent en fonctionnement automatique, c’est une sécurité, sinon une commodité pour le montage.

Avec réglage de la modulation

a/ Directement sur la caméra (pistes 1 & 2) : régler les indicateurs de niveau sur un passage forte, contrôler le résultat au casque puis au petit écouteur pendant la prise. Modifier le gain si besoin.

b/ Un boitier (à 2 entrées) sous la caméra : prérégler, mais de la même manière surveiller les vu-mètres en cas de sous ou de surmodulation ; étalonner et ajuster le niveau de sortie du boîtier sur l’entrée de la caméra (pistes 1 et 2), soit par exemple le 0 dB du boîtier réglé sur le -6dB de la caméra.

c/ Une mixette à 2 ou 3 entrées : le signal (avec limiteur éventuel) est envoyé vers l’entrée ligne, après calibrage – comme précédemment – des niveaux sortants de la mixette sur les niveaux entrants de la caméra.

d/ Éventuellement un enregistreur multipistes (2, 3 ou 4 entrées) sous ou à côté de la caméra : on enregistre chaque micro (cravate ou autre) isolément sur une piste. On garde néanmoins le son témoin obtenu par la caméra. Ceci nécessite un clap… Certains enregistreurs permettent une prise sécurisée en cas de surcharge : deux des quatre pistes reprennent la même modulation sonore à un niveau inférieur (-3 ou -6 dB) 15.

En stéréo

a/ Placer un micro MS (middle-side) sur la caméra. Ce système prend séparément le son frontal (M, middle) et les sons latéraux (S, sides). Il y aura possibilité, au montage son ou au mixage, de faire varier le plan sonore en dosant respectivement le cardio (ou l’hypercardio) frontal et le bi-directionnel (latéral), selon les besoins de la mise en scène.

b/ Positionner un couple XY ou AB placé sur un pied en avant de la caméra. On y gagne une meilleure lisibilité de l’espace et des sources, mais le dispositif s’interpose, fait écran, avec toutes les conséquences que l’on sait.

c/ Utiliser un enregistreur multipistes en séparant l’ambiance (spatialisée en stéréo) et les voix (recentrées au mixage). Cet appareil facilite la composition sonore et la répartition in/off.

Un autre écart

La recherche spontanée des images ne saurait en effet effacer ou recouvrir la recherche et l’exploration du sonore. Or nous passons la plus grande partie du temps à refouler les sons nombreux qui nous entourent, qui nous gênent même malgré leur distance. Nous nous sommes donc habitués à rétrécir le champ de l’attention auditive sur quelques éléments utiles. Nous écoutons encore, certes, mais qu’écoutons-nous ? Le paysage sonore ? Le monde intérieur de nos pensées et de nos émotions ? Les paroles qui nous intéressent ? Les évènements soudains ? La disqualification du sonore sous le terme générique et péjoratif de « bruit » peut faire oublier la qualité expressive et énergétique de certains sons, autrement dit : la pertinence indicielle, symbolique ou ironique de certaines images auditives.

Peut-être faut-il dresser davantage l’oreille et approcher suffisamment le micro, sans se préoccuper d’enregistrer l’image visuelle qui va avec ! Attraper le timbre, le grain, le profil dynamique de différents objets sonores. Longs ou brefs, intermittents ou continus, épais ou minces, les qualificatifs ne manqueront pas. Les monter, les doser dans leur présence montante ou évanouissante, les rapprocher ou les éloigner sur le fil du temps. La sensibilité auditive se réjouit de ce nouvel assemblage, de cette composition temporelle qui s’écarte à bon escient du réalisme, ou plutôt du « certificat de réalité » qu’ordonne le son factuel du direct. Chaque son off appelle en effet une mise en image polyesthésique, sans forcément imposer une représentation très précise. Le voilà donc plongé – ce spectateur redevenu auditeur du off – dans ses propres souvenirs, au milieu d’images resurgies et d’affects oubliés. Le voilà co-producteur d’un sens nouveau déclenché par le 1 + 1 = 3 (une image + un son off, possiblement synchrone, du moins au niveau de l’idée). Un mouvement d’images mentales et d’émotions passagères accompagne de la sorte en filigrane le mouvement plus défini et plus dirigé des images montrées 16.

S’y ajoute le fait qu’il est plus facile de monter, de resserrer ou d’espacer les sons off, de les faire émerger ou disparaître poco a poco ou subito, de les étager dans la profondeur (lors du montage son et du mixage) sans se soucier d’une synchronisation absolue. Un tel contexte, auditivement composé et pensé, certifié ici ou là par l’image, me paraît enrichir très nettement – au delà du simple effet Koulechov – le « film intérieur » de chaque spectateur.

Pour conclure, le tournage en solo diffère grandement des tournages professionnels en équipe restreinte, quand bien même serait-elle réduite à trois personnes. Il est impossible de faire aussi bien – techniquement parlant – à un qu’à plusieurs ! Mais on le fait autrement :

…abandonner la passion de la maîtrise – qui concerne pareillement les cinéastes de fictions et de documentaires – pour que naissent d’autres possibilités formelles d’expression du réel et que soient valorisés les accidents, la contingence et l’incongruité. 17

Il est vrai que si le cinéaste se sent plus libre de ses mouvements, la concentration mentale, l’attention aux êtres et aux choses, la cascade des décisions à prendre le conduisent parfois à l’épuisement, avec toutes les erreurs et les oublis liés la fatigue.

Par ailleurs, sur le grand plateau du réel, les rapports de force entre cinéaste seul et protagonistes multiples sont susceptibles de changer progressivement ou même de basculer soudainement : cela se voit et cela s’entend notamment dans les questions que les acteurs du réel opposent à celles du cinéaste. D’un autre côté, la petite caméra numérique, si discrète soit-elle, n’est ni une caméra invisible ni une caméra omnisciente. Quoique ! C’est au cinéaste de créer la confiance, de laisser venir « les flagrants délits de sincérité ». Pourtant, donner à voir son image ou ses conditions de vie à un public inconnu modifie sensiblement le comportement humain (on veut apparaître comme ceci ou comme cela ; on craint les qu’en-dira-t-on, on ne veut pas se mettre en danger ; on se montre sous son meilleur angle, on en profite pour régler des comptes, on veut improviser un personnage, etc.) jusqu’à proposer du faux à la place du vrai, un feux repérable comme tel, parce que mal joué, le plus souvent. C’est au documentariste de discerner et de repérer ce qui – le cas échéant – transpire de vérité au travers des omissions, des demi-mensonges ou des inventions. Le visage et la voix livreront d’autant mieux cette vérité particulière que l’enregistrement des images et des sons qui leur correspond aura été maîtrisé.


Bibliographie

  • James Ball, Robie Carman, Matt Gottshalk- Richard Harrington, La Video HD pour les photographes, -Ed Eyrolles, Paris 2010.
  • Lucien Balibar, La Chaîne du son au cinéma et à la télévision, -Ed Dunod, Paris 2015.
  • Vincent Magnier, Guide de la prise de son pour l’image- Ed Dunod, Paris 2011, 2e édition.
  • Henri-François Imbert, Le Dialogue des images – suivi de Le Temps des amoureuses, carnet de travail et dvd du film (83’), Cinergon, 2015.
  • Jean-Luc Godard, « Genèse d’une caméra », Cahiers du Cinéma, n°348-49, 1983 repris dans « Jean-Luc Godard par Jean-Luc Godard », Cahiers du cinéma /Éditions de l’Étoile, 1985.
  • Amanda Robles, Alain Cavalier, filmeur, De l’incidence éditeur, 2008.
  • René Prédal, Le Cinéma à l’heure des petites caméras, éd. Klinsksieck, 2008.
  • José Moure, Gaël Pasquier et Claude Schopp, L’Atelier des cinéastes de la nouvelle vague à nos jours, Klincksieck éditeur, 2012.

  1. Les progrès conjugués de la sensibilité à la lumière (on se souvient des 200 ASA des pellicules 16 mm), de la miniaturisation (on est très loin des « demi-pouces » en bandoulière), de la haute définition (2 000 points par ligne au lieu des 250 obtenus avec les camescopes VHS), de l’enregistrement sur carte-mémoire de grande capacité (exit la cassette d’une heure ?) et conséquemment de la faible consommation d’énergie (batterie au lithium), tout cela a considérablement transformé les conditions pratiques des tournages (par exemple : abondance de rushes et choix des prises reporté sur le montage). En revanche, l’enregistrement sonore n’a guère connu d’avancée majeure (sauf multipistes et micros H.F.).
  2. De même, la gestions des batteries, le transport du matériel, la sauvegarde quotidienne des rushes (en H.264, AVCHD ou Motion JPEG) fait partie des contraintes techniques hors du tournage proprement dit.
  3. Chercher le réel là où il se trouve (hors des représentations déjà établies), cela prend du temps et nécessite parfois beaucoup de courage et d’endurance.
  4. La dualité objectif/subjectif est du reste déjà présente dans la caméra : si l’objectif est tourné vers le champ-objet (d’où il tire son nom), l’oculaire (ou l’écran de visée) est tourné vers l’œil, c’est-à-dire vers un point de vue.
  5. Les conseils techniques qui vont suivre ne se veulent nullement prescriptifs, mais seulement indicatifs…
  6. Rapports coplanaires – perçus ou inaperçus – qui ne seront parfois découverts qu’au visionnement des rushes.
  7. La stabilité concerne aussi la continuité lumière (axe, contraste, niveau), laquelle facilite la mise en séquence des plans lors d’un montage de type narratif. Se protéger également des hautes lumières, peu malléables en post-production.
  8. Regard et écoute focalisent sur le même objet, mais pas toujours… puisqu’on peut dissocier point de regard et point d’écoute ! Mais l’amélioration auditive (sélectivité, intelligibilité) est optimale lorsque l’on regarde la source…
  9. Procédure assez peu pratique en tournage solo, mais pourtant incontournable dans certaines situations scéniques !
  10. Noter qu’un filtrage du grave (en dessous de 80 Hz ou de 120 Hz est parfois nécessaire : soit pour éviter la surcharge de l’ambiance ou de la réverbération dans les basses, soit pour diminuer l’effet de proximité lors de l’utilisation rapprochée de micros directionnels, soit enfin pour atténuer les effets résiduels du vent.
  11. Le facteur de recul fr tient dans un rapport de 1 à 2,5, contrairement au zoom optique, de plus grande extension.
  12. C’est de moins en moins le travail du mixage, mais plutôt celui du montage son, vu la performance des outils actuels. En mixage, on essaie plutôt de raconter en équilibrant ou en éliminant les éléments fournis, déjà calés, nivelés, égalisés, réverbérés au montage).
  13. Le rectangle de l’écran, l’absence de champ périphérique, la vision coplanaire, l’échelle des plans, la profondeur de champ variable, sans être des caractéristiques du champ visuel, sont déjà l’apanage du cinéma standard. Qui s’en offusque ? L’enchaînement des points de vue ne choque plus : le montage cut est-il donc si naturel ? Ce sont justement les différences au perceptif qui ont permis l’invention de ce qui est encore convenu d’appeler le « langage cinéma », avec son expressivité propre.
  14. Tourner le dos au bruit gênant ne suffit pas. Car le bruit se réfléchit éventuellement sur un mur ou une paroi adjacente. Ce bruit sera en outre compacté par le haut-parleur lors de la restitution, et comme tel indémêlable. Si certains micros sont quelque peu directionnels, a contrario les sources bruyantes sont très souvent omnidirectionnelles, surtout dans les basses.
  15. Capter des dialogues et non des monologues, c’est capter la vie, c’est reflèter les états internes, y compris ceux du cinéaste (voix off, émotions de la parole directe). Le dispositif se complique, évidemment, surtout si l’on utilise des micros à liaison h.f : il faut savoir les poser discrètement et efficacement, notamment pour éviter les frottements de contact.
  16. Relire à ce propos le numéro 21 de La Revue Documentaires (« Le Son documenté »), et en particulier, l’importante contribution de Daniel Deshays.
  17. Voir, l’article de Juliette Goursat sur l’école de Boston, dans ce même numéro.

Publiée dans La Revue Documentaires n°26-27 – Filmer seul-e (page 341, 2e trimestre 2016)
Disponible sur Cairn.info (https://doi.org/10.3917/docu.026.0341, accès libre)