Philosophie PTS

Savoir scientifique de base

email Facebook Twitter
Màj : 6 mai 2022   –   # pages : 233 [?]
Ce document est assez volumineux. Veuillez patienter quelques secondes.

Introduction

https://philosophie.jortay.net/savoir-scientifique-base#intro
 1.1. Culture générale scientifique
 1.2. Symboles scientifiques
 1.3. Notation et calculs de fractions

Culture générale scientifique

https://philosophie.jortay.net/savoir-scientifique-base#culture-generale-scientifique
savoir-scientifique-base.png
Quoi

Le présent document a pour objectif de permettre à quiconque d'apprendre ou revoir l'essentiel de la matière scientifique supposée connue à la fin des études secondaires (orientation sciences) : mathématique, physique, chimie et biologie.

Il intéressera donc particulièrement les personnes souhaitant :

  • se préparer à des études supérieures scientifiques ;
  • se doter d'une solide culture scientifique ;
  • développer ou entretenir leurs capacités intellectuelles.

Clipedia PDF

Comment

Pour ce faire, la présente publication présente des synthèses écrites (et illustrées) des exceptionnelles vidéos de clipedia.be, réalisées par une équipe dirigée par Marc Haelterman, professeur à l'École polytechnique de l'Université libre de Bruxelles.

  • Je suis seul responsable des éventuelles erreurs que contiendraient ces synthèses. D'autre part j'ajoute parfois des réflexions ou éléments personnels, que j'identifie par "N.d.A".
  • Clipedia est un travail en cours : toute la matière scientifique supposée connue à la fin des études secondaires (option sciences) n'est pas encore intégralement couverte. C'est donc également le cas de la présente publication.
Intuition

Les vidéos de clipedia.be privilégient l'approche pratique et intuitive, plutôt que la rigueur mathématique pure : c'est ce qu'on appelle de façon imagée "faire des maths avec les mains".

Syllabus

Vidéos et synthèses écrites sont idéalement complémentaires, les synthèses facilitant notamment la révision et l'approfondissement des vidéos. Mais la présente publication ajoute une autre plus-value : la matière est présentée de façon structurée, au moyen d'un sommaire numéroté, composé de chapitres, sections et sous-sections. En outre les équations sont numérotées (en rouge) et peuvent être ainsi référencées par lien hypertexte (en bleu) à d'autres endroits du document.

  • Cette présentation de la matière, dite "en table" (classement "logico-historique"), est complémentaire à la présentation sur le site de Clipédia (classement alphabétique), qui correspond plutôt à une approche "en graphe" (réseau nodal).
  • En début de chaque section du présent document est mentionnée la vidéo correspondante (lien hypertexte renvoyant vers la video sur clipedia.be). Ainsi il est possible de retrouver le résumé écrit d'une vidéo à partir de son titre : CTRL+F (Mac : commande+F) ⇒ "Titre de la vidéo".

Symboles scientifiques

https://philosophie.jortay.net/savoir-scientifique-base#symboles

Le lecteur trouvera dans les liens suivants la signification des symboles et lettres utilisés en sciences :

Affichage

Concernant l'affichage des symboles mathématiques (problématique illustrée en profondeur dans la section suivante, consacrée aux fractions) j'ai choisi la voie présentant à mon avis le meileur arbitrage entre simplicité et portabilité : la combinaison opérateurs mathématiques UTF-8 + CSS, plutôt que les balises MathML.

Notation et calculs de fractions

https://philosophie.jortay.net/savoir-scientifique-base#fractions
calculatrice.jpg

Dans la présente publication nous utilisons le signe " / " pour représenter l'opérateur de division (exemple : 12 / 3 = 4). Comme vous pouvez le constater, il diffère de celui de l'écriture manuscrite : le dénominateur se situe à droite du numérateur plutôt qu'en dessous, et il n'y a qu'une seule longueur possible pour ce signe de division. La notation manuscrite semble à priori plus intuitive, mais est pourtant à l'origine de fréquentes erreurs de calcul chez les étudiants. D'autre part, la notation " / " étant celle des machines à calculer, il est nécessaire de parfaitement la maîtriser...

Il se fait que Clipedia a réalisé une série de vidéos sur le calcul des fractions. Cette série constitue donc une parfaite entrée en matière ... que nous introduisons par les remarques suivantes.

2 / 2 / 2 =
( 2 / 2 ) / 2 =
1 / 2 =
0,5
Mais :
2 / 2 / 2 ≠
2 / ( 2 / 2 ) =
2 / 1 =
2

N.B. Les parenthèses ne sont pas nécessaire dans le premier cas, mais bien dans le second (pour indiquer que le troisième deux est au dénominateur du second).

Alors que ce problème ne se pose pas pour la multiplication :
2 * 2 * 2 = ( 2 * 2 ) * 2 = 4 * 2 = 8
2 * 2 * 2 = 2 * ( 2 * 2 ) = 2 * 4 = 8

La raison en est que le produit est commutatif, alors que la division ne l'est pas :
4 / 2 = 2
2 / 4 = 0,5

Règle : on lit de gauche à droite, et on ne met des parenthèses que dans deux conditions :

  • c'est absolument nécessaire (exemple : ( a + b ) / c ... alors que la notation manuscrite avec barre de division horizontale permet de se passer des parenthèses) ;
  • c'est éventuellement utile, pour faciliter la lecture d'une formule complexe.

Quelques développements directs pour s'habituer :

a / b * c =
a * c / b

a / b / c =
a / ( b * c )

N.B. Les parenthèse sont ici nécessaires, pour indiquer que "c" est, comme b, au dénominateur de "a".

a * b / c / a =
b / c

Des difficultés pour comprendre ces égalités ? Alors la présente section est faite pour vous...

Pour ne pas commettre les erreurs illustrées dans les vidéos, il importe de bien comprendre ce qu'est une fraction. Pour ce faire, deux approches sont possibles : intuitive et mathématique.

Soit :
N : numérateur
D : dénominateur
Q : quotient
c-à-d :
N / D = Q

Interprétation
intuitive

« Le quotient (Q) est le nombre de fois que ne dénominateur (D) rentre dans le numérateur (N) ».

Démonstration :
N / D = Q  
N = Q * D

On notera que, de même, D est le nombre de fois que Q rentre dans N.

Exemple non littéral :
1 / 1 / 2 = 2
car :
2 est le nombre de fois que ( 1 / 2 ) rentre dans 1

Interprétation
mathématique

« Diviser c'est multiplier par l'inverse » : a / b ≡ a * 1 / b. C'est un fait évident, et qu'il est utile de se rappeler pour faire apparaître comme une évidence la résolution de la division précédente par 1/2 : 1 / ( 1 / 2 ) = 1 * 2 (2 est bien l'inverse de 1/2) :

Démonstrations :
a / b =
a * 1 / b / ( b * 1 / b )
or par définition de l'inverse : b * 1 / b = 1  ⇒
a * 1 / b

Exemple non littéral :
1 / ( 1 / 2 ) =
2 * 1 / 2 * ( 1 / 2 ) =
2 / 1 =
2

Nous pouvons ainsi démontrer les trois exemples présentés à la fin de l'introduction de la présente section :

a / b * c =
a * ( 1 / b ) * c =
a * c * ( 1 / b ) =
a * c / b

N.B. Les parenthèse ne sont marquées que pour clarifier : elles ne sont pas ici nécessaires.

a / b / c =
a * 1 / b * 1 / c =
a * 1 / ( b * c ) =
a / ( b * c )

N.B. Les parenthèse sont ici nécessaires, pour indiquer que "c" est au dénominateur de "a".

a * b / c / a =
a * b * 1 / c * 1 / a =
a * b * 1 / ( c * a ) =
a * b / ( c * a ) =
b / c

On notera que les deux derniers exemples opèrent une simplification par réduction du nombre de divisions.

Développement d'une égalité

Lorsqu'on développe une égalité il faut toujours veiller à ce que celle-ci soit respectée, ce qui peut requérir qu'une opération effectuée d'un côté le soit également de l'autre. D'autre part il importe d'être attentif lorsque l'on opère des simplifications.

Exemple : a + b * c = d
Supposons que cette égalité fait partie d'une démonstration, et que dans celle-ci on veut :
  • faire passer a à droite pour y obtenir d-a, le développement complet est alors :
    a + b * c - a = d - a    
    b * c = d - a
  • faire passer c à droite pour y obtenir d/c, le développement complet est alors :
    ( a + b * c ) / c = d / c    
    a / c + b * c / c = d / c    
    a / c + b = d / c

Technique. On notera l'application fréquente de la technique consistant en de doubles multiplications :

  • dans les deux membres une égalité ;
  • au numérateur et dénominateur dans un même membre.

Cette technique de multiplications permet notamment de démontrer que a / b = c a = c * b :
a / b = c  
a / b * b = c * b  
a = c * b

Et aussi démonstration en sens inverse, en divisant cette fois par b c-à-d en multipliant par ... l'inverse de b :
a = c * b  
a / b = c * b / b  
a / b = c

Addition
de fractions

Cette même technique de multiplications est appliquée dans l'addition de fractions, qui requiert d'amener celles-ci à un même dénominateur commun, afin d'additionner "des pommes avec des pommes" :

a / b + c / d =
a * d / ( b * d ) + c * b / ( d * b ) =
( a * d + c * b ) / ( d * b )

Complétons la démonstration en démontrant le passage entre la seconde et la troisième ligne c-à-d que x / y + z / y = ( x + z ) / y :
x / y + z / y =
x * 1 / y + z * 1 / y =
( x + z ) * 1 / y =
( x + z ) / y

De même vous comprenez que :
( a + b ) / b ≠ a
( a + b ) / b ≠ a + 1
car vous comprenez que :
( a + b ) / b =
a / b + b / b =
a / b + 1

L'égalité erronée illustrée dans la première vidéo :
a / b + c / d ≠ ( a + c ) / ( b + d )
résulte du fait que sont additionnés "des pommes avec des poires". Il y a confusion entre somme de fractions et combinaison de proportions. Or, contrairement à la fraction, une proportion n'est pas un nombre.

N.d.A. Soulignons la signification de la nomenclature "numérateur vs dénominateur", qui accorde au second terme une valeur de nature et au premier une simple valeur d'état ("3/4 est un quart à l'état trois"). Cette hiérarchie prend toute sa signification dans la notion de "dénominateur commun".

Fraction
de fraction

Pour interpréter correctement une fraction de fractions il importe de percevoir correctement la hiérarchie des barres de division, qui en écriture manuscrite est déterminée par leur longueur, et dans la présente notation (/) est déterminée au moyen de parenthèses (lorsque nécessaire).

Dès lors qu'une fraction de fractions est correctement interprétée on peut alors la simplifier, en réduisant le nombre de fractions grâce à la propriété évoquées dans les deux vidéos précédentes : « diviser, c'est équivalent à multiplier par l'inverse du dénominateur ». Ainsi diviser par a par b/c, c'est multiplier a par l'inverse de b/c, c-à-d multiplier par c/b :
a / ( b / c ) =
a * ( c / b ) =
a * c / b

On notera également que diviser une première fois par deux (donc multiplier par 1/2), et puis une seconde fois par trois (donc multiplier ensuite par 1/3), cela est équivalent à diviser par 2x3 (c-à-d multiplier par 1/6) :
1 / 2 / 3 =
1 * 1 / 2 * 1 / 3 =
1 * 1 / ( 2 * 3 ) =
1 / ( 2 * 3 ) =
1 / 6

Fraction
négative

Que vaut 3 / ( - 2 ) = ?. La réponse est certes évidente, mais il est frappant de constater que l'interprétation intuitive exposée supra n'est ici plus du tout intuitive : la valeur cherchée ("?") est le nombre de fois qu'un nombre ...négatif rentre dans un nombre positif ...

Cependant la voie mathématique permet de démontrer la réponse. En l'occurrence il s'agit de multiplier par -1 aux numérateur et dénominateur :
3 / ( - 2 ) =
( - 1 ) * 3 / [ ( - 1 ) * ( - 2 ) ] =
- 3 / 2

Voilà, vous êtes maintenant armée pour entrer dans le vif du sujet. Commençons par les fondations : la mesure.

Mesure

https://philosophie.jortay.net/savoir-scientifique-base#mesure

La mesure des phénomènes étudiés est le premier pas de la démarche scientifique.

 2.1. Unités de mesures
 2.2. Puissance et exposant
 2.3. Logarithme
 2.4. Numération de position

Unités de mesures

https://philosophie.jortay.net/savoir-scientifique-base#unites-mesure
triangle-clipedia.png Vidéo Clipedia : Changements d'unités

Entrons maintenant dans le vif du sujet. Un fait souvent oublié est que les notations d'unité peuvent être traitées comme des nombres.

Surfaces

Ainsi pour l'unité de surface (x*y) en mètres (m) :
S = x m * y m = x * y m m = x * y m2

N.B. On ne place pas le signe de multiplication avant l'indicateur d'unité, ce signe est donc implicite.

Supposons maintenant qu'on veuille calculer le nombre N de briques de surface latérale de 75 cm2 nécessaire pour construire un mur de 3 m2 :
N = 3 m2 / ( 75 cm2 ) =
3 m m / ( 75 cm2 ) =
3 * 100 cm * 100 cm / ( 75 cm2 ) =
3 * 10.000 cm cm / ( 75 cm2 ) =
3 * 10.000 cm2 / ( 75 cm2 ) =
NB : les unités de mesure au numérateur et dénominateur s'annulent comme des nombres :
30.000 / 75 = 400
NB : ce nombre de brique est dit "sans dimension" : aucune unité de mesure ne lui est associée.

N.d.A. Autre exemple : 1 µm2 = 1 µ2 m2 = (10-6)2 m2 = 10-12 m2

Vitesse

Passons maintenant aux unités composées. Quelle est la vitesse moyenne en km/h atteinte par le recordman du monde du 100 mètres (9s58, Usain Bolt, 2009) ?

v = 100 m / 9,58 s
or 1 km = 1000 m ⇔ 1 m = 1 / 1000 km
et 1 h = 60 m = 60 * 60 s = 3600 s ⇔ 1 s = 1 / 3600 h

v = 100 * 1 / 1000 km / ( 9,58 * 1 / 3600 h )    ⇔
v = 100 / 1000 / 9,58 * 3600 km/h = 37,6 km/h

N.B. Il s'agit là de la vitesse moyenne. Or la vitesse de départ est de zéro ⇒ il y a une accélération conduisant à une vitesse maximale vers la fin de course. Cette vitesse de pointe atteinte par Bolt fut d'environ 45 km/h (PS : l'antilope et le guépard peuvent atteindre une vitesse de pointe d'environ 95 km/h : source).

Température

Le passage des mesures de température entre degrés Celsius et Fahrenheit se fait selon l'équation T C = ( T F - 32 ) / 1,8.

triangle-clipedia.png Vidéo Clipedia : Le radian
radian.png

Angles

Radian. Par définition α = a radians ⇔ arc(α) = a * R (en unités de longueur de R) .

En particulier α = 1 radian ⇔ arc(α) = R : exprimer l'angle α en radians (rad) c'est donc l'exprimer par rapport à une unité correspondant à une longueur d'arc égale au rayon R.

Degré. Le degré est défini par rapport au radian et au nombre π ("Pi"). Soit C la circonférence d'un cercle de rayon R :
π = C / R / 2     ⇔
C = 2 * π * R
or par définition :
360 deg = C / R  rad    ⇒
360 deg = 2 * π  rad    ⇔
deg = π / 180  rad    ⇔
1  rad = 180 / π  deg ≈    ⇔
1  rad = 180 / 3,1416  deg = 57,3 °

Le tableau suivant résume les développements ci-dessus sous forme de règles de trois.

RADARCDEG
θθ * R?
2 * π2 * π * R360
1R360 / ( 2 * π )
1R=1180 / π ≈ 180 / 3,1416 = 57,3

Un intérêt du radian, en liant toute grandeur d'angle à une longueur d'arc correspondante (pour un R déterminé *), est de faciliter la mesure des angles : on mesure la longueur de l'arc ⇒ on en déduit la taille de l'angle en degrés (alors que pour mesurer directement en degré il faut utiliser un rapporteur).

(*) Mais dans le cercle trigonométrique on suppose toujours R=1

Puissance et exposant

https://philosophie.jortay.net/savoir-scientifique-base#puissance-exposant

L'expression a2 se lit "a exposant 2" ou encore "a puissance 2". Mais elle se lit aussi "a carré" car a2 est la surface d'un carré de côté de longueur a. De même a3 se lit "a exposant 3" ou encore "a puissance 3". Mais elle se lit aussi "a cube" car a3 est la surface d'un cube d'arrête a.

La notion de puissance est illustrée dans nombre d'applications du monde physique :

  • au 19° siècle Ludwig Boltzmann a démontré que tout corps chauffé émet de la lumière dont l'intensité est proportionnelle à la puissance quatre de sa température : I = c * T 4 exprimant ainsi une forte sensibilité de l'intensité lumineuse par rapport à la température du corps : quand on double la température l'intensité est multipliée par 24=16.
  • au 17° siècle Isaac Newton a montré que la lune est attirée par la Terre par une force (dite "gravitationnelle") proportionnelle à l'inverse du carré de la distance séparant les deux astres : F = C / d 2 : si cette distance doublait cette force diminuerait d'un facteur 1/22=1/4.
  • la notation exponentielle (ou "scientifique") permet également d'exprimer simplement des grandeurs très élevées, telles que la vitesse de la lumière :
    c = 300.000.000 m/s    ⇔
    c = 3 * 100.000.000 m/s    ⇔
    c = 3 * 108 m/s

Par définition de l'exposant :
a pi = π pi a

Règles de calcul :

  • produit de puissances :
    π n ( a pi ) = a n pi
    Exemple : ( a u * a v ) = a u+v
    Démonstration :
    π n ( a pi ) =
    π n ( π pi a ) =
    π p1 a * ... * π pn a =
    a n pi
    CQFD
    P.S. On peut alors démontrer que a 0 = 1 (sauf si a=0, dans lequel cas il y a indétermination) :
    a m * a 0 = a (m+0)    ⇔
    a m * a 0 = a m    ⇔
    a 0 = 1
    CQFD
  • puissance de produit :
    ( π a ) n = π ( a n )
    Exemple : ( x * y ) n = x n * y n
    Démonstration :
    ( π a ) n =
    par définition de l'exposant
    π n ( π a ) =
    par commutativité du produit
    π ( π n  a ) =
    π ( a n )
    CQFD
  • puissance de puissance :
    ( a m ) n = a m * n
    Démonstration :
    ( a m ) n =
    π n ( a m ) =
    par n_produit-de-puissances :
    a n m =
    a m * n
    CQFD
  • quotient de puissance :
    a m / a n = a m - n
    Démonstration :
    a m / a n =
    π m ( a ) / π n ( a ) =
    π m-n ( a ) =
    a m - n
    CQFD
    Ce qui permet d'introduire la notion d'exposant négatif en posant m=0 dans n_quotient-de-puissance :
    a 0 / a n = a 0 - n    ⇒
    par n_exposant-zero :
    1 / a n = a - n qui est donc la définition de a - n.

Logarithme

https://philosophie.jortay.net/savoir-scientifique-base#logarithme
triangle-clipedia.png Vidéo Clipedia : Les logarithmes : introduction
Définition

Soit la fonction exponentielle y (x) = b x ou b est appelé "base de la fonction exponentielle", on appelle alors "fonction logarithmique en base b" la fonction logb (y) = x. La définition du logarithme est donc (en simplifiant y (x) par y) :
y = b x   ⇔   logb (y) = x

  • L'opération de gauche à droite est appelée "passage au logarithme".
  • Par convention lorsque b=10 on ne mentionne pas la base : log x = log10 x

Autrement dit (en lisant l'équivalence de droite à gauche) : le logarithme en base b (logb) d'un nombre y est la puissance en base b qui donne ce nombre y.

Fonctions réciproques. Les fonctions logarithme log(x) et exponentielle exp(x) sont réciproques, c-à-d que log( exp(x) )= exp( log(x) ) = x : (7)

  • exp( log(x) ) = x : en substituant la valeur de x du membre de droite de l'équivalence n_log-def-longue dans le membre de gauche ⇒ y = b logb (y) ;
  • log( exp(x) ) = x : en substituant la valeur de y du membre de gauche de l'équivalence n_log-def-longue dans le membre de droite ⇒ logb ( b x ) = x.
Applications

Nous allons maintenant montrer l'utilité du logarithme pour (i) rendre possible la comparaison de mesures d'ordres de grandeurs très différentes ; (ii) faciliter le calcul du produit de grand nombres ; (iii) mesurer la perception auditive.

Ordre de grandeurs. Dans l'échelle de mesure suivante, dont l'unité est le mètre, on peut comparer un humain et un cétacé, mais on ne peut distinguer les corps d'ordres de grandeur inférieurs au mètre, ni mesurer ceux d'un ordre de grandeur dépassant la largeur de l'écran (ici un séquoia).

echelle-non-log.png

Pour résoudre ce problème il suffit de passer à la notation scientifique (ou notation exponentielle) des ordres de grandeur :

virus~ 0,1 µm10- 7 m
bactérie~10 µm10- 5 m
fourmi~ 1 mm10-3 m
souris~ 1 cm10-2 m
humain~ 1 m100 m
cétacé~ 10 m101 m
séquia~ 100 m102 m

Il suffit alors de passer au exposant pour obtenir l'échelle dite "logarithmique", qui est telle que 10 - (n-1) / 10 - n = 10 (rapport constant), alors que l'échelle précédente correspond à un rapport n / n - 1 (le rapport tend vers 1 lorsque n augmente).

echelle-log.png

Cette échelle fait bien appel à la notion de log. Ainsi prenons le cas de la fourmi : log(1mm)=log(0,001m)=-3 car 0,01=10-3.

Simplification de calculs. La notion de logarithme a été développée au 17° siècle par John Napier pour faciliter les calculs impliquant des grands nombres (exemple : 3.5478.341 * 6.148.632). Cette technique de simplification exploite la propriété π n ( a ei ) = a n ei n_produit-de-puissances :

Soit 3.5478.341 = A et 6.148.632 = B    ⇒ par n_produit-de-puissances :
log ( A * B ) = log (A) + log (B)    ⇒
pour calculer A * B il suffit de :
1. chercher log(A) et log (B) dans la table des logarithmes
2. calculer log (A) + log (B)     ⇒ on connaît log ( A * B )     ⇒
3. chercher log ( A * B ) dans la table de logarithmes
4. on trouve A * B à la même ligne de la colonne adjacente.
CQFT

triangle-clipedia.png Vidéo Clipedia : Le logarithme et l’audition

Perception auditive. L'échelle logarithmique correspond à divers phénomènes naturels tels que l'audition. L'oreille humaine moyenne peut percevoir des intensités sonores comprises entre 10-12 W/m2 (noté I0 et appelé "seuil d'audibilité) et 1 W/m2 (appelé "seuil de dommage" : au-delà l'intensité commence à provoquer des lésions).

Mais l'intensité perçue par l'oreille humaine ne répond pas à la même dynamique que l'intensité mesurée par un appareil de mesure (microphone + sonomètre). Ainsi le graphique suivant montre que si la puissance de la source sonore est doublée la perception de cette variation par l'oreille est inférieure à ce facteur 2, et en outre cet effet d'amortissement (ou plutôt de saturation) augmente avec le niveau de puissance de la source. Le graphique suivant exprime cela de façon inverse : pour doubler la perception d'un son par l'oreille humaine il faut multiplier la source par un facteur croissant. Il apparaît que cette croissance est exponentielle : pour augmenter la perception de n à 2n la source doit augmenter de 10n (exemple : pour que la perception passe de 4 à 8 la source doit augmenter de 104.

echelle-sonore.png

Le zéro est placé à I0 et l'unité est fixée arbitrairement à 10 * I0.

On peut alors concevoir une unité sonore spécifique à l'oreille humaine pour obtenir une échelle mesurant l'intensité perçue par l'oreille humaine. Pour ce faire on opère en deux phases :

  1. Dans la seconde règle du graphique ci-dessous on exprime l'intensité sonore I en x unités du seuil d'audibilité I0 : I = x * I0 = x * 10-12 W/m2 :
    echelle-auditive.png

    Notez les unités différentes (à droite en vert).

  2. Dans ces conditions y = log x traduit le fait que l'intensité sonore perçue (y) répond de façon logarithmique à l'intensité sonore mesurée (x). L'unité de y est appelée "bel" (en hommage à Graham Bell), mais en pratique on utilise plutôt le dB : y = 10 log x [dB].

    echelle-auditive-dB.png

Comparons les intensités sonore de la voiture (V) et de la moto (M) :
40 = 10 (log xV)
80 = 10 (log xM)


xV = 10 4
xM = 10 8

⇒ par n_quotient-de-puissance :
xM / xV = 10 4
Interprétation : alors que la puissance sonore mesurée du moteur de moto est 10.000 fois supérieur à celle de la voiture nous ne percevons qu'une différence par un facteur 80/40=2 (PS : quant à la différence, perçue ou mesurée, entre voiture et moto, c'est grâce à la longueur plus grande de son pot d'échappement que la voiture amortit mieux la pression acoustique émise par les pistons du moteur à explosion).

triangle-clipedia.png Vidéo Clipedia : La fonction logarithme
Propriétés

Si dans l'équivalence y = b x   ⇔   logb (y) = x n_log-def-longue on substitue la valeur de y du membre de gauche de dans le membre de droite, on obtient que :
logb b x = x
c-à-d que le logarithme de l'exponentielle, c'est la fonction identité.

Et si dans cette même équivalence y = b x   ⇔   logb (y) = x n_log-def-longue on applique la fonction exponentielle à l'égalité de droite, alors on en déduit, par comparaison avec l'égalité de gauche, que :
b logb y = y
c-à-d que l'exponentielle du logarithme, c'est aussi la fonction identité.

Logarithme et exponentielle sont donc des fonctions réciproques.

graphe-exp-log.jpg

On obtient le graphe de la fonction log à partir de la fonction exp par deux rotations : 90° à sens horaire, puis 180° de bas en haut.

Les nombres négatifs ne font pas partie du domaine de la fonction log (exemple : -3 = 10 ?).

Quelques valeurs remarquables :
logb 0 = - ∞car0 = b - ∞
logb 1 = 0car1 = b 0
logb ∞ = car∞ = b

Règles de calcul :

  • logarithme d'un produit :
    En remplaçant pi par logb(pi) dans π n b pi = b n pi n_produit-de-puissances    ⇒
    π n b logb pi = b n logb pi    ⇒ par n_exp-de-log :
    π n pi = b n logb pi    ⇔
    log π n pi = log ( b n logb pi )    ⇔ par n_exp-log-reciproques :
    logb π n pi = ∑ n logb pi
  • logarithme d'une puissance :
    en remplaçant m par logba dans ( b m ) n = b m * n n_puissance-de-puissance     ⇒
    ( b logb a ) n = b n * logb a     ⇔
    a n = b n * logb a     ⇔
    logb a n = n * logb a
  • logarithme d'un quotient :
    en remplaçant m par logbm et n par logbn dans a m / a n = a m - n n_quotient-de-puissance     ⇒
    a logb m / a logb n = a logb m - logb n    ⇔
    m / n = a logb m - logb n    ⇔
    log ( m / n ) = logb m - logb n
  • Soit
    x = a loga x     ⇒
    b = a loga b
    substitué dans :
    x = b logb x     ⇒
    x = ( a loga b ) logb x     ⇔
    x = a loga b * logb x     ⇒
    égalité entre les membres de droite des 1° et 5° égalités ⇒
    loga x = loga b * logb x
    En particulier si x=a ⇒
    loga a = loga b * logb a
    1 = loga b * logb a     ⇔
    loga b = 1 / logb a

Enfin on notera que dans la pratique ce sont essentiellement trois bases qui sont utilisées : 10, 2 (notamment en informatique) et e=2,718281... (où loge est noté ln et appelé logarithme népérien en honneur à John Napier).

Numération de position

https://philosophie.jortay.net/savoir-scientifique-base#numeration-de-position
triangle-clipedia.png Vidéo Clipedia : Numération de position

La vidéo reproduit de manière fictive la mise au point d'une technique de comptabilité ("compter et enregistrer le résultat par une écriture") d'un cheptel de moutons, cela à une époque (4° millénaire av. J.C.) où l'écriture, qui venait à peine d'être inventée, se faisait sur des tablettes d'argile. Ce type d'enregistrement peut également servir dans le cas de contrats de vente.

tablette.jpg

Marquer sur la tablette un trait par mouton constitue un système de comptabilité assez primaire. N'étant fondé sur un vocabulaire composé que d'un seul symbole, il n'est pratique que pour un nombre limité de moutons/traits, au delà duquel la quantité écrite ne peut plus être lue par le cerveau humain mais doit être comptée (N.d.A : la limite se situant disons autour de six). Le seul véritable progrès à ce stade est que le comptage des moutons ne doit plus être fait en présence du cheptel, grâce cet l'enregistrement (pour autant que celui-ci soit à jour et sans erreur).

main-arbre.jpg

La "main arbre" est un figure fractale.

Pour améliorer ce système on va utiliser un outil de comptage portatif, en l'occurrence la main, dont les cinq doigts vont constituer un référentiel. Cette main, ou plutôt le nombre de doigts qui la constituent, vont être représentés par le signe |||| : une forme ancienne de notre chiffre 5 vient d'être ainsi inventée !

N.d.A. : |||| devient la représentation écrite de la quantité que représentent les doigts de la main, et peut donc être qualifiée de "chiffrement par regroupement".

tablette-2.jpg

Cette technique de comptabilité est clairement plus efficace : si par exemple l'information de quantité que le cerveau pouvait enregistrer en une fois (c-à-d lire sans compter) était de six avec la technique du trait unique, cette limite est désormais repoussée à 5*6=30 (quantité correspondant au nombre de doigts de six mains).

Cependant le nombre de paquets de cinq ne correspond pas nécessairement au nombre de moutons ⇔ il faut pouvoir également comptabiliser d'éventuelles unités restantes en nombre inférieur à celui d'un paquet.

tablette-3.jpg

Pour ce faire, on va marquer sur la plaque d'argile un long trait pour séparer l'écriture des paquets (à gauche) et des unités (à droite), de sorte qu'à gauche un paquet va pouvoir être représenté non plus par |||| mais par une "unité de cinq", et donc par un trait unique (cf. la "main arbre" supra). NB : cette innovation introduit donc la notion de position dans l'écriture de quantités, c-à-d dans la numération ⇒ le titre de la vidéo : "Numération de position".

tablette-4.jpg

Ainsi l'on repousse à nouveau la limite de lecture-vs-calcul, cette fois de 5*6=30 à 5*30=150 ! En effet, à gauche un paquet n'est pas un paquet d'unités mais un paquet de paquets : à gauche, |||| est l'équivalent de |||| |||| |||| |||| |||| à droite.

En outre ce principe de position peut être reproduit à une troisième colonne (cf. principe fractale de la "main arbre" supra).

tablette-5.jpg

Dans notre système de comptabilisation, désormais composé de trois positions et deux caractères (| et ||||), les unités de la colonne de gauche représentent 25 unités de la première colonne, tandis que la colonne centrale représente 5 unités de la première colonne. Par conséquent 27 moutons ne doivent plus être représentés par 27 traits, mais par seulement trois : un dans la troisième colonne et deux dans la première.

Visualisation intuitive : un trait de la colonne de gauche représente le nombre de doigts de la "main arbre" supra

tablette-contrat.jpg

NB : le nombre de traits dans une colonne sera toujours ≤4, car dès que l'on dépasse quatre on passe à la colonne suivante (vers la gauche). Et c'est évidemment dans cette limitation à quatre traits que réside la facilité de lecture. Ainsi la tablette ci-contre (fictive) acte un contrat passé entre Xavier et Thorgan, qui ont convenu d'échanger neuf moutons contre cinquante trois poulets.

Ce système de numération peut cependant être encore amélioré. On voudrait notamment trouver un moyen de supprimer les traits de séparation. Pour ce faire, sans semer la confusion, il suffit de deux opérations :

  1. remplacer les traits d'unité verticaux par des traits obliques enchaînés, de sorte de /\ représente deux unités, \/\ représente trois unités, et \/\/ représente quatre unités ;
  2. remplacer la représentation d'un colonne vide || par le signe 0.

Ainsi ll||lll s'écrira désormais /\0\/\ pour représenter notre 53 (NB : dans les trois cas on a bien 50+0+3).

Notre système de numération est désormais composé de cinq symboles : 0, |, /\, \/\, \/\/. NB : malgré que la main fut notre référence initiale, il n'est pas étrange qu'il n'existe pas de symbole de base pour le nombre cinq, car lorsque l'on dépasse quatre, c-à-d dès que l'on atteint cinq, on change de position : ainsi "cinq" s'écrit l0. Ce nombre qui détermine le passage à une position (colonne) supérieure, et qui est également le nombre de symbole du système, s'appelle la base du système de numération (nous sommes donc ici dans un système de base 5).

On peut en effet concevoir une infinité de systèmes de numération de position, chacun déterminé par sa base ! Ainsi nous allons voir que :
• la représentation du nombre cinq en base 10 (soit 5) s'écrit (l0) en base 5 ;
• le nombre dix en base 5 s'écrit /\0.

N.d.A. Par convention, la base utilisée pour mentionner l'ordre d'une base est la base d'ordre 10.

Notre système de numérotation (0,1,2,3,4,5,6,7,8,9) étant composé de dix symboles, nombre qui constitue le passage à une position supérieure, est donc de base 10. Ce système serait né en Inde, dont les perspicaces savants avaient remarqué que nous avions deux mains. Ainsi dans le système de notation avec les seuls traits verticaux, mais en base 10, le nombre vingt-quatre s'écrit ll|llll ⇒ dans notre écriture fictive /\ \/\/ ⇒ dans notre écriture arabe 24.

La dernière ligne du tableau suivant montre que lorsqu'on travaille avec diverses bases, on éviterait de possibles confusions si l'on utilisait des symboles spécifiques pour chaque base. Mais il faudrait pour cela connaître autant de séries de symboles qu'il y de bases différentes ...

Base 5Base 10
| lll | llll | lll
0 l /\ \/\ \/\//\ \/\l \/\
0 1 2 3 4 5 6 7 8 92313

La dernière base apparue est la base 2, qui est particulièrement adaptée au mode de fonctionnement des appareils électroniques (dont les ordinateurs), où l'absence de courant est associé au symbole 0, et la présence d'un courant au symbole I.

Base 2Base 5Base 10
| l l | l | | l | l l | | ll ll | lllllll
0 111011
0 1 2 3 4102
0 1 2 3 4 5 6 7 8 927

N.d.A. Voici deux exemples illustrant la méthode de conversion d'un nombre en base 10 vers une autre base, ainsi que la méthode de conversion inverse.

185(base7) = 353 :
73 = 343 > 185
72 = 49 ⇒ ENT( 185 / 49 ) = 3
71 = 7 ⇒ ENT( MOD( 185 , 49 ) / 7 ) = 5
70 = 1 ⇒ ENT( MOD( MOD( 185 , 49 ) , 7 ) / 1 ) = 3

Lecture. Pour le calcul de ces lignes, il faut les voir comme constituées de deux colonnes, séparées par la flèche : on commence en remontant la colonne de gauche, et puis on redescend la colonne de droite.

Et pour faire la conversion inverse il suffit d'additionner les produits des valeurs extrêmes de ces lignes :
3 * 70 + 5 * 71 + 3 * 72 = 185

40(base2) = 101000 :
26 = 64 > 40
25 = 32    ⇒ ENT( 40 / 32 ) = 1
24 = 16    ⇒ ENT( MOD( 40 , 32) / 16 ) = 0
23 = 8    ⇒ entier( MOD( MOD( 40 , 32) , 16) / 8 ) = 1
22 = 4    ⇒ entier( MOD( MOD( MOD( 40 , 32 ) , 16 ) , 8 ) / 4 ) = 0
21 = 2    ⇒ entier( MOD( MOD( MOD( MOD( 40 , 32 ) , 16 ) , 8 ) , 4 ) / 2 ) = 0
20 = 1    ⇒ entier( MOD( MOD( MOD( MOD( MOD( 40 , 32 ) , 16 ) , 8 ) , 4 ) , 2 ) / 1 ) = 0

Sur une calculette en mode avancé la ligne surlignée en vert se calcule par 40 mod 32 mod 16 mod 8 mod 4 mod 2

Conversion par addition de produits des valeurs extrêmes de ces lignes :
0 * 20 + 0 * 21 + 0 * 22 + 1 * 23 + 0 * 24 + 1 * 25 = 40

On peut généraliser comme suit :
soit :
s | b s-1 = MAX ( b x < n ) où x = 0,1,2,3,...
alors la suite des s chiffres du nombre n en base b est, de gauche à droite :
ENT( n / b s-1 )
ENT( MOD( n , b s-1 ) / b s-2 )
ENT( MOD( MOD( n , b s-1 ) , b s-2 ) / b s-3 )
...
ENT(MOD(MOD(...MOD( n , b s-1 ) , ... b s-(s-1) ) / b s-s )

Et pour la conversion inverse :
n =
b s-1 * ENT( n / b s-1 )
+
b s-2 * ENT( MOD( n , b s-1 ) / b s-2 )
+
b s-3 * ENT( MOD( MOD( n , b s-1 ) , b s-2 ) / b s-3 )
+
...
+
b s-s * ENT(MOD(MOD(...MOD( n , b s-1 ) , ... b s-(s-1) ) / b s-s )

Géométrie

https://philosophie.jortay.net/savoir-scientifique-base#geometrie
 3.1. Trigonométrie
 3.2. Vecteur
 3.3. Produit vectoriel
 3.4. Équation de la droite
 3.5. Équation du second degré

Trigonométrie

https://philosophie.jortay.net/savoir-scientifique-base#trigonometrie
triangle-clipedia.png Vidéo Clipedia : Somme des angles du triangle
somme-angles-triangle.png

La somme des angles d'un triangle quelconque vaut 180° ou π rad.
Pour le démontrer géométriquement, il suffit de translater le triangle (c-à-d le déplacer parallèlement à lui-même) pour placer sa copie de sorte que les angles a du triangle supérieur et c du triangle inférieur forment 180° avec l'angle qui les séparent (cf. graphique ci-joint). Or celui-ci est nécessairement le troisième angle b puisque le triangle a été déplacé parallèlement à lui-même.

N.d.A. : autre démonstration. La somme des angles d'un rectangle vaut 4*90°=360° ⇒ la somme des angles de chacun des deux triangles dessinés par la diagonale représente 360°/2=180°. Or ce résultat est inchangé si l'on transforme ce rectangle en parallélogramme de même surface, et les deux triangles rectangles deviennent ainsi quelconques.

triangle-clipedia.png Vidéo Clipedia : Le théorème de Pythagore
trigonometrie.png

Théorème de Pythagore : dans un triangle rectangle :
R2 = x2 + y2 .

Nous verrons une démonstration mathématique du théorème de Pythagore dans la section consacrée au produit scalaire n_pythagore-math. Mais on peut d'ors et déjà en faire une démonstration géométrique.

Voici une démonstration géométrique (cf. graphique ci-dessous), consistant en trois étapes :

  1. la rotation de l'hypoténuse R correspondant aux surfaces x2 (pour le petit côté adjacent de l'hypoténuse) et y2 (pour le grand côté adjacent de l’hypoténuse) génère la surface R2 ;
  2. la surface R2 pivote autour du même point pour inscrire son côté supérieur dans la surface y2;
  3. les trois surfaces à l'extérieur de R2 remplissent exactement les deux surfaces vides à l'intérieur de R2 ⇔ la surface R2 égale la somme des surface x2 et y2. CQFD.
pythagore.png

N.d.A. On constate que le théorème de Pythagore est l'équation d'un cercle de rayon R, et centré sur le point (0,0) :
R2 = x2 + y2     ⇔
y = +/- √(R2 - x2)
Et l'on obtient l'équation pour un cercle centré sur un point quelconque (a,b) en remplaçant x par x-a et y par y-b :
R2 = ( x - a )2 + ( y - b )2     ⇔
y = +/- √( R2 - ( x - a )2 ) + b

triangle-clipedia.png Vidéo Clipedia : La fonction sinus
sin-cos.png

Par définition (⇒ ne se démontre pas), dans un triangle rectangle, le sinus d'un angle est le rapport entre son côté opposé et l'hypoténuse :
sin(a) ≡ y / R
y = R * sin(a) : y est la projection de R par sin(a)
R = y / sin(a) : R est la projection de y par 1/sin(a)

triangle-clipedia.png Vidéo Clipedia : La fonction cosinus

Par définition, dans un triangle rectangle, le cosinus d'un angle est le rapport entre son côté adjacent (c-à-d celui qui le relie à l'angle droit) et l'hypoténuse :
cos(a) ≡ x / R
x = R * cos(a) : x est la projection de R par cos(a)
R = x / cos(a) : R est la projection de x par 1/cos(a)

Par n_sinus et n_cosinus :
cos(a) = sin (b)    ⇒
par n_somme-angles-triangle :
cos(a) = sin (90-a)    ⇔
sin(a) = cos(90-a)

Loi de projection. On peut alors généraliser en disant que :

  • tout côté adjacent de l'hypoténuse est la projection de celle-ci : soit par le cosinus de l'angle qu'il forme avec elle, soit par le sinus de l'angle opposé ;
  • l'hypoténuse est la projection de chacun des autres côtés : soit par l'inverse du cosinus de l'angle qu'il forme avec lui , soit par l'inverse du sinus de l'angle opposé.
triangle-clipedia.png Vidéo Clipedia : La loi des sinus
loi-sinus.png

Loi des sinus : dans un triangle quelconque le rapport entre le sinus d'un angle et son côté opposé est identique pour les trois angles ⇒
sin(α) / a = sin(β) / b = sin(γ) / c .
Démonstration par n_projection1 :
H = c * sin(β) = b * sin(γ) ⇔
H = c / sin(γ) = b / sin(β) ⇒
même principe en prenant un autre côté commé référentiel ⇒ CQFD.

Par n_sinus et n_cosinus substitués dans n_pythagore :
sin2(a) + cos2(a) = 1

sin(a+b).png

Addition : soient a et b deux angles quelconques dans le cercle trigonométrique de rayon 1 :

  • sin(a+b) = sin(a) * cos(b) + cos(a) * sin(b)
  • cos(a+b) = cos(a) * cos(b) - sin(a) * sin(b)

Pour démontrer sin(a+b) on détermine un référentiel pour l'angle b, obtenu par rotation du référentiel de a par la valeur de a. On va alors projeter sin(b) et cos(b) sur l'axe des sinus dans le référentiel de a :
(i) le segment rouge continu est la projection du rayon R=1 par cos(b) c-à-d cos(b) ; par n_cos(a)=sin(90-a) sa projection sur le segment rouge hachuré vaut sin(a) * cos(b) ;
(ii) le segment bleu continu est la projection du rayon R=1 par sin(b) c-à-d sin(b) ; sa projection sur le segment bleu hachuré vaut cos(a) * sin(b) (PS : c'est bien l'angle a que l'on retrouve là car ses côtés sont perpendiculaires à ceux de a originel).

Nous verrons plus loin dans le cours que l'on peut démontrer ces propriétés algébriquement, plus simplement, en faisant appel à la fonction exponentielle.

Un cas particulier de n_cos(a+b) est :
cos(2a) = cos2(a) - sin2(a)
or sin2(a) + cos2(a) = 1 n_sin2(a)+cos2(a)=1    ⇒
cos(2a) = 2 * cos2(a) - 1
cos(2a) = 1- 2 * sin2(a)

cos(a+b).png

Même principe pour démontrer cos(a+b), mais cette fois ci on va projeter sin(b) et cos(b) sur l'axe des cosinus dans le référentiel de a :
(i) le segment fléché en violet est la projection de R=1 par cos(a+b);
(ii) le segment fléché en rouge est la projection de cos(b) par cos(a);
(iii) le segment fléché en bleu est la projection de sin(b) par sin(a) (PS : c'est bien l'angle a que l'on retrouve là car ses côtés sont perpendiculaires à ceux de a originel);
(iv) or on voit que le segment violet vaut le rouge moins le bleu.

Et en remplaçant b par -b on trouve facilement que :

  • sin(a-b) = sin(a) * cos(b) - cos(a) * sin(b)
  • cos(a-b) = cos(a) * cos(b) + sin(a) * sin(b)
30-45-degres.png

Pour résoudre de nombreux calculs il est utile de connaître le sin et cos des "angles clés" que sont 30° et 45°.

Si a=30° alors son symétrique par rapport à l'axe X forme avec a un angle de 60° ⇒ comme il y a symétrie chacun des deux autres angles vaut donc (180-60)/2=60° ⇒ le triangle est équilatéral ⇒ les trois côtés valent 1 ⇒
sin(30) = 1/2
⇒ par n_sin2(a)+cos2(a)=1 : 1/4 + cos2(30) = 1 ⇒
cos(30) = √3 / 2

Si a=45° alors par symétrie sin(45)=cos(45) ⇒ par n_sin2(a)+cos2(a)=1 :
sin(45) = cos(45) = 1 / √2

tangente.png

Par définition, dans un triangle rectangle, la tangente d'un angle α (exprimé en radians) est le rapport entre sin(α) et cos(α) :
tan(α) ≡ sin(α) / cos(α)
ou encore entre ses côtés opposé (y) et adjacent (x) :
tan(α) = y / x :
tan(α) est la pente de l'hypoténuse
y = x * tan(α) : y est la projection de x par tan(α)
x = y / tan(α) : x est la projection de y par 1/tan(α)

Propriétés visuelles remarquables :
• si α petit ⇒ sin(α) ≈ α et cos(α) ≈ 1 tg(α) ≈ α
⇔ la droite verte de longueur tg(α) et la courbe noire de longueur α se confondent (ainsi pour de petits angles la tangente vaut l'angle exprimé en radians).

À partir du graphique précédent, en augmentant progressivement l'angle α à partir de 0π radian , on peut construire le graphique suivant.

Mplwp sin cos tan piaxis
tangente-2.jpg

On visualise ainsi :

  • le rythme imprimé par les segments de π/2 ;
  • l'explication algébrique du comportement asymptotique de la tangent, et de ses changements de signe, par l'égalité tg(α) = sin(α) / cos(α) ; NB : les sommets de la fonction tan() sont à l'infini, et correspondent à deux valeurs opposées (∞ et -∞ pour un même angle ...) ;
  • la période de la tangente (soit π), qui est la moitié de celle des sinus et cosinus ; tan(α) = tan(π-α) = - tan(α - π) NB : de par la seconde égalité la fonction tangente est dite "anti-symétrique" ; exemple : tan(225°) = tan(225°-180°) = tan(45°) = 1 .

Vecteur

https://philosophie.jortay.net/savoir-scientifique-base#vecteur
 3.2.1. Définition
 3.2.2. Addition et multiplication
 3.2.3. Produit scalaire
Définition
https://philosophie.jortay.net/savoir-scientifique-base#vecteur-definition

Un vecteur (par exemple un rayon d'une sphère) est déterminé par :

  • une origine ;
  • une grandeur (longueur, vitesse, force, ...) encore appelée "norme" ou "module" ;
  • une direction ;
  • un sens.

Dans un système de coordonnées cartésiennes de dimension n, un vecteur a est déterminé par n grandeurs, appelées "composantes". Ainsi dans les deux graphiques ci-dessous le vecteur a est déterminé par ses composantes (ax, ay). Ainsi défini, le vecteur peut être situé n'importe où, et déplacé par translation.

vecteur-translation.png

Le module de a se calcule par le théorème de Pythagore n_pythagore
|| a|| = √(ax2 + ay2)
Par convention on écrit souvent simplement a au lieu de || a|| .

Module vs norme. On parle de module en cas de grandeur physique (avec unité, par exemple le Newton), et de norme dans le cas d'une grandeur grandeur mathématique (sans dimension c-à-d sans unité).

Addition et multiplication
https://philosophie.jortay.net/savoir-scientifique-base#vecteur-addition-multiplication
vecteurs-addition.jpg

Les coordonnés cartésiennes permettent de calculer les coordonnée d'une somme de deux vecteurs en additionnant leur composantes deux à deux : a + b = (ax, ay) + (bx, by) = ( ax + bx , ay + by )

Il en découle que la multiplication vectorielle, c-à-d le produit d'un vecteur par lui-même, se fait par multiplication des composantes par le facteur de multiplication : n * a = ( n * ax, n * ay )

Il suffit alors de poser n=1 pour définir le vecteur opposé, et la soustraction vectorielle en changeant le signe de n_addition-vectorielle.

vecteur-soustraction.png

Géométriquement :

  • a + b est le vecteur allant de l'origine de a à l'extrémité de b
  • a - b est le vecteur allant de l'extrémité de b à celle de a

    Ainsi l'on pourra vérifier dans le graphique ci-contre que b + (a - b) = a

Vecteur
unitaire

N.d.A. L'addition et la multiplication vectorielle permettent de montrer que le vecteur position a = ( ax , ay )
est tel que :
a = ( ax , ay ) = ax * 1x + ay * 1y
1x et 1y sont respectivement les vecteurs unitaires des axes X et Y.

vecteur-unite.jpg

Démonstration :
par définition de l'addition vectorielle :
a = ax  + ay     ⇔
a = (ax,0) + (0,ay)     ⇔
par définition de la multiplication vectorielle :
a = ax * (1,0) + ay * (0,1)     ⇔
a = ax * 1x + ay * 1y
CQFD

Dont on retiendra également que :
1x = ax / ax     ⇔
1x = ax / √(ax2 + 02)     ⇔
1x = ax / ||ax||

Le lecteur trouvera une application très explicite de la notion de vecteur unitaire dans le chapitre consacré au passage de la forme scalaire de la loi de Coulomb à sa forme vectorielle : cf. infra #loi-coulomb.

Produit scalaire
https://philosophie.jortay.net/savoir-scientifique-base#produit-scalaire
triangle-clipedia.png Vidéo Clipedia : Le produit scalaire
produit-scalaire-physique.jpg

Application. L'image ci-contre illustre que pour amener la masse au sommet de la pente L ce n'est pas la force F qu'il faut contrer, mais celle-ci diminuée par l'aide apportée par cet "outil" qu'est la pente : plus cette pente est faible (c-à-d plus θ est grand) plus cette force aidante est grande ... mais le trajet aussi, de sorte que le travail effectué W = f * L n_travail est identique).

force-pente.jpg

Le graphique ci-contre permet de comparer les évolutions des vecteurs f et A (les composantes de F) lorsque θ augmente c-à-d lorsque la pente diminue (bleu ⇒ vert ⇒ rouge) : ||f|| diminue (à gauche du trait noir hachuré) tandis que ||A|| augmente (à droite du trait noir hachuré).

Le vecteur A = F - f est donc clairement une mesure du service fourni par la pente (mais qu'il faut "payer" par une distance plus longue). Physiquement cette aide s'explique par la perpendicularité de A par rapport à la pente, exprimant le fait que sa structure empêche la masse de passer au travers d'elle. Géométriquement, en appliquant le principe de soustraction vectorielle F - A c-à-d "le vecteur allant de l'extrémité de A à celle de F" (cf. supra #vecteur-addition-multiplication), on obtient bien le vecteur parallèle à la vente et dirigé vers le bas (f). Sa force opposée, donc orientée vers le haut, est celle qu'il faut exercer pour amener la masse en haut de la pente.

Le calcul trigonométrique nous montre que le module de ce vecteur n'est autre que la projection F * cos(θ) (cf. image précédente : ses côtés sont parallèles à ceux de l'angle θ). Il reste alors à multiplier celle-ci par la distance L pour obtenir le travail effectué. Et si la loi de conservation de l'énergie est vérifiée, c-à-d si :
W(h) = W(L)    ⇒
F * h = f * L    ⇔
F * h = F * cos(θ) * L    ⇔
h = cos(θ) * L
(qui est donc une façon de vérifier expérimentalement que la loi de conservation de l'énergie est vraie).

Formulation trigonométrique du produit scalaire de F (vecteur "force") et L (vecteur "déplacement") :
F . L = || F|| * || L|| * cos θ
c-à-d :
« le produit des modules des deux vecteurs, multiplié par le cosinus de l'angle que forment ces vecteurs ».
ou encore :
« le produit du module d'un vecteur par la projection sur lui du module de l'autre vecteur ».

N.B. Il ressort du membre de droite de n_produit-scalaire-trigono que le produit de deux vecteurs n'est donc pas un vecteur mais un nombre ! C'est pourquoi ce produit est dit "scalaire".

vecteur-produit.png

La formulation algébrique du produit scalaire de F et L se déduit de la formulation trigonométrique :
F . L = F * L * cos θ n_produit-scalaire-trigono     ⇔
F . L = F * L * cos ( φ - λ )     ⇒ par n_cos(a-b) :
F . L = F * L * ( cos φ * cos λ + sin φ * sin λ )     ⇔
F . L = F * cos φ * L * cos φ + F * sin φ * L * sin λ     ⇒
par n_sinus et par n_cosinus (voir aussi graphique supra) :
F . L = (Fx, Fy) * (Lx, Ly) = Fx * Lx + Fy * Ly

: « le produit scalaire est donné par la somme des produits des composantes homologues ».

Interprétations physique du graphique. On notera la symétrie des deux projections : le produit du déplacement par la projection de la force dans la direction du déplacement est égal au produit de la force par la projection du déplacement dans la direction de la force. Le produit scalaire peut ainsi être vu comme la formulation générale du travail, c-à-d pour une force F exercée dans une direction quelconque par rapport à la direction du déplacement L. La formulation simplifiée W = F * L n_travail correspondant au cas où ces deux directions sont parallèles ⇔ θ=0cos(θ)=1, ce qui est le cas de la chute libre. Enfin, en raison du principe de conservation de l'énergie, le travail effectué pour lever une masse d'une hauteur L est indépendant de la direction suivie pour aller de la hauteur initiale à la hauteur finale.

Commutatif :
a . b = a * b * cos(θ) = b * a * cos(-θ) = b . a
CQFD
La démonstration est encore plus triviale à partir de la formulation algébrique du produit scalaire n_produit-scalaire-algebrique.

Distributif :
a . ( b + c ) = ax * (bx + cx) + ay * (by + cy)     ⇔
a . ( b + c ) = ax * bx + ax * cx + ay * by + ay * cy     ⇔
a . ( b + c ) = ( ax * bx + ay * by ) + ( ax * cx + ay * cy )     ⇔
a . ( b + c ) = a . b + a . c
CQFD

Non associatif car le produit de trois vecteurs ne fait pas sens puisque le produit de deux vecteurs est un nombre :
a . b . c ≠ ( a . b ) * c ≠ a * ( b . c )

Notons enfin quelques valeurs ou propriétés remarquables :

  • a . a = a * a * cos(0) = ||a||2
    or par la forme algébrique du produit scalaire n_produit-scalaire-algebrique :
    a . a = ... = ax2 + ay2    ⇒
    ||a|| = √(ax2 + ay2)
    Nous venons donc de démontrer le théorème de Pythagore.
  • Le produit scalaire de deux vecteurs perpendiculaires vaut zéro, puisque cosθ=0 si θ=π/2.

  • projection-sup-90.jpg
    Si θ>π/2 ⇒ cos(θ)<0 ⇒ a.b<0 : lorsque la projection de ||b|| sur ||a|| se fait dans la direction opposée de a le produit scalaire doit être nul.

  • On ne peut diviser par un vecteur. Autrement dit, il n'existe pas d'opération / b qui serait l'inverse de . b :
    • division d'un vecteur par un vecteur, telle que :
      • a / b = c     ⇔
        a = c . b
        ce qui ne fait pas sens puisque le membre de gauche est un vecteur alors que celui de droite est un scalaire.
      • a / b = c     ⇔
        a = c . b
        or un produit scalaire multiplie un vecteur par un autre, et non un vecteur par un nombre ; en outre, même en écrivant :
        a = c * b
        cela ne ferait pas plus sens puisque cette égalité signifie que a et b sont parallèles alors que dans l'égalité avec la division cela n'est pas le cas en toute généralité.
    • division d'un scalaire par un vecteur : a / b :
      ne fait pas sens puisque, par définition de la division, cela signifierait qu'un vecteur rentrerait un certain nombre de fois dans un scalaire !

Produit vectoriel

https://philosophie.jortay.net/savoir-scientifique-base#produit-vectoriel
 3.3.1. Définition et propriétés
 3.3.2. Calcul
 3.3.3. Interprétation géométrique
Définition et propriétés
https://philosophie.jortay.net/savoir-scientifique-base#produit-definition
moment-de-force.png

La composante longitudinale n'intervient pas dans la force de torsion → c'est F*sin(θ) que le moment τ rapporte à r.

En introduction illustrative du produit vectoriel, nous évoquons la notion de moment de force, qui n'est étudiée que plus loin dans la présente publication, car elle repose sur les concepts de force et de levier.

Soit un levier (en l'occurrence une clé) par rapport auquel est défini le moment de force (qui est un moment de torsion) τ = r * F * sin(θ) n_moment-force
r est la longueur du bras de levier, et F la force exercée sur ce bras.
Le moment de force exprime tout simplement la proportionnalité entre la force F*sin(θ) et la longueur du levier : en doublant celle-ci, on peut diminuer de moitié la force exercée sur lui (pour arriver au même résultat).

Dans l'image ci-dessus la clé est utilisée par une personne pas très douée, qui exerce sa force dans la direction F plutôt que dans celle de la perpendiculaire à r

Ce modèle mathématique qui quantifie l'intensité (le "module" infra) de l'effort de torsion ne dit cependant rien sur le sens de rotation qui est induit par cet effort (en l'occurrence on ne sait pas si on serre on déserre). L'illustration géométrique ci-dessus donne certes la réponse, mais il reste à la formuler mathématiquement. Pour ce faire le modèle a été complété par un outil mathématique appelé "produit vectoriel", consistant à représenter τ, r et F par des vecteurs : τ = r x F (NB : notez le "x" qui a remplacé le "*" de l'expression du module donnée par n_moment-force ). Ainsi dans le graphique ci-dessus :

  • l'origine du vecteur "bras de levier" r représente le centre de rotation de la force, tandis que son extrémité représente le point d'application de cette force ;
  • la direction du vecteur "force" F est donnée par l'angle θ.

NB : étant maintenant représentées sous forme de vecteurs, les grandeurs r et F ne doivent plus nécessairement être dessinées à la suite l'une de l'autre, mais peuvent aussi bien être ramenées à une origine commune.

produit-vectoriel.png

On va ainsi généraliser n_moment-force sous forme vectorielle, en considérant des vecteurs quelconques à origine commune :
c = a x b = || a|| * || b|| * sin(θ) * 1
Le produit vectoriel se lit « a croix b ».
où :
1, qui est un vecteur de longueur unitaire, convertit le nombre || a|| * || b|| * sin(θ) en vecteur;
indique que le produit vectoriel c est perpendiculaire au plan constitué par ses composantes a et b, et que le signe de 1 est déterminé par la règle de la main droite.

Règle de la
main droite

Ces conventions déterminent l'outil mathématique qu'est le produit vectoriel, qui repose sur la règle de la main droite. Celle-ci est est une convention qui permet de déterminer le sens du produit scalaire c (c-à-d τ) : « quand le pouce de la main droite va dans le sens du vecteur c, alors le sens dans lequel se plient les autres doigts indique le sens de rotation dans lequel l'angle θ est mesuré (l'autre sens correspondant à 2π-θ), ou encore le sens de rotation de l'axe déterminé par c ». Pratiquement : soit le produit scalaire a x b replier la main droite sur l'angle formé par a et b, à partir de a, et dans le sens le plus court (NB : θ=2πθ) ⇒ le pouce indique le sens de c. Ainsi dans le premier graphique illustrant le moment de force on appuie vers le bas et on visse (ce qui est indiqué par le signe "plume de flèche" ⊗, la direction opposée étant indiquée par signe "pointe de flèche" ⊙).

  • C'est donc au travers du vecteur unitaire 1, et surtout de son signe, que la règle de la main droite est exprimée dans la formule du produit vectoriel.
  • Le produit vectoriel a x b = || a|| * || b|| * sin(θ) * 1 ne doit pas être confondu avec le produit scalaire a . b = || a|| * || b|| * cos(θ) : notamment parce que le premier est un vecteur tandis que le second est un scalaire (un nombre) ! N.d.A. : le produit scalaire peut se noter a . b ou a * b.
Application

Force de Lorentz. Un exemple d'application du produit vectoriel est la force de Lorentz, c-à-d la force dite "magnétique" subie par une particule chargée dans un champ électromagnétique. Quand une charge électrique q se déplace à une vitesse v dans le champ magnétique B d'un aimant, elle subit une force :

f = q * v x B

force-lorentz.png

Le graphique ci-joint montre comment la direction et le sens de f sont facilement déterminés par la règle de la main droite.

Dans le cas particulier où la particule se déplace dans le sens du champ magnétique, l'angle θ est alors nul ⇒ son sinus également ⇒ le produit vectoriel q * v x B = q * v * B * sinθ * 1 également : la force électromagnétique subie par la charge est nulle.

On constate ici toute la puissance du produit vectoriel, permettant de décrire par un simple produit vectoriel, un phénomène aussi complexe que celui décrit ici.

force-lorentz.png

Reprenons maintenant la situation de directions perpendiculaires entre charge et champ, mais d'un nouveau point de vue : cette fois en nous plaçant face au champ magnétique (NB : la "pointe de flèche" verte montre que le champ magnétique "sort de l'écran" dans notre direction). Le module de la force magnétique est f = q * v * B * sinθθ est l'angle entre la vitesse de la charge et le champ magnétique. Or comme on à posé θ=π/2 ⇒ sinθ=1 ⇒ f = q * v * B : la force exercée sur la charge est proportionnelle à la charge, sa vitesse, et à l'intensité du champ.

La force magnétique infléchit la trajectoire de la charge vers le bas, de sorte que cette trajectoire est courbée (la vitesse est donc inclinée vers le bas puisque la vitesse est toujours tangente à la trajectoire). Et comme par définition du produit scalaire la force magnétique f est perpendiculaire à la vitesse ⇒ ( v x B ) . v = 0 par n_produit-scalaire-angle-droit ⇒ le produit scalaire f . v = q * ( v x B ) . v = 0. Or on peut démontrer (en faisant référence à la mécanique avancée) que f * v traduit l'énergie fournie à la charge. Le champ électrique n'induit donc pas d'énergie cinétique ⇒ la vitesse de la particule est constante (en module). Or comme q et B sont donnés ⇒ f = q * v * B est également constante ⇒ la trajectoire est infléchie de façon constante ⇒ la courbure est constante ⇒ la trajectoire de la charge forme un cercle. Si on introduit alors la notion de force centrifuge qui équilibre la force centripète f (cf. n_troisieme-loi-newton ), on peut alors montrer que le rayon de courbure de ce cercle vaut R = M * v / ( q * B )m représente la masse de la particule. C'est grâce à la mesure de cette courbure que l'on peut identifier des particules élémentaires étudiées dans des laboratoires tels que le CERN. Si la particule est ralentie dans le détecteur ⇒ v ↓ ⇒ R ↓ ⇒ ce sont alors des spirales qui apparaissent jusqu'à former un point associé à la particule.

2pi-angle-2.jpg

Commençons par préciser que, grâce à la règle de la main droite, le produit vectoriel n'est aucunement ambigu concernant le sens dans lequel un angle peut être mesuré : θ mesuré dans le sens anti-horaire = 2π-θ mesuré dans le sens horaire.

2pi-angle.jpg

Mais sin(θ) = - sin(2π-θ)
a x b = || a|| * || b|| * sin(θ) * 1     ⇔
a x b = - || a|| * || b|| * sin(2π-θ) * 1

D'autre part rappelons que dans la définition du produit vectoriel a x b = || a|| * || b|| * sin(θ) * 1 n_prod-vect l'angle θ est calculé – et la règle de la main droit est appliquée – « de a vers b et dans le sens le plus court ».

Non commutatif. Il résulte directement de ce que nous venons de rappeler que :
a x b = - b x a     ⇒
a x b ≠ b x a
⇔ le produit vectoriel n'est pas commutatif ; en l'occurrence la propriété n_a→xb→=-a→xb→ est qualifiée "d'anti-commutativité", ou encore "d'anti-symétrie".

Valeur remarquable : a x a = 0 par n_prod-vect où θ=0.

Non associatif. Il résulte de n_a→xa→=0 que :
a x ( a x b ) ≠ ( a x a ) x b = 0

distributivite-produit-scalaire.jpg
Distributif. La démonstration de la distributivité du produit vectoriel dans un espace 3D étant trop complexe on va se limiter ici à la démonstration dans un espace 2D :
a x ( b1 + b2 ) = a x b1 + a x b2     ⇔
a * ||b1 + b2 || * sinθ * 1 = a * b1 * sinθ1 * 1 + a * b2 * sinθ2 * 1     ⇔
||b1 + b2 || * sinθ = b1 * sinθ1 + b2 * sinθ2
Malheureusement θ ≠ θ1 + θ2 puisque θ augmente si par exemple la norme de b1  ou b2  augmente.
distributivite-produit-scalaire-2.jpg
On pourra néanmoins vérifier l'égalité supra en projetant ( b1 + b2 ), b1  et b2  sur la même perpendiculaire à a, et en constatant qu'elles confirment l'égalité supra.

Calcul
https://philosophie.jortay.net/savoir-scientifique-base#produit-vectoriel-calcul
Calcul

À la fin de la vidéo "Le produit vectoriel, propriétés" nous avons vu que le calcul trigonométrique du produit scalaire est laborieux. Nous allons voir que son calcul algébrique est plus simple, grâce aux les propriétés du produit scalaire exposées supra.

produit-vectoriel-calcul.png

Grâce aux propriétés n_a→xa→=0 et de distributivité on va développer une règle de calcul du produit vectoriel. Une condition est que le référentiel orthonormé soit dextrogyre c-à-d tel que x x y = z ⇔ règle de la main droite : quand on ferme les doigts de la main de x vers y, la direction indiquée par le pouce doit être celle de z ⇔ :

1z = 1x x 1y
1x = 1y x 1z
1y = 1z x 1x

Dans ces conditions, il alors résulte de la définition du vecteur unitaire n_vecteur-unitaire que :
a x b = ( ax * 1x + ay * 1y + az * 1z ) x ( bx * 1x + by * 1y + bz * 1z )     ⇔
...     ⇔
a x b = ( ay * bz - az * by ) * 1x - ( ax * bz - az * bx ) * 1y + ( ax * by - ay * bx ) * 1z

Il existe heureusement une notation mnémotechnique de n_produit-vectoriel-regle-calcul, fondée sur la notion de déterminant (cf. infra #formule-generale-determinant) de a x b :

a x b =  
1x 1y 1z
ax ay az
bx by bz

NB : on constatera que le changement du signe de 1y dans le cas du croisement L1-C2 est cohérent avec l'application de la règle de la main droite à 1x x 1z.

Interprétation géométrique
https://philosophie.jortay.net/savoir-scientifique-base#produit-vectoriel-interpretation
produit-vectoriel-interpretation.png

Interprétations géométriques. Le graphique ci-contre reprend celui illustrant c = a x b = || a|| * || b|| * sin(θ) * 1 n_prod-vect, mais cette fois vu du haut. L'analyse géométrique révèle alors que le produit vectoriel correspond à la surface du parallélogramme construit sur les vecteurs a et b : a x b = Sab * 1Sab est donc le module du produit vectoriel.

produit-mixte.png

Soit un vecteur quelconque c, il résulte de la propriété ci-dessus que le produit scalaire (par c) du produit vectoriel a x b :
( a x b ) . c = Sab * 1 . c = Sab * c * cos(φ) = Sab * h
appelé "produit mixte" (et lu "a croix b fois c"),
représente le volume du parallélépipède quelconque
(c-à-d pas nécessairement rectangle) du graphique ci-joint, dont la valeur se calcule à partir de n_prod-scal-det : ( a x b ) . c =

1x 1y 1z
ax ay az
bx by bz
. c =
cx cy cz
ax ay az
bx by bz

On démontre cette égalité en remplaçant le déterminant du premier membre par un vecteur quelconque u (= a x b), puis en montrant que pour obtenir le produit scalaire de celui-ci avec c il suffit de remplacer les coordonnée de 1 par celles de c :

ux * cx + uy * cy + uz * cz
=
( ux * 1x + uy * 1y + uz * 1z ) . ( cx * 1x + cy * 1y + cz * 1z )
CQFD

( a x b ) . c = cx * ( ay * bz - az * by ) - cy * ( az * bx - ax * bz ) + cz * ( ax * by - ay * bx )

Équation de la droite

https://philosophie.jortay.net/savoir-scientifique-base#equation-droite
 3.4.1. Introduction à la géométrie analytique
 3.4.2. Équation paramétrique
 3.4.3. Équation cartésienne
Introduction à la géométrie analytique
https://philosophie.jortay.net/savoir-scientifique-base#intro-geometrie-analytique
lieu-de-points.jpg

Cette série de vidéos consacrées à l'équation de la droite commence par une question pratique précise : comment donner instructions à une imprimante 3D de tracer un "lieu de points" quelconque ?

Le graphique ci-contre en illustre deux :

  • le segment vert d'équation :
    y = ( ay / ax = tgα ) * x
    0 < x < ax
  • le cercle rouge, que l'on peut formuler de deux façons :
    y = +/- √(32 - x2)     n_equation-cercle
    -3 < x < 3

    On notera l'indication +/-, pour prendre en compte que y devient négatif dès que α dépasse π/2. C'est pourquoi on préférera généralement la formulation trigonométrique : y = 3 * sinα     n_sinus
    x = 3 * cosα
    0 < α < 2π

On constate une différence importante entre les deux formulations du cercle : la seconde fait apparaître un paramètre : l'angle α (c'est pourquoi elle est qualifiée de "paramétrique", la première étant la forme "cartésienne" car elle utilise les coordonnées cartésiennes).

Équation paramétrique
https://philosophie.jortay.net/savoir-scientifique-base#equation-parametrique
equation-parametrique.jpg

Soit deux points a et b définis par leur vecteurs position a et b, le segment entre les points a et b est alors représenté par le vecteur b - a n_addition-soustraction-vectorielle. De la même manière on peut définir le vecteur "courant" r tel que :
r = a + λ * ( b - a )
λ ∈ [0,1]

Ainsi en faisant varier la valeur de λ on dessine le segment de droite entre les points a et b. Et l'on peut même dessiner un segment de longueur arbitraire en remplaçant la contrainte [0,1] par la contrainte correspondante. Il reste maintenant à déterminer les composantes (x,y) du vecteur courant r :
x = ax + λ * ( bx - ax )
y = ay + λ * ( by - ay )

Un cas particulier remarquable est celui d'un segment vertical c-à-d tel que bx=ax
x = ax
y = ay + λ * ( by - ay )

de sorte que y devient le paramètre ultime : c'est sa variation qui dessine la droite.
equation-parametrique-2.jpg

Cependant, plutôt que par deux points, une droite peut être définie par un point et un angle, celui-ci étant déterminé au moyen d'un "vecteur directeur" v, de coordonnées (vx,vy) = (1,tgα), auquel la droite passant par le point doit être parallèle. Il suffit alors de translater ce vecteur directeur à la suite du vecteur a, où il va jouer le rôle du vecteur b - a, de sorte que l'équation paramétrique :
r = a + λ * ( b - a )
devient :
r = a + λ * v
⇒ exprimée en fonction de composantes des vecteurs :
x = ax + λ * vx
y = ay + λ * vy

Équation cartésienne
https://philosophie.jortay.net/savoir-scientifique-base#equation-cartesienne

Nous allons développer l'équation générale de l'équation cartésienne de la droite, à partir de sa forme paramétrique (que nous venons de développer supra, et où nous remplaçons ici a = (ax,ay) par p = (px,py) ). Pour cela on va substituer λ entre les deux égalités de equation-droite-plan-param-composantes de sorte que l'on exprime y en fonction de x :
( x - px ) / vx = ( y - py ) / vy    ⇔
y = vy / vx * x + py - vy / vx * px

N.B. Il s'agit bien de la forme habituelle (qui n'est pas la forme générale) :
y = a * x + b

• a = vy / vx
• b = py - vy / vx * px

Mais cette forme n'est pas l'expression générale de l'équation cartésienne de la droite, car elle ne permet pas d'exprimer la droite verticale : en effet dans ce cas la pente vy / vx est infinie ⇒ n_equation-cartesienne donne y = ∞ - ∞, qui est indéterminé. Pour contourner ce problème on multiplie les deux membres de n_equation-cartesienne par vx ⇒ on obtient l'équation cartésienne sous sa forme générale :
- vy * x + vx * y = - vy * px + vx * py

N.B. Qui est de type :
a * x + b * y = c

• a = - vy
• b = vx
• c = - vy * px + vx * py

Et l'on constate que cette forme générale de l'équation cartésienne permet bien de prendre en compte le cas d'une droite verticale c-à-d telle que vx=0 ⇒ n_equation-cartesienne-2 donne x=px

La façon la plus simple de dessiner une droite à partir de son équation cartésienne a * x + b * y = c est de calculer le point ou les deux points d'intersection avec les axes X et Y : il suffit de poser x=0 et de calculer la valeur correspondante de y (=c/b), puis de poser y=0 et de calculer la valeur correspondante de x (=c/a).

droite-forme-vectorielle.png

Forme
vectorielle

On va maintenant développer une interprétation géométrique de l'équation cartésienne, sous forme vectorielle. Pour ce faire la contrainte imposée au vecteur "courant" r relativement au vecteur "position" p n'est plus le couple (paramètre λ, vecteur "directeur" v) mais un vecteur "normal" n (perpendiculaire à la droite) :
n . r = n . p    ⇔
n * r * cos(φ) = n * p * cos(θ)
soit un produit scalaire signifiant que p et r on la même projection sur n.

Enfin soient : n = (a, b), p = (px, py) et r = (x, y)
⇒ par n_produit-scalaire-algebrique :
a * x + b * y = a * px + b * py

droite-formes-bouclage.png

L'on peut alors comparer n_a*x+b*y=a*px+b*py à n_equation-cartesienne-2 pour constater que les coordonnées du vecteur normal n = (a, b) ont remplacé les coordonnées (-vy, vx) ... qui sont bien celles du point déterminé par la rotation à 90° du vecteur directeur v !

Cette forme vectorielle de l'équation paramétrique sera très utile pour le développement de l'équation du plan dans l'espace à trois dimensions.

Équation du second degré

https://philosophie.jortay.net/savoir-scientifique-base#equation-second-degre

Soit l'équation polynomiale de degré n :
i=0n ai * x i = 0

Si n=2 on obtient le polynôme du second degré a0 + a1 * x + a2 * x2, que l'on écrit plus souvent sous la forme a * x2 + b * x + c (forme "standard").

Si a * x2 + b * x + c = 0 est l'équation polynomiale du second degré, on pourrait se demander ce qu'est a * x2 + b * x + c = d. La réponse est que « c'est également une équation polynomiale du second degré » :
a * x2 + b * x + c = d    ⇔
a * x2 + b * x + ( c - d ) = 0    ⇔

Résolution
algébrique

Pour trouver la solution de l'équation du second degré a * x2 + b * x + c = 0, c-à-d exprimer x en fonction de la valeur des paramètres, n'est pas évident. Une première tentative conduit à :
x = √( - ( b * x + c ) / a )     ⇒
Comment faire passer le x de droite dans le membre de gauche ...?

Voici un méthode en quatre étapes pour y arriver :

  1. isoler x :
    a * x2 + b * x + c = 0    ⇒
    en posant : b * x + c = - h    ⇒
    a * x2 - h = 0   ⇔   x = +/- √ ( h / a )
  2. passer à la forme canonique :
    dans la relation biunivoque ci-dessus, on remplace x par x-e    ⇒
    a * ( x - e )2 - h = 0   ⇔   x = e +/- √ ( h / a )
  3. calculer les équivalences en e et h, entre formes canonique et standard :
    a * ( x - e )2 - h = 0    ⇔    ( forme canonique)
    a * x2 - 2 * a * e * x + a * e2 - h    ⇒
    par comparaison avec :
    a * x2 + b * x + c    ( forme standard)
    on voit que :
    b = - 2 a * e
    c = a * e2 - h


    e = - b / ( 2 * a )
    h = a * e2 - c =   ⇒   h = b2 / ( 4 * a ) - c

  4. Substituer les valeurs de e et h dans la solution canonique :
    x = e +/- √ ( h / a )     n_equation-canonique
    x = - b / ( 2 * a ) +/- √ ( b2 / ( 4 * a2 ) - c / a )    ⇔
    x = [ - b +/- √ ( b2 - 4 * a * c ) ] / ( 2 * a )
    PS : ces deux valeurs (notez le +/-) sont appelées "racines de l'équation du second degré".

Pour qu'une solution existe il faut que la partie en racine carrée soit non négative : b2 - 4 * a * c ≥ 0 (car il n'existe pas de racine carrée d'un nombre négatif puisque tout carré est positif). Cette partie en racine carrée est appelée "discriminant" de l'équation (et notée Δ) car elle différencie les valeurs respectives des deux "racines" (on ne dit pas "solution" car c'est leur ensemble qui constitue la solution).

Interprétation
géométrique

Commençons par rappeler la différence entre le graphe y = a * x2 + b * x + c (la courbe rouge, telle que x est en abscisse et y(x) = a * x2 + b * x + c en ordonnée), et le cas particulier y = a * x2 + b * x + c = 0 déterminant les deux "zéros" du polynôme (les deux points jaunes).

solutions-polynome.png

Poussons maintenant l'analyse géométrique en observant l'effet de divers paramétrages du polynôme, c-à-d l'effet de diverses valeurs des paramètres a, b et c (⇔ diverses valeurs des paramètres h, e et a de la forme canonique n_equation-canonique ) sur le graphe de la fonction polynomiale y = a * x2 + b * x + c. Commençons par le cas de référence, tel que b=c=0 (⇔ h=e=0) ⇒ y = a * x2. Ensuite nous étudierons les cas où h puis e ne sont plus négatifs.

Le graphe suivant est illustre le cas de référence pour a=1/2.

parabole.png

Levons maintenant la restriction h=0y = a * x2 - h. Nous voyons que cela correspond à un mouvement vertical de la parabole vers le bas.

parabole-h.png

On voit alors (graphique ci-dessous) apparaître les "zéros" de la fonction. L'équation canonique x = e +/- √ ( h / a ) n_equation-canonique montre que la condition nécessaire est h/a ≥ 0 .

parabole-h-valeurs.png

Levons maintenant la restriction e=0y = a * ( x - e )2 - h, ce qui correspond à un mouvement horizontal de la parabole. Pour le comprendre il suffit de poser x=e ⇒ y=-h ⇔ la parabole se déplace horizontalement et vers la droite. Il en résulte que l'axe de symétrie est passé de x=0 à x=e.

parabole-e.png

On voit enfin que la valeur de a détermine l'ouverture de la parabole : plus a est grand, plus la valeur de y est élevée pour un x donné.

parabole-a.png

En résumé pour la forme canonique y = a * ( x - e )2 - h :

  • h détermine le minimum de la parabole, et donc le déplacement vertical ;
  • e détermine la position de l'axe de symétrie, et donc le déplacement horizontal ;
  • a détermine l'ouverture de la parabole.

Le graphique suivant exprime la situation cette fois en termes standards.

parabole-standard.png

Distinguons dans la solution encadrée en vert les deux membres de l'addition/différence : le membre de gauche (-b/(2a) c-à-d e) détermine l'axe de symétrie, tandis que le membre de droite détermine l'ouverture de la parabole. Quant à la position du minimum de la parabole, elle est fonction du signe du discriminant Δ :

  • Δ > 0 ⇔ minimum en-dessous de l'axe horizontal ⇔ deux "zéros"  ;
  • Δ= 0 ⇔ minimum sur l'axe horizontal ⇔ un seul "zéro"  ;
  • Δ < 0 ⇔ minimum au-dessus de l'axe horizontal ⇔ pas de "zéro".
Illustration

La trajectoire balistique d'un corps lancé dans l'espace en présence de gravitation est donnée par l'expression du graphique ci-dessous, qui est bien un polynôme du second degré. On notera le signe négatif lié à la gravitation g (puisque celle-ci est orientée vers le bas). Le signe du paramètre a dans y(x) = a * x2 + b * x + c étant ainsi négatif la parabole est bien concave. Il y a cohérence entre formulation théorique et réalité physique.

courbe-balistique.png

On veut calculer l'endroit où placer le matelas, c-à-d la valeur de x correspondant à y=0. L'équation a * x2 + b * x + c = 0 correspond donc à la problématique. La solution se trouve dans la valeur des racines dont nous avons calculé la formule. Les valeurs des paramètres g, v, φ et h étant connues, il en va de même pour les paramètres correspondants a, b et c. Il reste à calculer la valeur de x ... en veillant à utiliser les mêmes unités de longueur (PS : on notera à cet égard que la tangente n'a pas de dimension ⇒ ok pour x1).

Mais il reste à interpréter correctement les résultats, c-à-d en fonction de la réalité physique. En l'occurrence il apparaît qu'une des deux racine est nécessairement négative (puisqu'on a placé le zéro des abscisse au niveau du canon) et ne correspond ici à aucune réalité physique.

On va enfin calculer la hauteur maximale H que le clown va atteindre afin de vérifier que le chapiteau est suffisamment haut. L'équation du second degré correspondant à cette problématique est :
a * x2 + b * x + c = H     ⇔
a * x2 + b * x + ( c - H ) = 0

Le graphique suivant montre que c'est évidemment au sommet de cette courbe que la hauteur est maximale. Or ce sommet correspond aux cas où il n'y a qu'une seule racine c-à-d tel que le discriminant est nul (NB : remplacer c par c'=c-H dans la formule du discriminant).

courbe-balistique-2.png

Algèbre

https://philosophie.jortay.net/savoir-scientifique-base#algebre
 4.1. Dérivée
 4.2. Gradient et dérivée directionnelle
 4.3. Intégrale
 4.4. Nombre imaginaire et complexe
 4.5. Analyse combinatoire
 4.6. Suites mathématiques
 4.7. Fonction exponentielle
 4.8. Matrices

Dérivée

https://philosophie.jortay.net/savoir-scientifique-base#derivee

La dérivée f '(x) = df(x) / dx c'est la pente de la courbe, ou encore la sensibilité (c-à-d le taux de variation) de f(x) par rapport à x. Ainsi si x est le temps écoulé et f(x) la distance parcourue alors ce taux de variation est la vitesse. Nous allons voir que la dérivée correspond à la vitesse dite "instantanée" c-à-d en un point déterminé, par opposition avec la vitesse moyenne Δy / Δt c-à-d entre deux points déterminés.

derivee1.png

C'est de cette vitesse moyenne que nous allons d'ailleurs déduire celle de vitesse instantanée. La vitesse est constante ⇔ la pente de la courbe est constante en tous points (droite verte). Ou encore la pente de la droite verte représente la vitesse moyenne de la courbe rouge.

De même l'on pourrait calculer la vitesse sur seulement un segment de la fonction, comme illustré dans le graphique suivant.

derivee2.png

Le principe de la dérivée est alors qu'en diminuant Δt = tf - ti "à l'infini" c-à-d jusqu'à une valeur "arbitrairement proche de zéro" (infinitésimale), on pourra toujours atteindre une échelle suffisamment petite pour que le segment de la courbe déterminé par Δt puisse être considéré comme une droite.

Ainsi Δy et Δt tendent tous les deux vers zéro, mais leur ratio est constant (puisqu'il le segment infinitésimal peut être considéré comme une droite) et vaut :
v(t) = limΔt → 0 Δy / Δt     ⇔
v(t) = limΔt → 0 ( y( t + Δt ) - y(t) ) / Δt
que l'on simplifie en posant que :
si Δt → 0 alors Δt = dt :
(approche dite "différentielle", qui est donc une différence infinitésimale, permettant de passer d'une description discrète à un continuum ; en l'occurrence on passe ici de la notion de vitesse moyenne à celle de vitesse instantanée)    ⇒
v(t) = ( y( t + dt ) - y(t) ) / dt     ⇔
v(t) = dy(t) / dt

Généralisation :
f '(x) = df (x) / dx = ( f ( x + dx ) - f (x) ) / dx
La première égalité définit la notation simplifiée.
Le deuxième égalité définit le mode de calcul.
La dérivée d'une fonction f(x) est donc le rapport entre la différentielle de la fonction f(x) et la différentielle de la variable x.

derivee3.png

La dérivée est elle-même une fonction (exemple à partir d'une f(x) quelconque).

Exemples :

Soit la fonction :
f (x) = x2
appliquée à n_derivee    ⇒
d(x2) / dx = ( ( x + dx )2 - x2 ) / dx     ⇔
d(x2) / dx = ( ( x2 + 2 * x * dx + dx2 ) - x2 ) / dx     ⇔
d(x2) / dx = 2 * x + dx
où par définition dx peut-être arbitrairement petit et donc considéré comme négligeable par rapport à 2*x     ⇒
d(x2) / dx = 2 * x

Soit la fonction :
f (x) = 1 / x
appliquée à n_derivee    ⇒
d(1/x) / dx = ( 1 / ( x + dx ) - 1 / x ) / dx     ⇔
en réduisant le numérateur au même dénominateur :
d(1/x) / dx = - 1 / ( x 2 + x * dx )
où par définition dx peut-être arbitrairement petit, de sorte que x*dx peut être considéré comme négligeable par rapport à x2     ⇒
d(1/x) / dx = - 1 / x 2

Propriétés

À partir de f '(x) = df (x) / dx = [ f ( x + dx ) - f (x) ] / dx n_derivee on démontre les propriétés suivantes.

Dérivée d'une somme de fonction :
d( ∑ fi (x) ) / dx =
[ ∑ fi (x + dx) - ∑ fi (x) ] / dx =
la différence de sommes est une somme de différences :
[ ∑ ( fi (x + dx) - fi (x) ) ] / dx =
distribution de 1/dx :
∑ [ ( fi (x + dx) - fi (x) ) / dx ] =
∑ ( dfi (x) / dx )
La dérivée d'une somme de fonction est la somme des dérivées.

Dérivée d'un produit de fonctions :
d( π fi (x) ) / dx =
[ π fi (x + dx) - π fi (x) ] / dx =
par définition de dfi (x) = fi (x + dx) - fi (x) :
[ π ( fi (x) + dfi (x) ) - π fi (x) ] / dx = ?
Si l'on continue la démonstration sur cette voie générale ça va devenir difficilement lisible ⇒ on va plutôt passer par les cas n=2 et n=3 ; en outre, toutes les fonctions de la dernière étape étant en x, on va simplifier l'écriture en remplaçant f(x) par f :
n=2 :
d( f * g ) / dx =
[ ( f + df ) * ( g + dg ) - f * g ] / dx =
[ f * g + f * dg + df * g + df * dg - f * g ] / dx =
f * g ' + f ' * g + df * dg / dx =
f * g ' + f ' * g + f ' * g' * dx    ⇔
( f * g )' = f ' * g + f * g '
n=3 :
d( f * h * i ) / dx =
en posant g(x) = h(x) * i(x) dans n_d(f*g)/dx :
f * ( h * i ) ' + f ' * ( h * i ) =
f * ( h * i' + h' * i ) + f ' * ( h * i ) =
f * h * i' + f * h' * i + f ' h * i )
où l'on constate une symétrie : le signe de dérivée passe progressivement d'un côté à l'autre, ce que l'on peut généraliser comme suit :
( π1 n fi )' = ∑i=1 n ( fi' * π1 i-1 fi * π i+1 n fi )
(si on convient que π n+1 n fi = 1)
Ainsi dans le cas particulier fi = f   ∀ i :
( f n ) ' = n * f n-1 * f '
dont deux cas particuliers sont les fonctions :

  • identité : f (x) = x
    ( x n ) ' = dx n / dx = n * x n-1
  • inverse : f (x) = 1 / x = x -1
    ( x - n ) ' = dx - n / dx = - n * x -n-1

Dérivée d'un quotient de deux fonctions :
d( f (x) / g (x) ) / dx = d( f / g ) / dx = d( f * g - 1 ) / dx    ⇔
par n_d(f*g)/dx :
d( f / g ) / dx = f ' * g - 1 + f * g - 1 '    ⇔
par n_dfn(x)/dx :
d( f / g ) / dx = f ' * g - 1 - f * g - 2 * g '    ⇔
d( f / g ) / dx = ( f ' * g - f * g ' ) / g 2

Cependant la démonstration ci-dessus est incomplète car elle repose sur l'hypothèse non démontrée que n_dfn(x)/dx vaut également pour les entiers (n) négatifs. Pour démontrer cette hypothèse on va développer la différentielle d'un quotient particulier : f - n, cela en partant de sa définition :

f n * f - n = 1    ⇔
( f n * f - n ) ' = 0    ⇔
par n_d(f*g)/dx :
( f n ) ' * f - n + f n * ( f - n ) ' = 0    ⇔
( f - n ) ' = - ( f n ) ' * f - 2n    ⇔
( f - n ) ' = - n * f n-1 * f ' * f - 2n    ⇔
( f - n ) ' = - n * f -n-1 * f '
CQFD.

Dérivée de fonctions trigonométriques :
dcos(α) / dα = [ cos(α + dα) - cos(α) ] / dα    ⇔
par cos(a+b) = cos(a) * cos(b) - sin(a) * sin(b) n_cos(a+b) :
dcos(α) / dα = [ cos(α) * cos(dα) - sin(α) * sin(dα) - cos(α ] / dα    ⇔
dcos(α) / dα = - sin(α) * sin(dα) / dα    ⇒
par démonstration infra de sin(dα) = dα :
dcos(α) / dα = - sin(α)
Et on démontre de la même manière, cette fois à partir de n_sin(a+b), que :
dsin(α) / dα = cos(α)

derivee-cos.png

L'égalité sin(dα) = dα se démontre géométriquement à partir des définitions de l'angle radian n_radian et du sinus n_sinus : graphique ci-contre : la variation infinitésimale d'un angle α correspond à l'égalité "à la limite" entre l'arc-tangente (en rouge) et le sinus (en vert) : limα→0 sin(Δα) / dα = 1

Dérivée d'une fonction composée :
la démonstration est triviale :
dF( G(x) ) / dx =
dF( G(x) ) / dG(x) / ( dx / dG(x) )    ⇔
dF( G(x) ) / dx = dF( G(x) ) / dG(x) * dG(x) / dx   ⇔
( F[ G(x) ] )' = F'( G(x) ) * G'(x)

Gradient et dérivée directionnelle

https://philosophie.jortay.net/savoir-scientifique-base#gradient-derivee-directionnelle

Le gradient (∇) est un objet mathématique fondé sur les notions de dérivée partielle et de dérivée directionnelle. Il permet notamment de décrire des variations d'une grandeur (pression, température, ...) entre une série de points dans l'espace. En voici quatre exemples  :

  • gradient-déplacement-air.jpg

    ρ * dv / dt = - ∇P + μ * Δv + ρ * F : dans cette équation de mécanique des fluides, le gradient de la pression exprime le déplacement d'air de la gauche vers la droite de cette aile d'avion, par la diminution de la pression de l'air, de la gauche vers la droite.

  • gradient-conduction-thermique.jpg

    J = - kT * ∇T : dans cette équation de conduction thermique, le gradient de la température exprime le fait que la chaleur diffuse des points les plus chauds vers ceux de plus basse température.

  • gradient-optique-geometrique.jpg

    dx / dl = 1 / n(x) * ∇φ(x) : dans cette équation d'optique géométrique, le gradient de la phase du champ électromagnétique détermine la direction des rayons lumineux.

  • gradient-optimisation.jpg

    xk+1 = xk - α(k) * ∇f(xk) : cette équation est extraite d'un algorithme d'optimisation permettant de trouver les extrema de la fonction complexe représentée dans l'image ci-contre.

    C'est ce dernier cas d'optimisation (mais avec une fonction plus simple) que nous allons utiliser ici pour développer la notion de gradient, et illustrer son utilité.

Pour ce faire le problème d'optimisation que nous allons résoudre ici est le suivant : dans quelle direction faut-il tirer sur un des angles d'un rectangle pour obtenir le plus grand accroissement de surface (pour une longueur d'étirement Δl déterminée) ?

gradient-optimisation-rectangle.jpg

Pour répondre à cette question on va commencer par introduire un repère cartésien, de sorte que l'on va pouvoir exprimer la surface du rectangle en terme des coordonnées (x,y) du point d'étirement :
S = x * y     ⇔     f(x,y) = x * y

Quant au déplacement du point d'étirement, on peut le représenter par le vecteur Δl, dont les composantes en x et y sont Δx et Δy   ⇔   par n_vecteur-unitaire :
Δl = Δx * 1x + Δy * 1y

Et l'accroissement du rectangle (Δf) se formule par :
f(x+Δx,y+Δy) - f(x,y) = ( x + Δx ) * ( y + Δy ) - x * y

L'image ci-dessous montre que le graphe de la fonction f(x,y) est elle-même une surface.

gradient-optimisation-graphe.jpg

N.B. Lorsque l'on par de "la surface f(x,y)", il convient de distinguer :

  • la surface rectangulaire jaune, correspondant à une valeur déterminée de (x,y) ;
  • la surface bleue, qui est la représentation graphique de toutes les valeurs que peut prendre la surface jaune.

Il nous faut maintenant formaliser l'orientation du vecteur d'étirement Δl. Pour ce faire on va introduire le vecteur unitaire de direction 1l, ce qui permet d'exprimer Δl non plus seulement par :
Δl = Δx * 1x + Δy * 1y
mais aussi par :
Δl = Δl * 1l

gradient-optimisation-graphe-1.jpg
vecteur-unitaire-direction.jpg

La valeur de ce vecteur unitaire de direction est donnée – via n_vecteur-unitaire, n_sinus et n_cosinus – par :
1l = cos(α) * 1x + sin(α) * 1y n_vecteur-unitaire-directionnel

L'étape suivante de la formalisation de notre problème d'optimisation consiste à passer de Δl à dl n_dx c-à-d à un accroissement arbitrairement petit. En effet si le vecteur d'étirement est trop grand, on risque de "dépasser l'optimum" sur la surface f(x,y) c-à-d en fait, redescendre en-dessous de la valeur de cet optimum.

gradient-formalisation-infinitesimal.jpg

Or, en-dessous d'une certaine longueur, un segment de courbe peut être considéré comme une droite ⇒ le remplacement de Δl par la différentielle dl n_dx permet d'approcher la valeur recherchée de l'optimum de surface (NB : le remplacement de Δl par dl implique géométriquement celui de Δf par df).

gradient-optimisation-pente.jpg

Dans ces conditions, ce que l'on optimise est alors tout simplement la pente df / dl.

Et par n_tan(α)=y/x :
df / dl = tg(φ)     ⇔ deriv-dir-tg
df = tg(φ) * dl
c-à-d que la différentielle de f vaut le produit de sa pente tg(φ) par le déplacement dl.

Le problème est maintenant clairement posé : on cherche à déterminer l'orientation du vecteur d'étirement dl qui donne la plus grande pente df/dl.

Et nous savons que :

  • la norme de dl vaut :
    dl = √(dx2 + dy2)     n_module
  • df = f(x+dx,y+dy) - f(x,y)

Cependant, maximiser
[ ( x + dx ) * ( y + dy ) - x * y ] / √(dx2 + dy2)
est assez complexe.

Une voie plus simple consiste à exploiter le fait que
df = f(x+dx,y+dy) - f(x,y)
est assez proche de la définition de la dérivée
df / dx = ( f(x+dx) - f(x) ) / dx n_derivee.
En effet, pour passer de la première à la seconde, il suffit de supprimer la variable y (ou x), et de diviser les deux membres par dx (ou dy).

Alors bien sûr df / dx (ou df / dy) n'est pas df / dl. Cependant le passage à l'approche infinitésimale a pour effet qu'à un segment infinitésimal dl, correspond sur la surface quelconque (courbe) f(x,y) une surface de l'on peut considérer comme plane :

gradient-optimisation-formalisation.jpg

Or, dans ce contexte de surface plane, le graphique suivant illustre que la différentielle totale de f est égale à la somme de ses différentielles partielles :
df = dfx +dfy     ⇔
df = f(x+dx,y) - f(x,y) + f(x,y+dy) - f(x,y)

Le graphique ci-dessous illustre la simplification du calcul apportée par l'approche infinitésimale conduisant à une surface plane : le vecteur orange (correspondant à dfy), dont l'origine était celle du vecteur violet, peut être translaté à la suite de celui-ci.

gradient-derivee-partielle.jpg

Pour formuler cette propriété, procédons à l'artifice mathématique suivant :
df = ( f(x+dx,y) - f(x,y) ) * dx / dx + ( f(x,y+dy) - f(x,y) ) * dy / dy
⇒ soit :
∂f/∂x =( f(x+dx,y) - f(x,y) ) / dx
la "dérivée partielle de f en x" (NB : ∂, appelé "d ronde", remplace les d).

Soit par exemple f(x,y)=2*x2*y3 ⇒ ∂f/∂x=4*x*y3 ⇒ au point par exemple (x,y)=(3,1) on a que ∂f/∂x=12.

que l'on substitue dans l'égalité précédente ⇒
df = ∂f/∂x * dx + ∂f/∂y * dy
... dont le membre de droite ressemble à la formulation algébrique du produit scalaire :
ax * dx + ay * dy = a . dl     n_produit-scalaire-algebrique
Pour que cette ressemblance devienne équivalence, il suffit de définir a tel que :
a = ∂f/∂x * 1x + ∂f/∂y * 1y = ∇f
qui est appelé "gradient" de la fonction f (et noté f plutôt que a), et qui est donc « le vecteur dont les composantes en x et y sont les dérivées partielles de f en x et y (c-à-d les pentes de f en x et y) »
⇒ il résulte de n_gradient et n_differentielle-totale que
df = ∂f/∂x * dx + ∂f/∂y * dy = ∇f . dl
c-à-d que le différentiel total d'une fonction de plusieurs variables est égal au produit scalaire du vecteur déplacement dl par le vecteur gradient f (et le produit scalaire est la somme des produit des composantes homologues).

N.d.A. Le développement ci-dessus peut également se faire comme suit :
pour exprimer :
df = ∂f/∂x * dx + ∂f/∂y * dy   n_differentielle-totale
en fonction de :
dl = ( dx , dy ) = dx * 1x + dy * 1y   n_vecteur-unitaire
il suffit de définir :
f = ∂f/∂x * 1x + ∂f/∂y * 1y   n_gradient
de sorte que :
df = ∂f/∂x * dx + ∂f/∂y * dy = ∇f . dl   n_differentielle-totale-1

Le symbole ∇ est appelé "nabla" (nom grec d'une petite harpe).

Le graphique suivant illustre précisément les composantes de la différentielle totale df n_differentielle-totale-1 :
  • à la différentielle partielle dfx correspond l'angle formé par la composante mauve avec dx
  • à la différentielle partielle dfy correspond l'angle formé par la composante jaune avec dy
differentielle-totale.jpg

Nous approchons de la solution puisque nous avons maintenant une relation entre df et dl. Mais notre objectif est de formuler la relation entre df et dl, et plus précisément de déterminer l'orientation du vecteur d'étirement dl qui donne la plus grande pente df/dl. Pour ce faire il suffit de diviser par dl (module de dl) les deux membres de n_differentielle-totale-1 :
df / dl = ∇f . dl / dl     ⇔
df / dl = ∇f . dl * 1l / dl     ⇔
df / dl = ∇f . 1l

df / dl est appelée "dérivée directionnelle" de la fonction f, dans la direction 1l du déplacement dl. Le terme "dérivée" est quelque peu abusif car l n'est pas une variable de f, mais il se justifie par le fait que df / dl est la pente de la fonction f dans une direction donnée 1l.

derivee-directionnelle.jpg

En effet, par n_produit-scalaire-trigono, on a alors que :
df / dl = ||∇f|| * ||1l|| * cosθ     ⇔
df / dl = ||∇f|| * cosθ
où θ est l'angle entre f et 1l

Le terme "directionnelle" n'est donc quant à lui pas du tout abusif : il signifie que la variation de f dépend du module dl du vecteur déplacement dans une direction donnée 1l.

Le graphique suivant permet de situer en 3D le graphique précédent : df/dl c-à-d la pente de f le long de dl, c-à-d la tangente de l'angle entre cette pente de f et dl, c'est la projection du gradient f sur la direction 1l du déplacement.
gradient-final.jpg
derivee-directionnelle.jpg

Nous pouvons maintenant résoudre notre problème de maximisation de df/dl en modulant l'orientation : df/dl, c-à-d la projection du gradient dans la direction du déplacement dl, est à son maximum lorsque la direction du déplacement est celle (c-à-d parallèle à celle) du gradient f ! En effet, dans ce cas θ=0 ⇒ cosθ est alors à sa valeur maximale de 1 ⇒
df / dl |max = ||∇f ||

On voit ainsi que le gradient est un vecteur qui permet de caractériser les variations de la fonction :

  • il indique la direction de plus grande pente ;
  • son module est la valeur cette plus grande pente.
triangle-clipedia.png Vidéo Clipedia : Le gradient : illustration

Nous allons maintenant résoudre notre problème d'optimisation à partir du cas concret d'un rectangle déterminé par le point (3,2), et dont la surface f vaut donc 3*2=6cm2.

f = ∂f/∂x * 1x + ∂f/∂y * 1y     n_gradient   ⇒
puisque f(x,y) = x * y     ⇒
f = y * 1x + x * 1y     ⇒
f(3,2) = 2 * 1x + 3 * 1y [cm]     ⇒

gradient-illustration-1.jpg

Commençons par calculer la dérivée directionnelle (qui est une pente), correspondant à un angle α quelconque (mesuré par rapport à l'axe x).

gradient-illustration-2.jpg

df / dl = ∇f . 1l     n_derivee-directionnelle
Or :
•  ∇f(3,2) = 2 * 1x + 3 * 1y
•  1l = cos(α) * 1x + sin(α) * 1y
⇒ par n_produit-scalaire-algebrique :
df / dl = 2 * cos(α) + 3 * sin(α)
ainsi dans le graphique ci-dessus, dl à été dessiné sur une angle arbitraire de α = -5°, ce qui correspond à une pente df / dl = 1,73 cm.

La valeur de la pente maximale quant à elle correspond à θ=0
df / dl |max = ||∇f|| * cos0     n_derivee-directionnelle-2     ⇒
df / dl |max = ||∇f||     ⇔
df / dl |max = √(22 + 32) = 3,6 cm

Calculons enfin l'orientation du gradient correspondant à cette pente maximale (graphique suivant : angle γ par rapport à l'axe x, à ne pas confondre avec l'angle θ que forme le vecteur d'étirement par rapport au gradient) :
tg(γ) = 3/2     ⇔
γ = arctan(3/2) ≈ 56°

gradient-illustration-3.jpg

O peut généraliser la résolution du problème au cas de n'importe quel rectangle :
f(x,y) = y * 1x + x * 1y [cm]

  • dont le module vaut : df / dl |max = ||∇f || = √(y2 + x2)  cm
  • dont l'angle par rapport à l'axe x vaut : γ = arctan(x/y)

Champ vectoriel. À noter que, dès lors que l'on peut définir le vecteur gradient en tout point du domaine de définition de la fonction f(x,y), on peut donc considérer que le gradient d'une fonction scalaire est un champ vectoriel. Celui-ci donne des informations sur la façon dont la fonction varie.

gradient-illustration-4.jpg

On constate que l'orientation des vecteurs gradients est inférieure à 45°, ce qui est intuitif : on maximise évidemment la surface en tirant plus du côté le plus long. Selon le même raisonnement, les gradients situés sur l'axe à 45° correspondent au carré. On notera que cette intuitivité de la solution n'est plus apparente pour des problèmes plus complexes, et c'est évidemment dans ces cas là que l'outil mathématique du gradient s'avère particulièrement utile.

triangle-clipedia.png Vidéo Clipedia : Gradient et lignes de niveau

Nous allons ici montrer que la notion de gradient s'applique directement à celle de ligne de niveau, qui est une coupe horizontale du relief, et dont tous les points du périmètre de base représentent une même hauteur par rapport au niveau de la mer.

ligne-de-niveau.jpg

Le principe de lecture d'une telle carte est donc que plus on se déplace parallèlement aux lignes, plus le relief du trajet est plat, et plus on se déplace perpendiculairement aux lignes, plus le trajet est pentu. C'est évidemment via la notion de pente que le lien avec le gradient apparaît.

Formalisation. Le relief de la Terre peut être représenté par une fonction "altitude" : à chaque point de longitude x et latitude y, correspond une altitude h(x,y). Ainsi une ligne de niveau est telle que h(x,y) = kk est l'altitude de chaque point de la ligne.

Comprenons bien que cette notion de courbe de niveau peut être généralisé à toute fonction de deux variables, comme par exemple T = P * V / N / kB n_gaz-parfaits, ou encore notre exemple précédent h = x * y. L'unité de la fonction T=f(P,V) est l'unité de température (degré Celsius ou Kelvin), et l'on parle de ligne isotherme, tandis que l'unité de la fonction h(x,y) est l'unité de surface (m2).

ligne-de-niveau-2.jpg

Nous avons déjà vu que dans ce second cas la fonction prend elle-même la forme d'une surface (représentée en bleu). En chaque point de celle-ci la valeur de la fonction exprime la surface du rectangle jaune (et non pas une hauteur physique). La direction du gradient indique la direction de plus grande pente de la fonction. C'est cette direction qu'il faut suivre pour faire varier au maximum la surface jaune f(x,y).

ligne-de-niveau-3.jpg

À la surface de f(x,y) on peut associer une série de lignes de niveau. Les points d'une même ligne correspondent à une série de rectangles de même surface jaune.

ligne-de-niveau-4.jpg

La représentation bidimensionnelle est plus simple que la représentation tridimensionnelle. On y voit ici une série de rectangles jaunes correspondant à une même surface f(x,y)=2.

ligne-de-niveau-5.jpg

On peut y représenter les vecteurs gradients. À noter que dans le graphique ci-contre l'échelle du module de f = ∂f/∂x * 1x + ∂f/∂y * 1y n_gradient est réduite (1 cm devrait correspondre à la distance unitaire des axes) afin de pouvoir en représenter clairement un grand nombre.

Comprenons bien le lien entre gradient et ligne de niveau. Le gradient exprime la variation de la fonction f, qui est donnée par df = ∇f . dl n_differentielle-totale-1dl = dx * 1x + dy * 1y n_vecteur-unitaire "cache" les variations dx et dx des variables x et y de la fonction.

ligne-de-niveau-6.jpg

Le graphique ci-contre nous rappelle la signification géométrique de ce produit scalaire f . dl = ∂f/∂x * dx + ∂f/∂y * dy n_differentielle-totale-1 : df, la variation totale de la fonction f(x,y) sous l'effet de variations dx et dy (symbolisées par le vecteur dl), est donnée par la pente en x fois dx, plus la pente en y fois dy.

Cette interprétation géométrique étant rappelée on comprend alors toute la puissance de df = ∇f . dl pour formuler un déplacement le long d'une ligne de niveau : on l'exprime tout simplement par df = ∇f . dl = 0. Or nous savons qu'un produit scalaire nulle exprime le fait que les vecteurs f et dl sont perpendiculaires (cf. supra #produit-scalaire). Ainsi dans le graphique supra montrant le champ de gradients, ceux-ci sont perpendiculaires à chaque courbe de niveau qu'ils croisent.

ligne-de-niveau-7.jpg

De même, la dérivée directionnelle df / dl = ||∇f|| * cosθ = 0 n_derivee-directionnelle-2 correspond à θ=π/2, où θ est l'angle entre vecteurs radient et direction.

Voici donc clairement illustré le lien entre gradient et ligne de niveau. On constate ici toute la puissance mathématique de la notion de gradient, sans laquelle on aurait que df = ∂f/∂x * dx + ∂f/∂y * dy = 0 n_differentielle-totale-1 pour formuler le déplacement le long d'une ligne de niveau.

ligne-de-niveau-8.jpg

Lignes
de champ

Le gradient est un champ vectoriel qui est partout perpendiculaire aux lignes de niveau (bleues). On peut alors introduire la notion de lignes de champ (noires), qui en tout point sont tangentes au champ de gradients. Ainsi un déplacement sur une ligne de champ correspond à une déplacement de pente maximale, tandis que les déplacement sur une ligne de niveau correspond à une déplacement de pente nulle.

Notons d'autre part que les lignes de niveau apportent une information sur le module du gradient, de sorte que l'on n'est plus obligé de représenter l'ensemble des vecteurs dont le module augmentent vers le nord-est. En effet dès lors que les lignes de niveau dessinées correspondent à un même incrément de la fonction, on en déduit que des lignes plus espacées correspondent à une pente plus faible, et inversement. Ainsi dans le graphique l'espace entre les lignes de niveau diminue lorsqu'on se déplace vers le nord-est.

Sur base de ce que nous avons développé supra, la pente que gravit le montagnard dans son trajet sinueux est donnée par la dérivée directionnelle de la fonction "altitude" f(x,y), où x et y déterminent la position du marcheur par ses longitude et latitude. Cette dérivée directionnelle vaut le produit scalaire du gradient de la fonction (donnant la direction de plus grande pente) et du vecteur unitaire dans la direction du déplacement : df / dl = ∇f . 1l n_derivee-directionnelle. L'angle θ entre le vecteur gradient et la direction du déplacement conditionne la valeur du taux de variation de la fonction altitude : df / dl = ||∇f|| * cosθ n_derivee-directionnelle-2.

Nous avons vu également que le vecteur gradient f = ∂f/∂x * 1x + ∂f/∂y * 1y n_gradient peut être représenté graphiquement par le "champ gradient de la fonction". Nous allons présenter ici une façon de représenter, pour un point donné de ce champ, l'ensemble des valeurs prises par le taux de variation df/dl en fonction de la direction.

Voici quelques-une de ces valeurs :

  • si la direction est celle du gradient ⇔ θ=0 ⇒ df/dl = ||∇f || (NB : en l'occurrence il s'agit de la valeur maximale de cette pente) ;
  • si la direction est orthogonale au gradient ⇔ θ=π/2 ⇒ df/dl = 0 (NB : en l'occurrence il s'agit de la valeur d'une courbe de niveau) ;
  • si la direction est de 30° par rapport au gradient ⇔ θ=30° ⇒ df/dl = ||∇f || * √(3)/2 (NB : ainsi en déviant de 30% par rapport à la direction de plus grande pente on est encore à environ 87% de celle-ci...)  ;
  • si θ=60° ⇒ df/dl = ||∇f || * 1/2  ;
  • si θ=120° ⇒ df/dl = ||∇f || * -1/2 (NB : on descend sur une pente valant la moitié de la pente maximale)  ;
  • si θ=180° ⇒ df/dl = ||∇f || * -1 (NB : on descend sur la pente maximale) ; ... etc

Dans le graphique suivant les traits rouges représentent les valeurs de df/dl pour θ valant 0°, 30°, 60°, 300° et 330°. On notera que cette étoile "cannabis" s'incrit dans un cercle, dont le diamètre vaut le gradient et passant par le point auquel on étude les variations de la fonction f(x,y) en fonction de la direction.

gradient-cannabis.jpg
triange-rect-cercle.jpg

En effet on peut démontrer que tous les triangles rectangles ayant la même hypoténuse on leur sommet sur un cercle dont le diamètre est cette hypoténuse. Il résulte de cette propriété que la projection orthogonale du gradient sur une direction déterminée, c-à-d la la dérivée directionnelle de f(x,y), est la longueur de la direction intérieure au cercle.

gradient-cannabis-2.jpg

On peut alors, dans le graphique du champ de gradient, remplacer le vecteur gradient par l'étoile "cannabis", pour symboliser de façon plus complète et intuitive l'information contenue dans le concept de gradient. Dans le graphique ci-contre la direction sort du cercle ⇔ on a donc une valeur négative de la pente df/dl ⇔ dans cette direction, la valeur de la fonction diminue.

gradient-cannabis-2.jpg

L'image ci-contre illustre l'application de ce principe à notre montagnard.

Les sept premières minutes de cette vidéo rappellent l'essentiel de la première des cinq vidéos consacrées au gradient : celui-ci a été défini de telle sorte qu'il permet d'exprimer df en fonction du vecteur déplacement dl ⇒ en divisant les deux membres de cette expression par dl on obtient la dérivée directionnelle c-à-d la pente df/dl.

Dans cette dernière vidéo consacrée au gradient on souligne le fait que l’expression mathématique de la dérivée directionnelle en termes de gradient ne dépend pas du nombre de variables de la fonction.

Ainsi en 3D, on ajoute simplement une troisième composante (z), de sorte que le développement de n_differentielle-totale à n_differentielle-totale-1 devient que, pour exprimer :
df = ∂f/∂x * dx + ∂f/∂y * dy + ∂f/∂z * dz   n_differentielle-totale'
en fonction de :
dl = ( dx , dy , dz) = dx * 1x + dy * 1y + dz * 1z   n_vecteur-unitaire'
il suffit de définir :
f = ∂f/∂x * 1x + ∂f/∂y * 1y + ∂f/∂z * 1z   n_gradient'
de sorte que :
df = ∂f/∂x * dx + ∂f/∂y * dy + ∂f/∂z * dz = ∇f . dl   n_differentielle-totale-1'

df /dl = ∇f . dl / dl

df /dl = ∇f . 1l    n_derivee-directionnelle
qui est effectivement identique au cas à deux dimensions. CQFD.

gradient-3D.jpg

La trajectoire dl est décomposée en trois composantes dx, dy et dz.

Une différence apparaît cependant dans la représentation graphique du gradient, exposée dans la vidéo précédente. À deux dimensions, la projection orthogonale du gradient sur une direction déterminée – c-à-d la la dérivée directionnelle de f(x,y) – est la longueur de la direction intérieure au cercle dont le diamètre vaut le gradient et passant par le point auquel on étude les variations de la fonction f(x,y) en fonction de la direction.

grad-sph.gif

Animation en trois images montrant le passage de l'interprétation graphique 2D à 3D. Le second vecteur direction, apparaissant à l'image 2, sort du plan et détermine un autre cercle passant par le même point d'application des vecteurs gradient et direction.

Mais en 3D, le vecteur direction peut être pris dans n'importe quelle direction par rapport au gradient, et à chacune de ces directions correspond un cercle passant par le point déterminé par la projection du gradient sur le vecteur direction et leur point d'application commun, de sorte que la méthode du cercle en 2D devient en 3D la "méthode de la sphère", où la dérivée directionnelle a pour valeur la longueur du segment intérieur à la sphère, dans la direction du déplacement.

Ainsi l'analogie botanique avec la feuille de canabis – dont les doigts indiquent que la dérivée directionnelle est la plus grande dans le sens du gradient, et diminue au plus la direction se rapproche de l'orthogonalité au gradient – pourrait être prolongée en 3D par l'analogie avec une fleur de trèfle, constituée de jets qui partent tous du même point.

Nous sommes maintenant en mesure d'étudier les phénomènes de propagations dans les quatre exemples illustrés au début de la première vidéo. On notera que le quatrième exemple, une algorithme d'optimisation, est applicable à des fonctions composées de (beaucoup) plus de trois variables, ce qui est particulièrement utile dans le domaine de l'IA.

triangle-clipedia.png Vidéo Clipedia : Le gradient : exercice

Soit une montagne telle que :

  • modélisée mathématiquement au moyen de la fonction altitude h(x,y)x et y sont les coordonnées de la position du skieur repérée sur le plan XY (NdA : du niveau de la mer), dont l'origine correspond au sommet de la montagne ;
  • les axes X et Y correspondent à la latitude (S→N) et longitude (O→E) mais sont mesurés en mètres relativement à l'origine des axes X et Y, plutôt qu'en degrés relativement au croisement de l'équateur et du méridien de Greenwich.

Quelle est la pente φ prise par un skieur étant donné que ? :

  • il se dirige vers le cap 20° NNE ;
  • le skieur est positionné au point (x,y)=(20,30), l'unité valant 10 mètres ;
  • la forme de la montagne est modélisée au moyen d'un paraboloïde (une parabole en X et une parabole en Y) h(x,y) = h0 - a * x2 - b * y2 où :
    • h0 = 710m est la hauteur de la montagne (belge...), qui est bien la valeur de h(0,0);
    • a = 15 10-3 m-1
    • b = 12 10-3 m-1

      On a bien ainsi que h est mesurée en mètres : m - m-1 * m2 - m-1 * m2 ≡ m

gradient-exercice.jpg
Résolution

Il nous est demandé de calculer une pente, c-à-d une dérivée, étant donné que la direction est connue. L'outil mathématique dont nous avons besoin est donc la dérivée directionnelle. Et nous disposons des données requises pour la calculer, dont une direction (20°) à partir d'une position (20,30).

Le système d'équation de la solution est donc :
dh / dl = tg(φ)     n_deriv-dir-tg
dh / dl = ∇h . 1l     n_derivee-directionnelle
h = ∂h/∂x * 1x + ∂h/∂y * 1y     n_gradient
1l = cos(α) * 1x + sin(α) * 1y     n_vecteur-unitaire-directionnel

Par n_deriv-dir-tg on voit que l'angle φ est donné par la dérivée directionnelle, laquelle se calcule par n_derivee-directionnelle c-à-d le produit scalaire du gradient calculé par n_gradient et du vecteur unitaire directionnel calculé par n_vecteur-unitaire-directionnel :

n_gradient : ∇h = - 2 * a * x * 1x - 2 * b * y * 1y
n_vecteur-unitaire-directionnel : 1l = cos(α) * 1x + sin(α) * 1y

Par n_vecteur-unitaire et n_produit-scalaire-algebrique on sait que la valeur du produit scalaire n_derivee-directionnelle sera donc :
-2 * a * x * cos(α) - 2 * b * y * sin(α)     ⇒
tg(φ) = -2 * a * x * cos(α) - 2 * b * y * sin(α)     ⇒
tg(φ) = -2 * 15 10-3 * 20 * cos(20) - 2 * 12 10-3 * 30 *sin(20)     ⇒
tg(φ) ≈ -0,81     ⇒
φ = -39°

Pour terminer interprétons rapidement le second des quatre exemples illustrés au début de la première des vidéos consacrées au gradient.

gradient-conduction-thermique.jpg

J = - kT * ∇T Notre équation de conduction thermique exprime que le flux de chaleur est proportionnel (kT est le coefficient de conductivité thermique) à l'opposé du gradient, c-à-d qu'il se dirige dans le sens opposé au gradient. Celui-ci est visible par le gradient des couleurs : du blanc (au centre, plus chaud) vers le rouge (aux extrêmes, moins chaud). Rappel : nous avons vu que le gradient est perpendiculaire aux courbes de niveau.

Voilà qui termine la série des (six) vidéos sur le gradient et la dérivée directionnelle.

Intégrale

https://philosophie.jortay.net/savoir-scientifique-base#integrale

Seule l’interprétation graphique est modifiée en passant du cercle à la sphère pour la visualisation de la dérivée directionnelle dans une direction donnée.

triangle-clipedia.png Vidéo Clipedia : L'intégrale : introduction

Dans la section consacrée à la dérivée nous avons vu que "dériver" (par rapport au temps) consiste à calculer le taux de variation v(t) = dx(t) / dt à partir de la variation dx(t). L'opération inverse, c-à-d calculer la variation à partir du taux de variation, s'appelle "intégrer" : Δx(t) = ∫ dx(t) = ∫ v(t) * dt.

Pour ce faire l'équation xt - x0 = v * t n_vitesse du MRU suffit certes, car v est constant. Mais si le taux de variation est variable (cas du MRUA) alors on devra utiliser un nouvel outil mathématique : l'intégrale.

Le principe de l'intégrale consiste à découper le temps en tranches et d'attribuer à chacune une vitesse constante qui n'est autre que la vitesse moyenne de cette tranche. Nous avons vu dans l'illustration du MRU n_vitesse que la surface du rectangle correspondant est précisément la variation que l'on souhaite retrouver (en l'occurrence la distance parcourue).

Dès lors pour affiner l'intégration on passe d'un nombre fini de tranches (graphique de gauche ci-dessous, où elles sont notées en Δ) à un nombre infini de tranches infinitésimales (graphique de droite, où elles sont notées en d). Ce faisant on remplace la fonction discontinue vn = Δxn / Δt par la fonction continue v(t) = dx(t) / dt.

integrale.png

La flèche verte représente la fonction d'intégration (la flèche inverse représente donc la fonction de dérivation). Le graphique de droite représente la notation spécifique de l'intégrale, et sa signification géométrique d'effet de lissage.

integrale-2.jpg

Maintenant que nous avons exposé la signification géométrique d'une intégrale nous allons voir comment la calculer. Mais pour cela il nous faut d'abord transformer le résultat du graphique de droite ci-dessus en une fonction du temps c-à-d que l'on considère x( tf ) comme variable de sorte que l'on remplace x( tf ) par x( t ), et que x( ti ) est considéré comme connu (et passe donc dans le membre de droite ⇒ la flèche verticale bleu descend maintenant jusqu'à l'origine de l'axe x(t) ). Il nous faut également distinguer le t de la variable du t représentant la borne finale de l'intégrale ⇒ on remplace le premier par t' (qui représente le temps passé).

Après ces corrections de notations on obtient : x(t) = x(t i) + ∫ t it v(t') * dt'

Le calcul d'une intégrale se résume alors en un règle simple : « l'intégrale de f(x) est la différence des primitives de f(x) entre les bornes » :

x ix f f(x) * dx = F(xf) - F(xi)
que l'on note aussi :
x ix f f(x) * dx = [ F(x) ] x ix f
F(x) est appelée "primitive" de "l'intégrande" f(x), et est telle que
F(x) = ∫ f(x) * dxdF(x) / dx = f(x)
NB : primitive et dérivée sont donc des fonctions inverses.

Pour montrer le raisonnement conduisant à n_integrale on part de
x(t) = x(ti) + ∫ t it v(t') * dt' n_integrale-continue
appliquée au MRU c-à-d telle que v(t')=v0
Or dans ce cas on sait que la solution est x(t) = v0 * t + x0 n_vitesse
qui vaut aussi pour x(ti) = v0 * ti + x0
que l'on substitue dans n_integrale-continue
t it v(t') * dt' = v0 * t - v0 * ti
Comme on est dans le cas v(t')=v0 ⇒ on vérifie bien que :
t it v0 * dt' = v0 * ( t - ti )    ⇔
v0 * ∫ t it dt' = v0 * ( t - ti )    ⇔
v0 * ( t - ti ) = v0 * ( t - ti )

Ce résultat obtenu pour v(t')=v0 on le généralise à toute fonction v(t') en posant
t it v(t') * dt' = V(t) - V(ti )
V(t) est telle que dV(t) / dt = v(t')

On peut alors démontrer formellement n_integrale en partant de la primitive
V(t) = ∫ t*t v(t') * dt' + C    ⇔
V(t) = ∫ t*ti v(t') * dt' + ∫ ti t v(t') * dt' + C   ⇔
V(t) = V(ti) - C + ∫ ti t v(t') * dt' + C   ⇔
ti tv(t') * dt' = V(t) - V(ti)
CQFD

La principale difficulté du calcul d'une intégrale consiste donc en l'identification de la primitive de l'intégrande. Cette maîtrise vient par la pratique de l'intégration et la mémorisation de primitives fréquentes.

Quelques primitives fréquentes

Intégrande f(x)Primitive F(x)
1 / xln(x)
1 / x2- 1 / x
sin(x)- cos(x)
cos(x)sin(x)

La primitive est l'intégrale de l'intégrande, à une constante près. L'intégrande est la dérivée de la primitive.

Comme application du calcul intégral démontrons mathématiquement l'équation du MRUA xt = x0 + v0 * t + a * t2 / 2 n_xt=x0+v0*t en appliquant n_integrale pour calculer la distance parcourue xt - x0 :
xt - x0 = ∫ 0 t  v(t') * dt' = V(t)- V(0)
puisque géométriquement cette distance parcourue est la surface en-dessous de la droite vt = v0 + a * t n_acceleration     ⇒
V(t) = C + v0 * t + a/2 * t2    ⇒
xt - x0 = C + v0 * t + a/2 * t2 - C    ⇔
xt = x0 + v0 * t + a/2 * t2
CQFD

Autre application du calcul intégral : calculer la puissance de l'énergie nucléaire. Celle-ci consiste en la fission du noyau d'atome, ce qui provoque son explosion par expulsion des protons qu'il contient, puisque ceux-ci sont des charges électriques positives, qui se repoussent mutuellement.

La force électrique de répulsion entre les charges positives que sont les protons fournit donc un travail W à ceux-ci, qui acquièrent ainsi une certaine vitesse et, partant, une certaine énergie cinétique Ec = M * v2 / 2 n_energie-cinetique. Et en vertu du principe de conservation on a que W = Ec. Or W = f * x(t) n_travail, mais dans cette formule la force f est considérée comme constante, or la force électrique diminue avec la distance entre les charges : f(r) = kC * q1 * q1 / r 2 n_force-de-coulomb (NB : le modèle de calcul est ici composé de deux protons dont l'un est considéré immobile). La solution consiste à considérer la force électrique comme constante sur un segment infinitésimal dx.

explosion-atomique.png

Et puisque dx est une grandeur infinitésimale alors c'est aussi le cas du travail correspondant : dW = f(x) * dx (le rectangle bleu dans le graphique ci-dessus)    ⇒
W = ∫ dW = ∫ f(x) * dx = [ F(x) ]x0 =
[ - kC * qe2 / x ] x0 =
- kC * qe2 * [ 1 / ∞ - 1 / x0 ] =
- kC * qe2 * 1 / x0
où :
x0 est la distance entre nucléon du noyau c-à-d la taille d'un nucléon, soit un ordre de 10 * 10-15 m ;
kC = 9 * 109 N * m2 / C2
• qe = 1,6 * 10 -19 C
⇒ W = 23 * 10 -14 J
ce qui est extrêmement petit ... mais ne concerne qu'un seul proton ⇒ si on considère un nombre de protons égal au nombre d'Avogadro, c-à-d le nombre de protons contenus dans une mole, donc dans un gramme de protons, on obtient alors une valeur nettement plus grande :
1 g : W = 6 * 1023 * 23 * 10 -14 J = 138 * 109 J.
Un gramme de protons contient donc un potentiel d'énergie de milliards de joules !

La fission du noyau d'un atome lourd tel que l'uranium 235 dégage deux millions de fois plus d'énergie que brûler la même masse de charbon...

Technique
d'intégration

Établir la formule qui donne l'aire du cercle en fonction de son rayon est un cas montrant qu'il est parfois difficile de calculer la primitive de façon usuelle (pratique et mémorisation). Dans ce cas la technique de changement de variable consiste à passer des coordonnées cartésiennes aux coordonnées polaires et d'ainsi obtenir une expression trigonométrique de l'intégrande, dont la primitive est facilement identifiée à partir de la formule du cosinus de l'arc double.

surface-cercle.png

Le premier réflexe est de définir l'intégrande à partir du théorème de Pythagore :
R2 = x2 + y2 n_pythagore n_pythagore-math   ⇔
y = √ ( R2 - x2 )    ⇒
S/4 = ∫ ds = ∫0R y(x) * dx = ∫0R √ ( R2 - x2 ) * dx
Or trouver la primitive de √ ( R2 - x2 ) est très difficile ...

surface-cercle-polaire.png

Il est intuitivement facile de comprendre qu'une solution plus adaptée au cercle est d'exprimer ses points en fonction de leur angle correspondant (coordonnées polaires) plutôt que de leur coordonnées x et y :
y = R * cos(θ)
x = R * sin(θ)    ⇒
dx / dθ = R * dsin(θ) / dθ    ⇒
par n_derivee-sin
dx / dθ = R * cos(θ)   ⇔
dx = R * cos(θ) * dθ    ⇒
on substitue les nouvelles expressions de y(x) et dx dans :
S/4 = ∫ ds = ∫0R y(x) * dx    ⇒
S/4 = ∫0π/2 R * cos(θ) * R * cos(θ) * dθ   ⇔
S/4 = ∫0π/2 R2 * cos2(θ) * dθ

surface-cercle-polaire-2.png

La nouvelle intégrande a une forme différente, mais la surface qui lui correspond est bien égale à S/4.

Maintenant il nous faut trouver la primitive de l'intégrande R2 * cos2(θ) que l'on va simplifier par :
cos(2*θ) = 2 * cos2(θ) - 1    n_cos(2a)   ⇔
cos2(θ) = 1/2 + cos(2*θ) / 2     ⇒
S/4 = R2 * ∫0π/2 [ 1/2 + cos(2*θ) / 2 ] * dθ    ⇒
par n_derivee-fonction-composee :
F(θ) = θ / 2 + 1/4 * sin(2*θ)    ⇒
S/4 = R2 * [ θ / 2 + 1/4 * sin(2*θ) ]0π/2   ⇔
S/4 = R2 * π/4    ⇔
S = π * R2

surface-cercle-2.png

Notons que cette démonstration a été développée pour illustrer la technique du changement de variable. Cependant la surface du cercle peut être calculée plus simplement en décomposant le cercle en une somme de triangles de base infinitésimale R * dθ par n_radian, et dont la surface (notée dS) est donc :
dS = R * dθ * R / 2 = R2 * dθ / 2    ⇒
S = ∫ dS = ∫0 R2 * dθ / 2    ⇔
S = R2 / 2 * [ θ ]0    ⇔
S = π * R2

Terminons en notant que ab k = ∞ puisque l'outil intégral est conçu pour sommer des éléments infinitésimaux à l'infini ⇒ si l'élément infinitésimal est absent alors la somme vaut nécessairement l'infini !

Nombre imaginaire et complexe

https://philosophie.jortay.net/savoir-scientifique-base#nombre-imaginaire-complexe

Les nombres imaginaires et les nombres complexes constituent un outil mathématique qui permet de faciliter grandement le traitement mathématique d’un très vaste nombre de phénomènes en physique : optique, relativité, mécanique quantique, électricité, ...

 4.3.1. Nombres imaginaires
 4.3.2. Définition et opérations
 4.3.3. Représentation géométrique
 4.3.4. Forme polaire
 4.3.5. Puissance et racines
Nombres imaginaires
https://philosophie.jortay.net/savoir-scientifique-base#nombre-imaginaire

Une règle fondamentale de l'arithmétique en général et des nombre complexes en particulier est que « moins par moins donne plus » : -a * -b = a * b

Mais cette règle pose problème lorsqu'on l'applique à la racine d'un nombre.

Par définition la racine n-ième d'un nombre a – notée n a – est telle que ( √n a ) n = +/- a si n est paire et ( √n a ) n = a si n est impaire
ou encore
(   √2n a ) 2n = +/- a  et  (      √2n-1 a ) 2n-1 = a

Il découle de n_racine et ( a m ) n = a m*n n_puissance-de-puissance que n a = a 1/n

Il y a bien un problème dans le cas où a est négatif et n est paire : par exemple si n=2 alors il résulte de n_racine que √-4 * √-4 = +/- 4 ; or il résulte de n_moins-par-moins que le membre de gauche ne peut être que positif ...

triangle-clipedia.png Vidéo Clipedia : Les nombres imaginaires

La solution au problème décrit ci-avant été inventée au 16° siècle par le physicien et mathématicien Cardano (inventeur du cardan) afin de rendre possible le calcul des racines du polynôme du troisième ordre (a * x3 + b * x2 + c * x + d = 0).

Cette solution consiste à poser que :
√-a = √( -1 * a) = √-1 * √a = i * √a
où par définition i = √-1, appelée "unité imaginaire", est telle que i 2n = -1

Par conséquent, soit a un nombre réel, alors a * i est dit "nombre imaginaire" : I ≡ i * ℝ.

imaginaires-reels.png

La comparaison des deux droites illustre la nature "d'unité imaginaire" de i autour de zéro, ce dernier étant l'unique valeur commune aux deux ensembles iℝ et ℝ.

Ainsi la solution de l'équation du second degré n_racines-polynome :
x = ( - b +/- √D ) / ( 2 * a )
D ≥ 0

peut être généralisée en :
x = ( - b +/- d * √|D| ) / ( 2 * a )
d = 1 si D ≥ 0
d = i si D < 0

Ainsi en particulier l’équation x2 = −a  où  a > 0 a pour solutions x = +/- i * √a

Définition et opérations
https://philosophie.jortay.net/savoir-scientifique-base#complexes-definition-operations
Nombres
complexes

Un nombre complexe est la somme d'un terme réel et d'un terme imaginaire : z = x + i * y où x et y sont des réels : ℂ = ℝ +iℝ.

Les opérations sur nombres complexes consistent à appliquer les règles valables pour les réels aux parties des nombres complexes (en prenant en compte le fait que i 2 = −1) : soit z = x + i * y alors les parties réelle et imaginaire sont respectivement x et y (NB : y est appelé "partie" imaginaire tandis que i * y est appelé terme imaginaire ) :

  • addition :
    ( x1 + i * y1 ) + ( x2 + i * y2 ) = ( x1 + x 2 ) + i * ( y1 + y2 )
  • multiplication par un réel :
    a * ( x + i * y ) = a * x + i * a * y
  • multiplication par un autre complexe : distributivité de la multiplication sur l’addition ⇒
    ( x1 + i * y1 ) * ( x2 + i * y2 ) = ( x1 * x2 − y1 * y2 ) + i * ( x1 * y2 + x2 * y1 )

    dont découlent les cas particuliers :
    • carré :
      ( x + i * y ) 2 = x 2 - y 2 + i * 2 * x * y
      aussi par application du produit remarquable ( a + b ) 2 = a 2 + b 2 + 2 * a * b
    • multiplication par conjugué (soit z = x + i * yz = x - i * y) :
      ( x + i * y ) * ( x - i * y ) = x 2 + y 2
      aussi par application du produit remarquable ( a + b ) * (a - b ) = a 2 - b 2
      N.B. :
      • z * z ∈ ℝ 
      • on appelle module de z la racine carrée du produit par le conjugué : | z | = √ ( z * z ) = √ ( x 2 + y 2 )     ⇔
      N.d.A. On pourrait dire aussi que la racine carrée du produit d'un nombre complexe par son conjugué correspond à la formule du module d'un vecteur (cf. supra #vecteur-definition) ;
      z * z = x 2 + y 2     ⇔
      z * z = | z |2
      d'où découle l'inverse d'un nombre complexe :
      1 / z = z / | z |2
  • division :
    z1 / z2 = z1 * z2 / | z2 | 2    ⇔
    ( a + i * b ) / ( c + i * d ) = ( a + i * b ) * ( c - i * d ) / ( c 2 + d 2 )
La nature réelle du module permet de calculer ainsi la division de deux nombres complexes plus rapidement qu'en développant x + i * y = ( a + i * b ) / ( c + i * d ) pour identifier a et b par un système de deux équations à deux inconnues x et y :
x + i * y = ( a + i * b ) / ( c + i * d )     ⇔
( x + i * y ) * ( c + i * d ) = a + i * b     ⇔
x * c + i * y * c + x * i * d - y * d = a + i * b     ⇔
( x * c - y * d ) + i ( y * c + x * d ) = a + i * b

x * c - y * d = a
x * d + y * c = b


Nous verrons dans la section consacrée aux matrices qu'une façon de résoudre ce système d'équation en (x,y) consiste à le formuler en produit de matrice :
c-d
dc
*
x
y
=
a
b
    n_produit-matriciel-base

dont on sait que la solution est donnée par :

x
y
= 1 / ( c2 + d2 ) *
cd
-dc
*
a
b
    n_solution-determinant

x = (a * c + b * d ) / ( c2 + d2 )
y = ( - a * d + b * c ) / ( c2 + d2 )


( a + i * b ) / ( c + i * d ) = (a * c + b * d ) / ( c2 + d2 ) + i * ( - a * d + b * c ) / ( c2 + d2 )

Or cette solution on peut donc la trouver plus beaucoup rapidement par n_complexe-division : ( a + i * b ) / ( c + i * d ) = ( a + i * b ) * ( c - i * d ) / ( c 2 + d 2 )     ⇔
( a + i * b ) / ( c + i * d ) = [ a * c - i * a * d + i * b * c + b * d ) * ( c - i * d ) ] / ( c 2 + d 2 )     ⇔
( a + i * b ) / ( c + i * d ) = [ a * c + b * d + i * ( b * c - a * d ) ] / ( c 2 + d 2 )     ⇔

Représentation géométrique
https://philosophie.jortay.net/savoir-scientifique-base#complexe-geometrique

Nous avions souligné supra que la racine carrée du produit d'un nombre complexe par son conjugué correspond à la formule du module d'un vecteur. Voici une autre similitude entre nombre complexe et vecteur : la correspondance entre addition de deux nombres complexes et addition de deux vecteurs :

  • z1 + z2 = ( x1 + i * y1 ) + ( x2 + i * y2 ) = ( x1 + x 2 ) + i * ( y1 + y2 )
  • v1 + v 2 = (x1, x2y) + (y1, y2) = ( x1 + x2 , y1 + y2 ) n_addition-vectorielle
complexes-representation-geometrique.png

Cela montre que l'on peut considérer un nombre complexe comme un vecteur, et donc le représenter géométriquement de la même manière : l'axe X pour la partie réelle du nombre complexe, et l'axe Y pour sa partie imaginaire .

complexes-module-geometrique.png

Également similarité pour la représentation géométrique et le calcul algébrique du module.

Ainsi les nombres complexes ayant le même module se trouvent sur un cercle de rayon module et centré sur l'origine. On peut également représenter les nombres complexes opposés (symétrique centrale, par rapport à l'origine), conjugués (symétrie axiale, par rapport à l'axe X), ou encore multipliés.

complexes-cas-partic--geometrique.png
Forme polaire
https://philosophie.jortay.net/savoir-scientifique-base#complexe-polaire
complexe-coordonnees-polaires.png

ρ est mesuré positivement dans le sens trigonométrique c-à-d anti-horlogique

Nous venons de voir qu'un nombre complexe peut être représenté géométriquement par des coordonnées cartésiennes d'un point. Il peut l'être également par des coordonnées polaires définissant le vecteur position de ce point par deux grandeurs : le module ρ et l'angle θ (appelé "argument" et mesuré relativement à l'axe X) : z = ρ * cos(θ) + i * ρ * sin(θ)

mesures-globe.jpg

Pourquoi "polaire" ? On parle de forme "polaire" par référence au système de méridiens et parallèles utilisé pour déterminer une position sur la surface d'un globe (donc en trois dimensions). Chaque méridien passe par les deux pôles et est défini par un certain nombre de degrés de longitude relativement au méridien de Greenwich. Chaque parallèle coupe les méridiens perpendiculairement et est défini par un certain nombre de degrés de latitude relativement à l'équateur. Si l'on considère le pôle nord comme l'origine (0, 0) du graphique ci-dessus, θ correspond alors à la longitude, et l'axe X au méridien de Greenwich.

Il y a identité entre le module du nombre complexe et celui du vecteur associé : | z | = ρ
Démonstration :
| z | = √ ( x 2 + y 2 )    n_module-complexe    ⇔
par n_sinus et n_cosinus :
| z | = √ ( [ ρ * cos(θ) ] 2 + [ ρ * sin(θ) ] 2 )    ⇔
| z | = ρ * √ ( [ cos(θ) ] 2 + [ sin(θ) ] 2 )    ⇔
par n_sin2(a)+cos2(a)=1
| z | = ρ
CQFD

Nous avons donc deux formes des nombres complexes :

forme cartésiennez = x + i * y
forme polairez = ρ * cos(θ) + i * ρ * sin(θ)

Exprimer les coordonnées d'une forme en fonction des coordonnées de l'autre forme est trivial, sauf pour θ :

Coordonnées cartésiennesCoordonnées polaires
x = ρ * cos(θ)
y = ρ * sin(θ)
ρ = √ ( x 2 + y 2 )
θ = arctg( y / x )
complexe-argument.png

On démontre géométriquement la valeur de θ en dessinant un cercle centré sur l'origine et de rayon x.

On peut démontrer algébriquement la valeur de θ en divisant membre à membre les deux égalités de la colonne de gauche ci-dessus ⇒
y / x = sin(θ) / cos(θ)    ⇔
par n_tan(α)=sin(α)/cos(α)
y / x = tg(θ)    ⇔
θ = arctg( y / x )

complexe-arctg.png

N.B. Lors de l’emploi de la fonction arctan il faut veiller à choisir le quadrant correct pour θ, en ajoutant éventuellement 180° selon les signes des x et y. Ainsi le graphique ci-contre montre que lorsque x<0 la valeur donnée par la calculatrice (ici 56,3°) devra être augmentée de 180° afin d'obtenir la valeur de l'argument du nombre complexe. Cela est du au fait qu'une valeur de tangente correspond toujours à deux valeurs d'angles différant de 180°.

Puissance et racines
https://philosophie.jortay.net/savoir-scientifique-base#complexe-puissance-racine
Puissance de
complexe

La forme polaire présente l'avantage de faciliter le calcul des produits et puissances de nombres complexes. La version du produit de complexes sous forme polaire s'obtient de la même façon que sous forme cartésienne n_complexe-produit-cartesien : par distribution :

[ ρ1 * ( cosθ1 + i * sinθ1 ) ] * [ ρ2 * ( cosθ2 + i * sinθ2 ) ] =
ρ1 * ρ2 * [ cos(θ1 * cos(θ2) - sin(θ1 * sin(θ2) ] + i * [ cos(θ1) * sin(θ2) + sin(θ1) * cos(θ2) ] =
par n_sin(a+b) et n_cos(a+b) :
ρ1 * ρ2 * [ cos( θ1 + θ2 ) + i * sin( θ1 + θ2 ) ]
⇒ en posant : ρ1 * ρ2 = ρ3  et  θ1 + θ2 = θ3
puis en réitérant le procédé on voit que l'on peut finalement généraliser par :
i=1 n ( ρi * ( cosθi + i * sinθi ) = ∏i=1 n( ρi ) * [ cos(∑i=1 nθi) + sin(∑i=1 nθi) ]
où n est un nombre entier positif, et dont un cas particulier remarquable est celui de ρi = ρ et θi = θ ∀ i :
[ ρ * ( cos(θ) + i * sin(θ) ] n = ρ n * ( cos( n * θ ) + i * sin( n * θ )

complexe-produit-polaires.png

Le graphique ci-contre illustre n_complexe-produit-polaire pour n=2.


complexe-cercle.png

Il résulte de n_complexe-produit-polaire que le produit de nombres complexes de module égal à 1 est également un module de valeur 1, de sorte qu'ils sont situés sur le même cercle de rayon 1 et centré sur l'origine. Ainsi le point de ce cercle correspondant à l'angle de 45° a comme partie réelle cos(45) et comme partie imaginaire sin(45) par n_complexe-polaire, qui valent toutes deux 1/√2 par n_sin(45)=cos(45)=1/√2. En développant le carré de ce complexe 1/√2 + i * 1/√2 on montre qu'il est égal à √i. Le graphique illustre notamment le cas où il est élevé à la puissance trois : sa valeur devient i * √i et son argument 3*45°=135° par n_complexe-produit-polaire.

On va maintenant démontrer que n_complexe-puissance-polaire est également vérifiée lorsque n est négatif :
[ ρ * ( cos(θ) + i * sin(θ) ] -n =
ρ -n * 1 / [ ( cos(θ) + i * sin(θ) ] n =
par n_complexe-produit-polaire où ρ=1 :
ρ -n * 1 / [ ( cos( n * θ ) + i * sin( n * θ ) ] =
par n_complexe-division :
ρ -n * [ cos( n * θ ) - i * sin( n * θ ) ] / | cos( n * θ ) + i * sin( n * θ ) | 2 =
par n_complexe-modules où ρ=1 :
ρ -n * [ ( cos( n * θ ) - i * sin( n * θ ) ] =
ρ -n * [ ( cos( - n * θ ) + i * sin( - n * θ ) ]
CQFD

complexe-puissance-negative.png

Le graphique ci-contre illustre géométriquement la forme polaire de la puissance négative d'un nombre complexe, le signe négatif de la puissance ayant pour effet de réduire le module, ce qui est intuitivement cohérent.

Inverse et quotient de complexe. Il découle de n_complexe-puissance-polaire que :
1/z = 1/ρ * ( cos( - θ ) + i * sin( - θ )

z1 / z2 = z1 * ( 1 / z2 ) = ρ1 / ρ2 * [ cos( θ1 - θ2 ) + i * sin( θ1 - θ2 ) ]

triangle-clipedia.png Vidéo Clipedia : Racines des nombres complexes
Racines de
complexe

Nous avons vu que n_complexe-puissance-polaire est vérifiée pour n'importe quel nombre n entier. Mais est-ce encore le cas si n est fractionnaire c-à-d si n ∈ ℝ ? La réponse est négative : n_complexe-puissance-polaire doit être complétée pour vérifier ce cas.

Pour être mathématiquement rigoureux, il faut préciser que m/n est un nombre rationnel (m et n sont des entiers) or les réels comprennent également les nombres irrationnels (qui ne peuvent s'écrire sous la forme d'une fraction).

En raison de la périodicité des fonctions cosinus et sinus, l'argument d'un complexe est toujours défini à un multiple (k) de 360° c-à-d de 2*π rad près. Il en va donc de même pour le complexe lui-même :
ρ * [ cos(θ) + i * sin(θ) ] = ρ * [ cos( θ + k * 2 * π ) + i * sin( θ + k * 2 * π )]
k est un entier (k ∈ ℤ).

Cela est sans effet sur n_complexe-puissance-polaire tant que n est entier, mais plus si on le remplace par 1/n car alors on obtient un nombre non entier (k/n) de tours 2*π. Il faut donc le mentionner dans n_complexe-puissance-polaire pour obtenir la totalité des racines :

[ ρ * ( cos(θ) + i * sin(θ) ] 1/n = ρ 1/n * ( cos( θ / n + k / n * 2 * π ) + i * sin( θ + k / n * 2 * π )
k { 0, 1, 2, ..., n-1 }

complexe-racines.png

Un nombre complexe possède donc n racines n-ièmes distinctes qui correspondent à n valeurs successives de k, comprises entre 0 et n−1. Ces racines sont situées sur le même cercle de rayon ρ1/n et centré sur l'origine. On a bien que 2*π/n est l'écart angulaire entre les arguments des racines, de sorte que la somme des angles ouverts par chaque racine forme .

En voici trois exemples.

complexe-racines-exple.png

Analyse combinatoire

https://philosophie.jortay.net/savoir-scientifique-base#analyse-combinatoire
Dénombrement

Exemple 1. Dans un pays dont les numéros de plaques minéralogiques sont de type "3 lettres + 3 chiffres", pour déterminer le nombre total de plaques de ce type il faut multiplier entre eux le nombre de cas possibles : 26 * 26 * 26 * 10 * 10 * 10 = 17.576.000.

Le théorème fondamental du dénombrement, ou "principe de multiplication" se formule donc simplement par :
# combinaisons = ∏1pni    où

  • p est le nombre d'opérations requises pour composer une combinaison (ici : déterminer chacun des six caractères de la plaque minéralogique)  ;
  • ni est le nombre de cas possibles par opération(i) ou CPO (ici : le nombre de caractères possibles pour chacun des six caractères de la plaque minéralogique).

N.B. : si ni = n ⇒ # combinaisons = n p

La valeur de n_denombrement :

  • varie selon que les CPO sont indépendant ou pas : dans l'exemple ci-dessus (plaques minéralogiques) les CPO sont indépendants, mais si on impose que les lettres de la plaque minéralogique doivent être différentes (pas de répétitions) alors il n'y a plus indépendance puisque le choix de la première lettre diminuera le nombre de possibilités pour la seconde et la troisième, et que le choix de la seconde diminuera à nouveau le nombre de cas possibles pour la troisième ⇒ le nombre de combinaisons possibles devient : 26 * 25 * 24 * 10 * 10 * 10 = 15.600.000.

  • correspond à des combinaisons ordonnées : la formule n_denombrement prend en compte l'ordre d'arrangement des CPO d'une combinaison, c-à-d compte comme deux combinaisons différentes AB et BA.

arrangements.png

Exemple 2. Le tableau ci-contre montre qu'en recensant (par inversions et distributions) le nombre de combinaisons de quatre lettres (sans répétition d'une même lettre), on obtient un total de 12 ; ce nombre correspond bien à ce que l'on trouve par n_denombrement :
# opérations (choisir une lettre puis une seconde) : p=2 ;
CPO = { n1=4 ; n2=3 } ;
⇒ ∏1pni = 4 * 3 = 12

Dans ce dernier cas si on relâche la contrainte de non répétition, on ajoute alors quatre CPO (AA,BB,CC,DD) ⇒ 12+4=16, ce qui correspond bien à :
CPO = { n1=4 ; n2=4 } ;
⇒ ∏1pni = 4 * 4 = 16

Exemple 3. Si parmi dix compétiteurs on tire au sort les médailles d'or, d'argent et de bronze, combien de combinaisons de compétiteurs médaillés (compositions de podium) peut-on obtenir :
# opérations : p=3 ;
CPO = { n1=10 ; n2=9 : n3=8} ;
⇒ ∏1pni = 10 * 9 * 8 = 720

Arrangement

L'exemple ci-dessus est un cas particulier de dénombrement, appelé "arrangement", et dont le principe est « parmi n je prends p, et l'ordre compte » (le podium Pierre/Paul/Jean est différent de Paul/Pierre/Jean) . On le note An1p ou plus simplement Anp (A103 dans l'exemple ci-dessus), et on le lit « A n p ».

On peut généraliser sa formulation comme suit :
Anp = n * (n - 1 ) * ( n - 2 ) * ... * ( n - p + 1 )    ⇔
où les premiers facteurs montrent bien que le nombre de résultats par opération vaut bien n moins le numéro de l'opération plus 1
Anp = n * (n - 1 ) * ( n - 2 ) * ... * ( n - p + 1 ) * [ ( n - p ) * ( n - p - 1) * ... * 1 ] / [ ( n - p ) * ( n - p - 1) * ... * 1 ]   ⇔
Anp = n ! / ( n - p ) !

Ainsi dans l'exemple précédent on doit attribuer trois médailles parmi dix compétiteurs :
"parmi 10 je prends 3"    ⇒
A103 =
10 ! / ( 10 - 3 ) ! =
10 ! / 7 ! =
8 * 9 * 10 = 720

NB : 0!=1 par définition/convention.

Suites mathématiques

https://philosophie.jortay.net/savoir-scientifique-base#suites-mathematiques

Nous allons étudier ici les suite arithmétiques et géométriques.

Suites
arithmétiques

Une suite (u0, ... un) est dite "arithmétique" si ui = ui-1 + r ∀ i
où r est une valeur constante appelée "raison" de la suite.

Indice. On souhaite que l'indice d'un élément quelconque de la suite (le i de ui) représente le nombre d'intervalles entre lui et le premier éléments. C'est pourquoi l'on fixe à zéro l'indice du premier élément d'une suite. Il en résulte que l'indice du dernier élément de la suite vaut le nombre d'éléments de la suite moins 1 : trois points a, b et c déterminent bien deux distances |a-b| et |b-c| c-à-d 3-1, que l'on peut généraliser à n-1 pour un nombre arbitraire de points.

Ce principe d'indiçage vaut également pour les suites géométriques.

Graphe. Graphiquement une suite arithmétique se traduit par une droite, et c'est pourquoi l'on parle indifféremment de progression arithmétique ou linéaire [tableur].

Valeur d'un terme quelconque
Un première propriété de la suite arithmétique est que l'on peut calculer la valeur de n'importe lequel de ses termes (un) à partir de son indice (n), de la valeur du premier terme (u0) et de la raison (r) :
un = u0 + n * r
Démonstration à partir de suite-arithmetique :
un = un-1 + r ⇔
un = (un-2 + r ) + r = un-2 + 2 * r    ⇒
que l'on peut généraliser en remplaçant 2 par n :
un = un-n + n * r    ⇔
un = u0 + n * r    ⇔
CQFD

Valeur de la somme des termes
Par n_suite-arithm-valeur-terme :
i=0n   ui = ∑i=0n   ( u0 + i * r )    ⇔
i=0n   ui = ( n + 1 ) * u0 + r * i=0n   i
Or l'on démontre que :
i=0n   i = n * ( n + 1 ) / 2
en constatant que si :
• I = (0, 1, 2, 3, ..., n-1, n)
• I' = (n, n-1, ..., 3, 2, 1, 0)    ⇒
I + I' = ( U0=n, U1=n, U3=n, ..., Un=n )    ⇔
soit S(I) la somme des termes de la suite I :
2 * S(I) = n * ( n + 1 )    ⇔
S(I) = n * ( n + 1 ) / 2    ⇒
i=0n   ui = ( n + 1 ) * u0 + r * n * ( n + 1 ) / 2    ⇔
i=0n   ui = ( n + 1 ) * ( u0 + r * n / 2 )
Ainsi l'on peut calculer la somme d'une suite arithmétique à partir du nombre de ses éléments (n+1), de la valeur du premier élement (u0) et de la raison (r).

On peut également exprimer la somme des termes en fonction de la moyenne :
un = u0 + n * r    ⇔
n * r / 2 = ( un - u0 ) / 2    ⇒
i=0n   ui = ( n + 1 ) * [ u0 + ( un - u0 ) / 2 ]    ⇔
i=0n   ui = ( n + 1 ) * (u0 + un ) / 2    ⇔
i=0n   ui = ( n + 1 ) * Sn

triangle-clipedia.png Vidéo Clipedia : Les suites géométriques
Suites
géométriques

Une suite (u0, ... un) est dite "géométrique" si ui = ui-1 * r ∀ i
où r est une valeur constante appelée "raison" de la suite.

suite-geom.png

Graphe. Graphiquement une suite géométrique se traduit par une exponentielle, et c'est pourquoi l'on parle indifféremment de progression géométrique ou exponentielle [tableur].

Valeur d'un terme quelconque
Un première propriété de la suite géométrique est que l'on peut calculer la valeur de n'importe lequel de ses termes (un) à partir de son indice (n), de la valeur du premier terme (u0) et de la raison (r) :
un = u0 * r n
Démonstration à partir de suite-geometrique :
un = un-1 * r ⇔
un = (un-2 * r ) * r = un-2 * r 2    ⇒
que l'on peut généraliser en remplaçant 2 par n :
un = un-n * r n
un = u0 * r n
CQFD

Valeur de la somme des termes
Par n_suite-geom-valeur-terme :
i=0n   ui = ∑i=0n   ( u0 * r i )    ⇔
i=0n   ui - r * ∑i=0n   ui = ∑i=0n   ( u0 * r i ) - r * ∑i=0n   ( u0 * r i )    ⇔
i=0n   ui * ( 1 - r ) = ∑i=0n   ( u0 * r i ) - ∑i=0n   ( u0 * r i+1 )    ⇔
i=0n   ui * ( 1 - r ) = u0 * ( ∑i=0n   r i - ∑i=0n    r i+1 )    ⇔
Technique (artifice mathématique) dit de la "somme téléscopique".
i=0n   ui * ( 1 - r ) = u0 * ( 1 - r n+1 )    ⇔
i=0n   ui = u0 * ( 1 - r n+1 ) / ( 1 - r )
Ainsi l'on peut calculer la somme d'une suite géométrique à partir du nombre de ses éléments (n+1), de la valeur du premier élement (u0) et de la raison (r).

suite-geom-raison-negative.png

Raison négative. Si le cas de r<0 est trivial dans le cas d'une suite arithmétique (droite à pente négative) , ce ne l'est plus dans celui d'une suite géométrique car le signe des termes y alterne constamment : c'est alors une oscillation exponentielle que l'on constate (indécelable au début) [tableur].

Problème. Supposons un nénuphar doublant de taille chaque jour, de telle sorte qu'il recouvre la totalité du lac en 365 jours. Après combien de temps a-t-il rempli la moitié du lac ?

Résolution :
Il double de taille chaque jour : r = 2.
Il recouvre la totalité du lac en 365 jours : u365 = 2365 par n_suite-geom-valeur-terme.
⇒ de même, le nombre n de jours après lesquels le lac est à moitié recouvert est tel que :
2365 / 2 = 2 n    ⇔
n = log2(2365 / 2)   ⇔
n = log2(2365) - log2(2)   ⇔
n = 365 - 1 = 364
NB : on peut arriver à ce résultat par un raisonnement plus intuitif : comme la totalité du lac est couverte en i=365 et que la surface double chaque jour, la moitié du lac a donc été couverte en i=365-1 ...

Nous avons vu que les fonctions logarithme et exponentielle sont réciproques n_exp-log-reciproques, de sorte que si l'on applique un affichage logarithmique à une courbe exponentielle on obtient une droite [tableur]. Cela est vrai également dans le cas d'une raison négative, c-à-d d'une sismoïde exponentielle puisqu'il n'y a pas de valeur pour le logarithme d'un nombre négatif (sauf si l'on recourt aux nombres imaginaires).

Résumé

Le tableau suivant permet de comparer les formules des suites mathématiques selon leur type arithmétique ou géométrique.

DéfinitionTerme n∑ termes
Arithm.ui = ui-1 + run = u0 + n * ri=0n   ui = ( n + 1 ) * ( u0 + r * n / 2 )
Géom.ui = ui-1 * run = u0 * r ni=0n   ui = u0 * ( 1 - r n+1 ) / ( 1 - r )
Démonstration
par récurrence

Pour démontrer n_somme-suite-arithmetique nous avions du démontrer que i=0n   i = n * ( n + 1 ) / 2, et pour ce faire nous avions eu recours à un développement mathématique basé sur un artifice mathématique (I+I'). Voici une autre démonstration de n_somme-suite-arithmetique, qui contrairement à la démonstration par développement requiert d'utiliser la proposition dans sa démonstration (donc de la connaître a priori), mais qui présente l'avantage d'être fondée sur une méthode applicable à de nombreuses démonstrations : la démonstration par récurrence.

Cette technique est composée de deux étapes pour démontrer une proposition P(n)n :

  1. initialisation : démontrer P(0) ;
  2. hérédité : démontrer P(n) ⇒ P(n+1) en partant de P(n+1) et en y faisant apparaître P(n) ;

    Il faut démontrer également P(n) ⇒ P(n-1) si on ne se limite pas aux nombres naturels et que l'on considère le cas des entiers (ℤ).

  3. P(n) est démontré ∀ n

Alors allons-y : soit Sn = 0 + 1 + 2 + 3 + ... + nP(n) ≡ Sn = n * ( n + 1 ) / 2 :

  1. S0 = 0
    et
    0 * ( 0 + 1 ) / 2 = 0
    P(0) ≡ S0 = 0 * ( 0 + 1 ) / 2 est démontré.
  2. Sn+1 = 0 + 1 + 2 + ... + n + ( n + 1 )    ⇔ par P(n) :
    Sn+1 = Sn + ( n + 1 )    ⇔
    Sn+1 = n * ( n + 1 ) / 2 + ( n + 1 )    ⇔
    Sn+1 = ( n + 1 ) * ( n / 2 + 1 )    ⇔
    Sn+1 = ( n + 1 ) * ( n + 2 ) / 2
    Pn ⇒ Pn+1 est démontré.
  3. P(n) ≡ Sn = n * ( n + 1 ) / 2 est démontré ∀ n !

N.B. La démonstration par récurrence peut être utilisée dans d'autres cas que les suites mathématiques. Démontrons ainsi P(n) ≡ d(x n) / dx = n * x n-1 n_dfn(x)/dx :

  1. par n_exposant-zero :
    d(x0) / dx = 0
    et d'autre part :
    0 * x-1 = 0
    P(0) ≡ d(x0) / dx = 0 * x -1 est démontré.
  2. d(xn+1) / dx = d(xn * x ) / dx    ⇔ par n_d(f*g)/dx :
    d(xn+1) / dx = d(xn) / dx * x + xn * dx/dx    ⇔ par P(n) :
    d(xn+1) / dx = n * x n-1 * x + xn   ⇔
    d(xn+1) / dx = ( n + 1 ) * x n    ⇔
    Pn ⇒ Pn+1 est démontré.
  3. P(n) ≡ d(x n) / dx = n * x n-1 est démontré ∀ n !

On peut donc distinguer au moins deux types de démonstrations mathématiques :

  • par développement : quand on ne connaît pas a priori la proposition à développer (c-à-d qu'on ne peut l'utiliser dans le cadre de la démonstration) ;
  • par récurrence : on utilise la proposition P(n) dans sa démonstration, qui consiste à démontrer que P(n) est valable ∀ n.

Fonction exponentielle

https://philosophie.jortay.net/savoir-scientifique-base#exponentielle
 4.6.1. Exponentielle naturelle
 4.6.2. Exponentielle imaginaire
Exponentielle naturelle
https://philosophie.jortay.net/savoir-scientifique-base#exponentielle-naturelle
triangle-clipedia.png Vidéo Clipedia : La fonction exponentielle

La fonction exponentielle est illustrée ici par le phénomène biologique de division cellulaire de bactéries par fission binaire. La durée d'une fission, appelé temps de génération (TG), se situe en 15 minutes et quelques heures.

Cette fonction est f(x) = 2x où :
• 2 est le nombre moyen d'enfants par génération ;
x est le nombre de générations par unité de temps.

Pour illustrer la dynamique de la multiplication exponentielle on va mesurer l'espace pris après 24 heures par la multiplication de la bactérie "Escherichia coli", qui constitue 80% de notre flore intestinale (mais dont certaines souches sont pathogènes pour les intestins). Sa taille est environ 2*0,5 µm ("microns") ⇒ sa surface est de 1 µm2 = 10-12 m2 (invisible au microscope optique).

reproduction-bacterie.gif

Animation accélérée.

Soit TG=16min ⇒ le nombre de générations après 24 heures est de 24*60/16=90 ⇒ le nombre de bactéries est alors 290=1,24*1027 ⇒ elles occupent une surface de 1,24*1027*10-12 m2=1,24*1015 m2 ... soit plus du double de la surface de la Terre (0,51*1015 m2) ! Ainsi puisque chaque génération double le nombre total de cellules, il en résulte que l'augmentation de surface entre les 89° et 90° générations équivaut à la surface de la Terre ! La croissance exponentielle est donc un phénomène qu'il n'est pas facile d'appréhender intuitivement.

On généralise la formulation de l'exponentielle par f(x) = bx, où :
b est la "base" de la fonction exponentielle (cas ci-dessus : nombre moyen d'enfants par génération) ;
x = P / Tg est le nombre de fois que la base est reproduite par unité de temps (cas ci-dessus : nombre de générations par jour) :
  ○ P est la période de référence ;
  ○ Tg est le temps de génération.

On peut étudier formellement la dynamique de la fonction exponentielle en calculant sa dérivée :
f '(x) = ( f ( x + dx ) - f (x) ) / dx n_derivee   ⇒
(2x)' = ( 2( x + dx ) - 2x ) / dx    ⇔ par n_produit-de-puissances :
(2x)' = ( 2x * 2dx - 2x ) / dx    ⇔
(2x)' = 2x * ( 2dx - 1 ) / dx

( 2dx - 1 ) / dx = 0/0    ⇒
pour lever l'indétermination on va tester des petites valeurs de x :
• si dx=0,01 ⇒ ( 2dx - 1 ) / dx = 0,695...
• si dx=0,001 ⇒ ( 2dx - 1 ) / dx = 0,693...
• si dx=0,0001 ⇒ ( 2dx - 1 ) / dx = 0,693...    ⇒
(2x)' = 0,693 * 2x
Interprétations :
□ le taux de croissance (la dérivée) de la fonction exponentielle est lui-même une fonction exponentielle (⇒ on comprend mieux maintenant l'impressionnante croissance spatiale de la division cellulaire) ;
□ 0,693 est donc la valeur de la pente de la fonction 2x à l'origine c-à-d pour x=0 :
(2x)'|x=0 = 20 * 0,693 = 0,693.

De même on pourra calculer que :
(10x)' = 2,303 * 2x

Se pose alors une question intéressante : quelle est la valeur de la base b de la fonction bx dont la pente à l'origine vaut 1, c-à-d telle que :
(bx)' = 1 * bx
N.B. Cette fonction est particulière : en tout point, elle est égale à sa dérivée :
(bx)' = bx

exponentielle.png

Le tableau suivant suggère que la base de cette fonction, que nous allons noter e, se situe entre 2 et 10.

bxPente (bx)'
10x2,303
ex1
2x0,693

Pour identifier la valeur de e on va à nouveau procéder par essais-erreurs, en partant de b=2 :
• si b=2,5 ⇒ (2,5x)'|x=0 = 0,916  ⇒ je peux encore augmenter la base :
• si b=3 ⇒ (3x)'|x=0 = 1,098  ⇒ je dois diminuer la base :
• si b=2,7 ⇒ (2,7x)'|x=0 = 0,993  ⇒ je dois augmenter la base :
• si b=2,72 ⇒ (2,72x)'|x=0 = 1,001  etc... ⇒
e = 2,718282... (nous verrons plus loin une méthode plus rigoureuse pour calculer e : la méthode d'Euler).

exponentielle-naturelle.png

La fonction ex, dite fonction exponentielle naturelle est donc telle que :
(ex)' = ex * ( edx - 1 ) / dx = ex
⇔ la pente à l'origine de la fonction ex étant unitaire, implique qu'en tout point la fonction est égale à sa dérivée (nous verrons plus loin que cette propriété de la fonction exponentielle correspond à la dynamique de nombreux phénomènes physiques).

Dénomination et notation :
• la fonction est dite "exponentielle" car la variable x apparaît à l'exposant ;
• la notation ex peut être remplacée par exp(x), ce qui est utile lorsque x est une fonction dont l'écriture comprend de nombreux termes.

expo-asymptote

La fonction exponentielle est asymptotique (à l'axe horizontal ) pour x --> - ∞ mais il n'y a pas de tendance asymptotique pour x --> + ∞ : x doit augmenter infiniment pour que ex augmente infiniment.

Enfin nous avons vu dans la section consacrée à la fonction logarithme que celle-ci est réciproque de la fonction exponentielle (et réciproquement) :
f(x) = e x   ⇔   loge (e x) ≡ ln (e x) = x n_log-def-longue
b = e ln(b) n_exp-log-reciproques
de sorte que – grâce au logarithme en base e (noté loge), appelé logarithme naturel (noté ln) – on peut exprimer une exponentielle de base quelconque comme une exponentielle de base e :
bx = ( e ln(b) ) x   ⇔    par n_puissance-de-puissance :
bx = e ln(b) * x   ⇒
( bx ) ' = ( e ln(b) * x ) '   ⇔    par n_derivee-fonction-composee :
( bx ) ' = d( e ln(b) * x ) / d( ln(b) * x ) * d(ln(b) * x) / dx   ⇔    par n_derivee-exponentielle-naturelle :
( bx ) ' = e ln(b) * x * ln(b)   ⇒
soit ln(b) = a    ⇒
( e a * x ) ' = a * e a * x
qui est une d'équation différentielle de type f '(x) = a * f(x), qui permet de décrire de nombreux phénomènes physiques où biologiques dont la variation est proportionnelle à la grandeur elle-même,et dont la solution est de type exponentielle.

triangle-clipedia.png Vidéo Clipedia : Le nombre "e"

La méthode appliquée supra pour calculer la valeur de e est grossière. La méthode d'Euler permet de calculer facilement cette valeur, avec une précision arbitraire. Elle repose sur le fait qu'aucune autre fonction que f(x)=ex est telle que f(x)'=f(x). Elle consiste à utiliser une fonction f(x) que l'on fait progressivement approcher de ex :

exponentielle-decomposition.png

Étape 1. On commence avec l'équation de la tangente de ex à l'origine. :
f(x) = 1 + x
qui est telle que :
limx→0 1 + x = ex

Étape 2. On complète f(x) pour en faire polynôme du second degré :
f(x) = 1 + x + a * x2
⇒ on calcule la valeur de a telle que f(x) vérifie la propriété caractéristique de l'exponentielle c-à-d telle que :
f(x)' = f(x)    ⇒
( 1 + x + a * x2 )' = 1 + x + a * x2    ⇔
1 + 2 * a * x = 1 + x + a * x2    ⇔
a = 1 / ( 2 - x )
or :
limx→0 1 / ( 2 - x ) = 1/2
⇒ on pose a=1/2 ⇒ :
f(x) = 1 + x + 1/2 * x2

Étape 3. On complète f(x) pour en faire un polynôme du troisième degré :
1 + x + 1/2 * x2 + b * x3    ⇒
on calcule la valeur de b telle que f'(x) = f(x) :
( 1 + x + 1/2 * x2 + b * x3 )' = 1 + x + 1/2 * x2 + b * x3    ⇔
b = 1 / ( 6 - 2 * x )
or :
limx→0 1 / ( 6 - 2 * x ) = 1/6
⇒ on pose b=1/6 ⇒ :
f(x) = 1 + x + 1/2 * x2 + 1/6 * x3    ⇒

Étape 4. On complète f(x) pour en faire un polynôme du quatrième degré :
1 + x + 1/2 * x2 + 1/6 * x3 + c * x4    ⇒
on calcule la valeur de b telle que f'(x) = f(x) :
( 1 + x + 1/2 * x2 + 1/6 * x3 + c * x4 )' = 1 + x + 1/2 * x2 + 1/6 * x3 + c * x4   ⇔
c = 1 / ( 24 - 6 * x )
or :
limx→0 1 / ( 24 - 6 * x ) = 1/24
⇒ on pose c=1/24 ⇒ :
f(x) = 1 + x + 1/2 * x2 + 1/6 * x3 + 1/24 * x4
où l'on constate que les dénominateurs ui des coefficients constituent une suite de type :
ui = i !
i est également le degré polynomial associé au terme de la suite; ou encore le rang du terme dans la suite.

Étape 5. On peut alors, par généralisation à un degré arbitraire n, établir la formulation de f(x) pour une précision arbitraire n :
f(x) = 1/0! + 1/1! * x + 1/2! * x2 + 1/3! * x3 + 1/4! * x4 + ... + 1/n! xn    ⇒
f(x) = ∑n=0    xn / n!

NB : 0!=1 par définition.

On obtient ainsi la décomposition en série entière de la fonction exponentielle :
ex = ∑n=0    xn / n!
⇒ pour calculer la valeur de e il suffit de poser x=1 ⇒
e = ∑n=0    1 / n!    ⇔
e = 1 +1 + 1/2 + 1/6 + 1/24 + ... = 2,71828182846...
Euler a montré qu'il s'agit d'un nombre irrationnel c-à-d ne pouvant être égal au quotient de deux nombres.

Exponentielle imaginaire
https://philosophie.jortay.net/savoir-scientifique-base#exponentielle-imaginaire
Exponentielle
imaginaire

Il peut être utile dans certains calculs de transformer une exponentielle imaginaire de base quelconque b i en exponentielle naturelle e f(i) :
par n_exp-log-reciproques :
b i = ( e ln(b) ) i    ⇔
par n_puissance-de-puissance :
b i = e i * lnb

exponentielle-imaginaire.jpg

Plus généralement on souhaite exprimer la fonction :
f(θ) = e i * θ    (où θ ∊ ℝ)
sous forme de son complexe :
f(θ) = e i * θ = x(θ) + i * y(θ)
⇒ on doit déterminer les fonctions x(θ) et y(θ).

N.B. Alors que i * θ est l'argument de l'exponentielle, θ est l'argument de l'exponentielle imaginaire. D'autre part, θ ∊ ℝ signifie que θ ne peut être un nombre complexe, sinon il s'agirait d'une exponentielle complexe (i * θ où θ est un réel est dit "imaginaire pure").

Étape 1 :
par n_module-complexe :
| e i * θ | 2 = e i * θ * e -i * θ    ⇔ par n_produit-de-puissances :
| e i * θ | 2 = e 0    ⇔ par n_exposant-zero :
| e i * θ | 2 = 1
⇔ le graphe de la fonction e i * θ a la forme d'un cercle centré sur l'origine des axes représentant les parties réelle et imaginaire du complexe x(θ) + i * y(θ).

Étape 2. Pour définir l'équation de ce cercle on va commencer par calculer sa dérivée : par n_(ea*x)' :
de i * θ / dθ = i * e i * θ

formule-euler.png
Étape 3. On exprime f(θ) sous forme polaire :
f(θ) = e i * θ = x(θ) + i * y(θ)    ⇔ par n_complexe-polaire :
f(θ) = e i * θ = cos[ φ(θ) ] + i * sin[ φ(θ) ]
⇒ en identifiant φ(θ) on pourra identifier
• x(θ) = cos[ φ(θ) ]
• y(θ) = sin[ φ(θ) ]


Étape 4.
  • On substitue le résultat de l'étape 3 – la forme complexe polaire de f(θ) – dans celui de l'étape 2 ⇒
    de i * θ / dθ = i * e i * θ = i * ( cos[ φ(θ) ] + i * sin[ φ(θ) ] )   ⇒
    de i * θ / dθ = i * e i * θ = i * cos[ φ(θ) ] - sin[ φ(θ) ]
  • D'autre part on égalise le résultat de l'étape 2 à la dérivée de la forme complexe de f(θ) :
    i * e i * θ = [ x(θ) + i * y(θ) ] '    ⇔
    i * e i * θ = x '(θ) + i * y '(θ)    ⇒ par n_sinus et n_cosinus :
    i * e i * θ = ( cos[ φ(θ) ] ) ' + i * ( sin[ φ(θ) ] ) '    ⇔ par n_derivee-cos n_derivee-sin n_derivee-fonction-composee :
    i * e i * θ = - sin[ φ(θ) ] * φ '(θ) + i * cos[ φ(θ) ] ) * φ '(θ)
  • ⇒ on constate l'égalité des résultats des deux points ci-dessus :
    i * cos[ φ(θ) ] - sin[ φ(θ) ] = - sin[ φ(θ) ] * φ '(θ) + i * cos[ φ(θ) ] ) * φ '(θ)    ⇔
    i * cos[ φ(θ) ] - sin[ φ(θ) ] = ( - sin[ φ(θ) ] + i * cos[ φ(θ) ] ) * φ '(θ)    ⇔
    φ '(θ) = 1    ⇒
    φ(θ) = θ + c
    or le graphique montre que φ(θ=0)=0     ⇒
    φ(0) = 0 + c = 0     ⇔
    c = 0 ⇒
    φ(θ) = θ
    φ(θ) est donc tout simplement la fonction identité.
formule-euler-2.png
Étape 5. On injecte le résultat de l'étape 4 dans celui de l'étape 3 :
• x(θ) = cos[ φ(θ) ] = cos(θ)
• y(θ) = sin[ φ(θ) ] = sin(θ)
⇒ la formule d'Euler :
e i * θ = cos(θ) + sin(θ) * i
θ est en radians.
On notera ces valeurs particulières, calculées à partir de n_formule-euler :
• e i * 0 = 1
• e i * π/2 = i
• e i * π = -1  ⇔ e i * π + 1 = 0    ("identité d'Euler", qui combine ainsi cinq nombres remarquables : 0, 1, π, e, i)
• e i * 3π/2 = -i

Nous allons maintenant illustrer le fait que l'exponentielle imaginaire e i * θ est la représentation algébrique du cercle trigonométrique.

Commençons par souligner le fait que le cercle trigonométrique a pour caractéristique que son rayon vaut 1 :
par n_module-complexe :
| e i*θ | = √ ( cos2(θ) + sin2(θ) )    ⇔
par n_sin2(a)+cos2(a)=1 :
| e i*θ | = 1
ce qui implique que θ doit être un nombre réel c-à-d qu'il ne peut être un nombre complexe :
ei*(a+i*b) = ei*a-b = ei*a * e-b
or
| ei*a | = 1    ⇒
| ei*a * e-b | = | ei*a | * e-b = e-b = 1 ⇔ b=0
CQFD

Poursuivons notre illustration de l'exponentielle imaginaire en posant la question suivante : soit a un nombre réel, quelle est la signification mathématique et géométrique de ai ? (PS : objet abstrait puisqu'il s'agit de multiplier a i fois par lui-même ...).

expo-imagin-illustration1.png

Nous avons vu que :
a i = ( e ln(a) ) i    ⇔
a i = e i * ln(a)
Ainsi a i est le point du cercle trigonométrique correspond à l'angle d'arc-tangente ln(a) (en vert).)

Logarithme imaginaire. Il est alors facile de trouver la valeur de ln(i) :
eln(i) = i
et d'autre part :
e i * π/2 = cos(π/2) + i * sin(π/2) = i    ⇒
e i * π/2 = eln(i)    ⇔
ln(i) = i * 1/2 * π + i * 2*k*π

De la même manière on trouve la valeur de ln(-i) en identifiant le point du cercle trigonométrique correspondant à -i ⇒ on voit qu'il s'agit de 3π/2 :
eln(-i) = -i
et d'autre part :
e i * 3*π/2 = cos(3*π/2) + i * sin(3*π/2) = -i    ⇒
e i * 3π/2 = eln(-i)    ⇔
ln(-i) = i * 3/2 * π + i * 2*k*π

De même on trouve la valeur de ln(-1) en identifiant le point du cercle trigonométrique correspondant à -1 ⇒ on voit qu'il s'agit de π :
ln(-1) = i * π + i * 2*k*π
N.B. Ce dernier résultat est remarquable : on peut maintenant calculer le logarithme d'un nombre négatif :
ln(-|x|) = ln(-1 * |x| )    ⇔ par n_produit-de-log :
ln(-|x|) = ln(-1) + ln(|x|)    ⇔
ln(-|x|) = ln(|x|) + i * π + i * 2*k*π
qui est un nombre imaginaire dont la partie réelle vaut ln(|x|) et la partie imaginaire vaut π+2*k*π.

Applications. On va maintenant montrer que l'exponentielle imaginaire est très pratique pour représenter les nombres complexes et en étudier les propriétés.

Ainsi l'on va pouvoir démontrer plus simplement certaines propriétés des nombres complexes, à commencer par la formule du produit de complexes n_complexe-produit-polaire : soit :
z = ρ * ( cos(θ) + i * sin(θ) ) ⇒ par n_formule-euler :
z = ρ * e i*θ    ⇒
z1 * z2 = ρ1 * ρ2 * e i*θ1 * e i*θ2   ⇔
z1 * z2 = ρ1 * ρ2 * e i*(θ12)
que l'on peut généraliser à :
i=1 n zi = ∏i=1 n( ρi ) * e i * ∑i=1 nθi
où n est un nombre entier positif, et dont un cas particulier remarquable est celui de :
ρi = ρ  et  θi = θ  ∀ i ⇒
z n = ρ n * e i * ( n * θ )
• qui est valable pour n < 0    ⇒
    - inverse : 1 / z = 1 / ρ * e i * ( - θ )
    - division : z 1 / z 2 = z 1 * 1 / z 2 = ρ 1 / ρ 2 * e i * ( θ1 - θ2 )
• qui est aussi valable pour n fractionnaire    ⇒
   - z1/n = ρ 1/n * e i * [ 1/n * (θ+2kπ) ]

La notion d'exponentielle imaginaire facilite également la démonstration de propriétés de fonctions trigonométriques, à commencer par la fonction sin(2*a). Pour ce faire on part de la formule d'Euler :
e i * θ = cos(θ) + sin(θ) * i n_formule-euler
qui nous dit que le cos est la partie réelle du complexe, et le sin sa partie imaginaire :
• cos(θ) = Re[ei*θ]
• sin(θ) = Im[ei*θ]

sin(2a) = Im[ei*2*a]    ⇔ par n_produit-de-puissances :
sin(2a) = Im[ei*a * ei*a]    ⇔
sin(2a) = Im[ ( cos(a) + i * sin(a) ) * ( cos(a) + i * sin(a) ) ]    ⇔
sin(2a) = Im[ cos2(a) - sin2(a) + i * 2 * cos(a) * sin(a) ) ]    ⇔
sin(2a) = 2 * cos(a) * sin(a)    ⇔
CQFD
qui est effectivement plus simple que la démonstration géométrique de n_sin(a+b).

On procède de même pour démontrer :
cos(a+b) = Re[ e i*(a+b) ]    ⇔
cos(a+b) = Re[ e i*a * e i*b ]    ⇔
cos(a+b) = Re[ ( cos(a) + i * sin(a) ) * ( cos(b) + i * sin(b) ) ]    ⇔
cos(a+b) = Re[ cos(a) * cos(b) - sin(a) * sin(b) + i * (...) ]    ⇔
cos(a+b) = cos(a) * cos(b) - sin(a) * sin(b) ]
CQFD Encore une fois on est plus obligé de démontrer géométriquement par des montages sur le cercle trigonométrique, grâce au fait que la fonction exponentielle imaginaire est une représentation mathématique du cercle trigonométrique ⇒ on peut rester dans le domaine de l'algèbre.

Pour terminer on va démontrer :
cos(a) + cos(b) = 2 * cos[ ( a + b ) / 2 ] * cos[ ( a - b ) / 2 ]
en partant du fait que par n_imaginaire-addition :
cos(a) + cos(b) = Re[ e i*a + e i*b ]    ⇔
en appliquant un artifice mathématique :
cos(a) + cos(b) = Re[ e i*(a+b)/2 * ( e i*(a-b)/2 + e - i*(a-b)/2 ) ]
où :
e i*(a-b)/2 + e - i*(a-b)/2
est la somme de deux complexes conjugués.
Or :
e i*a + e -i*a = [ cos(a) + i * sin(a) ] + [ cos(a) - i * sin(a) ] = 2 * cos(a)    ⇔
cos(a) = ( e i*a + e - i*a ) / 2
qui est la définition moderne du cosinus, ou encore que cos(a) est la partie réelle de ei*a !
De la même manière on démontre que :
sin(a) = ( e i*a - e - i*a ) / ( 2 * i )

e i*(a-b)/2 + e - i*(a-b)/2 = 2 * cos[ (a-b) / 2 ]
NB : qui est un nombre réel    ⇒
cos(a) + cos(b) = Re[ e i*(a+b)/2 ] * 2 * cos[ (a-b) / 2 ]    ⇔
cos(a) + cos(b) = cos[ (a+b) / 2 ] * 2 * cos[ (a-b) / 2 ]
CQFD

expo-imagin-applications.png

Cette démonstration aurait été nettement plus difficile à démontrer sans recourir à l'exponentielle imaginaire, ce qui confirme la puissance de celle-ci pour résoudre de nombreux problèmes mathématiques, mais également modéliser de nombreuses applications caractérisées par des variations harmoniques c-à-d sinusoïdales :

  • le nuage électronique qui vibre avec une certaine fréquence (ω dans la formule de l'image ci-contre) ;
  • l'onde que propage le laser ;
  • les variations du courant et de la tension de l'électricité alternative.

Matrices

https://philosophie.jortay.net/savoir-scientifique-base#matrices
 4.7.1. Définition
 4.7.2. Déterminant et matrice inverse
 4.7.3. Addition matricielle
 4.7.4. Produit matriciel
 4.7.5. Matrice identité
 4.7.6. Transformation
 4.7.7. Plan et volume
 4.7.8. Formule générale du déterminant et cofacteur
 4.7.9. Propriétés du déterminant
 4.7.10. Matrice inverse
 4.7.11. Déterminant d'un produit de matrices
Définition
https://philosophie.jortay.net/savoir-scientifique-base#matrice-definition
triangle-clipedia.png Vidéo Clipedia : Les matrices : introduction
Solutions
système
équations

Nous allons voir que l'objet mathématique qu'est la matrice permet de simplifier le calcul des solutions d'un système d'équations, et d'ainsi rendre possible des applications technologiques impliquant un grand nombre de variables et paramètres. Voici la façon la plus fréquente de formuler un système d'équations linéaires à deux inconnues x et y (les autres grandeurs, appelées "paramètres", étant considérées comme connues) :

a * x + b * y = p
c * x + d * y = q

dont on constate que les membres de gauche correspondent à des produits scalaires n_produit-scalaire-algebrique :

(a, b) . (x, y) = p
(c, d) . (x, y) = q

de sorte que le système peut être représenté sous forme matricielle comme suit :

ab
cd
*
x
y
=
p
q

dont la règle de calcul est formulée par n_syst-2-equ-lin. Nous verrons une généralisation de cette règle de calcul. Mais pour cela il nous faut d'abord développer les notions de matrice inverse et de déterminant.

Rappel (N.d.A.) : une condition nécessaire pour obtenir la valeur de toutes les inconnues d'un système d'équations est que le nombre d'équations égale le nombre d'inconnues, c-à-d que la matrice rouge ci-dessus soit carrée.

Déterminant et matrice inverse
https://philosophie.jortay.net/savoir-scientifique-base#matrice-determinant-inverse

En simplifiant l'écriture de la forme matricielle ci-dessus par A * X = P, on définit alors le membre de gauche comme étant un "produit matriciel", et dont la règle de calcul est comme suit :

  • première ligne de P : produit scalaire de la première ligne de A avec la "matrice colonne" X (on dit aussi "vecteur colonne") ;
  • seconde ligne de P : produit scalaire de la deuxième ligne de A avec la colonne de X.

Il résulte de A * X = P que l'on pourrait calculer simultanément l'ensemble des solutions du système par le produit : X = A-1 * P.

Il nous faut donc approfondir la notion de matrice inverse (A-1), ce que l'on va faire grâce au moyen d'un objet mathématique très utile : le déterminant d'une matrice.

Pour ce faire on va commencer par calculer les solutions de n_syst-2-equ-lin, sans recourir aux matrices. Pour ce faire on procède comme suit :

  1. multiplier :
    • la première équation par le coefficient de y dans la seconde équation (d) ;
    • la seconde équation par le coefficient de y dans la première équation (b) :
    ( a * x + b * y ) * d = p * d
    ( c * x + d * y ) * b = q * b
  2. soustraire les deux équations pour éliminer y :
    a * d * x - b * c * x = d * p - b * q     ⇔
    x = ( d * p - b * q ) / ( a * d - b * c )
  3. appliquer les étapes 1 à 2 pour obtenir la valeur de y
    x = d * p − b * q / ( a * d − b * c )
    y = a * q − c * p / ( a * d − b * c )
Déterminant
de A

On constate que les deux solutions ont même dénominateur : a * d − b * c. On l'appelle "déterminant de A" car si sa valeur est nulle il détermine que x et y sont infinis c-à-d que le système n'a pas de solution. Il est noté det(A) et l'on constate que sa valeur correspond au produit scalaire des éléments de la diagonale principale (↘) de A par ceux de l'autre diagonale (↙) :

det
ab
cd
= a * d − b * c

N.d.A. La notion de déterminant ne concerne donc que les matrices carrées.

Inverse
de A

Nous verrons plus loin que la résolution de nombreux calculs d'ingénierie requiert l'utilisation de l'inverse d'une matrice. Or la notion de déterminant va nous permettre de formuler simplement l'inverse d'une matrice.

En effet, en entroduisant ce nouvel objet qu'est le déterminant, le système des solutions que nous avons calculées n_solutions-systeme peut alors s'écrire plus simplement :

det(A) * x = d * p − b * q
det(A) * y = a * q − c * p


que l'on ordonne pour symétriser :

det(A) * x = d * p - b * q
det(A) * y = - c * p + a * q


de sorte que les deux membres peuvent être écrits sous forme matricielle :

det(A) * x
det(A) * y
=
d-b
-ca
*
p
q

On met alors det(A) en évidence puis on le fait passer dans le membre de droite, de sorte que l'on obtient la forme matricielle du système des solutions du système n_produit-matriciel-base :

x
y
= 1 / det(A) *
d-b
-ca
*
p
q


que l'on compare à :
X = A-1 * P
pour en déduire que :

A-1 = 1 / det(A) *
d-b
-ca


Où l'on notera que la matrice ressemble quelque peu à A, sauf que :
• les éléments que la diagonale principale (↘) sont intervertis ;
• les éléments que la diagonale secondaire (↙) ont changé de signe.

Par conséquent on peut conclure que l'écriture :
A * X = P  ⇒  X = A-1 * P
vaut également pour des matrices (pour autant, nous le verrons plus loin, que le produit matriciel soit possible, ce qui requiert que les matrices soient telles que A pxn * B nxq, c-à-d telles que le nombre de colonnes de A est égal au nombre de lignes de B).

N.d.A. La méthode du déterminant, pour déterminer l'inversibilité d'une matrice et calculer son inverse, ne concerne donc que les matrices carrées.

Addition matricielle
https://philosophie.jortay.net/savoir-scientifique-base#matrice-addition

La comparaison des deux formulations d'un système d'équations n_syst-2-equ-lin et n_produit-matriciel-base suggère que le produit d'une matrice par un scalaire, ainsi que l'addition de matrices, s'opèrent en appliquant élément par élément de matrice les principes du produit et de l'addition de scalaires. On comprend également que ne peuvent être additionnées que des matrices de dimensions #lignes x #colonnes égales.

Notation. Dans les indices de matrices le premier chiffre indique le nombre de lignes, et le second le nombre de colonnes. Ainsi la matrice Amxn est de dimension mxn, c-à-d est composée de m lignes et n colonnes (NB : mxn est donc le nombre d'éléments de la matrice). Dans le cas des opérations d'algèbre matricielle on utilise une notation en fonction des éléments aij :

Amxn =
a11a12...a1n
a21a22...a2n
............
am1am2...amxn
= (aij)

où :
i=1,...,m : indique la ligne de l'élément aij;
j=1,...,n : indique la colonne de l'élément aij.

Ainsi l'on démontre facilement la distributivité de la multiplication scalaire sur l’addition de matrices :
α * [ A + B ] =
α * [ (aij) + (bij) ] =
α * ( aij + bij ) =
[ α * ( aij + bij ) ] =
( α * aij + α * bij ) =
( α * aij ) + ( α * bij ) =
α * ( aij ) + α * ( bij ) =
α * A + α * B
CQFD

On démontre de la même manière :

  • l'associativité de l’addition de matrices : [A+B]+C=A+[B+C]
  • la commutativité de l’addition de matrices : A+B=B+A
Application

Une matrice constitue un outil mathématique idéal pour représenter et modifier une image numérique :

  • chaque élément de la matrice correspond à un point de l'image (pixel) ;
  • la valeur de chaque élément correspond à l’intensité lumineuse du point correspondant ;
  • la dimension de la matrice correspond à celle de l'image.

Ainsi dans le cas simple d’une image monochrome :

  • la matrice nulle, c-à-d ne comportant que des zéros, correspond à une image noire ⇔ la somme d’une image quelconque avec une image noire redonne l’image de départ, et pas une image noire ;
  • on créé un effet de fondu (superposer deux images) en additionnant les matrices correspondant à ces images ;
  • on modifie la luminosité d'une image en multipliant sa matrice par un scalaire.
Produit matriciel
https://philosophie.jortay.net/savoir-scientifique-base#matrice-produit

Nous disposons maintenant des éléments nécessaires pour définir le produit matriciel général. On peut le faire facilement à partir du produit de deux matrices carrées, que l'on détermine comme suit :

ab
cd
*
ef
gh
*
x
y
 =

ab
cd
*
e * x + f * y
g * x + h *y
 =

a * ( e * x + f * y ) + b * ( g * x + h *y )
c * ( e * x + f * y ) + d * ( g * x + h *y )
 =

( a * e + b * g ) * x + ( a * f + b * h ) * y
( c * e + d * g ) * x + ( c * f + d * h ) * y
 =

cf. passage de n_syst-2-equ-lin à n_produit-matriciel-base

a * e + b * ga * f + b * h
c * e + d * g c * f + d * h
*
x
y


⇒ par comparaison avec la première égalité :

ab
cd
*
ef
gh
=
a * e + b * ga * f + b * h
c * e + d * g c * f + d * h

où l'on constate que l'élément i j de la matrice produit C=A*B est égal au produit scalaire de la ligne i de A par la colonne j de B, ce que l'on formule mathématiquement comme suit :
c i j = a i 1 * b 1 j + a i 2 * b 2 j = ∑k=12a i k * b k j

Et l'on voit que cette formule peut être généralisée au produit :
A pxn * B nxq = C pxq
où :
c i j = a i 1 * b 1 j + ... + a i n * b n j = ∑ k=1na i k * b k j.

NB : le nombre de colonnes de A doit être égal au nombre de lignes de B, sans quoi le produit scalaire ne serait pas possible.

Application. Il suffit des quatre lignes de code suivantes pour programmer la transcription informatique du dernier membre de la formule mathématique n_produit-matriciel. Cet algorithme permet à un ordinateur de calculer en quelques secondes une matrice produit scalaire comportant des millions d'éléments :

// Pour chaque ligne de la matrice produit Cpxq :
for (i=0;i<p;i++)
	// et pour chaque colonne de la matrice produit C pxq :
	for (j=0;j<q;j++)
		// le  produit scalaire ligne * colonne s'effectue :
		for (k=0;k<n;k++)
			// en  cumulant les produits des éléments homologues :
			c[i][j]+=a[i][k]*b[k][j];

Notez la similitude entre la dernière ligne de l'algorithme et le dernier membre de n_produit-matriciel.

Matrice 1x1. On notera qu'une matrice 1x1 n'est pas un scalaire :
(c11) = C1x1 = A1xn * Bnx1 =

a11a12...ann
*
b11
b21
...
b2n
=
(c11 = ∑ k=1na i k * b k j)
qui est donc une matrice ne contenant qu'un seul élément, mais qu'il ne faut pas confondre avec le scalaire c11 ! Ainsi la multiplication d'une matrice quelconque ( dij ) par un scalaire est toujours possible :
c11 * ( dij ) = ( c11 * dij )
mais ce n'est pas le cas du produit de cette matrice quelconque par une matrice C1x1=( c11 ) :
( c11 ) * ( dij )
qui n'est n'est possible que si i=1

À noter également que si l'on commute les matrices du produit :
A1xn * Bnx1 = C1x1
on obtient :
Bnx1 * A1xn = Cnxn
qui est donc une matrice nxn !

b11
b21
...
b2n
*
a11a12...a1n
=

b11*a11...b11*a1n
.........
b2n*a11...b2n*a1n

Propriétés du produit matriciel :

  • Non commutativité :
    Soit
    A lxn * B nxm = C lxm
    alors
    B nxm * A lxn
    n'est possible que si m=l c-à-d si A et B sont de dimensions inverses, ou égales si elles sont carrées (NB : cette condition de commutativité est nécessaire, mais pas suffisante !) ⇒ le produit matriciel n'est donc pas commutatif en toute généralité. CQFD.

    N.B. Le produit d'une matrice par son inverse est commutatif :
    A-1 * A = I   ⇔
    A * A-1 * A = A * I = A   ⇔
    A * A-1 = I
    CQFD

  • Distributivité de la multiplication matricielle sur l’addition matricielle :
    A * ( B + C ) =
    (aik) * [ (bkj) + (ckj) ] =
    (aik) * ( bkj + ckj ) =
    par n_produit-matriciel :
    ( ∑ k=1na i k * ( bkj + ckj ) ) =
    par distributivité entre scalaires, puis regroupements b et c :
    ( ∑ k=1na i k * bkj + ∑ k=1na i k * ckj ) =
    ( ∑ k=1na i k * bkj ) + ( ∑ k=1na i k * ckj ) =
    A * B + A * C
    CQFD
  • Associativité :
    (A * B ) * C =
    [ (ail) * (blk) ] * (ckj) =
    ( ∑l a il * b lk ) * (ckj) =
    ( ∑k [ ∑l a il * b lk ] * ckj ) =
    ( ∑k [ ∑l a il * b lk * ckj ] ) =
    par commutativité de la somme :
    ( ∑l [ ∑k a il * b lk * ckj ] ) =
    mise en évidence de a il :
    ( ∑l [ a il * [ ∑k b lk * ckj ] ] ) =
    ( a il ) * ( ∑k b lk * ckj ) =
    ( a il ) * [ ( b lk ) * ( ckj ) ] =
    A * ( B * C )
    CQFD
Matrice identité
https://philosophie.jortay.net/savoir-scientifique-base#matrice-identite
Soit la matrice carrée A =
ab
cd
. On appelle "matrice identité" la matrice I = A-1 * A.

On calcule sa valeur comme suit :

A-1 * A =
par n_matrice-inverse :
1 / det(A) *
d-b
-ca
*
ab
cd
=

1 / det(A) *
a * d - b * c0
0a * d - b * c


par n_determinant :

I =
10
01

Quant à la définition de la matrice identité, on peut la généraliser au cas d'une matrice carrée quelconque nxn :

I = (ipq)   où   ipq = 0 si p≠q
1 si p=q


et que l'on démontre comme suit :
A * I = (aik) * (ikj)     ⇔
par n_produit-matriciel
A * I = ( ∑k=1na i k * i k j )     ⇔
par définition n_matrice-identite :
A * I = ( a i1 * i 1j + a i2 * i 2j +... + a ij * i jj + ... + a in * i nj )
où tous les i sont nuls sauf i jj=1     ⇒
A * I = (aij) = A
CQFD (même principe pour I*A).

On démontre enfin qu'une matrice identité est nécessairement carrée, à partir de l'égalité :
I lxn * A nxm = A lxm
qui n'est possible pour A que si n=l
CQFD

Nous sommes maintenant en mesure de démontrer une quatrième propriété du produit matriciel : [A * B]−1 = B−1 * A−1
que l'on démontre en commençant par montrer que :
A * B * B−1 * A−1 = A * A−1 = I
⇒ si on multiplie par [A * B]−1 les deux membres extrêmes de cette chaîne d'égalités    ⇒
[A * B]−1 * A * B * B−1 * A−1 = [A * B]−1    ⇒
B−1 * A−1 = [A * B]−1
CQFD

Transformation
https://philosophie.jortay.net/savoir-scientifique-base#matrice-transformation
triangle-clipedia.png Vidéo Clipedia : Matrices et transformations

Le calcul matriciel permet notamment d'opérer des transformations géométriques simples, qui sont des applications linéaires bijectives (symétrie, agrandissement, rétrécissement, rotation, cisaillement, perspective, etc). Nous allons étudier ici la transformation d'une image par transformation de ses coordonnées : X'2x1 = A2x2 * X2x1 où les vecteurs colonnes X et X' sont les vecteurs positions d'un pixel dans chacune des images, et A2x2 est la matrice de transformation.

Ainsi la symétrie axiale d'axe y d'une image (cf. graphique infra) peut s'écrire :

x' = -x
y' = y


x'
y'
=
-10
01
*
x
y

Symétrie axiale d'axe Y

symetrie-axe-Y.png

De même que n’importe quelle matrice carrée 2×2 peut être considérée comme une transformation d’image (ou encore comme une transformation du plan), plus généralement, une matrice carrée 3×3 peut être considérée comme une transformation d’objet à trois dimensions (transformation de volume).

Nous allons maintenant étudier quelques propriétés remarquables de transformations matricielles.

Réversion
La première propriété est particulièrement intuitive : l'inverse d'une matrice transformation est la matrice de la transformation inverse (on dit aussi "réciproque") :
X’ = A * X    ⇔
A−1 * X’ = A−1 * A * X    ⇔
A−1 * X’ = X
CQFD

NB : il résulte de de la formule de la matrice inverse n_matrice-inverse qu'une transformation dont le déterminant est nul est par conséquent non réversible (dans le cas des transformations d'image, on dit que l'information sur l'image originelle a été perdue lors de la transformation).

Matrice égale à son inverse :
à l'instar des scalaires :
A = A−1   ⇔   A2 = I
mais contrairement aux scalaires il n'y pas seulement A=I et A=-I comme solutions : il existe une infinité de matrices ayant pour propriété d'être égale à leur inverse. C'est par exemple le cas de la matrice telle que :

-1α
01
*
-1α
01
=
10
01

Transformations
multiples

La matrice B * A est la matrice d’une seule transformation équivalente à la transformation B appliquée à la transformation A :
X" = B * X' = B * A * X
À noter que l'ordre des transformations est l'inverse de celui de leur écriture formelle du produit, ce qu'il importe de ne pas perdre de vue dès lors qu'un produit matriciel n'est pas nécessairement commutatif (il l'est cependant dans certains cas, comme par exemple si la transformation par A est une symétrie axiale d'axe Y, et la transformation par B une symétrie axiale d'axe X).

Vecteurs
unitaires
transformés
Pour analyser plus en profondeur le principe de transformation, on va identifier la transformation des points de coordonnées (1, 0) et (0, 1), qui sont les coordonnées des vecteurs de base unitaires :

1x =
1
0
   et    1y =
0
1
    dans les directions x et y.

Les vecteurs transformés sont :

ab
cd
*
1
0
=
a
c


et

ab
cd
*
0
1
=
b
d

Où l'on voit que les colonnes successives de la matrice transformation carrée représentent des vecteurs qui sont les transformées de chacun des vecteurs de base .

Ainsi l'on comprend, plus intuitivement, que par exemple la matrice
α0
01
    a pour effet de modifier la largeur de l'image, puisque l'unité de l'axe X (colonne de gauche) est multipliée par α tandis que l'unité de l'axe Y (colonne de droite) est inchangée.
elargir.png
Rotation

Dans le cas d'une rotation d'un angle θ les figures suivantes illustrent le vecteur 1x et sa transformation (deux figures de gauche : représentation vectorielle et sa transformée en représentation cartésienne), puis le vecteur 1y et sa transformation (deux figures de droite : représentation vectorielle et sa transformée en représentation cartésienne) :

matrice-rotation.png
Par conséquent :

matrice-rotation-x.png
1'x =
a
c
=
cos θ
sin θ

matrice-rotation-y.png
1'y =
b
d
=
- sin θ
- cos θ


de sorte que :

ab
cd
=
cos θ- sin θ
sin θcos θ

D'où il résulte que le déterminant d'une rotation vaut 1 :
det(A) = a * d - b * c = (cosθ)2 + (sinθ)2    ⇔ par n_sin2(a)+cos2(a)=1 :
det(A) = 1
CQFD

Plan et volume
https://philosophie.jortay.net/savoir-scientifique-base#matrice-2D-3D

Nous allons voir que :

  • une matrice 2x2 (/ 3x3) correspond à la transformation d'une surface (/ d'un volume) ;
    • cette propriété est liée au fait que le produit vectoriel (/ mixte) correspond à une surface (/ un volume).
  • la valeur du déterminant de cette matrice donne le facteur de dilatation de la surface (/ du volume) par la transformation ;
    • cette propriété est liée au fait que le produit vectoriel (/ mixte) vaut le ("se calcul au moyen du") déterminant de la matrice dont les colonnes (ou les lignes) sont les vecteurs du produit.

Le lecteur attentif aura remarqué que l'interprétation d'une matrice comme expression d'une transformation correspond à un changement de notation dans le système d'équations n_syst-2-equ-lin où les constante p et q ont été remplacées par la coordonnée (x', y') du point transformé ⇒

a * x + b * y = x'
c * x + d* y = y'

transformation-surface.png

2D

On constate qu'un segment de droite avant transformation reste un segment de droite après une telle transformation, mais en général d’orientation et de longueur différentes. En particulier le segment déterminé par les points (0,0) et (1,1), c-à-d le vecteur position (1,1), est transformé en vecteur position (a+b,c+d). Ainsi le carré unitaire est transformé en parallélogramme.

ab
cd
*
1
1
=
a+b
c+d

Nous allons montrer, de façon géométrique puis algébrique, que le déterminant de la matrice de transformation est le facteur de transformation de la surface : S' = S * det(A).

transformation-surface-2.png

Démonstration géométrique :
On transforme le parallélogramme du graphique précédent en une forme de surface égale en translatant le triangle supérieur en dessous du parallélogramme, de sorte que :
S' = base * hauteur = x0 * d
où il reste à déterminer x0 en exploitant la proportionnalité des deux triangles de bases b et a-x0 :
b / d = ( a − x0 ) / c    ⇔    x0 = a − b * c / d    ⇒
S' = ( a − b * c / d ) * d = a * d - b * c    ⇔ par n_determinant :
S' = det(A)
CQFD

On se rappellera déjà ici qu'à une surface correspond un produit vectoriel. On y reviendra plus loin.

Analyse de cas particuliers :

  • det(A) = 1 : une rotation, dont nous avons vu que le déterminant vaut 1 n_determinant-rotation, ne modifie pas la surface ;
transformation-surface.png
  • det(A) = 0  ⇔  a * d - b * c = 0  ⇔  b / d = c / a
    ⇔ les pentes des deux côtés du parallélogramme sont égales    ⇒ la surface initiale est transformée en un segment de droite ;
  • det(A) < 0 :  ⇔  a * d - b * c < 0  ⇔  b / d < c / a
    ⇔ la pente du vecteur (a,c) devient supérieure à celle du vecteur (b,d)    ⇔ la surface initiale est retournée (effet miroir ⇔ surface "négative").
transformation-surface-3.png

Démonstration algébrique :

soit la matrice   
ab
cd

ses deux colonnes représentent deux vecteurs transformés, qui par n_sinus et n_cosinus sont tels que :

v =
a
c
  =  
v * cos α
v * sin α


w =
b
d
  =  
v * cos β
v * sin β


de sorte que :
det(A) = a * d - b * c = v * w * (sin α * cos β - cos α * sin β)    ⇔ par n_sin(a-b) :
det(A) = v * w * sin( β - α )
or la similitude du membre de droite avec le module du produit vectoriel montre que det(A) représente bien la surface du parallélogramme déterminé par v et w.
CQFD

Surface orientée. On peut maintenant interpréter la notion de surface négative comme une orientation déterminée par le signe de sin( β - α ) c-à-d par le signe de β - α (si cet angle est inférieur à 180°). Cette orientation est déterminée par la règle de la main droite : dans le graphique supra (β - α > 0) le produit scalaire est représenté par un troisième axe (z), qui sort du plan (dévissage) ; par contre si on avait β - α < 0 alors la position relative des vecteurs v et w serait inversée de sorte que l'axe z rentrerait dans le plan (vissage).

triangle-clipedia.png Vidéo Clipedia : Déterminant 3x3
3D

Ces considérations nous conduisent à étudier le cas des volumes c-à-d à des matrices de dimension 3. Nous allons voir qu'on retrouve l'équivalent des propriétés étudiées dans le cas des matrice de dimension 2. Mais avant de poursuivre introduisons une notation rationnelle du déterminant :

det(
uxvxwx
uyvywy
uzvzwz
) =
uxvxwx
uyvywy
uzvzwz

Soit le système matriciel suivant :

x'
y'
z'
=
uxvxwx
uyvywy
uzvzwz
*
x
y
z

vecteurs-3d.png

On y retrouve les propriétés analysées pour les matrices de dimension 2, notamment que les colonnes de la matrice de transformation sont les transformées des vecteurs unitaires.

NB : le graphique ci-joint attire l'attention sur le fait que la perspective 3D est écrasée : aucun des trois vecteur dessiné n'est nécessairement dans le plan X-Y correspondant à celui de votre écran. Cette remarque facilite la lecture du graphique suivant, qui illustre l'application de la règle de la main droite dans un espace 3D.

main-droite-3d.png

Dans ces conditions le produit vectoriel v x w est donné par n_produit-vectoriel-regle-calcul :
v x w = ( vy * wz - vz * wy ) * 1x - ( vx * wz - vz * wx ) * 1y + ( vx * wy - vy * wx ) * 1z

qui peut également s'écrire sous forme matricielle comme suit n_prod-scal-det :

v x w =  
1x vx wx
1y vy wy
1z vz wz

et dont la règle de calcul consiste à multiplier chaque vecteur de base par le déterminant 2×2 qui subsiste dans le tableau après avoir éliminé le reste de sa ligne et de sa colonne : .

calcul-determinant-3d.png

Le graphique suivant montre que les composantes (v...w...− v...w...) du produit scalaire sont respectivement les aires des projections – sur les plans yz, xz et xy – du parallélogramme construit sur les vecteurs v et w. La surface bleue du graphique (Syz) correspond au premier facteur du produit scalaire supra (vy * wz - vz * wy), au premier des trois déterminants ci-dessus. Enfin chacune des trois projections reproduit ce que l'on a analysé dans le cas des matrices de dimension 2.

v x w = Syz * 1x - Sxz * 1y + Sxy * 1z
projection-determinant-2-3d.png

Volume. De même que le déterminant d'une matrice de dimension 2 correspond à une surface, on se doute que le déterminant d'une matrice de dimension 3 correspond à un volume, lequel est calculé par un produit mixte (a→xb→)*c→ :

det(A) = u . ( v x w ) ≡ volume

determinant-3d.png

Démonstration :
par n_produit-scalaire-trigono
u . ( v x w ) = || u|| * || v x w|| * cosφ    ⇔
u . ( v x w ) = || u|| * S * cosφ = S * || u|| * cosφ    ⇔
u . ( v x w ) = S * h
CQFD
On retrouve donc une généralisation 3D de ce que l'on avait analyés en 2D : ici un cube d’arête 1 et de volume 1, dont les faces sont des carrés, est transformé en un parallélépipède non rectangle, dont les faces sont des parallélogrammes.

Analysons maintenant le déterminant. Pour ce faire exprimons ce volume en termes des composantes :
par règle de calcul du produit scalaire n_produit-vectoriel-regle-calcul :
v x w = 1x * ( vy * wz - vz * wy ) - 1y * ( vx * wz - vz * wx ) + 1z * ( vx * wy - vy * wx ) *    ⇔
par forme algébrique du produit scalaire n_produit-scalaire-algebrique :
u . ( v x w ) = ux * ( vy * wz - vz * wy ) - uy * ( vx * wz - vz * wx ) + uz * ( vx * wy - vy * wx )    ⇔
en reprenant la notation mnémonique :

u . ( v x w ) =
ux vx wx
uy vy wy
uz vz wz

où le membre de droite est noté det(A).

levogyre.png

Volume orienté.. Il ressort de :
u * ( v x w ) = || u|| * || v x w|| * cos(φ) n_matrice-volume
que det(A) > 0 si cos(φ) > 00 ≤ φ < π/2 ce qui dans le graphique précédent correspond à un trièdre (v,w,u) dextrogire (le produit scalaire v x w va dans le sens de u). À l'opposé, dans le graphique ci-contre on a inversé v et w ⇒ le produit scalaire v x w ne va plus dans le sens de u (trièdre lévogyre), ce qui correspond à π/2 < φ ≤ π. Enfin det(A) = 0 si cos(φ) = 0φ = π/2, c-à-d que les trois vecteurs sont coplanaires ⇔ le volume est bien nul.

On notera enfin que :
u * ( v x w ) = ux * ( vy * wz - vz * wy ) - uy * ( vx * wz - vz * wx ) + uz * ( vx * wy - vy * wx )
est la somme de trois volumes :
u * ( v x w ) = ux * Syz - uy * Sxz + uz * Sxy

4D

Pour développer la notion de matrice de dimension n, on va commencer par étudier la matrice de dimension 4. Mais avant, il nous faire une parenthèse pour souligner le fait que la notion de déterminant ne fait sens qu'avec des matrices carrées. Pour ce faire rappelons-nous l'équivalence des égalités suivantes :

a * x + b * y = x'
c * x + d* y = y'


(a, b) . (x, y) = x'
(c, d) . (x, y) = y'


ab
cd
*
x
y
=
x'
y'


x
y
=
1 / det(A) *
d-b
-ca
*
x'
y'


x
y
= A-1 *
x'
y'

Or il est facile de vérifier que si A n'est pas carrée alors le système d'équation correspondant est soit sous-déterminé (# de variables > # d'équations) soit sur-déterminé (# de variables < # d'équations).

4D.png

Cette précision étant faite notons l'impossibilité de représenter un espace à 4 dimensions, raison pour laquelle dans le graphique ci-contre le 4° axe et le 4° vecteur sont représentés en hachuré.

Heureusement la notation mathématique n'est pas limitée par cette contrainte.

Ainsi le cas 3D, det(A) =

u . ( v x w )
=
ux *
vy wy
vz wz
- uy *
vx wx
vz wz
+ uz *
vx wx
vy wy

=
ux * Syz - uy * Sxz + uz * Sxy

devient

r . ( u x v x w )
=
rt *
ux vx wx
uy vy wy
uz vz wz
- rx *
ut vt wt
uy vy wy
uz vz wz
+ ry *
ut vt wt
ux vx wx
uz vz wz
- rz *
ut vt wt
ux vx wx
uy vy wy

=
rt * Vxyz - rx * Vtyz + ry * Vtxz - rz * Vtxy

Cette somme étant composée de 4 volumes de dimension 4, on entre ainsi dans le domaine des hypervolumes (dimension > 3), et en l'occurrence dans celui des parallélotopes.

Où l'on voit apparaître une structure de calcul en poupées russes (cf. les "mineurs" du déterminant). Le nombre d'opération est ici de 63, de sorte que le calcul global est très lourd. Nous verrons des méthodes permettant de simplifier de nombreux cas de calcul.

nD

On peut maintenant généraliser au cas de matrices de dimension nxn. Notons que l'analogie est (évidemment) elle aussi limitée pour représenter des dimensions supérieures à trois : ainsi un matrice de niveau n contient n matrice de niveau n-1 (alors qu'une poupée russe n'en contient qu'une seule), de sorte que le nombre de poupées c-à-d de déterminants vaut N!, le dernier étant de dimension 1x1.

nD.png

det(A) = v1 . ( v2 x v3 x ... x vN )

Formule générale du déterminant et cofacteur
https://philosophie.jortay.net/savoir-scientifique-base#formule-generale-determinant
triangle-clipedia.png Vidéo Clipedia : Formule du déterminant

Le déterminant de la matrice 3x3 n_produit-mixte-3x3 est une somme de 6 produits de 3 facteurs :
ux * ( vy * wz - vz * wy ) - uy * ( vx * wz - vz * wx ) + uz * ( vx * wy - vy * wx )    =
ux * vy * wz - ux * vz * wy - uy * vx * wz + uy * vz * wx + uz * vx * wy - uz * vy * wx

det-3x3.png

3 colonnes u,v,w
3 lignes x,y,z

Cette somme de produits est telle que :

  • les facteurs des produits correspondent aux trois colonnes (u,v,w) du déterminant ;
  • les indices (x,y,z) des facteurs correspondent aux trois lignes, et ne se répètent jamais au sein de chaque facteur (puisque chaque mineur (*) est déterminé en éliminant la ligne et la colonne de son élément de référence) ;

(*) C-à-d les "poupées russes" évoquées supra, étant entendu qu'à la différence des poupées russes, un mineur de niveau n contient n mineurs de niveau n-1.

Il en résulte que le déterminant d'ordre n contient toutes les combinaisons possibles de n éléments distincts appartenant à des lignes et des colonnes différentes. Et il apparaît que les éléments de la somme supra sont donc les combinaisons que l'on peut obtenir de 3 lettres (x,y,z), leur nombre est donné par Anp = n ! / ( n - p ) !n_arrangements soit ici 3!/(3-3)=6.

determinant-damier.png

On voit également qu'il y a une forme de symétrie, inhérente au caractère carré de la matrice et au mode de calcul du déterminant. Il résulte de cette symétrie que le calcul du déterminant peut être réalisé à partir de n'importe quelle colonne ou ligne. La difficulté dans ce type de calcul est de ne pas se tromper dans l'attribution des signes moins (résultant de la règle de la main droite). Pour cela il suffit de constater que cette répartition est elle aussi symétrique, la règle étant celle du damier : dans l'image ci-contre les cases grisées correspondent aux signes négatifs, et l'on notera qu'elles correspondent également à une somme d'indices (ligne+colonne) impaire, ce qui est exprimé par (−1) i+j dans la la formulé générale du calcul de déterminant :

det(A) = ∑ iouj=1N (−1) i+j * aij * Mij

Mij est le mineur correspondant à l'élément aij, c-à-d déterminé par la suppression de la colonne et de la ligne de aij (il porte donc les indices de son référentiel) ;
iouj=1 signifie que le calcul peut être effectué sur n'importe quelle ligne i ou colonne j.

Que l'on simplifie encore par :

det(A) = ∑ iouj=1N aij * Cij
Cij = (−1) i+j * Mij est le "cofacteur" de l'élément aij.

Ainsi, appliquée à partir de la première ligne, cette définition donne :
det(A) = ∑ j=1N a1j * C1j

Le déterminant d'une matrice est donc la somme des produits des éléments d'une rangée quelconque par leur cofacteur. En pratique, pour simplifier le calcul d'un déterminant, on le calculera sur base de sa ligne ou colonne contenant le plus de zéros.

Propriétés du déterminant
https://philosophie.jortay.net/savoir-scientifique-base#determinant-proprietes

On va étudier ici le cas de trois type de matrice : transposée, permutée et proportionnelle. Nous verrons qu'en combinant les propriétés de ces matrices particulières avec la propriété générale de linéarité on peut simplifier le calcul des déterminants.

Matrice
transposée

Soit la matrice A telle que : [A]ij = aij, alors sa transposée est telle que [At]ij = aji. La transposée est donc une symétrie axiale autour de la première diagonale.

transposee.png

Dès lors qu'un déterminant peut être calculé selon n'importe quelle ligne ou colonne, il en résulte que :
det ( At )ij = det ( A )ij

Ces deux matrices correspondent à des parallélépipèdes de formes différentes (puisque les vecteurs sont différents) mais de volumes identiques (puisque les déterminants sont égaux).

transposee2.png
Matrice
permutée

Une matrice est permutée si deux rangées parallèles (lignes ou colonnes) sont permutées. Géométriquement, la permutation de deux colonnes correspond à la permutation des vecteurs correspondants ⇒ la règle de la main droite montre que cette permutation change le signe du déterminant.

det(A) = u . ( v x w ) = V    ⇔ en permuttant v et w :
det(A') = u . ( w x v ) = -V    ⇔ en permuttant u et w :
det(A'') = w . ( u x v ) = V    ⇔ ...

Étant donné qu'une matrice et sa transposée ont le même déterminant, il en résulte qu'on observera le même phénomène que ci-dessus dans le cas de permutations de lignes :


soit : B = At     ⇒     det(B) = det(A) = V
soit : B' = A't    ⇒     det(B') = det(A') = -V
etc.

Ainsi en règle générale, après n permutations de rangées parallèles (colonnes ou lignes) le déterminant est multiplié par (−1)*n : det ( A (n) ) = (-1) n * det ( A )

Matrice
proportionnelle

Une matrice est dite proportionnelle si elle a au moins deux rangées (lignes ou colonnes) proportionnelles. Étudions le cas du calcul du déterminant d'une matrice proportionnelle relativement à une rangée non proportionnelle. Or on vérifie facilement que, étant donné le mode de calcul des déterminants, les mineurs impliquant les deux rangées proportionnelles sont nécessairement nuls, et donc le déterminant de la matrice aussi. Et ce principe vaut pour toute matrice de degré n : la nullité des mineurs de dernier niveau se répercutant dans tous les niveaux de la "poupée russe" du calcul du déterminant. Le graphique suivant illustre l'interprétation géométrique : le "plan" déterminé par les deux vecteurs proportionnels w=α*v est ramené à une droite, et donc le volume à un plan ⇒ le volume est nul, et le volume c'est le déterminant. On a donc que :

le déterminant d'une matrice proportionnelle est nul

matrice-proportionnelle.png
Linéarité

Cette quatrième propriété est la plus importante car elle permet de simplifier le calcul matriciel (c-à-d du calcul de déterminants). Par "linéarité" on entend ici que si tous les éléments d’une seule rangée (ligne ou colonne) d’un déterminant sont multipliés par une constante, alors la valeur de ce déterminant (et donc le volume) est aussi multipliée par cette constante :

Soit la matrice A telle que :
det(A) = u . ( v x w ) = V
alors
det(A') = α * u * ( v x w ) = α * V

Pour démontrer cette propriété spécifiquement au cas d'une ligne ou d'une colonne on utilisera :
det(A) = ∑ iouj=1N aij * Cij n_formule-generale-det
⇒ appliquons-la, par exemple, relativement à la première ligne :
det(A) = ∑ j=1N a1j * C1j    ⇒
det(A') = ∑ j=1N α * a1j * C1j = α * ∑ j=1N a1j * C1j = α * det(A)
CQFD

Somme de déterminants. Il découle de la propriété de linéarité que det(A+B) ≠ det(A) + det(B). démonstration :
Soit les matrices :
A telle que : det(A) = u . ( v x w ) = V
A' = α * A
alors
det(A') = α * u . [ ( α * v ) x ( α * w ) ] = α 3 * u . ( v x w ) = α 3 * det(A)    ⇒
det(α * A) = α N * det(A) ≠ α * det(A)
NB : on voit ici qu'il n'y a plus linéarité dès que plus d'une rangée est multipliée par une constante.
⇒ soit α=2 :
det(A+A) ≠ det(A) + det(A)    ⇒
det(A+B) ≠ det(A) + det(B)

somme-volumes.png

Méthode de calcul. Soit :
det(A') = 2 * u . ( v x w ) = 2 * V    ⇔
det(A') = ( u + u ) . ( v x w ) = 2 * V    ⇔
det(A') = u . ( v x w ) + u . ( v x w ) = V + V

det(A') = ( u + s ) . ( v x w ) = Vu + Vs    ⇔
det(A') = u . ( v x w ) + s . ( v x w ) = Vu + Vs

Ainsi le volume du parallélépipède déterminé par les lignes hachurée en rouge est égal à Vu + Vsdet( A' ) = det( Au ) + det( As ), que l'on démontre trivialement à partir de det(A) = ∑ iouj=1N aij * Cij n_formule-generale-det :
i=1N ( ai1 + a'i1 ) * Ci1 = ∑ i=1N ai1 * Ci1 + ∑ i=1N a'i1 * Ci1

technique-calcul-det.png

Pour élaborer notre technique de simplification du calcul de déterminant, on va poser s = v. Or dans ce cas det(As)=0 par n_det-matrice-propor. Ainsi si l'on remplace la première colonne par la somme de celle-ci avec la seconde, on conserve le même déterminant.

Et si l'on pose plutôt s = α * v + β * w on obtient toujours le même résultat induit pas n_det-matrice-propor : le déterminant reste inchangé ! Et c'est grâce à cela que l'on va pouvoir simplifier des déterminants. L'idée est de chercher des combinaisons linéaires qui permettent de simplifier le déterminant que l'on souhaite calculer, c-à-d d'obtenir des zéros dans la rangée modifiée (ligne ou colonne).

Ainsi dans l'exemple suivant on a pu transformer la matrice en une matrice triangulaire, dont le déterminant vaut tout simplement le produit des éléments de la diagonale !

matrice-diagonale.png
Matrice inverse
https://philosophie.jortay.net/savoir-scientifique-base#matrice-inverse

Nous allons ici étudier la formulation générale de la formule du déterminant :

A-1 = 1 / det(A) *
d-b
-ca
    n_matrice-inverse

Cette dernière est très pratique (facile à retenir) pour A2x2, mais plus pour des dimensions supérieures. On va donc tenter de trouver la forme générale de :

d-b
-ca
triangle-clipedia.png Vidéo Clipedia : Inversion matricielle
Illustration

La résolution de nombreux calculs d'ingénierie requiert l'utilisation de l'inverse d'une matrice. C'est par exemple le cas de l'évaluation (par simulation informatique) des effets des forces aérodynamiques sur la structure d'un avion (évaluation de sa déformabilité).

Ainsi dans le modèle matriciel A * X = F :
• la matrice F décrit les forces aérodynamiques ;
• la matrice A décrit la structure matérielle de d'avion ;
• la matrice X décrit les déformations imprimées à la structure de l'avion (A) par les forces aérodynamiques (F).

L'égalité exprime la troisième loi de Newton (ou principe d'action-réaction) n_troisieme-loi-newton ⇒ pour connaître l'ampleur des déformations de la structure (c-à-d X) il faut exprimer X en fonction des valeurs connues que sont les forces aérodynamique (F) et la résistance du matériau constituant la structure de l'avion (A) ⇔ X = A-1 * F

Pratiquement la modélisation de l'avion se fait sous forme de points appelés "noeuds" (de sorte que ce type de modélisation est appelé "procédure de discrétisation"). Il s'agit alors d'évaluer la déformabilité (X) du modèle d'avion à partir des valeurs connues que sont la déformabilité du matériaux constituant la structure (A) et les forces aérodynamiques (F).

Calcul

Trouver la matrice A-1 c'est trouver la matrice A-1 telle que A-1 * A = I. Pour ce faire on va nommer les constituants de A-1 de telle sorte que ses trois lignes représentent trois vecteurs, associés au vecteurs de A, par transposition et notation majuscule (nous verrons plus loin pourquoi).

calcul-matrice-inverse.png

Or nous avons vu que le produit matriciel se calcule comme suit : l'élément i j de la matrice produit C=A*B est égal au produit scalaire de la ligne i de A par la colonne j de B n_produit-matriciel. Et l'on voit dans l'égalité ci-dessus que :

  • 1° ligne de I : U doit être perpendiculaire à v et w car : U . v = U . w = 0 n_produit-scalaire-angle-droit
  • 2° ligne de I : V doit être perpendiculaire à u et w car : V . u = V . w = 0
  • 3° ligne de I : W doit être perpendiculaire à u et v car : W . u = W . v = 0

Or pour obtenir ces doubles perpendicularités il suffit de poser que :

  • U est produit vectoriel de v et w : U = v x w n_prod-vect
  • V est produit vectoriel de w et u : V = w x u
  • W est produit vectoriel de u et v : W = u x v

... ce qui implique que chaque élément de la diagonale de la matrice du membre de droite devrait être égal à det(A) :

  • U . u = ( v x w ) . u = det(A)
  • V . v = ( w x u ) . v = det(A)
  • W . w = ( u x v ) . w = det(A)

En effet nous avons vu que le déterminant correspond au volume déterminé par ses vecteurs, et qu'on le calcule par le produit mixte de ceux-ci n_matrice-volume. Ce produit mixte peut évidemment être calculé dans tous ses ordres.

Or l'on devrait avoir U * u = V * v = W * w = 1. Par conséquent la matrice faite des vecteurs lignes n'est pas A-1 mais det(A)*A-1 (⇒ après mise en évidence de det(A) dans le membre de droite, puis élimination dans les deux membres on retrouve bien A-1 * A = I).

calcul-matrice-inverse-2.png

Il reste donc à calculer les éléments de la matrice det(A)*A-1. Pour ce faire on va utiliser le fait que ces trois vecteurs lignes ont été définis supra comme étant trois produits vectoriels. Ainsi pour la première ligne on a par n_prod-scal-det :

U = v x w =  
1x vx wx
1y vy wy
1z vz wz

dont la composante en x, c-à-d l'élément Ux de la matrice det(A)*A-1, est par n_produit-vectoriel-regle-calcul le cofacteur de 1x dans le déterminant ci-dessus :

Ux =
vywy
vzwz

que l'on retrouve dans la matrice A comme cofacteur de ux.

On peut alors généraliser par la constatation suivante : les composantes de chaque vecteur ligne de la matrice det(A)*A-1 (majuscules) sont les cofacteurs des éléments de la colonne correspondante de A (minuscules).

NB : ne pas oublier les signes "-" du damier dans le calcul des cofacteurs : n_formule-generale-det. Ainsi :
Uy = -
vxwx
vzwz

On va alors construire la matrice des cofacteurs de la matrice A, notée CA, et qui est la matrice A dont les éléments minuscules sont remplacés par les éléments majuscules de det(A)*A-1, de sorte que det(A) * A-1 = CAt

A-1 = CAt / det(A)

dont on constate, à partir de n_formule-generale-det, que c'est une généralisation de n_matrice-inverse.

matrice-cofacteurs.png
Déterminant d'un produit de matrices
https://philosophie.jortay.net/savoir-scientifique-base#determinant-produit

Soient les matrices A et B ⇒ par n_formule-generale-det :
det(A) = ∑ iouj=1N aij * CijA
det(B) = ∑ iouj=1N bij * CijB

det(A*B) = ∑ iouj=1N  ( ∑ k=1N  aik * bkj ) * CijAB = det(A) * det(B)

La démonstration de l'égalité entre le membre de gauche et celui de droite par développement du membre central est trop complexe algébriquement. C'est pourquoi on va se limiter ici à une interprétation géométrique (à deux dimensions, mais que l'on peut facilement généraliser). Cette interprétation sera l'occasion de résumer l'essentiel de la matière que nous venons de développer au sujet du calcul matriciel.

Une matrice de dimension 2 (c-à-d 2x2) peut être vue comme représentant la transformation d'une surface dans le plan de coordonnées cartésiennes.

matrice-synthese.png

Cette transformation est telle que :

  • les vecteurs unitaires 1x de coordonnées (1,0) et 1y de coordonnées (0,1), qui représentent un carré, sont transformés en deux vecteurs u de coordonnées (a,c) et v de coordonnées (b,d), qui représentent un parallélogramme ;
  • les cordonnées de ces deux vecteurs constituent les deux colonnes de la matrice de transformation ;
  • le déterminant représente la surface de l'aire transformée, et par conséquent le facteur par lequel l’aire du carré unitaire est multipliée pour donner l’aire du parallélogramme.
Ainsi dans le système matriciel :

ab
cd
*
x
y
=
x'
y'


il suffit de remplacer (x,y) par (1,0) pour obtenir que a*1+b*0=a et c*1+d*0=c :

ab
cd
*
1
0
=
a
c


et de remplacer (x,y) par (0,1) pour obtenir que a*0+b*1=b et c*0+d*1=d :

ab
cd
*
0
1
=
b
d


ou encore de remplacer (x,y) par (1,1) pour obtenir que a*1+b*1=a+b et c*1+d*1=c+d :

ab
cd
*
1
1
=
a*1+b*1
c*1+d*1
=
a+b
c+d
=
a
c
+
b
d

Où l'on voit que le point (1,1), correspondant à une surface égale à 1, a été transformée en le vecteur somme u+v correspondant au point de coordonnées (a+b, c+d), et à une surface égale à det(A).

De la même manière on peut remplacer (1,1) par (x,y), pour formuler la transformation du point (x, y), correspondant à une surface rectangulaire x * y, en un point (a*x+b*y, c*x+d*y), correspondant à une surface parallélépipédique x * y * det(A) :

ab
cd
*
x
y
=
a*x+b*y
c*x+d*y
=
a*x
c*x
+
b*y
d*y
= x *
a
c
+ y *
b
d
= x * u + y * v
produit-matrices.jpg

N.B. Il est donc erroné de dire que "le déterminant, c'est la surface" : cela n'est vrai que si la surface originelle vaut 1. En fait le déterminant c'est le facteur de transformation de la surface. La généralisation ci-dessus montre bien qu'on passe d'une surface x*y à une surface x*y*det(A).

Et l'on peut étendre cette généralisation à toute surface ε2 dont l'origine est (x,y), et qui est donc transformée en une surface ε2 * det(A) d'origine ( a * x + b * y , c * x + d * y ).

produit-matrices-2.jpg

Et l'on peut encore étendre la généralisation à toute aire composée de petits carrés de surface ε2.

matrice-synthese-2.png

Comme en outre on peut abaisser la valeur de ε à un niveau arbitraire, on peut donc dessiner n'importe quel surface, y compris avec des contours "arrondis". Enfin la généralisation peut s'étendre à des volumes de dimension N.

Et comme le produit matriciel B*A correspond à l'application de la transformation par B à la transformation par A n_transformations-multiples :
S=1     ⇒
SA = 1 * det(A)     ⇒
SBA = det(A) * det(B)
or :
det(B*A) = SBA     ⇒
det(B*A) = det(B) * det(A)
CQFI.

En particulier si :
B=A-1     ⇒
det(A-1*A) = SA-1A = det(A-1) * det(A)    ⇔
det(I) = det(A-1) * det(A)    ⇔
det(A-1) = 1 / det(A) = det(A)-1

ou encore, si :
B=A     ⇒
det(A*A) = SAA = det(A) * det(A)    ⇔
det(A2) = det(A) * det(A)    ⇔
det(A2) = det(A)2

Dynamique

https://philosophie.jortay.net/savoir-scientifique-base#dynamique
 5.1. Cinématique : MRU et MRUA
 5.2. Force et mouvement
 5.3. Force et pression
 5.4. Force et énergie
 5.5. Masse et débit volumiques

Cinématique : MRU et MRUA

https://philosophie.jortay.net/savoir-scientifique-base#cinematique

Mouvement rectiligne uniforme (MRU) :

La vitesse v est la distance xt - x0 parcourue durant le temps t :

v = ( xt - x0 ) / t     ⇔
xt = x0 + v * t    ⇔
NB : v est la "pente" de la droite x(t)
xt - x0 = v * t    ⇒
xt - x0 est la surface verte en dessous de la droite vt = v0

MRU.png

Lecture du graphique. La valeur de la longueur xt - x0 hachurée en vert (exprimée en m) est égale à la valeur de la surface verte, c-à-d au produit de sa hauteur v0 (en m/s) et de sa longueur t (en sec.), de sorte que son unité est bien m/s*s=m.

Mouvement rectiligne uniforme accéléré (MRUA) :

L'accélération a est la vitesse vt - v0 acquise durant le temps t :

a = ( vt - v0 ) / t     ⇔
⇒ l'accélération exprime la progressivité dans la modification d'un mouvement.
vt = v0 + a * t    ⇒ par n_vitesse :
( xt - x0 ) / t = v0 + a * t     ⇔
xt - x0 = v0 * t + [ ( v0 + a * t - v0 ) * t ] / 2    ⇔
NB : [ ( v0 + a * t - v0 ) * t ] / 2 est la moitié du rectangle au-dessus du rectangle vert
xt - x0 = v0 * t + a * t2 / 2    ⇔
xt = x0 + v0 * t + a * t2 / 2    ⇔
xt = x0 + ( v0 + vt ) / 2 * t
NB : ( v0 + vt ) / 2 est une mesure moyenne de la vitesse.

MRUA.png

Lecture du graphique. La surface triangulaire rouge c'est bien la moitié de la surface rectangulaire base * hauteur = t * ( a * t )) ⇒ elle vaut donc bien 1/2 * a t2. On obtient alors la valeur de xt en ajoutant à celle de x0 la valeur de la surface totale en-dessous de la droite vt ⇔ la distance parcourue xt - x0 (ligne hachurée en brun) est égale à la valeur de cette surface.

PS : dans la section consacrée au calcul intégral nous avons calculé qu'effectivement :
xt - x0 = ∫ 0 t  v(t') * dt' = v0 * t + a/2 * t2

MRUA.jpg

L'image ci-contre détaille la composition de la distance x(t). La composante 1/2 * a * t2 s'ajoute à la composante v0 * t, qui est mesurée à partir de x0.

Les passages de la vidéo "Le Mouvement Rectiligne Uniformément Accéléré : généralisation" consacrés à l'interprétation de ces résultats en termes de référentiels me paraissent confus. Heureusement ces passages n'ajoutent rien de formel aux équations ci-dessus. Je ne mentionnerai donc ici que leur conclusion en termes de contributions des deux référentiels :

v(t) =v0+a * tn_acceleration
x(t) =x0 + v0 * t+1/2 * a * t2n_xt=x0+v0*t
Contrib. :MRU+MRUA

... dont l'avant dernier graphique donne l'interprétation géométrique.

NB : à partir des équations du MRUA on retrouve celles du MRU en posant a=0.

Cette analyse cinématique fait abstraction des masses qui caractérisent les corps, ainsi que les éventuelles forces qu'ils peuvent subir ou exercer en relation avec d'autres corps (on parle alors de cinétique). Cela est l'objet des sections suivantes.

Force et mouvement

https://philosophie.jortay.net/savoir-scientifique-base#force-mouvement
 5.2.1. Relativité
 5.2.2. Inertie
 5.2.3. Loi de Newton
Relativité
https://philosophie.jortay.net/savoir-scientifique-base#relativite
triangle-clipedia.png Vidéo Clipedia : Le principe de relativité

Le principe de relativité affirme l'équivalence entre MRU et repos : ils constituent tous les deux un référentiel inertiel c-à-d tel que la vitesse est constante en direction et en norme (NB : une vitesse nulle n'est qu'un cas particulier de vitesse constante).

Pour comprendre ce principe à priori peu intuitif, commençons par étudier de plus près la notion de mouvement. Un mouvement est un changement de position d'un corps au cours du temps ⇒ par v = ( xt - x0 ) / t n_vitesse le mouvement est dont intrinsèquement lié à la notion de vitesse (N.d.A. : on pourrait même définir le mouvement par sa vitesse). Par conséquent, poser la question de ce qui cause le mouvement, c'est poser la question de ce qui provoque un changement de vitesse. On pourrait donc penser que la vitesse d'un mobile serait proportionnelle à la force qui lui est appliquée : v ∝ F ?

En fait lorsque je lance une pierre, la force que j'exerce sur elle n'opère plus sur la pierre après qu'elle a quitté ma main. Et si la pierre finit par s'arrêter c'est à cause des forces de frottement. On peut expérimenter cela dans l'espace (qui est vide, donc sans frottements) : si on lance un objet, il suit sans fin la même direction, et à vitesse constante. Sa direction et vitesse ne seront modifiées que par l'action de forces extérieures.

Dès le 17° siècle Galilée avait déjà observé, avec son expérience d'un bille dévalant un plan incliné suivi d'un plan horizontal, que le trajet total de la bille augmentait d'autant plus qu'on lissait la surface de la bille et des plans, c-à-d qu'on réduisait les forces de frottement (et cela avec la même force initiale qui est la force d'attraction terrestre, la bille étant simplement lâchée au sommet du plan incliné).

Dans cette situation "immuable sauf forces extérieures" on dit que le corps est "inerte" ou encore "au repos". Mais cela signifie-t-il qu'il est immobile ? Réponse : cela est relatif ! Pour le comprendre imaginons un train en MRU, et ne subissant aucune force de frottement ⇒ la seule force qu'il subit est la force de pesanteur. Une balle lâchée dans ce train en mouvement tombe à la verticale devant l'expérimentateur ⇔ dans un train ou dans son salon, le lâcheur de balle observe le même phénomène. On en conclut que mouvement (rectiligne et uniforme) et repos sont relatifs, c-à-d que l'on peut considérer aussi bien que c'est le train qui est en mouvement et la Terre (le salon) qui est au repos, ... ou bien que c'est au contraire le train qui est au repos et la Terre en mouvement. Nous avons d'ailleurs tous expérimenté ce phénomène : assis dans le train dans une gare nous pensons qu'il démarre enfin, puis découvrons qu'en réalité c'est le train d'à côté qui démarre (dans l'autre sens). De même, assis dans l'avion qui avance à une vitesse (constante) de plusieurs centaines de km/h, nous ne sommes pas plaqués contre le dossier de notre siège.

Par contre, lorsque l'avion prend son envol en accélérant, nous sommes poussés contre le dossier du siège. Pour expliquer cela il faut d'abord introduire le principe d'inertie, et ensuite celui de masse.

Inertie
https://philosophie.jortay.net/savoir-scientifique-base#inertie

Le principe d'inertie (aussi appelée "première loi de Newton) affirme que pour changer de mouvement (c-à-d de vitesse) un corps doit subir une force.

Les principes de relativité et d'inertie sont donc très proches : tous deux ont pour corollaire qu'il n'est pas besoin de subir une force pour être en mouvement.

Référentiel
inertiel

La notion de relativité requiert de préciser dans quel référentiel une mesure est effectuée. Si du quai d'une gare j'observe tomber une balle lâchée dans un train en MRU, je n'observe pas la même trajectoire (une courbe) que celle observée par l'expérimentateur situé dans le train (une droite), bien que ces deux trajectoires dépendent de la même équation. La raison en est que dans le référentiel de la gare la balle a une vitesse non nulle (celle du train), tandis que dans le référentiel du train sa vitesse est nulle. Et inversement, en raison du principe de relativité, si la balle est lâché par la personne sur le quai, l'observateur situé dans le train constatera une trajectoire courbe car dans (relativement à) son référentiel qu'est le train la balle a une vitesse non nulle. On parle de référentiel "inertiel" dans le cas d'objets inertes c-à-d n'exerçant ni subissant aucune force (ni force de propulsion, ni force de frottement, ...).

N.d.A. Une voiture qui démarre puis accélère jusqu'à se maintenir à une vitesse constante, puis freine jusqu'à s'arrêter subit quatre changements de référentiel :
MRU(v=0) ⇒ MRUA(a>0) ⇒ MRU(v=vc)⇒ MRUA(a<0) ⇒ MRU(v=0)
parties vertes : ∄ force ;
partie rouge : ∃ force.

Pour changer de référentiel inertiel il faut l'action d'une force, qui est appelée "force d'inertie". On notera à cet égard que le principe de relativité vaut également pour les notions de décélération et accélération. Ainsi lorsque le pilote freine relativement au référentiel de la Terre, il démarre (vers l'arrière) dans celui de son véhicule qui était en MRU : il quitte le référentiel de son véhicule pour aller vers celui de la terre. Et inversement : lorsqu'il accélère relativement au référentiel de la Terre, il freine (vers l'arrière) dans le sien qu'il quitte.

Un corollaire du principe d'inertie est que la force engendre l'accélération (négative en cas de décélération). C'est Issac Newton, né l'année du décès de Galilée, qui va formuler cette relation en introduisant la notion de masse.

Loi de Newton
https://philosophie.jortay.net/savoir-scientifique-base#loi-newton
triangle-clipedia.png Vidéo Clipedia : La loi de Newton

Un corps ne doit pas nécessairement subir une force pour être en mouvement (principe d'inertie), mais par contre la modification d'un mouvement ou du repos implique l'action d'une force. La (seconde) loi de Newton (la première étant la loi d'inertie) définit et formule cette force : exercer une force F c'est imprimer une accélération a au déplacement d'une masse m :
F = m * a [kg * m / s2 = N]
où le newton (N) est donc la force requise pour imprimer à une masse de 1kg une accélération de 1 m/s2.

Poids vs masse. Il ne faut pas confondre la masse (en kg, unité de masse) avec le poids (en N, unité de force), qui est la force subie par une masse dans un champ gravitationnel. Dans le champ gravitationnel terrestre, qui est tel que a≈10m/s2, une masse de 1kg subit donc une force de gravitation FG = 1 * 10 = 10N. La confusion vient du raccourci consistant à parler d'un poids de x "kilos" alors qu'il s'agit en réalité d'un poids de x "kilogramme-force", ou plus exactement x*10 newtons. Plus précisément : 1N=102g.

acceleration-force

Pour vérifier la linéarité effective de la relation n_F=m*a imaginons un chariot propulsé sur un rail, et faisons abstraction de toutes forces de frottement. Si le chariot subit une force de propulsion constante, sa vitesse augmente constamment, et cela à un rythme constant. Cela se démontre géométriquement en additionnant, pour une courbe quelconque de la fonction v(t) sur un intervalle Δt, une suite de pentes Δv/Δt telles que Δt, et donc Δv, sont arbitrairement petits. Il apparaît alors que dv/dt, qui est précisément l'accélération n_vitesse, est constante. C'est donc l'accélération, et non la vitesse, qui est proportionnelle à la force exercée : a ∝ F.

dynanometre.jpg

Nous venons ici d'effectuer une mesure de la force en mesurant la modification de mouvement (c-à-d de vitesse). Une autre manifestation de la force est la modification de forme, que l'on peut mesurer au moyen d'un dynamomètre. La force est ici mesurée par l'allongement d'un ressort dont la raideur est étalonnée : force = raideur × allongement. Ceci nous permet de compléter notre relation : l'accélération est proportionnelle à la force (avec laquelle elle augmente) et à la masse (avec laquelle elle diminue pour une force donnée) : a ∝ F, 1/mF ∝ m, a ⇒ la façon la plus simple de définir la force est alors F = m * a, ce qui est confirmé par l'expérience de pensée consistant à attacher deux chariots propulsés, de sorte que l'on mesure bien que 2 * F = ( 2 * m ) * a.

La loi d'action-réaction, ou "troisième loi de Newton" (N.d.A. : qui est un corrolaire de la loi de conservation de l'énergie) énonce que toutes les forces apparaissent par couple de forces opposées :

  • soit l'accélération de pesanteur terrestre gT ≈ 9,8 mT/s2 ⇒ pour tenir/soulever dans ma main une masse de 1kg je dois exercer une force de 9,8 N, qui est le poids de cette masse c-à-d sa force d'inertie ;
  • le passager en apesanteur dans un véhicule spatial qui démarre (MRUA) donne l'impression d'être projeté contre la paroi arrière du véhicule, mais c'est en réalité celle-ci qui s'avance vers lui, jusqu'au moment où il est rattrapé, ce qui marque son passage d'un référentiel inertiel à celui que constitue le véhicule; à partir de ce moment le passager subit deux forces : la force motrice qui propulse le véhicule en avant, et la force d'inertie, opposée, qui le maintient contre la paroi jusqu'à ce que la vitesse devienne constante (MRU) moment à partir duquel il retourne en apesanteur.

Selon Einstein cette force d'inertie qui maintient le passager non attaché contre la paroi est de même nature que la force de gravitation : c'est le principe d'équivalence, point de départ de la théorie de la relativité générale. On peut ainsi considérer que la surface de la Terre avance avec une accélération a=g. Autrement dit, la force gravitationnelle ne serait rien d'autre qu'une force d'inertie.

La Terre n'est donc pas un référentiel fixe.

Et on a là l'explication de la "chute des corps" avec la même accélération, indépendamment de leur masse : en réalité il ne s'agit pas de leur accélération mais de celle de la Terre !

En vertu du principe d'équivalence, en sautant ou tombant je passe dans un référentiel inertiel ⇔ je ne subis plus d'accélération ⇔ par n_F=m*a : Poids = m * g = m * 0 ⇔ je suis en apesanteur ⇔ "on ne tombe pas, on est rattrapé par la Terre" ⇒ il n'y a aucune raison pour que deux corps ne soient pas rattrapés en même temps, même si leurs masses diffèrent. CQFD par raisonnement logique. Mais des démonstrations expérimentales ont aussi été réalisées, comme le montre la vidéo suivante.

Démonstration expérimentale (4m41s)

Cette interprétation de Terre en MRUA permanent est pour le moins contre-intuitive puisqu'elle vaut pour tous les points de planète, donc également pour deux points diamétralement opposés : comment la Terre peut-elle se déplacer en MRUA dans toutes les directions à la fois ... ? Nous verrons dans la section consacrée aux ondes gravitationnelles que cette explication contre-intuitive est cependant cohérente si l'on introduit dans le raisonnement la notion de courbure de l'espace-temps à proximité d'un corps de masse non nulle. Malheureusement la complexité de cette théorie fait que dans les écoles est enseignée l'interprétation fausse de la "chute" des corps, plus intuitive que celle du rattrapage des corps par la Terre qui "monte" ...

Force et pression

https://philosophie.jortay.net/savoir-scientifique-base#force-pression
 5.3.1. Pression sur des solides
 5.3.2. Pression atmosphérique
 5.3.3. Pression hydrostatique
Pression dans les solides
https://philosophie.jortay.net/savoir-scientifique-base#pression-solides
triangle-clipedia.png Vidéos Clipedia : La pression dans les solides

C’est la pression que la force engendre, et non pas la force elle-même, qui détermine la façon dont un matériau réagit sous la contrainte. Ainsi les fibres du bois d'un plancher se partagent le poids qu'elles supportent.

La pression c'est la force par unité de surface : Pression = Force / Surface [N/m2]

La résistance des matériaux est caractérisée par la pression. Ainsi au moyen d'une presse on peut mesurer la limite de rupture des fibres d'un bloc de bois (dans le cas du pin : 50 MN/m2 = 50 N/mm2 = 5 kgf/mm2. La pression exercée par un talon aiguille de 5mm de côté, et supportant une personne de 70kg, exercera une pression de 700N/25mm2=28N/mm2, ce qui n'étant pas très éloigné de la limite de rupture du pin explique l'emprunte du talon sur un plancher de pin.

Si la résistance du bois est de 1 (référence sans dimension), on a 5 pour l'acier, 20 pour la toile d'araignée et 1000 pour le béton. Il s'agit là évidemment d'ordres de grandeurs, car il y a des qualités différentes de chacun des ces matériaux.

pression-solide.jpg

Les images ci-jointes montrent deux applications technologiques fondées sur n_P=F/S. Elles ont pour principes de répartir la force sur une certaines surface afin de réduire la pression par unité de surface : on s'enfonce moins dans la neige avec des raquettes, et la sensation de poids d'un sac en bandoulière est réduite par la largeur de la sangle.

compression-traction.jpg

Compression et traction sont très semblables : on parle ainsi de la pression comme une "contrainte de traction". Cela est illustré par les atomes d'un cristal de fer, qui s'organisent spatialement comme dans l'image ci-contre (NB : l'organisation est en 3D, contrairement à cette illustration en 2D). Sous l'effet de l'agitation thermique, ces atomes oscillent autour de leur position de repos. Mais globalement la structure est (très) stable, en raison de complexes interactions électromagnétiques, que l'on pourrait représenter par des ressorts. Un ressort ni comprimé ni tendu est en position de repos. L'image ci-contre illustre l'action d'une force de traction verticale contre la force de cohésion électromagnétique, à partir de la position de repos. Dans le cas d'une force de compression verticale, les deux flèches seraient dirigée l'une vers l'autre.

force-muscle.jpg

Cette notion de traction est illustrée par l'exemple du muscle. Il est constituée d'un ensemble de fibres dont les molécules peuvent se raccourcir selon des signaux nerveux envoyés par le cerveau. Un muscle fonctionne en traction, c'est donc bien une contrainte de traction qui est ainsi exercée.

On notera que la force d'un muscle n'est pas nécessairement proportionnelle à son volume mais à sa surface transverse.

N.d.A. Je crois comprendre que c'est en réalité le potentiel de contraction du muscle, c-à-d le différentiel entre surface transverse au repos vs contractée, qui détermine sa puissance. Ainsi entre deux personnes aux biceps de mêmes volumes, celle dont les biceps contractés sont plus petits (donc plus durs) aura une force de traction plus puissante.

Pression atmosphérique
https://philosophie.jortay.net/savoir-scientifique-base#pression-atmospherique

Il est possible de sentir l'existence de l'air en bougeant rapidement un bras dans un mouvement de va et vient : on sent alors "le vent" sur la surface de notre peau. Cette sensation est l'effet des molécules constitutives de l'air, entrant en contact avec les cellules perceptives situées à la surface de la peau. L'air est un mélange gazeux dont les molécules sont essentiellement l'azote (78%) et l'oxygène (21%), plus d'autres molécules, dont le dioxyde de carbone (CO2 : 0,04%) [source].

molecule-agitation-thermique.gif

Mouvement thermique d'un segment de molécule d'une protéine.

Ces molécules sont continuellement agitées : c'est l'agitation thermique. L'énergie thermique est l'énergie cinétique d'agitation microscopique d'un objet, qui est due à une agitation désordonnée de ses molécules et de ses atomes. Plus la température est élevées, plus la vitesse d'agitation est élevée. Or à une température ambiante de 20 degrés la vitesse moyenne de ces particules de l'air est de 500 m/s (donc dans le vide), soit 1.800 km/h !

pression-agitation-thermique.jpg

Par conséquent, sur une paroi quelconque placée dans un milieu non vidé de son air, il y a en permanence des molécules de l'air qui viennent frapper la paroi. On peut considérer que ces forces d'impact s'additionnent et se répartissent sur l'ensemble de la paroi (et cela sera est d'autant plus vrai que l'on observe le phénomène à une grande échelle). Et plus la surface est grande, plus cette force globale est grande (dès lors que celle-ci est proportionnelle au nombre de particules considérées). Le coefficient de proportionnalité entre force et surface c'est précisément ce qu'on appelle la "pression". On retrouve donc bien Pression = Force / Surface n_P=F/S.

La pression exercée par un gaz sur son environnement caractérise donc ce gaz, relativement à d'autres gaz. Par conséquent la connaissance de la pression d'un gaz permet, grâce à n_P=F/S, de calculer la force qu'il exerce sur une surface.

Notons que la force exercée par cette pression est dirigée perpendiculairement à la paroi, toujours en raison de l'approche moyenne des impacts causés par (ou plutôt expression de) l'agitation thermique. Et cela vaut quelle que soit l'orientation de la paroi. On dit ainsi que la pression est "isotrope" (par opposition à "vectorielle").

Dans la section consacrée aux gaz parfaits nous étudierons la relation de proportionnalité entre pression, nombre de particule (P∝N) et température (P∝T).

Pour étudier la pression atmosphérique, il faut faire référence à la théorie mécanique de Newton qui montre que la force moyenne exercée sur le sol par une balle qui rebondit est égale à la force exercée sur le sol par une balle identique qui ne rebondit pas, soit le poids de celle-ci (m*g). Par conséquent, la colonne d'aire délimitée par une surface S au sol exerce sur celle-ci une force M*gM est la masse des particules constituant cette masse d'air. On a pu ainsi calculer que la pression atmosphérique, c-à-d la pression exercée par l'atmosphère (dont la hauteur est d'environ 100km : u delà on ne trouve quasiment plus aucune molécule constitutive de l'air) sur une surface de 1m2 (au niveau de la mer) vaut : Patm = M * g / 1 ≈ 10.000 * 10 N/m2 (Pa, pour pascals) = 10.000 kgf.

La notion de vide est un corollaire de celle de pression : un volume vide c-à-d ne contenant aucune molécule ni atome implique mécaniquement l'absence de pression dans ce volume. Le vide peut être facilement créé à l'intérieur d'une ventouse en écrasant sa base sur une surface, de sorte que la plupart des molécules d'air en sont éjectées. Par conséquent la pression interne exercée par les quelques molécules éventuellement subsistantes est très inférieur à la pression externe, exercée par la pression atmosphérique. Il en résulte que la ventouse est "collée" contre la paroi.

Pression hydrostatique
https://philosophie.jortay.net/savoir-scientifique-base#pression-hydrostatique
triangle-clipedia.png Vidéo Clipedia : La pression dans les liquides

On suppose ici une masse de liquide immobile (sans courants). On comprends déjà intuitivement que la pression subie dans un liquide augmente avec la profondeur. Mais qu'en est-il exactement ? Pour répondre à cette question revenons brièvement à la pression atmosphérique. Dans n_pression-atmospherique nous avions mentionné la valeur de 10.000 kgf pour la masse totale des particules atmosphériques. Cette masse atmosphérique n'est pas facile à calculer car la densité des particules atmosphériques diminue avec la hauteur.

molecule-eau.jpg

Pression
hydrostatique

Dans le cas d'un liquide, ses particules sont également sujettes à l'agitation thermique. Mais contrairement aux molécules d'un gaz, qui ne sont pas liées, celles d'un liquide sont liées (de façon semi-rigide, ce qui confère la fluidité de leur ensemble). Ce sont les "ponts hydrogènes" (cas de l'eau), caractérisés par une attraction électromagnétique d'un atome d'hydrogène (H) par un atome d'oxygène (O). Or ces liens ne dépendent pas des forces extérieures que subissent les molécules (notion de "liquide incompressible", cas de la plupart des liquides) ⇔ la densité, et donc la masse d'un volume déterminé de liquide, varient relativement peu avec la profondeur ⇒ le calcul de la masse d'une colonne de liquide est plus facile que celui d'une colonne de gaz :
par n_masse-volumique : M = ρ * V = ρ * h * S     où :
ρ est la masse volumique du liquide ;
h est la hauteur de la colonne ;
S est la surface de la base de la colonne ;
⇒ par n_P=F/S
P = ρ * h * S * g / S     ⇔
P = ρ * g * h
NB : où h est le seul paramètre libre.
NB : n_pression-hydrostatique n'est pas applicable aux gaz car dans ceux-ci ρ n'est pas constant.

Ainsi pour l'eau, à 10m de profondeur :
P ≈ 1.000 * 10 * 10 = 100.000 [kg / m3 * m / s2 * m = kg * m / s2 / m2= N / m2 = Pa]

Mais attention : pour obtenir la pression totale, il reste à ajouter la colonne atmosphérique située au-dessus de la colonne de liquide ⇒ par n_pression-atmospherique : en passant du niveau de la mer à dix mètres de profondeur d'eau on double la pression.

eau-vs-mercure.jpg

Atome Hg et molécule H2O

Rappelons que le terme "hydrostatique" est générique, c-à-d utilisé pour tout liquide. Prenons le cas du mercure (Hg), un liquide métallique, dont 1cm3 pèse 13,5g (contre 1g pour l'eau) en raison du grand nombre de protons et neutrons que contient le noyau d'un atome de mercure : 202 contre 18 pour l'eau. NB : 202/18=11,2 est plus petit que 13,5 car le volume de la molécule d'eau est légèrement plus élevé que celui d'un atome de mercure, en raison des deux atomes d'H situés à une certaine distance de l'atome d'O ⇔ la densité d'atomes du mercure est supérieure à celle de l'eau. Ainsi alors qu'avec une colonne de 10m d'eau on obtenait une pression de 100.000 Pa, pour le mercure il suffira de 10/13,5=0,74m.

triangle-clipedia.png Vidéo Clipedia : Le principe de Pascal
pression-isotrope.jpg

Principe
de Pascal

Nous allons voir ici que la pression hydrostatique au fond d’un bassin d’eau ne dépend que de la hauteur d’eau et non de la quantité d’eau qui s’y trouve. Pour comprendre ce résultat contre-intuitif il faut percevoir la combinaison de deux phénomènes :

  • d'une part, l’origine microscopique de la pression : la pression sur une paroi est due aux collisions qu’elle subit de la part des molécules d’eau en mouvement d’agitation thermique. C'est la nature isotrope de la pression, qui explique la répartition uniforme de la pression à une hauteur donnée ;
  • d'autre part, la pression exercée par la colonne sur sa base augmente avec la hauteur de la colonne. Mais à une hauteur déterminée, la pression est identique quelle que soit la largeur de la colonne, et donc quelle que soit la surface de sa base : ainsi dans le développement de n_pression-hydrostatique on voit bien que le facteur de surface S disparaît par la substitution de :
    M = ρ * V = ρ * h * S
    dans :
    P = M * g / S = ρ * h * S * g / S     ⇔
    P = ρ * g * h     n_pression-hydrostatique

La combinaison de ces deux phénomènes a pour effet que diminuer la largeur de la colonne du graphique ci-dessus ne changera rien à la pression en n'importe quel point de la base du bassin. Ce résultat constitue le principe de Pascal.

creve-tonneau.jpg

Crève-
tonneau

L'expérience du "crève-tonneau" est particulièrement parlante : avec une quantité d'eau ridiculement faible il est possible de crever un tonneau de bois. On voit que l'eau injectée dans la colonne joue comme un piston qui pousse sur la surface de l'eau. Le principe de Pascal permet ainsi d'expliquer le principe des vases communicants, ainsi que le principe du siphon.

vases-communicants.jpg

Vases
communicants

Le graphique ci-contre illustre deux vases communiquant par un tuyau. la vanne rouge est alors fermée, et puis du liquide est rajouté dans le vase de droite ⇒ la hauteur de la colonne augmente ⇒ la pression augmente dans la partie droite du système ⇒ si on ouvre la vanne rouge, la pression se propage dans la partie gauche, dont le niveau va monter jusqu'à ce que les hauteurs dans les deux vases soient au même niveau (qui sera évidemment plus élevé que le précédent niveau d'équilibre).

vases-communicants-2.jpg

Le système illustré ci-contre permet d'affiner notre compréhension du phénomène : que vaut la pression Px dans la partie la plus haute du tuyau ? On sait que :

  1. au niveau de la ligne hachurée la pression est partout la pression atmosphérique ;
  2. dans la partie haute du tuyau la pression Px est moins forte qu'au niveau de la ligne hachuré puisque cette partie haute ne subit pas la pression de la colonne h1

Par conséquent : Px = Patm - ρ * g * h1

syphon.gif

Syphon

Si dans le graphique précédent on retire à droite une partie de la colonne à partir de là où la pression vaut Patm + ρ * g * h ⇒ la pression juste au dessus de la section ne sera plus égale qu'à Patm, et ne pourra donc contenir la pression Patm + ρ * g * h provenant d'en-dessous la section. On pourra ainsi vider le vase de gauche, par siphonnage.

triangle-clipedia.png Vidéo Clipedia : Le principe d’Archimède
archimede.jpg

Le principe d'Archimède est expliqué ici sans référence au calcul des pressions subies par les parois rigides d'un volume d'eau immergé (qui sont supérieures sur la partie inférieure que sur la partie supérieure).

On peut néanmoins comprendre que ce volume est soutenu par la masse d'eau qui l'environne, par le jeu de ces pressions sur toute la surface du volume.

Si ce même volume est rempli de béton plutôt que de l'eau, alors il va s'enfoncer car son poids volumique est supérieur à celui de l'eau. Si au contraire le volume est remplis de bois, il va s'élever car le poids volumique du bois est inférieur à celui de l'eau. Une question qui vient alors à l'esprit est de savoir ce qui détermine la répartition entre volume immergé et volume émergé du volume total de bois flottant à la surface.

Le principe d'Archimède stipule que « tout corps plongé dans un fluide au repos, entièrement ou partiellement, subit une force dirigée de bas en haut, et opposée au poids du volume de fluide déplacé. Cette force appelée poussée d'Archimède s'applique au centre de masse du fluide déplacé ». Autrement dit, un corps qui flotte est tel que son poids (force gravitationnelle vers le bas) est égal à la poussée exercée vers le haut par le volume de liquide qu'il déplace.

Ainsi dans la partie droite de l'image suivante la partie immergée du bloc de poids est telle que son poids en eau est égal au poids total du bloc de bois ⇔ le volume de bois immergé est le même que le volume d'eau dont le poids vaut celui du bloc de bois.

archimede-2.jpg

Gauche : le bloc de bois monte. Droite : il est à l'équilibre.

archimede-3.jpg

On comprends alors qu'il peut exister des bateaux en acier ou en béton : le volume ne contient ces matériaux qu'au niveau des parois, de sorte que le poids de l'ensemble de la structure flottante peut être égal au poids du volume en eau de la partie immergée. Dans ce cas la structure flotte.

Force et énergie

https://philosophie.jortay.net/savoir-scientifique-base#force-energie
 5.4.1. Travail
 5.4.2. Rotation
 5.4.3. Énergie cinétique
Travail
https://philosophie.jortay.net/savoir-scientifique-base#travail
triangle-clipedia.png Vidéo Clipedia : Energie : introduction

Tout travail réalisé (par un organisme vivant ou une machine) requiert de l'énergie. Toutes les formes que peut prendre l'énergie résultent de l'action de force et de déplacements.

N.d.A. Travail et énergie sont égaux en quantité, mais se différencient par leur nature : le travail est une action, tandis que l'énergie est un potentiel d'action. C'est par l'action du travail qu'une quantité d'énergie peut être transformée en une quantité égale d'une énergie d'un autre type.

Cela est évident pour laver le linge (à la main ou en machine) ou encore pétrir de la pâte (à la main ou par une machine). Nous allons montrer ici la combinaison force+déplacement dans des cas où la force et le déplacement sont à priori moins apparents.

Commençons par le cas du fil de cuivre, composé d'un ensemble d'atomes de cuivre. Ceux-ci ont pour caractéristique, lorsqu'ils sont à proximité les uns des autres de libérer des électrons. Un courant d'électrons peut ainsi être créé. Chacun de ces électrons qui entre en collisions avec un atome de cuivre, met celui-ci en vibration, laquelle se communique aux autres atomes de cuivre, de proche en proche. Cette agitation se manifeste par de la chaleur : on parle d'énergie calorifique. Le courant électrique créé de l'énergie calorifique, mais il faut préalablement de l'énergie pour créer le courant électrique.

bobine-central-electrique.jpg

Pour ce faire un générateur (de centrale électrique ou d'éolienne) consiste à exploiter la force de Lorenz n_force-lorentz dans un système composé d'une bobine de fil de cuivre qui à l'aide d'un rotor est mise en mouvement dans un champ magnétique.

onde-antenne.jpg

Flèche rouge : force électrique ⇒ flèche bleu déplacement des électrons

Un autre exemple pour illustrer l'énergie comme la combinaison d'une force et d'un mouvement est l'énergie électromagnétique. Ainsi une antenne est un fil de cuivre le long duquel les électrons se déplacent en aller-retours sous l'action de sources de tensions variables, et ce faisant provoquent une onde électrique qui va se propager puis être détectée par une antenne. L'onde du champ électromagnétique n'est rien d'autre qu'un transport d'énergie, comme en témoignent les électrons dans le circuit de l'antenne réceptrice (originellement sans sources de tension), qui vont ainsi se mettre à de déplacer eux-aussi dans un mouvement de va-et-viens le long de l'antenne.

Les mêmes principes valent pour la lumière. Dans le filament de l'ampoule on observe des vibrations extrêmement rapides des électrons. Ces vibrations génèrent elles aussi des ondes électromagnétiques. Celles-ci peuvent être détectées par des récepteurs de l'oeil, sensibles à la force électrique portée par l'onde électromagnétique lumineuse.

energie-lumiere.jpg

Un dernier exemple est donné par l'énergie nucléaire qui vient des noyaux atomiques, composés de neutrons (charges 0) et protons. Ces derniers étant tous de chargent +, ils se repoussent d'autant plus fort qu'ils sont extrêmement compactés. Dans les noyaux de grande taille, tels que ceux de l'uranium ou du plutonium, cela peut aller jusqu'à l'éclatement de l'atome, libérant ainsi une énergie considérable.

triangle-clipedia.png Vidéo Clipedia : Le travail

Réaliser un travail (noté W) est la forme la plus élémentaire d'énergie : cela consiste à exercer une force F sur une longueur L :
W = F * L [W = N * m = J (joule)]

L est généralement noté x(t) lorsqu'on souhaite exprimer la distance parcourue en fonction du temps.

On peut démontrer n_travail par un double expérience de pensée. Soit W0 un travail de référence consistant à élever une masse M à une hauteur L ⇒ :

  • si j'élève cette masse à une hauteur 2*L ⇒ je réalise un travail W=2*W0 ⇒ W∝L ;
  • si j'élève une masse 2*M à une hauteur L ⇒ je réalise un travail W=2*W0 ⇒ W∝F ;
Pour synthétiser ces deux résultats dans une même formule, et cela le plus simplement possible, il suffit alors de définir W comme étant le produit de F et L. CQFD.
triangle-clipedia.png Vidéo Clipedia : Les leviers

Leviers. Le principe du levier – qui permet de démultiplier une force – est une illustration très intuitive des notions de travail et de conservation de l'énergie.

Le levier est un système mécanique caractérisé par trois points (cf. graphique infra) :

  • point d'appui du levier ;
  • point d'application de la force motrice FM sur le levier, à laquelle correspond la longueur du bras de levier moteur LM (toujours mesurée par rapport au point d'appui du levier) ;
  • point d'application de la force résistante FR (là où se situe la masse) sur le levier, à laquelle correspond la longueur du bras de levier moteur LR (toujours mesurée par rapport au point d'appui du levier).
levier-inter-appui.png

Levier de type "inter-appui"

Aux points d'application de FM et de FR correspondent les distances LM et LR, toutes deux mesurées par rapport au point d'appui.

On distingue divers types de levier, les plus simples étant :

  • inter-appui : le point central est le point d'appui (graphique ci-dessus)  ;
  • inter-résistant : le point central est le point de résistance (cas de la brouette) ;
  • inter-moteur : le point central est le point moteur (cas du bras) ;

Les deux systèmes sont identiques dans leurs situations extrêmes LR=0 et LM=0

La loi (d'équilibre) des leviers :
FM * LM = FR * LR
s'écrit plus simplement en l'exprimant comme l'égalité des moments de force (cf. infra #moment-force) :
τM = - τR

Une autre relation lie FM et FR via la force du point d'appui FA : FM + FA = FR. Mais elle ne joue pas car le bras de levier correspondant LA ≡ 0 par définition ⇒ τA ≡ 0 par définition.

Démonstration :
pour démontrer la loi des levier il faut introduire la notion de conservation de l'énergie : quelle que soit la nature (méthode) du travail effectué pour déplacer une masse M sur une distance L – par exemple un palan (cf. section suivante) plutôt qu'un levier – l'énergie impliquée sera toujours la même. En l'occurrence il s'agit de démontrer l'égalité entre d'une part le travail associé au déplacement dM du point d'application de la force motrice FM, et d'autre part le travail associé au déplacement correspondant dR du point d'application de la force résistante FR :
WM = WR     ⇒
FM * dM = FR * dR
D'autre part on peut établir géométriquement la valeur du facteur de démultiplication (r) en constatant dans l'image supra la constance du rapport :
dM / LM = dR / LR
(cf. les deux triangles axés sur le point d'appui du levier)    ⇔
dM / dR = LM / LR = r
qu'il suffit alors de substituer dans n_FM*dM=FR*dR     ⇒
FM * LM = FR * LR
CQFD.

Il résulte de n_loi-leviers et n_ratio-multiplication que :
FM = FR / r

Les deux images suivantes illustrent le levier inter-moteur (cas des leviers du corps humain). Dans le cas du bras le facteur de démultiplication r = LM / LR = 1/7 < 1 ⇒ par n_FM=FR/r : FM = 7 * FR: pour soulever un poids de 1kgf je dois exercer une force de 7 kgf. Faut-il en déduire que le corps est une machine bien peu efficace ? Pas du tout, car la force importante qu'il faut exercer est compensée par (c-à-d "est le prix à payer pour") un long bras de levier résistant, c-à-d pour une grande amplitude de mouvement, ce qui pour un organisme vivant est une propriété qui peut s'avérer vitale (pour fabriquer des outils, ou encore se déplacer dans les branches d'un arbre).

levier-inter-moteur.jpg

Le bras est un levier de type "inter-moteur".

levier-inter-moteur-2.jpg

Levier de type "inter-moteur" schématisé.

N.d.A. En comparant le levier au palan (système de levier à poulie) on constate que le progrès technologique ne peut faire autre chose que de rendre possible des combinaisons différentes de F et L pour une même quantité d'énergie/travail.

triangle-clipedia.png Vidéo Clipedia : Les poulies
poulie.jpg

Le principe du palan est proche de celui du levier :

  • on y retrouve les notions de force moteur et force résistante ;
  • une corde remplace le levier 
  • la poulie joue un rôle de point d'appui.

Une notion supplémentaire est introduite : la force de tension, qui est répartie sur toute la longueur de la corde, entre le point d'action de la force résistante et celui de la force moteur.

force-tension.jpg

Le graphique ci-contre est l'illustration la plus simple de la force de tension : chaque point de la corde subit une force égale vers le haut et vers le bas (concrètement, les fibres de la corde, ou les maillons d'une chaînes, sont étirées dans les deux sens ⇒ la notion de "tension de rupture", fonction du matériau). C'est en réalité une version simplifiée de la poulie, où le point d'application de la force moteur est située au niveau du crochet supérieur.

Le palan est donc un système plus sophistiqué que le levier car il permet d'orienter la direction de la force moteur (quant à sa roue, elle a pour fonction de réduire les forces de frottement à un niveau minimum).

Dans ce système la force moteur à exercer pour soulever la masse est égale à son poids. On n'a donc pas encore d'effet de démultiplication permis par le système du levier. Nous allons montrer progressivement que pour cela il faut fixer la poulie sur la masse !

repartition-force-tension.jpg

Commençons par montrer que le principe de démultiplication du palan repose sur le fait que si le point d'action de la force moteur est fixée sur la masse elle-même (donc par un second crochet), il en résulte que la force de tension est répartie sur les deux segments de corde, c-à-d qu'elle vaut F/2 en tout point ! Or rien n'empêche d'inverser le système : crochets en haut et poulie en bas.

repartition-force-tension-2.jpg

Ensuite si l'on remplace un des deux crochets du haut par un point d'application libre de la force moteur, la force à exercer pour soulever un poids est divisée par deux. Cependant il y a un "prix à payer". Pour le montrer abaissons le point d'application de la force moteur jusqu'à la poulie ⇒ toute la longueur L de la corde est sur l'autre côté ⇒ si je remonte le point d'application de la force moteur jusqu'en haut (c-à-d sur une hauteur L), la masse ne montera nécessairement que de la moitié de cette hauteur maximale.

Ce prix à payer est l'illustration du principe de conservation de l'énergie : l'énergie ne se perd ni ne se créé, mais se transforme. Étant donné que l'énergie, c-à-d le travail, égale le produit de la force et de la distance :

  • si le travail pour élever de L/2 la masse, sans palan, vaut : W = F * L/2
  • alors le travail pour élever de L/2 la masse, avec ce palan, vaut : W = F/2 * L

Ainsi avec le système du palan, une personne de force insuffisante pourra néanmoins arriver à soulever la masse si elle est suffisamment endurante.

palan-4cordes.jpg

On peut améliorer le système du palan, c-à-d obtenir des rapports supérieurs à 2 en augmentant le nombre de poulies. Mais combien, et comment ? En ajoutant une poulie en haut on peut alors tirer vers le bas (ce qui est pratique), mais sans augmentation de la démultiplication, puisque le nombre de segments soutenant la charge n'a pas augmenté. Pour cela il faut ajouter une seconde poulie sur la masse ! Et dans ce cas puisque la tension est répartie sur quatre cordes, la force requise est divisée par 4, .... mais le point d'application de la force résistante se déplace quatre fois moins que le point d'application de la force moteur. Pour le montrer abaissons le point d'application de la force moteur jusqu'à la poulie ⇒ toute la longueur L de la corde est répartie sur les trois autres segments ⇒ si je remonte le point d'application de la force moteur jusqu'en haut, c-à-d, de L/3, la masse ne montera nécessairement que de L/3 à L/4 c-à-d de L/3-L/4=L/12 ⇒ :

  • si le travail pour élever de L/12 la masse, sans palan, vaut : W = F * L/12
  • alors le travail pour élever de L/12 la masse, avec ce palan, vaut : W = F/4 * L/3

Nous avons vu jusqu'ici trois cas : un, deux et quatre segments porteurs ⇒ le cas avec trois segments porteur se déduit facilement : la règle pour déterminer le nombre de segments porteurs est double :

  1. on ne compte que les crochet et poulie(s) placés sur la masse ;
  2. crochet=1 ; poulie=2.
palans.jpg

N.B. Alternance haut/bas du crochet ⇒ :
• crochet en bas ⇒ # impair de segments porteurs ;
• crochet en haut ⇒ # pair de segments porteurs.

Pour trois segments porteur le raisonnement est évidemment toujours le même. On abaisse le point d'application de la force moteur jusqu'à la poulie ⇒ toute la longueur L de la corde est répartie sur les deux autres segments ⇒ si je remonte le point d'application de la force moteur jusqu'en haut, c-à-d sur une hauteur de L/2, la masse ne montera nécessairement que de L/2 à L/3 c-à-d de L/2-L/3=L/6 ⇒ :

  • si le travail pour élever de L/6 la masse, sans palan, vaut : W = F * L/6
  • alors le travail pour élever de L/6 la masse, avec ce palan, vaut : W = F/3 * L/2
Rotation
https://philosophie.jortay.net/savoir-scientifique-base#rotation
triangle-clipedia.png Vidéo Clipedia : Le moment de force

Moment
de force

Nous avions déjà évoqué la notion de moment de force pour illustrer celle de #produit-vectoriel. Nous allons ici approfondir la notion de moment de force au regard de ce que nous avons appris entre-temps concernant la loi d'équilibre des leviers FM * LM = FR * LRτM = - τR n_loi-leviers (où la lettre grecque "Tau" exprime la torsion). Le principe est ici qu'un même moment de force peut correspondre à différentes combinaisons (F,L).

moment-force-additivite.jpg

On appelle équilibre de rotation l'égalité τM + τR = 0. Il est facile de démontrer de τR peut être décomposée en une somme de moments de force correspondant chacun à un couple (Fi,Li) ⇒ τM + ∑in τRi = 0. Le moment de force est ainsi clairement une grandeur additive.

Nous allons maintenant passer à la notation vectorielle du moment de force. Pour ce faire on commence par simplement changer la notation τ = F * L, où L représente la longueur du bras de levier, par τ = F * r r représente le rayon de courbure de la trajectoire suivie par le point d'application de la force.

moment-force.jpg

L'angle que fait cette force avec la direction du rayon peut-être quelconque, pourvu qu'on la prenne en compte. Intuitivement on comprend que la force est maximale lorsque cet angle vaut π/2 (force tangente à la courbure), et nulle lorsqu'elle vaut π (force dans le même axe que le rayon de courbure). Par conséquent, dans le cas d'un angle située entre les deux, seule la composante perpendiculaire aura un effet sur le moment de rotation ⇒ :
τ = r * F * sinα     ⇔
α est donc l'angle entre la force F et le bras de levier r, celui-ci étant le vecteur position du point d'application de la force, l'origine de ce vecteur position étant l'axe de rotation des vecteurs.
τ = r x F

moment-force-2.jpg

La règle de la main droite vue à la suite de n_prod-vect s'applique donc : le moment de force τ est le vecteur perpendiculaire au plan formé par les vecteurs r et F, le sens positif de τ étant alors indiqué par la direction du pouce. L'image ci-contre illustre la propriété de translation des vecteurs, en l'occurrence celui du vecteur force déplacé à l'origine pour illustrer clairement l'application de la règle de la main droite : le signe "pointe de flèche" ⊙ montre que le vecteur τ sort bien du plan de l'écran.

Unité. NB : bien que l'unité du moment de force est N*m on ne peut pas pour autant en déduire qu'il s'agit de joules : le moment, c-à-d une force exercée sur un bras de levier, n'est pas une énergie.

rotation-composantes.png

Moment
d'inertie

Pour illustrer le mouvement de rotation on prend le cas du pendule, mais en faisant abstraction de la force de gravitation : on peut donc le considérer dans un plan horizontal. Et étant donné la construction du système de pendule, la force centrifuge exercée par la masse sur la tige du pendule est compensée par la force centripète (en raison de la rigidité du câble). Le même principe vaut pour la composante de la force dans le sens du pendule. Il ne reste donc que la composante de force perpendiculaire à la tige du pendule ⇒ on peut décrire ce mouvement circulaire comme s'il était rectiligne ⇒ on peut appliquer la loi de Newton :

rotation-calcul.png

Étape 1.
m * a = F    ⇔   par n_sinus :
m * a = F * sin(α)    ⇔
m * d2x / dt2 = F * sin(α)
Pour modéliser le mouvement de rotation on ne va pas utiliser la coordonnée de position x mais la coordonnée angulaire θ. Pour ce faire on passe de x à θ (en radians) par :
x = r * θ n_radian    ⇒
d2x / dt2 = r * d2θ / dt2   ⇒
m * r * d2θ / dt2 = F * sin(α)    ⇔
d2θ / dt2 = F * sin(α) / ( m * r )    ⇒
dθ / dt = F * sin(α) / ( m * r ) * t   ⇒
θ = F * sin(α) / ( m * r ) * t 2 / 2
c-à-d l'équivalent angulaire de xt = x0 + v0 * t + a * t2 / 2 n_xt=x0+v0*t où position et vitesse initiales sont nulles.

NB : l'accélération angulaire d2θ / dt2 = F * sin(α) / ( m * r ) est donc au mouvement de rotation ce que l'accélération rectiligne a est au MRUA.

Étape 2. Passons maintenant à un cas plus général, tel que le point d'application de la force extérieure n'est pas nécessairement situé sur la masse (cf. graphique suivant).

rotation-levier.png

En fait il s'agit d'un système de levier, et on peut donc lui appliquer la loi des leviers n_loi-leviers :
r * fi = rF * F * sin(α)    ⇔
fi = rF / r * F * sin(α)    ⇒
en vertu de la notion d'équilibre dynamique, c-à-d le fait que les forces apparaissent toujours par couple de forces opposées n_troisieme-loi-newton :
f = rF / r * F * sin(α)

On refait alors comme précédemment :
m * a = f    ⇔
m * d2x / dt2 = rF / r * F * sin(α)    ⇔
m * r * d2θ / dt2 = rF / r * F * sin(α)    ⇔
NB : on retrouve bien le cas précédent (force appliquée sur la masse) en posant rF = r.
• d2θ / dt2 = rF * F * sin(α) / ( m * r2 )    ⇔
θ(t) = 1/2 * rF * F * sin(α) / ( m * r2 ) * t2
⇔ par n_moment-force :
• d2θ / dt2 = τ / ( m * r2 )    ⇔
θ(t) = 1/2 * τ / ( m * r2 ) * t2

Le carré du rayon exprime une forte sensibilité à la distance.

Si on passe de la notation scalaire à la notation vectorielle pour appliquer la règle de la main droite, on observe dans l'image supra que ses résultats (symboles ⊗ et ⊙ au point pivot) sont cohérents avec l'égalité des moments de force (au signe près) :
τi = r x fi = r x - f = - τf    ⇒
par supra :
r * f = rF * F * sin(α)    ⇒
- τi = τ    ⇔
τi + τ = 0

Étape 3. Passons maintenant à un cas encore plus général en supposant le cas de deux masses distinctes du point d'application de la force extérieure.

rotation-levier-2.png

Pour ce faire on va à nouveau recourir à la notion d'équilibre dynamique exprimée en fonction des moments de force :
τi1 + τi2 + τ = 0
c-à-d que le moment de force extérieur compense les moment de force d'inertie combinés. Et selon ce même principe d'équilibre dynamique les forces d'inertie sont compensées par les forces qui accélèrent les masses, via la structure rigide du pendule c-à-d via leurs moments de force respectifs :
τi1 = - τ1 et τi2 = - τ2
que l'on substitue dans l'égalité précédente    ⇒
τ1 + τ2 = τ
⇒ on passe à la notation scalaire, ce qui simplifiera le développement :
τ1 + τ2 = τ
où l'on injecte les valeurs de τ données par le résultat de l'étape 2    ⇒
m1 * r12 d2θ / dt2 + m2 * r22 d2θ / dt2 = τ    ⇔
( m1 * r12 + m2 * r22 ) * d2θ / dt2 = τ

• où J = m1 * r12 + m2 * r22 est le "moment d'inertie"
• où l'on retrouve le résultat de l'étape 2 en posant r1=r2 et m1+m2=m

Le tableau suivant permet de comparer la loi de Newton et sa version adaptée au mouvement circulaire.

Rectilignem * d2x / dt2 = f
Rotation( m1 * r12 + m2 * r22 ) * d2θ / dt2 = τ
rotation-volumes-2.png

Généralisation finale :

  • l'équation du mouvement de rotation vaut pour un nombre indéfini de masses, dont le moment d'inertie vaut : J = ∑n=1N mn * rn2
  • l'équation du mouvement de rotation vaut également pour une localisation indéfinie dans l'espace à trois dimensions (du système du levier) car toute localisation en dehors de l'axe contenant le point d'application de la force extérieure peut y être ramené par rotation et translation ; NB : la distance r se calcule par rapport à la distance à l'axe de rotation.

En pratique pour calculer le moment d'inertie d'un corps en trois dimension on va "décomposer" celui-ci en un nombre arbitrairement élevé de cubes élémentaires ΔVn (donc de taille arbitrairement petite), chacun étant caractérisé par une distance rn par rapport à l'axe de rotation. Quant à la masse de chacun de ces volumes élémentaires on l'obtient par la masse volumique ρ : mn = ρ * ΔVn n_masse-volumique
J = ∑n=1N ρ * ΔVn * rn2   ⇒
J = ∫n=1N ρ * dVn* rn2

On peut montrer que l'on obtient des formules assez simples pour le moment d'inertie des volumes suivants :

rotation-volumes.png
Énergie cinétique
https://philosophie.jortay.net/savoir-scientifique-base#energie-cinetique
Conservation et
transformation

Le travail est une forme d'énergie. En poussant sur un mur de légos, je peux le faire tomber grâce au travail des mes muscles. Par le travail de mes muscles je peux également envoyer une balle sur ce mur, ce qui aura le même effet. Pourtant la balle ne dispose d'aucun muscle ou mécanisme artificiel lui permettant d'effectuer un travail. L'explication est que le travail effectué pour lancer la balle s'est transformé en énergie (en l'occurrence cinétique), transféré dans la balle par mon travail musculaire. Ensuite, lors du choc de la balle avec le mur, c-à-d lorsque la balle a exercé une force sur le mur, la balle a transféré de l'énergie cinétique au mur, et sa valeur vaut le produit de la force d'inerte par la longueur du déplacement du mur.

Il convient donc de distinguer dans cette chaîne :

  1. la force mécanique appliquée par les muscles pour conférer à la balle une énergie cinétique : W = = Fmeca. * L = Ec 
  2. la force d'inertie exercée ensuite par la balle sur le mur, et par laquelle l'énergie cinétique va être transformée en travail : Ec = Finer. * L = W.

N.d.A. La quantité d'énergie cinétique transférée peut varier en fonction notamment des forces de frottement qui ont été impliquées dans chacun des modes de transfert/transformation de cette chaîne. Ces forces de frottement sont transformées (on dit qu'elles se "dissipent") en chaleur (au niveau des muscles, puis du mur, ...) c-à-d en énergie calorifique.

Énergie
potentielle

Si plutôt que de lancer horizontalement une masse, je la lève pour la poser sur un support d'une certaine hauteur, la masse s'y trouvera au repos. Le travail mécanique que j'ai réalisé ne s'est donc pas transformée en énergie cinétique. Mais en vertu du principe de conservation, le travail fourni s'est nécessairement transformé en une forme d'énergie. Celle-ci est appelée "énergie potentielle". Pour observer physiquement son existence, faisons disparaître le support par expérience de pensée ⇒ la masse tombe, et laisse sur le sol une empreinte qui n'existait pas, et la profondeur de cette empreinte sera d'autant plus grande que la masse aura été préalablement élevée à une grande hauteur.

barrage.jpg

Le fonctionnement des barrages hydroélectriques est fondé sur le principe de l'énergie potentielle : lorsque les vannes sont ouvertes l'énergie potentielle de l'eau qui descend dans le conduit se transforme en énergie cinétique par la force du courant ⇒ celle-ci pousse les aubes de la turbine située plus bas, de sorte que l'énergie cinétique de l'eau est ainsi transformée en énergie électrique via le générateur (N.d.A. : du moins partiellement car une partie de l'énergie cinétique est dissipée en énergie calorifique par les forces de frottement inhérentes au mécanisme de la turbine).

On observe également l'énergie potentielle au niveau atomique. Ainsi la pile électrique exploite la force électrique qui attire un électron et un proton [cf. infra #atomes et #cohesion-electromagnetique] : des protons (signe +) ont été placés d'un côté, et des électrons (signe -) de l'autre ⇒ si l'on place un fil conducteur entre les deux "bornes" on créé un courant de charges électriques (dans le sens - vers +), qui peut alors alimenter un appareil électrique (lampe de poche, ventilateur, ...).

De même l'élasticité de certaines molécules permet d'y stocker de l'énergie potentielle en les maintenant dans un état de tension ou de pression.

Nous verrons dans la section #potentiel-gravitationnel une formulation mathématique de l'énergie potentielle.

Énergie
cinétique

Il suffit de lâcher une masse sur un sol meuble, à plusieurs hauteurs différentes pour constater que l'énergie cinétique augmente avec la masse et la vitesse : Ec = f( m, v ), qui exprime que l'énergie cinétique est l'énergie "enfermée" dans le mouvement d'une masse. Mais quelle est la formule exacte de la fonction f() ? Pour trouver la réponse à cette question il suffit d'exprimer W=Ec en fonction de m et de v
dans :
W = F * x(t) n_travail
on substitue :
F = m * a n_F=m*a     ⇒
W = m * a * x(t)
où l'on substitue
a = v(t) / t n_acceleration
x(t) = v(t) * t / 2 n_xt=x0+(v0+vt)/2*t

W = m * v(t) / t * v(t) * t / 2     ⇔
W = m * v(t)2 / 2

À partir de cette équation, que se passe-t-il lorsqu'au temps t la force de propulsion devient brusquement nulle, c-à-d lorsque plus aucun travail n'est fourni ? Dans ce cas l'énergie cinétique n'augmente plus ⇒ la vitesse est donc constante (NB : on fait toujours abstraction des forces de frottement) ⇒ on est revenu en MRU ⇒ on peut donc simplifier l'équation en supprimant la référence au temps :

Ec = m * v2 / 2 [kg*(m/s)2=J]

Ainsi l'énergie cinétique d'une voiture de 600 kg se déplaçant à 106 km/h=106*1000/3.600 m/s ≈ 29 m/s vaut :
Ec = 600 * 302 / 2 = 270.000 J = 270 kJ soit environ trois fois moins que l'énergie contenue dans un petit pot de yaourt. C'est l'énergie qu'il faut dépenser pour pousser une voiture de 600kg jusqu'à ce qu'elle atteigne (NB : sans forces de frottement) une vitesse de 106 km/h.

N.d.A. L'équation n_energie-cinetique correspond à une réalité physique : celle des planètes qui dans le vide ne sont pas soumises à des forces de frottement.

Référentiel. Mais pour utiliser cette équation correctement il faut bien spécifier le référentiel par rapport auquel elle est appliquée. On peut ainsi considérer que la voiture est à l'arrêt dans son référentiel (v=0 ⇒ Ec=0), et que c'est le référentiel de la Terre qui défile en-dessous de ses roues, en vertu du principe de relativité des référentiels inertiels (cf. supra #relativite). Comprenons donc bien que la notion d'énergie cinétique n'est pas absolue, mais relative à un référentiel. Elle est d'ailleurs essentiellement utilisée pour faire des bilans énergétiques c-à-d la différence entre deux mesures avant et après un événement physique.

Énergie
de rotation
Lorsque nous avons étudié le moment d'inertie (cf. supra #moment-inertie) nous avons vu que seule la composante de force perpendiculaire à la tige du pendule devait être prise en compte et que par conséquent on peut décrire ce mouvement circulaire comme s'il était rectiligne, en appliquant la loi de Newton F = m * a n_F=m*a. Mais nous avons vu aussi qu'il était utile de remplacer les coordonnées de position x par la coordonnée angulaire θ. Nous allons donc faire de même pour l'énergie cinétique Ec = m * v2 / 2 n_energie-cinetique :
soit l'arc-radian :
x = r * θ n_radian    ⇒
v = dx / dt = r * dθ / dt    ⇒
on appelle vitesse angulaire :
ω = dθ / dt = 2 * π / T
T est la période du mouvement c-à-d le temps mis pour faire un tour,
v = r * ω
que l'on substitue dans n_energie-cinetique
Ec = m * r2 * ω2 / 2    ⇔ par n_moment-inertie-1 :
Ec = J * ω2 / 2    ⇔

Le tableau suivant compare les formules de l'énergie cinétique selon le type de mouvement.

RectiligneEc = m * v2 / 2
RotationEc = J * ω2 / 2
moment-anneau.png

Application. On prend le cas d'un moteur monocylindre, dont le mouvement du cylindre est en quatre temps : explosion (qui produit de l'énergie) plus trois phases (échappement ⇒ admission ⇒ compression), qui ne produisent pas d'énergie ⇒ pour que le moteur fonctionne à une vitesse constante on va chercher de l'énergie additionnelle dans l'énergie cinétique accumulée dans un volant adossé au moteur. Pour calculer son énergie cinétique on utilise la formule du moment d'un anneau (graphique ci-contre), obtenue par le calcul d'intégration de volumes ébauché supra :
J = 1/2 * M * ( R12 + R22 )    ⇒
en injectant les valeurs du schéma ci-contre (la valeur de ρ est celle de l'acier) on trouve :
J ≈ 1,9 kg*m2
On suppose que le moteur tourne à une fréquence de :
f = 2.400 tour/min = 40 tr/s (= Hz)
or la fréquence est par définition l'inverse de la période T    ⇒
ω = 2 * π / T ≈ 251 Hz   n_vitesse-angulaire    ⇒
Ec = J * ω2 / 2 ≈ 1,9 * 2512 / 2 ≈ 60.000 J
ce qui représente l'énergie nécessaire pour envoyer une masse de 1kg à une hauteur de 6.000 mètres :

  • Ec = W = F * L n_travail    ⇒
    L = W / F = 60.000 / F
  • F = m * a n_F=m*a    ⇒ F ≈ 1 * 10 = 10 N

⇒ L = 60.000 / 10 = 6.000 m

Le tableau suivant compare les formules de (moment) de force, énergie et vitesse selon le type de mouvement.

(Moment de) ForceÉnergieVitesse
Rectilignem * d2x / dt2 = fEc = m * v2 / 2v = dx /dt
Rotation( n=1N mn * rn2 ) * d2θ / dt2 = τ Ec = J * ω2 / 2ω = dθ / dt

Ainsi dans le MRUA la force d'inertie exercée sur le corps est déterminée par la masse m tandis que dans le mouvement de rotation elle est déterminée par le moment d'inertie J = ∫n=1N ρ * dVn * rn2.

Masse et débit volumiques

https://philosophie.jortay.net/savoir-scientifique-base#masse-debit-volumiques
triangle-clipedia.png Vidéo Clipedia : La masse volumique

La masse volumique ρ est la masse par unité de volume :
ρ = M / V
Ainsi la masse volumique du bois de pin (0,45 kg/dm3) est inférieure à la masse volumique de l'eau (1 kg/dm3 = 1 g/cm3 = 1 t/m3... par convention !). Grâce au tableau périodique des éléments (cf. infra #atomes) la comparaison de la masse atomique de l'aluminium et du plomb permet de donner l'explication atomique de la masse volumique. Ainsi le noyau du plomb contient dix fois plus de nucléons (270/27). Ce rapport est supérieur à celui des masses volumiques(11,4/2,7≈4,2) car les atomes de plomb sont plus volumineux.

De même la masse volumique de l'eau est inférieure à celle de l'aluminium car les molécules qui la composent sont plus volumineuses que les atomes d'Al tout en ayant moins de nucléons.

Maintenant comparons l'air à l'eau. L'air est composé de molécules d'oxygène (O2) et d'azote (N2) qui contiennent respectivement 32 et 28 nucléons. La molécule d'eau (H2O) comporte 2*1+16=18 nucléons. Pourtant l'air est manifestement plus léger que l'eau (sa masse volumique est inférieure : 1,3 g/dm3). La raison en est que les molécules d'oxygène et d'azote ne sont pas compactes (pas liées par des forces électriques) ⇔ il y en a moins par unité de volume. En effet l'air est un gaz.

La masse volumique est sensible à l'hétérogénéité du matériaux (exemple masse volumique de l'emmental) --> dans ce cas la masse volumique doit être considérée comme une grandeur moyenne. À l'extrême la masse volumique d'une machine n'a pas beaucoup de sens.

Enfin la masse volumique ne doit pas être confondue avec la densité, qui est, pour un même volume, le rapport entre la masse du matériaux et celle d'un matériaux de référence. Les volumes étant identiques la densité est donc le rapport des masse volumiques.

triangle-clipedia.png Vidéo Clipedia : Mesure et calcul de débits

Commençons par rappeler ces grandeurs volumiques et massique standards : un litre représente un volume de 1.000 cm3 soit le volume d'un cube d'arrête de 10cm (⇒ 1 ml = 1 cm3), et un litre d'eau pèse 1kg.

Il importe de distinguer débit volumique DV = V / t et débit massique DM = M / t.

Débit volumique. Une autre façon, tout aussi intuitive, de formuler le débit volumique est :
DV = S * v
S est la surface de la section du conduit, et v la vitesse du fluide dans ce conduit.

Démonstration :
DV = V / t    ⇔
DV = S * L / t
par définition de la vitesse v = L / t
DV = S * v * t / t    ⇒
DV = S * v
CQFD

Le débit massique peut se calculer à partir de la masse volumique ρ = M / V n_masse-volumique :
DM = M / t = ρ * V / t.

Relation. On peut alors démontrer que DM = ρ * DV :
DM = ρ * V / t =
ρ * S * L / t =
ρ * S * v =
par n_debit-volumique :
ρ * DV
CQFD

N.B. On notera le lien intuitif entre M = ρ * V et DM = ρ * DV

Matière

https://philosophie.jortay.net/savoir-scientifique-base#matiere

Le développement des techniques de calcul (algèbre) a favorisé le développement technologique, qui a lui-même facilité l'étude des particules élémentaires de la matière.

 6.1. Gaz parfaits
 6.2. Atomes
 6.3. Chimie
 6.4. Cohésion électromagnetique
 6.5. Cohésion nucléaire

Gaz parfaits

https://philosophie.jortay.net/savoir-scientifique-base#gaz-parfait

La loi des gaz parfaits, qui constitue la base de la thermodynamique, fut découverte expérimentalement au 19° siècle. Elle énonce qu'à température constante, si l'on diminue le volume alors la pression augmente :
P * V = N * kB * T
N est le nombre de particules, et kB est la constante de Boltzmann.

Plus exactement, N est le nombre de moles du gaz (cf. infra #mole).

Afin de comprendre les mécanismes physiques de cette loi il faut prendre en compte la nature atomique (c-à-d non continue) de la matière. Étymologiquement le mot "gaz" vient du grec "chaos", ce qui traduit le fait que les particules qui le composent sont en mouvement permanent, provoquant ainsi des chocs sur les parois du récipient qui le contient. Ce mouvement permanent vient du fait que les atomes étant plongés dans le vide, ils ne subissent aucune force de frottement ⇒ ils conservent leur éventuel mouvement. L'idée vient alors de calculer la pression d'un gaz sur base des forces d'impact des particules sur les parois.

Ainsi la pression atmosphérique est la pression exercée par l'air sur les corps, vivants comme inertes.

Ce calcul est cependant extrêmement complexe, en raison du nombre de particules et de la diversité de leurs vitesses, directions et masses. La voie de simplification choisie par Maxwell et Boltzmann, les inventeurs de la théorie cinétique des gaz, est la physique statistique. Une voie encore plus simple, développée ici, est fondée sur la notion de force d'impact moyenne, appliquée au cas d'une expérience de la pensée.

piston.png

Étape 1

On étudie d'abord le cas simplifié d'un volume de gaz (i) contenu dans un piston librement coulissant (pas de forces de frottement), et (ii) composé d'une seule particule en mouvement vertical d'allers-retours, et dont on connaît la masse et la vitesse. Comme d'autre part on introduit la gravitation dans l'expérience il en résulte que le piston a tendance à descendre. On veut alors identifier les conditions d'équilibre volumique de ce gaz, c-à-d telles que la force d'impact moyenne f de cette particule contre le piston est égale au poids M * g de celui-ci, de sorte que ce gaz à une particule supporte le piston à une certaine hauteur. f est donc une force imaginaire continue qui porte le piston comme si celui-ci reposait sur un socle (portage statique ≈ portage dynamique) :
f = M * g
Cf. troisième loi de Newton ou principe "d'action-réaction" : toutes les forces apparaissent par couple de forces opposées.
Vu que g est connu il reste à déterminer M (puisque par hypothèse m et v sont connus).
Pour ce faire on recourt au principe selon lequel l'équilibre est caractérisé par la conservation des quantités de mouvement du piston (M*V) et du volume de gaz (m*v) :
M * V = m * v     ⇔
NB : où m et v sont supposés connus.
M = m * v / V   ⇒ il reste à déterminer V.
Or, soit x la position verticale du piston, on peut considérer que l'équilibre est caractérisé par xt=0 (la dynamique cyclique entre la particule et le piston est telle que celui-ci oscille autour d'une position xt=0) :
x = ( V * T ) - g / 2 * T2 = 0 n_xt=x0+v0*t V est la vitesse initiale du piston, et T le temps mis par la particule pour faire un aller-retour     ⇔
V = g * T / 2    ⇒ il reste à déterminer T.
Or soit L la hauteur du volume de gaz :
v = 2 * L / T   ⇔   T = 2 * L / v     ⇒   substitué dans V :
V = g * L / v   ⇒   substitué dans : M * V = m * v     ⇒
M = m * v2 / g / L     ⇔
M * g = m * v2 / L     ⇔
f = m * v2 / L
f est ainsi déterminé puisque l'on connaît m, v et L. En outre on s'est affranchi de g dans son expression (ce qui est une bonne chose puisque les propriétés d'un gaz sont identiques en apesanteur ou à la surface de la Terre).

Si dans n_f=m*v2/L on substitue L=T*v/2 ⇒
f = M * g = 2 * m * v / T
qui exprime la condition d'équilibre du piston de masse M, autour d'une position d'équilibre, sous l'action de la quantité de mouvement m*v du gaz à particule unique.

On est alors en mesure de faire le lien avec la loi expérimentale grâce à Ec = m * v2 / 2 n_energie-cinetique que l'on substitue dans n_f=m*v2/L    ⇒
f * L = 2 * Ec     ⇒
Soit S la surface supérieure du cylindre :
( f / S ) * ( L * S ) = 2 * Ec     ⇔
P * V = 2 * Ec qu'en comparant avec
P * V = N * kB * T on pourrait qualifier de "loi des gaz parfaits à une particule". Il nous reste donc à généraliser au cas de N particules.

La comparaison des deux équations révèle également le lien entre énergie cinétique et température (le T de n_gaz-parfaits est la température, et non pas la période traitée ci-avant).

Étape 2

On va maintenant généraliser les deux hypothèses principales de l'étape 1 : (i) on considère N particules, au lieu d'une seule ; (ii) leur direction est quelconque, et non plus uniquement verticale.

Nous raisonnons alors dans le cadre d'un gaz à l'équilibre tel que la force d'impact moyenne f de ses particules contre chacune de ses parois est égale à la force de réaction exercée par celles-ci.

Pour ce faire on va poser comme hypothèse simplificatrice que ce gaz est parfait, c-à-d que ses particules constitutives (atomes ou molécules) n'interagissent pas entre elles (de sorte qu'elles n'interagissent qu'avec les parois du récipient), ce qui requiert :

  • de les considérer comme des "masses ponctuelles", c-à-d que leur volume étant (sous cette condition) d'un ordre de grandeur très inférieur à la distance moyenne qui les sépare, on considère qu'elles ne se rencontrent quasiment jamais (il n'y a donc pas d'interactions entre elles) ; on dit alors que le gaz qu'elles forment est "dilué", c-à-d que sa pression est faible ;
  • que sa température, et donc l'énergie cinétique et la vitesse de ses particules, ne soient pas trop basses, sans quoi il y aura des agrégats de particules c-à-d des interactions entre elles (et il ne s'agit alors plus d'un gaz parfait) : en effet si l'énergie cinétique est trop faible, alors elle sera insuffisante pour neutraliser les forces d'attractions électromagnétiques entres particules.

Il n'existe pas de gaz parfait, mais tout gaz peut se rapprocher des ces conditions de faible pression et température.

Les particules ponctuelles étant maintenant mobiles dans toutes les directions, il faut considérer leur vitesse non plus comme un simple scalaire mais comme un vecteur (cf. supra #vecteur).
f(t) = m * dv/dt
qui exprime les chocs sur la paroi et la subséquente modification de vitesse.
⇔ par n_vecteur-unitaire :
f(t) = m * (dvx/dt * 1x + dvy/dt * 1y + dvz/dt * 1z)    ⇒

piston-2.jpg

Bilan après le choc contre la paroi : viy = vfy

On fait alors une nouvelle hypothèse simplificatrice : on suppose que même à l'échelle microscopique la paroi est parfaitement lisse ⇒ deux des trois composantes cartésiennes de la vitesse sont inchangées lors des chocs contre une paroi (ce qui, en l'absence de cette hypothèse, est relativement vérifié en moyenne) ⇒ il n'y a que la composante perpendiculaire de la vitesse (disons vx) qui change lors d'un contact avec une paroi ⇒
f(t) = m * dvx/dt * 1x   ⇔
f(t), force d'impact moyenne d'une particule d'inclinaison quelconque, est donc orientée perpendiculairement à la paroi qui subit le choc.

Dans l'étape théorique suivante les forces d'impact exercées par les N particules sur la paroi sont sommées en une force unique :
F = ∑n=1N fn ⇒ par n_f=m*v2/L :
F = ∑ m * vnx2 / L    ⇔
F = N * m / L * ∑ vnx2 / N    ⇔
F = N * m / L * < vx2 >
où < vx2 > est la moyenne "d'ensemble" (tandis que f est une moyenne "temporelle") des vitesses en x.

Ensuite en raison de la distribution isotrope des vitesses (aucune des directions, donc aucune des composantes de la vitesse, n'est privilégiée puisqu'on se situe dans le vide) on a que :
< vx2 > = < vy2 > = < vz2 >
or par n_module :
∑ vn2 = ∑ vnx2 + ∑ vny2 + ∑ vny2     ⇒ en divisant les deux membres par N :
< v2 > = 3 * < vx2 >     ⇒
NB : 3 représente donc le nombre des dimensions de l'espace, c-à-d le nombre de liberté qu'on les particules de bouger.
F = N * m / L * < v2 > / 3     ⇔ en divisant par la surface S de la paroi supérieure :
P = N * m / V * < v2 > / 3     ⇔
P * V = N * 1/3 * m * < v2 >     ⇒
si l'on compare avec l'égalité expérimentale
P * V = N * kB * T
on en déduit que
1/3 * m * < v2 > = kB * T     ⇔
2 * < m * v2 / 2 > / 3 = kB * T     ⇒ par n_energie-cinetique :
T = 2/3 * < Ec > / kB
où < Ec > est l'énergie cinétique moyenne par particule de gaz.

On comprend alors ce qu'est la température en termes physiques. On comprend en particulier pourquoi la température la plus basse qui puisse exister – le zéro absolu – est celle d'un gaz parfait dont l'énergie cinétique est nulle, niveau le plus bas que l'énergie cinétique puisse atteindre. On comprend également qu'en apportant de la chaleur à un gaz, donc en augmentant sa température, on augmente son énergie cinétique. On verra que l'énergie thermique est en fait de l'énergie cinétique (du moins pour les gaz monoatomiques).

Atomes

https://philosophie.jortay.net/savoir-scientifique-base#atomes
 6.2.1. Modèle atomique
 6.2.2. Isotopes
 6.2.3. Tableau périodique
Modèle atomique
https://philosophie.jortay.net/savoir-scientifique-base#modele-atomique
triangle-clipedia.png Vidéo Clipedia : Les atomes

Un atome est une particule élémentaire de matière. On a recensé à ce jour environ 120 types d'atomes ("éléments"). Ils sont classés dans le tableau des éléments (cf. infra). On les représente physiquement sous forme d'une sphère (modèle atomique).

Nous verrons plus loin la différence entre "atome" et "élément" au travers de la notion d'atome isotope.

La taille d'un atome varie de 0,25 à 3 Å (un ångström vaut cent picomètres et 1 pm = 10 -10 m) selon le type de matière (hydrogène, carbone, etc). Ainsi la taille d'un atome (ordre de 10-10 m) par rapport à un pamplemousse est du même ordre de grandeur que la taille d'une sphère de 1cm de diamètre par rapport à la Terre.

Les atomes ne se distinguent pas que par leur taille, mais aussi (et surtout) par leur structure.

Dans le modèle atomique l'atome est composé de particules (dites "subatomiques") :

  • un noyau, composé de deux types de "nucléons" :
    • protons :
      • charge électrique individuelle positive (1,602.10 -19 C = charge +1);

        Le coulomb est la charge électrique (la quantité d'électricité) traversant une section d'un conducteur parcouru par un courant d'intensité de un ampère pendant une seconde (1 C = 1 A*s).

      • masse individuelle = 1,673.10 -27 kg.
    • neutrons
      • sans charge électrique;
      • masse individuelle = 1,675.10 -27 kg.
  • d'un nuage entourant le noyau et composé d'électrons, qui sont des particules :
    • chargées négativement (charge -1);
    • de masse individuelle = 9,109.10 -31 kg soit 1.838 fois moins lourde qu'un nucléon, de sorte qu'elle est souvent ignorée dans les calculs des chimistes (et comme les électrons sont environ deux fois moins nombreux que les nucléons il en résulte que le noyau est environ 4.000 fois plus lourd que son nuage).

Quel que soit le type d'atome, les protons ont donc la même masse, de même que les neutrons.

ChargeMasse
p ++11
n 001
e --1négligeable

La masse d'un atome est donc concentrée dans le noyau (99,97%), tandis que sa charge est répartie, entre protons du noyau et nuage électronique. La concentration de masse est encore plus impressionnante lorsque l'on se rend compte que le rapport entre la taille du noyau et celle de l'atome est équivalent à celui entre la tête d'une fourmi et un terrain de football (ordre de grandeur du rapport : 1/100.000).

Taille (ordre de grandeur)

Atome10-10 m
Noyau10-15 m

Unités de
mesure

Dès lors que la masse d'un proton est très proche de celle d'un neutron, on a simplifié la mesure en posant que la masse d'un nucléon (proton ou neutron) – notée mu – vaut une "unité de masse atomique" (notée u ou u.m.a.), dont la valeur est déterminée comme suit :

  • jusqu'en 2019 sa valeur était mesurée, en prenant comme référentiel l'atome isotope 12C (le plus fréquent des trois types d'atome de carbone : cf. infra pour la notion d'isotope) ; comme celui-ci comporte 12 nucléons (6 protons + 6 neutrons) on a donc que l'unité de masse atomique vaut un douzième de la masse de 12C :
    mu ≈ 1 u ≡ m12C / 12 = 1,66053 8921 * 10 -27 kg

  • depuis 2019, l'unité de masse atomique n'est plus mesurée mais fixée par convention :
    mu ≈ 1 u ≡ 1 / NA  g = 1,66053 9066 * 10 -27 kg

    NA est le nombre d'Avogadro : au 19° siècle le physicien et chimiste turinois Avogadro avait démontré que deux volumes égaux de gaz différents, dans les mêmes conditions de température et de pression, contiennent un nombre identique de molécules ⇒ on en a déduit que 1g de n'importe quelle matière contient le même nombre NA de nucléons ; pour s'accorder sur une valeur précises de NA les scientifiques ont convenu :

    • jusqu'en 2019, que NA est le nombre d'atomes de carbone dans 12 grammes de carbone 12, soit 6,022140 86 * 1023  ;
    • depuis 2019, que dorénavant la valeur de NA ne serait plus mesurée mais fixée par convention à NA ≡ N(1g) = 6,022140 76 * 1023

Mais ce qui caractérise essentiellement un type d'atome c'est le nombre de protons qu'il contient (exemple : le carbone est l'atome composé de six protons), appelé numéro atomique (noté Z, et annoté comme suit 6C, pour le carbone). NB : la matière est généralement neutre c-à-d que la charge électrique d'un atome est nulle ⇒ Z indique donc également le nombre d'électrons (#protons = #électrons).

Quant au nombre de nucléons (protons et neutrons) on l'appelle nombre de masse (noté A).

En résumé :

  • Numéro atomique : Z = # p+ = # e
  • Nombre de masse : A = # p+ + # n0

Le nombre de masse permet de calculer la masse atomique (exprimée en u). Mais pour cela il convient d'introduire la notion d'isotopes.

triangle-clipedia.png Vidéo Clipedia : Les isotopes
Isotopes
https://philosophie.jortay.net/savoir-scientifique-base#isotopes

Sur base des définitions que nous venons d'énoncer, on pourrait s'attendre à ce qu'un atome de carbone pèse A u = 12 u. Or un atome de carbone pèse 12,01074 u [ on le sait en mesurant la masse d'une mole de carbone, qui vaut 12,01074 g (cf. infra #mole) ]. La raison en est qu'il existe différents types d'atomes, qui diffèrent par leur nombre de neutrons, et donc par leur masse : ce sont les isotopes de l'atome. Ainsi lorsque l'on pèse une certaine quantité d'un atome on pèsera un mélange de ces trois isotopes. La proportion de chaque isotope est appelée "abondance naturelle" (notée Ni) de l'isotope.

tableau-periodique-case.jpg

Par exemple pour le carbone on a : N(12C)≈98,93% ; N(13C)≈1,07% ; N(14C)≈0%. Et dans ce cas on constate bien que :
M(C) = ∑i  Ai * Ni    ⇒
M(C) = A(12C) * N(12C) + A(13C) * N(13C)+ A(14C) * N(14C)    ⇔
M(C) ≈ ( 6 + 6 ) * 0,9893 + ( 6 + 7 ) * 0,0107 + ( 6 + 8 ) * 0 = 12,0107.

Il est important de bien comprendre que :

  • la masse atomique est donc une moyenne pondérée des nombres de masse.
  • quand l'unité de la masse atomique M(X) n'est pas spécifiée, on convient qu'il s'agit de l'unité de masse atomique "u" n_u.m.a., et non de grammes ou de kilos !
Tableau périodique
https://philosophie.jortay.net/savoir-scientifique-base#tableau-periodique
triangle-clipedia.png Vidéo Clipedia : Tableau périodique

Dans chaque case du tableau des éléments (cf. ci-dessous) le chiffre situé au-dessus du symbole de l'élément est son numéro atomique tandis que le nombre situé en dessous du symbole est la masse atomique (cf. supra #isotopes). Le tableau "périodique" peut se lire notamment de gauche à droite c-à-d dans l'ordre des numéros atomiques. Les "périodes" sont les lignes, tandis qu'à chaque colonne est attribué un numéro de groupe (ainsi par exemple les éléments du groupe IA réagissent de façon assez semblable aux élément du groupe IB). Dix familles d'éléments sont ainsi regroupées par couleurs.

tableau-periodique.png

Pour agrandir : clic droit sur l'image > Afficher > cliquer sur l'image pour agrandir au maximum.

L'atome d'hydrogène (H) est le premier élément du tableau périodique (cf. infra) : c'est l'atome le plus petit, simple et léger : il est composé d'un seul proton, d'un seul électron et ne possède pas de neutron.

Description succincte des familles d'éléments :

  1. métaux alcalins (Li, Na, K, Rb, Cs, Fr) : réagissent fortement avec l'oxygène de l'air et de l'eau;
  2. halogènes (F, Cl, Br, I) : gaz diatomiques, et toxiques car il réagissent fortement (avec notamment les métaux alcalins);
  3. alcalino-terreux (Be, Mg, Ca, Sr, Ba, Ra) : il font les mêmes types de composés que les alcalins mais avec des taux de combinaison doubles;
  4. métaux de transition (Ti, Cr, Fe, Ni, Cu, Zn, Ag, Pt (catalyseur), Cd, Au, ...) : solides, conducteurs, ductiles, à haute température de fusion/ébullition, combinables entre eux (alliages), composables avec les non-métaux (oxydes, chlorures, sulfates, ...) en proportions diverses (exemple d'oxydes de fer : FeO, Fe2O3, F3O4) ;
  5. gaz nobles ou rares, inertes (He, Ne, Ar, Kr, Xe, Rn) : monoatomiques, très peu réactifs (ce qui en fait de bon gaz parfait) --> ils forment peu de composés (d'où leur nom de inertes ou nobles);
  6. non métaux (C, H, O, N, P, S) : jouent un rôle déterminant dans le métabolisme des organismes vivants, légers (faible masse atomique), combinables (acides aminés – Ala, Tyr, ... – constituant les protéines, molécules de phospholipides constituant les membranes cellulaires, molécules d'ADN, ...);
  7. métalloïdes (B, Si, Ge, As, Sb, Te, At) : moins bons conducteurs que les métaux (⇒ utilisés pour fabriquer des semi-conducteurs, transistors et circuits intégrés);
  8. métaux pauvres (Al, Ga, Sn, Pb, ...);
  9. lanthanides ou "terres rares" (La, Pr, Nd, ...);
  10. actinides (U, Pu, Md, ...) : les plus lourds, matières premières des centrales nucléaires.

Les éléments récemment découverts sont les plus lourds : ils contiennent le plus grand nombre de protons. Découvrir de nouveaux éléments requiert de plus en plus d'énergie ⇒ au fur et à mesure que nous pourrons mobiliser de plus grandes quantités d'énergie grâce au progrès technologique découvrirons-nous sans fin de nouveaux éléments ?

Chimie

https://philosophie.jortay.net/savoir-scientifique-base#chimie
 6.3.1. Réaction chimique
 6.3.2. Mole
 6.3.3. Solution et concentration
 6.3.4. Énergie et cinetique
Réaction chimique
https://philosophie.jortay.net/savoir-scientifique-base#reaction-chimique

Il est théoriquement possible de transmuter la matière, par exemple le plomb (82Pb) en or (79Au) : pour cela il faut enlever 82-79=3 protons à chaque atome de plomb. Cependant cela requiert tellement d'énergie que dans l'état actuel des technologies la transmutation est plus coûteuse que l'extraction.

Cette anecdote est l'occasion de préciser que le champ de la physique nucléaire se situe à l'échelle intra-atomique, qui est par nature plus petite que l'échelle inter-atomique de la chimie, dont le champ est le nuage électronique qui entoure le noyau des atomes (la biologie, ou plus exactement la biochimie, se situant quant à elle à une échelle encore plus grande : celle des molécules, qui sont des ensemble d'atomes).

Il en résulte qu'une réaction nucléaire est une transformation d'un ou plusieurs noyaux atomiques, de sorte qu'elle transforme un élément en un autre. Tandis qu'une réaction chimique ne concerne que les électrons ou les liaisons entre les atomes, donc conserve les éléments, mais transforme leurs composés que sont les molécules.

Une réaction chimique est un phénomène de transformation de la matière, que l'on observe dans certains cas lorsque l'on mélange des substances. Les composés se transforment ainsi en un ou plusieurs composés d'une autre nature (c-à-d avec des propriétés physico-chimiques différentes), cela tout en conservant la quantité de matière (cf. premier et second principes de la thermodynamique). Les réactions chimiques se distinguent notamment par leur intensité (on utilise parfois le terme de "violence") : ainsi par exemple lorsque l'on jette un morceau de sodium dans un récipient contenant de l'eau, le morceau de sodium se met à bouger en dégageant de la fumée, puis il brûle et enfin explose.

Autres exemples. Les organismes vivants sont le lieu de nombreuses et permanentes réactions chimiques, qui déterminent le métabolisme de ces organismes : respiration, nutrition, ... (cf. infra #metabolisme). Les réactions chimiques sont abondamment utilisées dans l'industrie, notamment pour produire des métaux à partir de minerais, ou encore des polymères (matières plastiques telles que le nylon). Elles sont également utiles pour le recyclage de déchets (cf. les stations d'épuration). Enfin nous sommes tous des chimistes, puisque l'art culinaire consiste en l'exploitation de réactions chimiques sur des aliments (exemple : réaction de maillard).

Revenons à la réaction de la vidéo, et écrivons son équation chimique :

Réactifs --> Produits
Na + H2O --> NaOH + H2

On constate que l'atome de sodium (Na) prend la place d'un des deux atomes d'hydrogène (H), qui est éjecté, ce qui produit une molécule d'hydroxyde de sodium et une molécule de dihydrogène (gaz). Cependant l'équation ci-dessus n'est pas correcte car le principe de conservation de la matière/énergie ("rien ne se perd, rien ne se créé") n'est pas respecté : on a plus d'atomes de H en produits (à droite de la flèche) qu'en réactifs (à gauche de la flèche) ⇒ il faut diviser la molécule de dioxygène par 2 :

Na + H2O --> NaOH + 1/2 * H2

mais comme dans la réalité il n'existe pas de "demi-molécule" il faut alors multiplier les deux membres par 2 afin d'équilibrer correctement l'équation :

2Na + 2H2O --> 2NaOH + H2

reaction-chimique.jpg
Mole
https://philosophie.jortay.net/savoir-scientifique-base#mole
triangle-clipedia.png Vidéos Clipedia : La Mole // La mole : illustration

Les nombres situés à gauche des réactifs et produits de la section ci-dessus sont appelés "coefficients stœchiométriques". Ils constituent la base de la chimie quantitative. Celle-ci repose sur la notion de mole, qui exprime une relation entre la masse d'une certaine quantité de matière et le nombre d'atomes qu'elle contient. La notion de mole permet ainsi de quantifier correctement les réactifs d'une réaction chimique.

La mole est « la quantité de matière d'un système contenant exactement NA (nombre d'Avogadro) entités élémentaires (atomes, ions, molécules, etc.), et est telle que une mole de nucléons (protons et neutrons), c-à-d NA nucléons, pèse 1g ». Autrement dit, 1g de n'importe quelle matière contient 1 mole de nucléons :
NA * mu = 1 [g/mol]
où :
mu : masse du nucléon (proton ou neutron) n_u.m.a. ;
NA : nombre d'Avogadro n_avogadro.
PS : on note l'unité [g/mol] au lieu de [g] pour préciser qu'il s'agit de la masse d'une mole.

La définition de "une mole de nucléons" n_mole n'est donc qu'une reformulation de la définition de la masse du nucléon (mu), où 1g de n'importe quelle matière est exprimé comme correspondant à la masse du nucléon multipliée par NA .

Ainsi n_mole permet d'associer une quantité de substance (membre de droite) à un nombre de nucléons (membre de gauche) et donc à un nombre d'atomes ou molécules.

Pour bien comprendre l'utilité de cette notion de mole, revenons à celle de masse atomique. Nous avons vu que la masse d'un atome est représentée à plus de 99% par celle du noyau. Par conséquent la masse d'un atome X vaut approximativement le produit du nombre de nucléons (c-à-d le nombre de masse AX) par la masse d'un nucléon (mu) :
mX ≈ mnoyau X = AX * mu  [g]
⇔ en unités u :
mX = AX  [u]

Cependant nous avons vu que ce raisonnement est trop simpliste. Il faut prendre en compte les isotopes : la masse d'un atome X est une moyenne pondérée de ses isotopes, notée Mx n_masse-atomique, et est mentionnée dans le tableau périodique des éléments (cf. supra #tableau-periodique). Par conséquent il faut réécrire les équations ci-dessus comme suit :

mX = MX  [u] = MX * mu [g]

Notons que n_masse-atomique-u-g vaut quelle que soit l'entité chimique X considérée : atome ou molécule. Ainsi la masse d'un atome de carbone (C) vaut 12 [u], et la masse d'une molécule d'H2O vaut 2*1+16=18[u].

Ensuite, à partir d'une "entité" (atome ou molécule), on définit sa masse molaire (masse d'une mole) en substituant mu de n_mole dans n_masse-atomique-u-g
entité : mX = MX / Na  [g]    ⇒
mole : NA * mX = MX  [g/mol]

Ainsi par exemple la masse d'une mole de carbone (C) vaut 12g/mol, et celle d'une mole de H2O vaut [(2*1)+16]=18g/mol.

On notera qu'une "entité" de X (atome de C, molécule H2O, ...) pèse MX [u] n_masse-atomique-u-g, tandis qu'une mole de X pèse MX [g] n_masse-molaire.

Enfin, à partir de la masse molaire n_masse-molaire on pourra calculer le nombre nX de moles de matière X contenues dans une masse qX de cette matière, en divisant celle-ci par la masse molaire MX :
nX = qX / MX

Appliquons maintenant ces principes de chimie quantitative à notre équation chimique de la section précédente :

- NA * mNa = 23g : une mole de Na pèse environ 23g;
- NA * mH2O = 18g : une mole de H2O pèse 2*1+16=18g
- NA * mNaOH = 40g : une mole de NaOH pèse 23+16+1=40g
- NA * mH2 = 2g : une mole de H2 pèse 2*1=2g

On peut associer coefficients stœchiométriques et nombre de moles d'une réaction :

2Na+2H2O2NaOH+H2
⇒ en multipliant les deux membres par NA (ne pas confondre avec Na) :
2 moles Na+2 moles H2O2 moles NaOH+1 mole H2

Ne pas confondre Na (sodium) et NA (nombre d'Avogadro).

De sorte qu'à partir de n'importe quelle quantité de Na (par exemple 46g) on peut alors déterminer celles des autres réactifs et produits correspondant à l'équation.

2Na+2H2O2NaOH+H2
2 moles Na+2 moles H2O2 moles NaOH+1 mole O2
46g+36g80g+2g

On constate que 46+36=80+2. Ainsi la masse de matière est conservée (tout comme le nombre d'atomes).

On peut également déduire que :
18g de H2O contient 1 mole de H2O    ⇒
1g de H2O contient 1/18 mole de H2O = 0,055 mole de H2O = 0,055 * NA molécules de H2O.

Solution et concentration
https://philosophie.jortay.net/savoir-scientifique-base#solution-concentration
triangle-clipedia.png Vidéo Clipedia : Solutions et concentration

Certaines matière se mélangent facilement (mélange homogène) et d'autres pas (mélange hétérogène). Ainsi du sable et de l'eau donneront (même après agitation) deux "phases" : solide (sable) et liquide (eau). Même type de résultat si l'on remplace le sable par de l'huile (on parlera alors plutôt de phases "organique" pour l'huile, et "aqueuse" pour l'eau).

Mais si l'on remplace l'huile par du lait, on obtient alors un mélange homogène, ... du moins à l'oeil nu. Le lait, à l'instar de la peinture, est en réalité un colloïde (du grec "kollôdês" signifiant "collant") c-à-d une suspension d'une ou plusieurs substances dispersée(s) régulièrement dans un liquide, formant un système à phases séparées mais sans que cela soit visible à l'oeil nu.

En fait la distinction entre produits miscibles ou non n'est généralement pas dichotomique mais plutôt en continuum. L'homogénéité peut être approchée par agitation ou encore ajout d'un émulsifiant, de sorte que l'on obtient un mélange appelé "émulsion" : vinaigre+huile (mayonnaise) ou encore air+graisse (mousse).

solution.jpg

Lorsque le mélange est homogène au niveau moléculaire on parle de solution. C'est le cas de l'eau et du sel (NaCl) : l'image ci-contre montre que les ions Na+ et Cl- (solutés) sont entourés de molécules de H2O (solvant).

Dans le cas de solutions on peut alors considérer la concentration du soluté dans le solvant, par le rapport cc = quantité de soluté / volume de solvant

L'intérêt de la notion de concentration (cc) est qu'elle est indépendante de la quantité : une portion quelconque de solution a la même concentration que la solution puisque par nature la solution est spatialement homogène. La concentration est ainsi qualifiée de variable "intensive", à l'instar de la masse volumique ρ = M / V n_masse-volumique.

La cc se définit globalement par cc = quantité de soluté / volume de solvant. Mais on peut distinguer divers types d'indice selon la façon dont est mesuré le numérateur, c-à-d la quantité de soluté : masse, # moles, volume.

Concentration massique : Cm = masse soluté / volume solution [kg/m3 ou g/l]

Cependant du point de vue de l'analyse chimique on obtient plus d'informations en mesurant la quantité de soluté par le nombre de moles (et partant le nombre d'atomes) plutôt que par la masse :

Concentration molaire : CM = # moles / volume solution [mol/m3 ou mol/l]

On note parfois C ou [formuleMolécule] au lieu de CM

Calculons la cc molaire de 3g de NaCl dans 40ml de H2O :
CM = # molesNaCl / 0,04    ⇔ par n_nombre-moles :
CM = mNaCl / MNaCl / 0,04    ⇔ par n_masse-molaire :
CM = 3g / ( 23 + 35 ) / 0,04 = 1,3 mol/l   

N.B. On voit que :
cc molaire = cc massique / masse molaire :
Démonstration :
CM = # moles / volume solution   ⇔
CM = masse soluté / M / volume solution   ⇔
CM = Cm / M
où M est la masse molaire n_masse-molaire.

Pourcentage en solution : volume de soluté / volume solution, comme dans le cas des boissons alcoolisées ("degrés" d'alcool).

Effets

La cc joue donc sur l'intensité d'une solution, et partant sur diverses propriétés telle que la couleur. Ainsi la couleur des pétales d'une plante est fonction de l'intensité de ses pigments, laquelle dépend de l'acidité (le "ph") du sol (qui vaut de 0-1 pour les acides forts à 13-14 pour une "base" (le contraire d'un acide). Et le ph est lui-même une variable intensive puisqu'il vaut le négatif de la cc en ion H3O+ : ph = -log[H3O+].

Une autre propriété déterminée par la cc est la vitesse de réaction entre deux solutés d'un solvant : plus leur cc est élevée, plus la probabilité de rencontre entre leurs particules est élevée, et partant la vitesse de réaction de l'ensemble du soluté mixte.

Énergie et cinétique chimique
https://philosophie.jortay.net/savoir-scientifique-base#energie-cinetique-chimique
Énergie

Dans la réaction illustrée par la vidéo supra, ce n'est pas le sodium "qui a brûlé" (cf. vidéo) : la réaction produit du dihydrogène H2 qui réagit à son tour avec l'oxygène de l'atmosphère, en provoquant ainsi une réaction de combustion. Cette réaction chimique est donc associée à un dégagement d'énergie sous forme de chaleur, on parle alors de réaction exothermique :

2H2 + O2  -->  2H2O (+ énergie)

N.d.A. : sauf in vitro, une réaction chimique entraîne généralement d'autres réactions chimiques.

molecule-H2O.png

Dans une molécule chaque liaison entre atomes se fait par mise en commun d'un électron. Chaque liaison, ou plus exactement chaque électron de la liaison peut-être vu comme détenteur d'une sorte d'énergie potentielle (cf. supra #energie-potentielle). Ainsi par exemple dans la réaction de synthèse de l'eau, une molécule de dihydrogène vient briser le lien qui unit les deux atomes du dioxyde, cela libère une énergie qui propulse la molécule de H2O synthétisée. La réaction de combustion correspond à une émission d'énergie (thermique et mécanique), de sorte que le produit d'une réaction exothermique correspond à un état énergétique inférieur à celui des réactifs, en vertu du principe de conservation.

Le graphique ci-dessous représente l'évolution du bilan énergétique d'une réaction. On voit que le pic correspondant à l'énergie d'activation peut-être abaissé, grâce à un catalyseur. Par exemple en ajoutant de la mousse de platine aux réactifs H2 et O2 on pourra déclencher la réaction avec seulement une échauffement plutôt qu'une explosion (la réaction est donc plus lente).

reaction-exothermique.png

Réaction exothermique

Le graphe ci-contre est celui d'une réaction exothermique : l'énergie d'activation (c-à-d requise pour briser les liaisons dans les réactifs) est inférieure à l'énergie de réaction (c-à-d dégagée par la formation des liaisons chimiques dans les produits de réaction).

La combustion est une réaction exothermique (NB : la réaction de combustion peut prendre des formes très subtiles, telles que la respiration).

reaction-endothermique.png

Réaction endothermique

Le graphe ci-contre est celui d'une réaction exothermique : l'énergie d'activation (c-à-d requise pour briser les liaisons dans les réactifs) est supérieure à l'énergie de réaction (c-à-d dégagée par la formation des liaisons chimiques dans les produits de réaction).

La glace qui fond est une réaction exothermique.

Les notions d'énergie d'activation et de réaction endothermique illustrent le fait qu'il ne suffit pas toujours de mélanger des réactifs pour que la réaction se déclenche. Un apport d'énergie (électricité dans l'eau, flamme dans l'air, ...) peut être nécessaire. Ainsi en fournissant de l'énergie on pourra provoquer une réaction chimique inverse.

electrolyse-eau.png

Électrolyse de l'eau

Par exemple, à l'inverse de la réaction exothermique n_reaction-exothermique, on peut produire du H2 et du O2 à partir de H2O. Pour ce faire une technique est l'électrolyse de l'eau, qui est une réaction endothermique :

2H2O (+ énergie)  -->  2H2 + O2

Le schéma ci-contre montre qu'en créant un courant électrique dans le système, on provoque une production de gaz dans les deux colonnes, et telle que le volume de gaz produit dans la colonne de droite est le double de celui de la colonne de gauche, ce qui correspond au rapport des coefficients stoechométriques du membre de droite : la réaction produit deux fois plus de molécules de H2 que de O2.

Cinétique

On voit que les réactions chimique se distinguent notament par leur vitesse : dans une explosion la réaction est quasiment immédiate tandis que dans d'autres phénomènes elle est beaucoup plus lente (par exemple la rouille sur un métal).

Cette observation nous conduit à la question : quel est le mécanisme d'une réaction chimique ? Elle se fait par le biais des électrons c-à-d des forces électromagnétiques. Et contrairement à la dynamique orbitale régulière des astres cosmiques (régie par la force gravitationnelle), les mouvements des électrons autour du noyau semblent chaotiques (aléatoires), de sorte qu'on ne parle pas d'orbites mais de probabilité de présence.

Une réaction chimique consiste dans la mise en commun d'électrons, ce qui requiert des chocs entre les atomes des réactifs (dans le cas de la dernière équation supra il faut que trois molécules se rencontrent : deux de H2 et une de O2). Or la probabilité de ces chocs diminue avec le nombre d'atome par unité volumique (concentration, pression) ainsi qu'avec l'agitation de ces atomes (liée à la température). D'autre part on pourrait penser qu'une réaction chimique requiert également un positionnement ad hoc des atomes, ainsi qu'une mobilisation efficace de l'énergie nécessaire. Mais comme tout cela est statistiquement peu probable de se produire simultanément il faut donc trouver une autre explication. C'est ce qu'ont fait les prix Nobel de chimie 1956 Hinshelwood & Semenov. Dans leur théorie les molécules sont d'abord cassées en leur "radicaux libres" qui, possédant sur leur couche externe un ou plusieurs électrons non appariés, sont généralement instables et réagissent fortement avec les autres réactifs (avec nouvelles productions de radicaux), provoquant de complexes réactions en chaînes ⇒ l'explosion de la vidéo.

On peut ainsi distinguer :

  • thermodynamique chimique ⇔ notion de bilan énergétique : dans quel sens se produit la réaction ?
  • cinétique chimique ⇔ notion de vitesse de réaction : pas de réaction < réaction modérée < explosion.

Cohésion électromagnétique

https://philosophie.jortay.net/savoir-scientifique-base#cohesion-electromagnetique
 6.5.1. Algèbre de l'électricité
 6.5.2. Orbites électroniques
 6.5.3. Liaison covalente
Algèbre de l'électricité
https://philosophie.jortay.net/savoir-scientifique-base#algebre-electricite

Lors du big bang, une quantité phénoménale d'énergie a été libérée, ainsi que des neutrons. Ces particules élémentaires n'ont apparemment pas d'autre propriété que leur masse (leur charge électrique est nulle) ... du moins pendant une quinzaine de minutes, après lesquelles elles se mettent à vibrer puis émettent un électron (particule de charge négative), ce qui transforme le neutron en proton (particule de charge positive), et fait apparaître entre les deux particules une force d'attraction, dite "électrique". Sous certains aspects, celle-ci est comparable à la force de gravitation (force d'attraction entre tous les corps de masses significatives) : réciprocité de la force d'attraction entre les deux corps, intensité de cette force en fonction de la distance entre les corps. Mais elle est aussi beaucoup plus forte (facteur 1040 !) et plus complexe : la force électrique est attractive entre proton et électron, mais répulsive entre entre particules semblables (protons ou électrons).

L'attribution d'une charge positive au proton et négative à l'électron, plutôt que le contraire, n'est qu'une convention mathématique permettant de modéliser, au moyen d'une "algèbre de l'électricité", la détermination du sens des forces d'attraction et de répulsion observées entre particules : + = répulsion ; - = attraction ; - * + = - ; - * - = + ; + * + = +.

algebre-electricite.png

Ok, les types différents s'attirent. Mais qui va vers l'autre ? Réponse : tout est question de conventions ...

Au moyen de cet algèbre de l'électricité nous allons pouvoir étudier et formaliser la dynamique des forces intra-atomiques (c-à-d à l'intérieur des atomes) et inter-atomiques (c-à-d entre atomes) : en particulier les forces de cohésion et les orbites électroniques.

N.d.A. Il s'agit ici de l'approche purement mathématique. Au niveau physique c'est plus complexe. Ainsi l'effectuation de la force d'attraction n'est pas symétrique : ce sera plutôt l'électron qui se rapproche du proton, car la masse de ce dernier étant nettement plus élevée, son inertie l'est également. Ceci dit, le résultat est le même ...

Orbites électroniques
https://philosophie.jortay.net/savoir-scientifique-base#orbites-electroniques

Lorsqu'un proton et un électron se rencontrent deux options sont possibles : soit ils forment un neutron, soit ils forment un atome d'hydrogène (le plus simple des atomes : 1 proton et 1 électron).

Forces électrique (attractive) et gravitationnelles ont un autre point commun : combinées avec une force centrifuge (en sens opposé, selon la loi d'action-réaction n_troisieme-loi-newton ), elle provoquent un mouvement orbital (à une vitesse beaucoup plus grande dans le cas de la force électrique – de l'ordre du millions de m/s – que dans celui de la lune). Ainsi le système atomique composé d'un proton et d'un électron se déplaçant en orbite autour de son noyau (ici composé d'un seul proton et d'aucun neutron) est appelé "atome d'hydrogène" (noté H).

2H.jpg

L'image ci-contre montre que lorsque deux atomes d'hydrogène sont suffisamment proches, ils peuvent être liés si la combinaison spatiale est telle que les forces d'attraction l'emporte sur les forces de répulsion. Dans ce cas ils vont alors former une molécule de dihydrogène (H2).

molecule-hydrogene.png

Molécule d'hydrogène, composée de deux atomes d'hydrogène, donc de deux protons (en rouge) et deux électrons (en bleu).

Dans cette nouvelle molécule les vecteurs d'attraction entre particules de signes différents sont toujours plus longs que les vecteurs de répulsion entre particules de mêmes signes. Et d'autre part la force d'attraction résultante est compensée par la force centrifuge de sens opposé, ce qui maintient la structure orbital des électrons dans un système atomique à deux noyaux (ici molécule H2).

À l'échelle supérieure des interactions inter-moléculaires la force d'attraction entre molécules de dihydrogène est faible dans les conditions physico-chimiques de la surface de la Terre : des molécules de H2 qui entrent en collision ne provoquent généralement pas de réaction chimique. Cette absence d'interaction entre molécules fait de H2 ce que l'on appelle un "gaz".

Plasma

Les étoiles sont originellement des amas de gaz H2 dont la masse est tellement élevée que la force gravitationnelle devient supérieure aux forces électriques qui structurent chaque molécule de H2, de sorte que ces molécules sont brisées en protons et électrons. Cette "soupe" est appelée "plasma". Les mouvements de ces particules y sont permanents. Des neutrons sont alors formés par la rencontre de protons avec des électrons, et quand un neutron rencontre un proton on obtient un corps stable.

force-nucleaire.jpg

Lorsque ceux-ci collisionnent entre eux on obtient alors des corps à deux protons et deux neutrons où les neutrons jouent le rôle de "colle" entre les protons. Cette effet de colle joué par les neutrons est appelé "force nucléaire", ou encore "interaction forte" car elle est beaucoup plus forte que la force électrique qui repousse les deux protons entre eux. Ainsi dans l'image ci-contre la force de répulsion entre les deux protons (rouge, charges +) est plus que compensée par l'attraction de la force nucléaire exercée par les neutrons (gris, charges 0).

Des paquets de protons+neutrons de tailles différentes sont ainsi formés. Lorsqu'ils se trouvent à la surface de ces immenses corps célestes que sont les étoiles, ils sont alors dans des conditions physico-chimiques de plus faible pression et température (cette dernière n'étant plus que de quelques milliers de degrés) de sorte que des orbites électroniques sont possibles. Ainsi à l'amas de deux protons et deux neutrons de l'image précédente peuvent se lier en orbite deux électrons, de sorte que l'ensemble de ce système stable forme un atome d'hélium (He).

etoile-usine.png

Neutrons en gris et protons en rouge. L'image ne peut représenter tous les nucléons (protons et neutrons) ainsi on peut constater dans le tableau périodique que l'atome d'oxygène contient 8 protons et l'atome de Na en contient 11.

Par le même type de processus apparaissent tous les autres atomes repris dans le tableau périodique : des corps stables contenant des quantités différentes de protons et neutrons sont formés selon le même procédé que pour l'hélium, le nombre d'électrons (signe -) apparaissant étant égal à celui des protons (signe +). Ces électrons sont positionnés en couches composées de 2 électrons pour la première (la plus proche du noyau) et 8 par couche supplémentaire, sauf la dernière qui contient un nombre d'électrons inférieur ou égal à huit.

Les étoiles sont donc des "fabriques à atomes" (cf. supra le #tableau-periodique des éléments).

Affinons notre compréhension de la dynamique des forces électromagnétiques et nucléaires. Plus un noyau est lourd, plus il a d'électrons (puisque la stabilité de l'atome requiert #protons=#électrons) ⇒ plus il y a d'orbites, moins forte est la force d'attraction du noyau sur les électrons des orbites plus éloignées (alors que ceux-ci sont repoussés par les électrons de la couche précédente). Ces électrons instables vont faciliter les réactions chimiques avec d'autres atomes.

Ions

Si l'on prend par exemple deux atomes Na et Cl on constate que la dernière couche du Na ne contient que 11-2-8=1 électron et va avoir tendance à le perdre lorsqu'il rentre en contact avec un atome tel que Cl dont la couche extérieure contient 17-2-8=7 électrons (notion d'affinité électronique qui est fonction du nombre d'électrons en couche externe et de la distance entre celle-ci et le noyau). L'atome Na devient donc un ion Na+ tandis que l'atome Cl devient un ion Cl (un atome est neutre tandis qu'un ion a une charge électrique non neutre). Étant de signes opposés ces ions Na+ et Cl vont alors s'attirer, et ainsi former des amas à structure symétrique que l'on appelle des cristaux (exemple : le sel NaCl).

H2O.png

H2O : interaction intra-moléculaire.

D'autre part on comparera utilement la formation de la molécule de NaCl avec celle de H2O. Dans ce dernier cas il n'y a pas transfert mais mise en commun d'électrons de deux atomes d'H avec une atome d'O de sorte que la dernière couche orbitale de l'atome d'oxygène (8-2=6) est complétée à 8.

liquide.png

H2O : interaction inter-moléculaire. NB : "=" signifie "2-".

Au niveau des interactions inter-moléculaires, on peut considérer chaque atome H d'une molécule H2O comme chargé 1+, et l'atome O de cette molécule comme chargé 2+. Ainsi l'image ci-contre montre que l'atome H d'une molécule H2O est attiré par un atome O d'une autre molécule H2O (on parle de "liaison hydrogène"). Mais cette attraction est relativement faible, ce qui fait de H2O un liquide (dans des conditions de température ni trop élevée ⇒ vapeur, ni trop basse ⇒ glace). De même cette attraction inter-moléculaire est forte chez les solides et quasiment inexistante chez les gaz.

sable.jpg

Dans le cas de la molécule de silice SiO2 la force d'attraction intermoléculaire est beaucoup plus forte, il s'agit d'un solide, qui le sera d'autant plus si dans les interstices viennent s'imbriquer des atomes de calcium, formant ainsi des silicates (roches, grains de sables, ...).

Les interactions électriques sont également à la base des grandes et complexes molécules organiques, composées de C, O, H, N, ..., telles que l'ADN, molécule composée de milliards d'atomes, et contenant le code génétique des organismes vivants. Le nombre de combinaisons possibles est quasiment infini.

chaine-phospholipides.jpg

Enin les phospholipides sont des molécules en forme de "tête" avec deux "queues", celles-ci forment des chaînes avec d'autres molécules de phospholipides, constituant ainsi les membranes cellulaires. Les têtes peuvent s'emboîter les unes avec les autres, formant ainsi des êtres pluricellulaires. Tout cela par l'effet des forces d'attraction électriques.

La force électrique est donc à la base de la vie.

Liaison covalente
https://philosophie.jortay.net/savoir-scientifique-base#liaison-covalente
triangle-clipedia.png Vidéo Clipedia : Pourquoi le carbone ?

Des atomes identiques ou différents peuvent former des molécules en se liant par partage de deux électrons libres de leur couche externe (appelée "couche de valence"). Ce doublet d'électrons joue donc le rôle de "colle", appelée "liaison covalente. Plus un atome disposent d'électrons libres, plus il est à même de faire des liaisons covalentes avec d'autres atomes.

La règle de l'octet permet de déterminer le nombre d'électrons libres. Les atomes avec un numéro atomique Z ≥ 4 tendent à se combiner de façon à avoir huit électrons dans leur couche de valence (ce qui leur donne la même structure électronique qu'un gaz noble). N.d.A. : ainsi # e- libres = 8 - ( numéro atomique - # e- des couches inférieures) (PS : nous verrons plus loin qu'il existe des exceptions à cette règle).

  • liaisons-hydrogene.jpg

    Oxygène (O). Son numéro atomique est 8 (cf. supra #atomes) ⇒ # e- libres = 8 - ( 8 - 2 ) = 2 électrons libres. Il peut ainsi faire deux liaisons covalentes simples (exemple : H2O) ou une liaison covalente double (exemple : O2).

  • Azote (N). Son numéro atomique est 7 ⇒ # e- libres = 8 - ( 7 - 2 ) = 3 électrons libres. Il peut ainsi faire trois liaisons simples (exemple : NH3 appelé "ammoniac") ou une liaison triple (exemple : N2).

  • Carbone (C). Son numéro atomique est 6 ⇒ # e- libres = 8 - ( 6 - 2 ) = 4 électrons libres. Il peut ainsi faire quatre liaisons simples (exemple : CH4 appelé "méthane"). Lorsque toutes ses liaisons simples sont avec d'autres atomes de carbone, il forme un cristal de carbone, un des matériaux les plus solide qui soit (il ne fond qu'aux températures les plus élevées), dont un type célèbre est le "diamant".

pentane.jpg

Pentane (C5H12) : deux des douze atomes H ne sont pas visibles car représentation 3D.

Les liaisons permettent de nombreuses combinaisons en formant diverses chaînes atomiques. Partons ainsi du C5H12 (pentane) où les deux atomes de carbone externes de la chaîne sont liés à trois hydrogènes tandis que chacun des atomes de carbone internes est alors lié à 4-2=2 hydrogènes (cf. image ci-contre).

pentadiene.jpg

Pentadiène (C5H8).

Si à partir du pentane ci-dessus on transforme les second et quatrième carbones de telle sorte qu'ils forment avec le carbone qui les précède une liaison double, on aura automatiquement 2*2=4 atomes H en moins ⇒ on obtient du C5H8 (pentadiène). Il y a ainsi modification de la composition et de la géométrie de la molécule, ce qui implique généralement une modification de ses propriétés physico-chimiques. En l'occurrence, alors que le pentane C5H12 est dit "saturé" (en H), car on a associé aux atomes de C le maximum possible d'atomes H, le pentadiène C5H8 est quant à lui "insaturé".

cyclopentane.jpg

Cyclopentane (C5H10).

Si, toujours à partir du pentane C5H12, on referme celui-ci en une boucle, il faudra pour cela retirer un atome H au deux carbones externes ⇒ on obtient du C5H10 (cyclo-pentane). Et à cette nouvelle configuration de la composition et de la géométrie de la molécule, correspondent de nouvelles propriétés physico-chimiques.

ethane-ethanol.gif

Animation : ajout d'une fonction alcool.

Fonctions

Pour modifier les propriétés physico-chimiques d'une molécule on peut également lui ajouter une "fonction", en lui ajoutant un atome de nouveau type. Prenons ainsi le cas de l'éthane (C2H6) : si l'on place un oxygène entre un hydrogène et son carbone, on obtient alors de l'éthanol (C2H5OH). En l'occurrence on obtient une "fonction alcool" (OH).

acide-ethanoique.jpg

Acide éthanoïque (ou acétique) CH3COOH.

On peut aussi obtenir de l'alcool à partir de sucre au moyen de levures. D'autres bactéries peuvent à leur tour transformer l'alcool C2H5OH en acide éthanoïque (ou acétique) CH3COOH (vinaigre) : les deux H du carbone voisin du O sont remplacés par un liaison double avec un autre C ⇒ On a ainsi transformé la "fonction alcool" (OH) en "fonction acide carboxylique" (COOH).

Bactéries et levures sont des micro-organismes vivants (encore appelés microbes). La notion d'organisme vivant sera développée plus loin (#la-vie).

glycine.jpg

Glycine NH2CH2COOH.

On peut ajouter plusieurs fonctions. Par exemple si, partant de l'acide éthanoïque ci-dessus on remplace un des trois H du C externe de la chaîne, par un azote (qui est lié à deux H puisque l'azote a trois électrons libres) ⇒ on ajoute ainsi une "fonction amine" (NH2), qui donne de la glycine NH2CH2COOH. La combinaison de fonctions acide et amine est appelée fonction "acide aminé". Les acides aminés sont une des "briques de base" pour fabriquer des protéines (macromolécules constitutives des cellules vivantes).

Ainsi les doubles liaisons, les cycles (boucles), les ramifications et les fonctions ouvrent la porte à une nombre immense de combinaisons possibles d'atomes et de molécules.

Cohésion nucléaire

https://philosophie.jortay.net/savoir-scientifique-base#cohesion-nucleaire
triangle-clipedia.png Vidéo Clipedia : Isotopes et radioactivité

La théorie électromagnétique permet d'expliquer la dynamique des force inter-atomiques, c-à-d entre atomes. Nous verrons infra que sa formulation est F(r) = kC * q1 * q2 / r 2 n_force-de-coulomb, où q1 et q2 sont deux charges électriques, r la distance qui les sépare, et kC une constante universelle.

Mais pour ce qui concerne la cohésion intra-atomique c-à-d entre particules constitutives du noyau atomique (protons + et neutrons 0), la théorie électromagnétique n'est plus suffisante puisque, étant de même signe, les protons se repoussent. Or les atomes sont généralement stables. Les physiciens ont donc été conduits à en conclure qu'au niveau du noyau atomique intervient une autre force, plus forte que la force électrique. C'est la force attractive, dite "nucléaire".

Nous allons voir que celle-ci est une force par laquelle les neutrons jouent le rôle de "colle" entre les protons du noyau atomique (nous verrons plus loin que l'on considère en pratique deux types de force nucléaire : forte et faible). Sa formulation est nettement plus complexe que celle de la force électromagnétique (elle fait appel à la mécanique quantique), et est encore l'objet de propositions diverses, dont un exemple est l'équation de Klein-Gordon (dont le développement sort du cadre de cette publication) :

klein-gordon.svg

N.d.A. La fonction d'onde Ψ(r,t) exprime la position d'une particule à la position r et à l'instant t. Elle est telle que Ψ( r , t ) = < r | Ψ(t) > qui exprime que ... (à faire).

electromagnetique-vs-nucleaire.jpg

Le graphique ci-contre illustre le fait qu'à l'échelle de taille du noyau atomique (10-15 m), la force nucléaire est nettement plus puissante que la force électromagnétique.

carte-isotopes.jpg

Le graphique ci-contre exprime le nombre de neutrons d'un atome en fonction de son nombre de protons (c-à-d son numéro atomique Z). Il montre donc le nombre d'isotopes (cf. supra #isotopes) de chaque atome (isotopes également appelé "nucléides" lorsqu'on les caractérise en outre par leur état d'énergie nucléaire). Notons qu'outres les isotopes naturels, d'autres isotopes peuvent être créés au moyen d'un accélérateur de particules (cf. infra #accelerateur-particule). Les cases intermédiaires vides, telles que la case (2,3), correspondent à des isotopes fugaces c-à-d qui disparaissent très vite. Les cases grises correspondent aux isotopes les plus stables, qui sont généralement les isotopes naturels. Les isotopes mentionnés en cases blanches constituent une classe intermédiaire d'isotopes dits "instables".

On constate dans ce graphique que les isotopes naturels (cases grises) sont les plus proches de la diagonales c-à-d qu'ils ont généralement un nombre de neutrons proche de leur nombre de protons. Cela est cohérent avec le fait que la force nucléaire est plus forte entre nucléons différents (proton-neutron) qu'entre nucléons identiques (proton-proton, neutron-neutron).

N.d.A. Autrement dit : FN = kN * / ( #protons - #neutrons ) ⇒ la force de cohésion nucléaire est d'autant plus forte que #protons - #neutrons est petit c-à-d que #neutrons est proche de #protons.

carte-isotopes-2.jpg

Cependant le graphique ci-contre montre que cette propriété selon laquelle les isotopes les plus stables sont ceux avec un même nombre de protons et neutrons est de moins en moins vraie au fur et à mesure qu'augmentent le nombre de protons, et partant la masse atomique. L'explication de ce phénomène est qu'avec l'augmentation du nombre de protons, il y a augmentation relative des forces électromagnétiques répulsives entre ces nucléons identiques, et cela alors que la force nucléaire est moins forte entre nucléons identiques qu'entre nucléons différents. Par conséquent la cohésion de l'atome ne peut être alors préservée que par une augmentation plus importante du nombre de neutrons (d'où l'expression de "colle" pour décrire la fonction de cohésion exercée par les neutrons dans la force nucléaire).

Dans le graphique supra on voit que l'élément stable le plus lourd est le Plomb (126 neutrons pour 82 protons). La droite noire allant de ce point à l'origine des axes est appelée "vallée de la stabilité", car les isotopes instables situés aux alentours ont tendance à se désintégrer (notion de radio-activité) pour dériver vers l'état stable

N.d.A. Il y a là une analogie avec la notion de "puits de potentiel" (que nous étudierons dans le chapitre suivant consacré autres interactions entre les corps).

Radioactivité

Ce phénomène physique par lequel des noyaux atomiques instables se transforment spontanément en d'autres atomes (en émettant simultanément des particules de matière et de l'énergie) est appelé "radioactivité". Dans le graphique ci-dessus les couleurs aux alentours de la ligne de stabilité correspondent à des modes de désintégration c-à-d de radioactivité.

Prenons le cas de la radioactivité du 14C : un des 8 neutrons se transforme en 1 proton, 1 électron et 1 antineutrino. L'augmentation du nombre de protons, de 6 à 7, transforme l'atome de carbone en atome d'azote (transmutation, cf. supra #tableau-periodique). D'autre part l'émission d'un électron correspond à une émission d'énergie que l'on appelle rayonnement/désintégration/radiocativité β. Nous verrons plus loin qu'il existe différents type de radioactivité, selon le type de particule émise : β+, β, α.

Radiothérapie. Le phénomène de radioactivité, donc de désintégration de noyaux d'atomes, est utilisé pour détruire des cellules cancéreuses en leur faisant subir un rayonnement radioactif. Celui-ci a pour effet de provoquer une mutation de leur ADN, de sorte que leur reproduction sera bloquée. Un avantage de la radiothérapie est qu'elle ne nécessite pas d'opérer le patient. La radiothérapie doit cependant veiller à ce que ses effets collatéraux c-à-d la destruction de cellules saines ne l'emporte sur la destruction de cellules cancéreuses.

triangle-clipedia.png Vidéo Clipedia : Datation au carbone 14
periode-radioactive.jpg

Période
radioactive

La désintégration d'un isotope n'est évidemment pas instantanée, elle dure une certaine période, très variable selon le type d'isotope. D'autre part la vitesse de désintégration est proportionnelle à la quantité d'isotope subsistant (en grammes ou moles), c-à-d qu'à chaque intervalle de temps Δt la quantité N0 diminue du même facteur. Ainsi si le facteur vaut 2 ⇒ on obtient la série de points de coordonnées cartésiennes suivante :
( 0 , N0 )
( 1 , N0 / 2 )
( 2, N0 / 4 )
( 3 , N0 / 8 ), etc.
Ainsi le graphe de la quantité d'un isotope en fonction du temps est une exponentielle.

La période T1/2 est la durée au terme de laquelle la quantité a diminué de moitié. Elle est appelée "période radioactive" ou plus simplement "période" d'un isotope. On utilise parfois aussi la dénomination "temps de demi-vie" ou plus simplement "demi-vie" (NB : qui ne signifie pas que l'isotope s'est totalement désintégré au terme de la seconde demi-vie, puisque la courbe est asymptotique à l'axe du temps). La demi-vie constitue donc une mesure temporelle de la radioactivité : plus un nucléide est radioactif ⇒ plus vite il se désintègre ⇒ plus courte est sa période. Il y a donc relation inverse entre période et radioactivité c-à-d entre durée et intensité de la radioactivité.

tableau-demi-vie.jpg

Le tableau ci-contre montre que la période varie considérablement entre isotope, l'écart couvrant plusieurs ordres de grandeur. On constate notamment la période tellement courte du béryllium-8 (8Be), expliquant pourquoi il n'est pas repris dans le graphe supra #neutron=F(#protons). C'est typiquement le cas d'un isotope "non naturel" c-à-d qu'on ne peut observer (brièvement) qu'au moyen d'un #accelerateur-particule. Le molybdène-99 (99Mo), qui a une période de 66 heures, sert de précurseur d'éléments utilisés en radiothérapie. La période du célèbre carbone-14 (14Ca) – utilisé pour la datation archéologique – est d'environ 5.730 années. Le carbone-14 est donc plus radioactif que le plutonium-239 (239Pu), utilisé dans les bombes atomiques, et dont la demi-vie est de 24.000 ans. Enfin l'uranium-235 (235U), combustible primaire de la plupart des centrales nucléaires, est encore moins radioactif puisque sa demi-vie est d'environ 700 millions d'années.

C'est à partir d'une période d'un milliard d'années que l'on considère un isotope comme "faiblement radioactif". On considère qu'un élément est stable si sa période est d'au moins mille milliards d'années.

N.d.A. Le scientifique de Clipedia reconnaît que les critères permettant de qualifier un élément de "faiblement" ou "fortement" radioactif ne sont "pas clairs". Il n'en dit malheureusement pas plus. Je suppose que les critères sont d'ordre médical. Il serait intéressant d'en savoir plus, alors que les conditions d'affections sévères causées par la radioactivité semblent semblent être plus difficilement réunies que ce que l'on croyait, comme le suggèrent l'état de la faune et de la flore dans la région de Tchernobyl [source] ou encore la très faible augmentation du nombre de cancers suite à l'accident de Fukushima [source]. Pour une analyse économique de cette problématique voir konfedera.org/developpement-durable#problematique-energetique.

Étudier la technique de datation au carbone-14 est l'occasion d'illustrer des phénomènes physiques et biologiques très importants. À commencer par la photosynthèse, processus par lequel les végétaux captent le CO2 de l'atmosphère et la lumière ambiante comme sources de matière première et d'énergie, pour fabriquer leur matière organique et permettre ainsi leur croissance. Ce CO2 se retrouve donc dans les végétaux et les animaux qui se nourrissent de végétaux, ainsi que les animaux prédateurs d'herbivores. D'autre part une partie constante du carbone dans l'atmosphère est composée de carbone-14 : 14CO2 / CO2 ≈ 10-12. Cette constance est due au fait que la désintégration naturel du 14CO2 en azote est compensée par le fait que dans la haute atmosphère se produit une réaction nucléaire entre rayons cosmiques et azote, qui transforme celui-ci en 14CO2. Le taux de 10-12 se retrouve donc dans les végétaux et animaux, et s'y maintient jusqu'à leur mort (puisque la quantité de 14CO2 est renouvelée par le métabolisme des organismes vivants, et que leur espérance de vie est très inférieure à la période du carbone-14). AU décès des organismes vivants leur métabolisme s'arrête, de sorte que seule opère la désintégration du 14CO2. Par conséquent le taux de 14CO2 contenu dans un débris d'organisme mort permet de déduire la date de celle-ci à partir du graphique supra où N0=10-12. La datation au carbone-14 est suffisamment précise pour des organismes décédés il y a moins de cinquante mille ans. Mais au-delà la quantité de 14CO2 est trop faible que pour être mesurée avec suffisamment de précision (⇒ on utilise aujourd'hui d'autres isotopes pour la datation archéologique).

Interaction

https://philosophie.jortay.net/savoir-scientifique-base#interaction

N.d.A. Par "interaction" on entend "interaction non locale de corps séparés dans l'espace", autrement dit "action à distance".

Cette notion "d'action à distance" peut-être abusive voire fausse :

  • d'une part "interaction" implique "action réciproque", ce qui n'est sans doute pas toujours le cas ;
  • d'autre part "à distance" traduit notre perception de la réalité, or la séparation apparente entre corps est peut-être illusoire, ou peut-être encore s'agit-il plutôt d'un gradient dans la notion de séparation.
 7.1. Électricité
 7.2. Loi de Gauss
 7.3. Potentiel
 7.4. Ondes gravitationnelles
 7.5. Optique

Électricité

https://philosophie.jortay.net/savoir-scientifique-base#electricite
 7.1.2. Applications techniques
 7.1.2. Loi de Coulomb
 7.1.3. Champ électrique
Applications techniques
https://philosophie.jortay.net/savoir-scientifique-base#electricite-applications-techniques

Nous avons évoqué les mécanismes notamment microscopiques de l'électricité. Ce phénomène peut être facilement observé à l'échelle humaine en frottant un objet de cuivre (forte affinité aux électrons c-à-d forte propension à les attirer) avec un chiffon de coton (faible affinité), ce qui va séparer les charges positives des charges négatives, et ainsi provoquer un transfert d'électrons du chiffon vers le cuivre. Le premier étant ainsi chargé positivement (puisqu'il a perdu des électrons à partir d'une situation de charge neutre) et le second négativement (puisqu'il a gagné ces électrons à partir d'une situation de charge neutre) une force d'attraction apparaît entre les deux au point que le chiffon peut rester collé à l'objet de cuivre. Ce phénomène est appelé "électrisation".

cu.gif

Ce bloc de cuivre forme un réseau cristallin, comme le NaCl, mais avec cette différence que la cohésion de ce cristal de cuivre est formé par la mise en commun des électrons périphériques, plutôt que par un transfert d'électrons (Na --> Cl : cf. supra #ions) : les électrons périphériques de chaque atome de Cu circulent librement entre ceux-ci, en exerçant ainsi un rôle de "colle" entre les atomes de cuivre, et en faisant de ce métal un bon "conducteur" (contrairement au bois ou au plastique, qui sont ainsi de bons isolants).

claquage.jpg

Claquage. Si le nombre de ces électrons "injectés" par l'électrisation devient très élevé, alors les forces de répulsion entre électrons peuvent avoir pour effet d'en éjecter. On observe alors un "claquage électrique" formant un "arc électrique", communément appelé "éclair".

Plasma. L'image ci-dessus est celle d'un lampe à plasma : la boule métallique baigne dans un gaz à l'état de plasma (ce qui ralentit l'effet de claquage). Un plasma est un état de la matière dans lequel les atomes ont perdu leurs électrons, de sorte qu'ils circulent au gré des forces qu'ils rencontrent. Nous avions évoqué le plasma dans la formation des étoiles et de la matière après le "big bang" (cf. #plasma). Des plasmas sont développés pour étudier le phénomène de fusion nucléaire.

pile-cu-zn.jpg

Le bâton cuivre est plongé dans une solution de sulfate de cuivre, et le bâton de zinc dans une solution de sulfate de zinc.

Une notion importante est "l'affinité" pour les électrons : ainsi on peut créer un courant électrique passant d'un bloc de zinc vers un bloc de cuivre, car l'affinité électronique du zinc est faible tandis que celle du cuivre est élevée (on peut dire aussi que les électrons sont plus attirés par le cuivre que par le zinc). C'est le principe de la pile, illustré dans l'image ci-contre (et que nous étudierons plus en détail dans le chapitre consacré au potentiel : nous verrons notamment pourquoi une pile s'épuise, mettant ainsi un terme au courant permanent qui y circulait).

Courant

Dans la plupart des centrales électriques on créé du courant électrique grâce à une propriété importante des aimants : quand des électrons passent dans le champ magnétique généré par un aimant leur trajectoire est déviée par une force magnétique perpendiculaire (électromagnétisme). Ainsi en faisant tourner des aimants autour d'un bobine de conducteur, on y créé un courant électrique. Ainsi une force mécanique (le rotor) créé de la force électrique par l'intermédiaire de la force magnétique [pour approfondir revoir l'illustration supra du produit vectoriel par la force de Lorenz n_force-lorentz].

Les applications de courant électrique sont très nombreuses. En voici d'autres.

  • moteur-electrique.jpg

    Le moteur électrique c'est en quelque sorte l'inverse de la centrale électromagnétique : on fait passer un courant électrique au travers d'un câble baigné dans un champ magnétique, ce qui pousse vers le haut les électrons, et donc le câble dans lequel ils circulent. Un mécanisme peut alors exploiter ce mouvement du câble pour faire tourner un rotor, transformant ainsi une force électrique en force mécanique par l'intermédiaire de la force magnétique.

  • En faisant passer un flux d'électron ("courant électrique") au travers d'un fil de cuivre, ces électrons bousculent les atomes de cuivres provoquant ainsi leur mouvement, ce qui génère de la chaleur (radiateur électrique) ; au-delà d'une certaine température le fil de cuivre va chauffer à blanc c-à-d émettre de la lumière (ampoule électrique) ;
  • transport-energie.gif

    Dans l'animation ci-contre, la boule de gauche est chargée positivement et la boule de droite négativement ⇒ la première exerce une force répulsive sur la seconde. Si en outre la première effectue des mouvements de bas en haut, ceux-ci sont alors communiqués à la boule de droite. La force électromagnétique exercée par la première sur la seconde devient ainsi une onde électrique. C'est le principe de l'antenne : un mouvement de va et vient des électrons, généré le long de l'antenne émettrice, est transporté vers les électrons de l'antenne réceptrice.

Loi de Coulomb
https://philosophie.jortay.net/savoir-scientifique-base#loi-coulomb
Forme
scalaire

La loi de Coulomb décrit la force électrique exercée entre deux charges q1 et q2 séparées par une distance r :
F(r) = kC * q1 * q2 / r 2
kC est la constante de Coulomb.

On notera la similitude avec la loi de gravitation universelle (que Coulomb connaissait), qui décrit la force de gravitation FG = G * m1 * m1 / r 2 n_force-gravitation-universelle, mais dont la constante de gravitation G est énormément plus petite que kC (la force électrique est beaucoup plus forte que la force gravitationnelle).

Coulomb se doutait que les grandeurs intervenant dans le calcul de F(r) étaient q1, q2, r et une constante. Il a pu déterminer n_force-de-coulomb expérimentalement grâce à la balance à torsion.

Coulomb a ainsi pu mesurer que la force électrique (répulsive ou attractive) diminue avec le carré de la distance entre les corps chargés sur lesquels elle s'exerce :
F(r) = A / r 2
Ensuite il a mesuré, pour une distance r et une charge q2 données, le rôle joué par la charge q1 électrique sur la force électrique. Coulomb a ainsi observé une relation proportionnelle ⇒ il faut remplacer A par B*q2 :
F(r) = B * q2 / r 2
Mais en vertu du principe de conservation, la force, qu'elle soit répulsive ou attractive, est identique pour les deux charges q1 et q2 ⇒ il faut remplacer B par k*q1 :
F(r) = k * q1 * q2 / r 2
N.B. Le produit des charges est cohérent avec la propriété, à priori peu intuitive, de superposition de la force électrique : dans le graphique suivant la force électrique exercée par les trois protons de gauche ne se répartit pas sur les deux de droite, mais s'applique à chacun d'eux. Et cela on ne retrouve bien dans :
kC * 3qe * 2qe / r 2 = 6 * kC * qe2 / r 2

electricite-superposition.png

Le principe de superposition signifie donc que l'effet d'une charge q1 sur une charge q0 n'est pas influencé par l'effet d'une charge q2 sur la charge q0.

Enfin si une des deux charges est négative, alors il en de même de F(r), qui est bien alors une force d'attraction, en cohérence avec l'algèbre de l'électricité (cf. supra #algebre-electricite).

Quelle est l'unité (ou "dimension") [ kC ] de kC ? Si l'on écrit l'équation n_force-de-coulomb en remplaçant tout par les dimensions on obtient :
N = [ kC ] * C2 / m2    ⇔
[ kC ] = N * m2 / C2    ⇒
Quelle est la valeur de kC ? Si q1=q1=1C et r=1m ⇒ on observe expérimentalement que F=8,99*109N ⇒ par n_force-de-coulomb on en déduit que kC = 8,99 * 109 N * m2 / C2

C'est une valeur énorme au regard de la charge d'un électron qe = 1,6 * 10 -19 C ⇒ si l'on devait charger une bille de 10cm à 1C il y aurait tellement d'électrons dans cette bille que l'on observerait de très nombreuses expulsions d'électrons (éclairs). Si l'unité de charge qu'est le coulomb (C) est si grande, c'est parce qu'elle a été conçue dans le cadre de la force magnétique.

Vecteur
unitaire
radial

L'équation n_force-de-coulomb n'est que la forme scalaire de la force électrique, et est donc incomplète. Il convient de pouvoir déterminer la direction dans laquelle la force s'exerce ⇒ il faut passer de la forme scalaire à la forme vectorielle. Pour ce faire il suffit de multiplier la forme scalaire par un vecteur unitaire, noté 1r (ou encore ur ou er selon les auteurs) : par n_vecteur-unitaire-2 :
F = F * 1r     ⇒
F = kC * q2 * q1 / r 2 * 1r

force-coulomb-vectorielle.png

Comment calculer ce vecteur unitaire ? L'axe des forces électriques agissant sur les charges q1 et q2 passe par ces deux charges (leur centre de gravité). Or, par n_addition-soustraction-vectorielle, le vecteur reliant celles-ci correspond à la définition de la différence de leurs vecteurs positions r1 = (x1, y1, z1) et r2 = (x2, y2, z2). Par conséquent, la distance r entre les deux charges, c'est la norme du vecteur différence :
r = || r2 - r1 ||
Par conséquent, le vecteur unitaire par lequel on va multiplier F c'est bien 1r. Celui-ci est défini par n_vecteur-unitaire-2 :
1r = r / || r ||     ⇔
1r = ( r2 - r1 ) / || r2 - r1 ||     ⇔ par n_addition-vectorielle et n_module :
1r = ( x2 - x1 , y2 - y1 , z2 - z1 ) / √ ( ( x2 - x1 ) 2 + ( y2 - y1 ) 2 + ( z2 - z1 ) 2 )
qui est donc le vecteur direction (en norme) de la force exercée en q2 ; ce vecteur est sans dimension (m/m=1).

N.d.A. En vertu du principe d'action-réaction n_troisieme-loi-newton, tout le raisonnement ci-dessus peut se faire arbitrairement par rapport à q1 ou q2. D'autre part, en restant ci-dessus dans le cas de la force F exercée sur q2, on a que :
- F =
kC * q2 * q1 / r 2 * - 1r =
kC * q2 * q1 / r 2 * ( r1 - r2 ) / || r1 - r2 || =
kC * q2 * q1 / r 2 * ( r1 - r2 ) / r =
kC * q2 * q1 / r 2 * - ( r2 - r1 ) / r =

coulomb-exercice.jpg

Application. Soit :
• q1= -2C ; q2= 1C
• r1 = (0, 0, -1)m
• r2 = (0, 4, 2)m

r2 - r1 = (0, 4, 3)
|| r2 - r1 || = √(42 + 32) = 5

1r = (0, 4, 3) / 5 = (0, 4/5, 3/5)     ⇒
F = 8,99 109 * 1 * -2 / 52 * (0, 4/5, 3/5) N     ⇔
F = (0, -0,58, -0,43) GN
NB : les signes des charges n'ont pas d'effet sur le vecteur unitaire, qui est donc indépendant de la nature attractive ou répulsive de la force.

transport-energie.gif

Vecteur unitaire radial. Le vecteur unitaire 1r est qualifié de "radial" (d'où l'indice "r") car si l'on déplace l'une des deux charges autour de l'autre, la force décrit le cercle correspondant. Le caractère radial du vecteur unitaire dans la loi de Coulomb est à la base de la notion de champ de forces électriques. Poursuivons donc notre cheminement : Coulomb scalaire ⇒ Coulomb vectoriel ⇒ champ de forces ...

Champ électrique
https://philosophie.jortay.net/savoir-scientifique-base#champ-electrique
triangle-clipedia.png Vidéo Clipedia : Le champ électrique
levitation.jpg

Lévitation d'une feuille de papier chargée.

Si je soulève un feuille de papier non rigide à l'aide d'une tige placée en travers d'elle et à égale distance des deux bords, les deux parties non soutenues par la force mécanique de la tige sont ballantes (N.d.A. : sauf si l'expérience est réalisée en apesanteur). Par contre si cette feuille est suffisamment électrisée elle pourra être maintenue en sustentation sur toute sa surface. On dit alors qu'elle subit un "champ de forces" (électriques).

Ainsi la force électrique se distingue de la force mécanique notamment par deux propriétés :

  1. la force électrique s'exerce à distance 
  2. la force électrique s'exerce sur l'ensemble d'un corps, alors que la force mécanique s'exerce sur des points d'application, et c'est précisément cette action d'ensemble qu'exprime la notion de champ électrique, via la notion de radialité.
charge-essai.jpg

La notion de "radialité" du vecteur unitaire est donc inhérente au champ électrique. Pour modéliser ce phénomène d'action d'ensemble à distance, on va accentuer la différenciation entre q1 et q2, qui deviennent q et q0. Cette dernière est appelée "charge d'essai", pour illustrer une multitude de positions relativement à q, de sorte que la variation du vecteur r0 - rq dans l'espace décrit un volume centré sur q : le champ électrique.

Pour définir le champ électrique E correspondant à la charge q, il faut donc que sa formulation décrive uniquement l'environnement de q, indépendamment de la charge d'essai q0. Cela conduit naturellement à définir simplement le champ électrique par :
E = F / q0     ⇔
NB : où F est la force exercée sur la charge d'essai q0 ; et ainsi en connaissant E et q0 on calcule facilement F.
E = kC * q * q0 / r 2 * 1r / q0     ⇔
E = kC * q / r 2 * 1r où [E]=N/C.

Pour exprimer une charge négative (q ou q0) on remplace le symbole de la charge par sa définition du nombre négatif : x < 0 ⇔ x = - | x |

  • si q > 0 ⇒ E est de même signe que 1r ⇒ le champ est extraverti (indépendamment du signe de la charge d'essai) ;
  • si q < 0 ⇒ E est de signe opposé à 1r ⇒ le champ est intraverti (indépendamment du signe de la charge d'essai).
champ-electrique-3D.png

Partie droite : si la charge d'essai q0 était positive alors le vecteur vert F serait orienté vers q, donc dans la même direction que E. Ainsi, alors que le champ est indépendant de la charge d'essai, la force exercée sur celle-ci ne l'est évidemment pas. Corrélativement la notion de champ ne s'intéresse pas aux forces subies par la charge q qui y est associée.

champ-plasma.jpg

La lampe à plasma évoquée plus haut pour illustrer le phénomène de claquage est une parfaite illustration du champ électrique, dont la radialité et la tridimensionnalité. Et l'on constate qu'il correspond à la situation de droite dans l'illustration précédente.

champ-electrique-calcul.png

Enfin le calcul de E est facile puisque c'est une version simplifiée de F, et où, par rapport au calcul applicatif de la fin de section précédente, r2 et r1 sont remplacés par r et rq :
• r - rq = ( x - xq , y - yq , z - zq )
• r = √ ( ( x - xq ) 2 + ( y - yq ) 2 + ( z - zq ) 2 )

Nous venons de modéliser la notion champ électrique d’une seule charge ponctuelle (champ coulombien). Nous allons maintenant modéliser la répartition du champ électrique généré par une paire de charges électriques. Pour ce faire nous considérons la force totale engendrée par ces deux charges q1 et q2 sur une charge d’essai q0.

champ-charges-multipes.png

NB : le module de F2 est plus petit, car q2 est plus éloignée de q0 (PS : les vecteurs verts sont partiellement recouverts par les bleus).

Le graphique ci-contre montre que le principe de superposition que l'on avait constaté pour les forces électriques, vaut également pour les champ électriques : par n_champ-electrique-2 :
F = F1 + F2 = q0 * ( E1 + E2 ) = q0 * E
(superposition : l'effet de q2 sur q0 n'est pas influencé par l'effet de q1 sur q0).
⇒ on retrouve :
E = F / q0

n-champs.jpg

Et le principe de superposition est évidemment applicable au cas de n particules positionnées arbitrairement :
E = ∑ nEi

Lignes
de champ

Ainsi si l'on calcule les champs d'un nombre suffisant de charges d'essai on verra apparaître les "lignes de champ" qui caractérisent la répartition spatiale du champ. Les deux graphiques suivants montrent le cas de deux charges positives et égales. Celui de droite montre que l'élaboration complète de gauche répond aux règles simples de la superposition, ainsi que de la symétrie.

champ-charges-positives.png champ-charges-positives-2.png

Dans le graphique suivant les deux charges sont toujours égales en valeur absolue mais de signes opposés (champ "dipolaire"). On observe encore ici les mêmes règles simples de la superposition et de la symétrie.

champ-dipolaire.png champ-dipolaire-2.png
H2O-dipole.jpg

Les champs dipolaires sont fréquents, notamment à l'échelle microscopique. C'est ainsi le cas de la molécule d'eau (H2O), où les électrons ont tendance à se concentrer sur l'atome d'oxygène, et laissent donc des charges positives sur les deux atomes d'hydrogène ⇒ concentration de charges positives d'un côté, et de charges négatives de l'autre. Le caractère dipolaire du champ électrique associé aux molécules de H2O explique leur état habituel sous forme liquide plutôt que gazeuse. Autre application, cette fois artificielle : dans une antenne un circuit électrique entretient un courant oscillant – c-à-d alternance de la répartition opposée des charges de signes opposés entre les deux extrémités – de sorte que celles-ci constituent un dipôle oscillant. Et c'est la nature oscillante du champ dipolaire généré par l'antenne, qui génère des ondes (dites électromagnétiques.)

Abstraction
mathématique

Dans le graphique ci-dessus considérons maintenant l'une des deux charges comme une charge d'essai (disons q2). Quel est alors la force exercée sur elle ? On pourrait être tenté de répondre à cette question en appliquant E = F / q0 n_champ-electrique-2 à q2. Mais justement : q2 n'étant pas la charge d'essai relative à un champ déterminé, il existe une infinité de E que l'on pourrait choisir pour calculer F à partir de n_champ-electrique-2 ⇒ la force exercée sur q2 est indéterminée ! Un tel calcul ne fait pas sens puisque, par définition même du champ électrique, la charge d'essai n'est pas reprise dans sa configuration. Autrement dit, on doit oublier le champ généré par la charge d'essai ⇒ il ne reste plus ici que q1 à considérer. Et comme on pourrait tenir le même raisonnement en intervertissant les rôles (q1 devenant charge d'essai) on doit en conclure que le champ électrique ne correspond à aucune réalité physique (ou, pour dire les choses plus prudemment : dans le cadre des connaissances scientifiques actuelles il est difficile de conclure que le champ électrique puisse correspondre à une réalité physique). En fait le concept de champ électrique, qui change selon la charge que l'on considère pour mesurer la force, n'est qu'un outil mathématique permettant de réaliser des calculs.

On peut enfin calculer des configuration de champs complexes, comme ci-dessous, avec même pour la configuration de droite une perte apparente de symétrie.

champ-complexes.png

Cependant dans la pratique la notion de champ est surtout utilisée pour caractériser des composants de circuits électriques tels qu'un condensateur, qui n'est autre qu'un couple de plaques de charges opposées (cf. champ dipolaire) ce qui génère un champ entre les plaques (qui va permettre de contrôler les courants et tensions dans le circuit). On notera à cet égard que le nombre de charges sur ces plaques est tellement élevé (des milliards voire des milliards de milliards) qu'il serait fastidieux d'utiliser E = ∑ nEi n_superposition pour réaliser ces calculs. Dans ce type d'application on utilisera alors d'autres méthodes de calcul. Ce qui nous conduit aux chapitres suivants ...

condensateur.jpg

Le condensateur d'un circuit électronique n'est autre qu'un assemblage de deux plaques constituant un champ dipolaire.

Loi de Gauss

https://philosophie.jortay.net/savoir-scientifique-base#loi-de-Gauss
 7.2.1. Loi de Gauss : lumière
 7.2.2. Loi de Gauss : électricité
 7.2.3. Distribution de charge continue
 7.2.4. Forme locale et divergence
 7.2.5. Théorème d'Ostrogradski
 7.2.6. Méthode de Gauss : la sphère
 7.2.7. Méthode de Gauss : le cylindre
 7.2.8. Méthode de Gauss : le plan
Loi de Gauss : lumière
https://philosophie.jortay.net/savoir-scientifique-base#Gauss-lumiere
triangle-clipedia.png Vidéo Clipedia : La loi de Gauss : Introduction

La lumière est faite de particules appelées "photons" qui avancent dans l'espace à la vitesse de 300.000 km/s. La perception continue que nous avons de la lumière est due au très grand nombre de photons qui la composent (une ampoule classique en émet des milliards de milliards par seconde).

Flux

Une source de lumière, par exemple une ampoule, est caractérisée notamment par le nombre de photons émis par unité de temps :
Φ = ΔN / Δt   (prononcer "phi")

Ce débit (ou flux), multiplié par l'énergie des photons, détermine la puissance de la source lumineuse.

Source interne. Supposons que cette ampoule est entourée d'une sphère de verre parfaitement transparente (c-à-d qu'elle laisse passer tous les photons). Soit ΦS le nombre de protons passant au travers de cette surface sphériqueΦ = ΦS (NB : Φ est le flux émis par la source, tandis que ΦS est le flux passant par la surface. On notera que cette mesure est indépendante de la taille et même de la forme de cette surface (dite "surface de Gauss") englobant la source lumineuse.

Source externe. Maintenant déplaçons cette surface de sorte qu'elle ne contient plus la source lumineuse ⇒
Φ > ΦS
et l'ont peut en outre distinguer :
• le flux sortant de ΦS, auquel par convention on attribue une valeur positive : Φs = |Φs| ;
• le flux entrant dans ΦS, auquel par convention on attribue une valeur négative : Φe = -|Φe| ;
or étant donné que par nature :
• ΦS = |Φs| - |Φe|     ⇒ par convention :
  ΦS = Φs + Φe
• si |Φe| > 0 ⇒ |Φs| = |Φe|     ⇒ par convention :
  Φs = - Φe     ⇒
  ΦS = Φe + Φs = 0

En résumé :

  • source interne à la surface de Gauss : le flux passant par la surface est égal à celui issu de la source : ΦS = Φ
  • source externe à la surface de Gauss : le flux passant par la surface est nul : ΦS = 0
Surface
ouverte

Maintenant plaçons-nous dans le cas de la source externe, et enlevons comme un couvercle la surface correspondant au flux entrant. La question qui se pose alors est de savoir ce que vaut ΦS, le nombre de photons passant au travers de cette surface ouverte.

La réponse n'est pas évidente puisque :
• la source n'étant pas interne ⇒ ΦS ≠ Φ ;
• la source n'étant pas externe ⇒ ΦS ≠ 0 ...

film-savon.jpg

Film de savon bordé par un contour tordu

N.B. Quand on parle de "surface ouverte" il faut entendre "surface limitée par un contour", ce qui n'est pas le cas d'une sphère, qui est une surface fermée sur elle-même, et ne définit donc pas de contour. Le soufflage de bulles de savon illustre parfaitement cette notion de surface ouverte : si l'on ne souffle pas trop longtemps/fort dans le cercle, la "bulle" non décrochée est encore ouverte. Et si l'on arrête alors de souffler, la forme presque totalement sphérique redevient le cercle plat déterminé par le contour de l'instrument. Cette presque bulle et ce cercle plat sont deux cas de "surfaces ouvertes".

Par convention on représente cette surface "en coupe", c-à-d coupée par un plan perpendiculaire à l'axe de vision ⇒ on obtient une ligne quelconque (une droite dans le cas du cercle plat orienté non parallèlement au plan).

comptage-photons.png

Densité
de flux

Supposons maintenant une source lumineuse émettant un faisceau parallèle. L'image ci-contre représente un volume ΔV contenant ΔN photons, passant à vitesse v au travers de la surface S pendant une durée Δt. D'autre part on suppose que la densité volumique des photons η = ΔN / ΔV est connue.

On a donc que :
• ΔV = v * Δt * S    (par n_vitesse )
• ΔN = η * ΔV

ΔN = η * v * Δt * S
or par définition :
ΦS = ΔN / Δt     ⇒
ΦS = η * v * S

Ce résultat intuitif montre donc que l'intensité du flux sur une surface S est déterminée par le produit densité*vitesse, que l'on appelle la "densité de flux" :
F = η * v     ⇒
ΦS = F * S     ⇔
F = ΦS / S

La densité de flux mesure donc le flux par unité de surface. C'est la mesure de l'intensité de la lumière émise par la source.

comptage-photons-2.png

On va maintenant généraliser au cas d'une surface inclinée d'un angle θ (par rapport à la perpendiculaire au champ de photons). En outre cette surface est de forme carrée telle que S=L2. Le volume de Gauss devient donc :
ΔV = v * Δt * L * h    ⇔
ΔV = v * Δt * L * L * cosθ    ⇔
ΔV = v * Δt * S * cosθ    ⇒
ΔN = η * ΔV = η * v * Δt * S * cosθ    ⇒
ΦS = ΔN /Δt = η * v * S * cosθ    ⇔
ΦS = F * S * cosθ

Ainsi en comparant n_densite-flux et n_F*S*cosθ, cosθ (dont la valeur absolue est ≤ 1) apparaît comme un facteur de réduction de la surface suite à son inclinaison. En fait il s'agit de la réduction de la surface "de prise au flux". Ainsi si θ=π/2, plus aucun photon ne traverse la surface, et cos(θ)=0.

comptage-photons-3.png

Alternativement, en associant cosθ à v (ΦS = η * v * S * cosθ), on peut le voir aussi comme un facteur de réduction de la vitesse, car seule la composante normale (perpendiculaire à la surface) de la vitesse intervient dans le calcul du flux.

Cette remarque nous conduit naturellement à introduire la notation vectorielle : F = η * v de sorte que F caractérise le flux non seulement dans son intensité mais aussi sa direction.

F représente donc le champ vectoriel des photons.

vecteur-de-surface.png

Vecteur de
surface

Nous pouvons maintenant introduire une notion fondamentale de la loi de Gauss : le vecteur de surface S, normal à la surface (c-à-d perpendiculaire à celle-ci), et dont le module est cette même surface. Ce vecteur va permettre d'exprimer également l'orientation de la surface.

On arrive à cette notion de vecteur de surface en considérant que puisque θ est l'angle séparant F et S (tous deux sont perpendiculaires aux axes formant θ) on peut donc considérer ΦS = F * S * cosθ comme un produit scalaire n_produit-scalaire-trigono :

ΦS = F . S
S est appelé "vecteur de surface".

S * cos(θ) est donc la projection du module S sur la direction du flux F.

Surface quelconque. Étendons la généralisation en considérant maintenant une surface ouverte de forme quelconque. Ensuite découpons-là en damier de petites surfaces carrées telle que :
S = ∑n=1N ΔSn

vecteur-de-surface-2.png

Comme ces carrés peuvent être arbitrairement petits on peut alors approcher idéalement la surface ouverte quelconque. Chacun de ces petits carrés peut être représenté par son vecteur de surface, de sorte que leur somme est aussi vectorielle :
S = ∑n=1N ΔSn
⇒ on peut alors décrire le flux passant par chacun de ces petits carrés :
ΦΔSn = F . ΔSn
ΦS = ∑n=1NΦΔSn = ∑n=1N F . ΔSn    ⇔
ΦS = F . ∑n=1N ΔSn = F . S

On retrouve donc le même résultat que celui obtenu avec la surface carrée, de sorte que l'on peut faire le même type d'interprétation de cos(θ) : soit comme facteur de réduction de la surface suite à son inclinaison, soit comme facteur de réduction de F via la vitesse.

gauss-champ-non-uniforme.png

Champ non uniforme. Continuons la généralisation en considérant maintenant un champ non uniforme : la source émet maintenant dans toutes les directions, de sorte que F est variable sur la surface, ce que l'on va exprimer en le notant Fn. Mais alors la dernière égalité n'est plus valable car Fn ne peut plus être extrait de la somme puisqu'il dépend de n (et n'est donc plus constant) :
ΦS = ∑n=1NΦΔSn = ∑n=1N Fn . ΔSn

gauss-champ-non-uniforme-2.png

Si l'on perd en simplicité on gagne cependant en généralité car maintenant on va pouvoir supposer n'importe que forme pour la surface de Gauss ! Pour cela on va passer à la limite infinitésimale :
ΔSn → dSn    ⇒
ΦS = ∫s F . dS

NB : les indices n doivent être enlevés car ces dS sont en nombre infini, donc non énumérables.

forme-vectorielle-lapin.jpg
gauss-champ-non-uniforme-3.png

Notons que la formulation ci-dessus est minimaliste : sa notation complète (mais rare) est plutôt : ΦS = ∫s F(r) . dS(r). C'est en effet le vecteur position r qui détermine un point particulier sur la surface de Gauss, auquel correspond un vecteur de surface dS(r) d'inclinaison particulière par rapport au champ F(r).

Surface quelconque fermée. La surface de Gauss est fermée par définition. On le formule au moyen d'une notation spéciale de l'intégrale, dont le signe est maintenant affublé d'un petit cercle : ΦS = ∮s F . dS = Φ

Rappel : le flux émis par la source (Φ) est égal à celui passant par la surface (ΦS) dès lors que celle-ci englobe la source n_source-interne-externe.

gauss-source-interne.png

Par convention les physiciens ont choisi que les vecteurs de surface d'une surface fermée sont sortants, que la source soit interne ou externe. Il en résulte qu'un flux sortant d'une surface fermée est toujours positif : car on a alors θ<π/2cos(θ)>0. En effet θ<π/2 puisque d'une part dS est perpendiculaire à la surface, et que d'autre part F ne peut former un angle supérieur à π par rapport à celle-ci, qui entoure la source.

N.d.A. Cette convention est la corollaire de la double convention Φe = -|Φe| et Φs = |Φs| ayant conduit à ΦS = Φe + Φs = 0 n_source-interne-externe.

ggauss-source-externe.png

Le graphique ci-contre illustre le cas d'une source externe. Les produits scalaires n_flux-est-produit-scalaire correspondant à la calote d'entrée (Φe) sont négatifs car leur θ>π/2 ⇒ leur cos(θ)<0. La limite de cette calotte correspond au passage des cos(θ) de valeurs négatives à positives c-à-d au passage de θ>π/2 à θ<π/2 de sorte que ce point de passage est tel que θ=π/2 c-à-d la perpendicularité entre les deux vecteurs F (tangent à la surface, et sortant de celle-ci) et dS.

N.B. Étant donné la forme quelconque de la surface fermée, si le nombre de photons est très faible on pourra avoir des mesures sur des dt telles que e| ≠ |Φs|. Cependant l'égalité Φe = - Φs est bien vérifiée en moyenne sur une certaine période.

Nous somme maintenant en mesure d'exprimer la loi de Gauss pour la lumière.

gauss-lumiere.png

Pour ce faire on va d'abord considérer deux sources à l'intérieur de la surface fermée. À un vecteur de surface dS sont donc associés deux vecteurs F1 et F2 tels que :
ΦS = ∮s ( F1 + F2 ) . dS    ⇔
ΦS = ∮s F1 . dS + ∮s F2 . dS    ⇔
ΦS = Φ1 + Φ2

Ce résultat est inchangé si l'on ajoute une source cette fois extérieure, et dont le flux est donc nul n_source-interne-externe. Par conséquent la loi de Gauss peut être formulée généralement par :
ΦS = ∮s F . dS = ∑ Φint
où n'interviennent donc que les flux de sources internes à la surface de Gauss.

Considérons maintenant le cas d'une source lumineuse ponctuelle (que l'on peut voir comme une sphère de rayon infiniment petit) dont le débit de photons est Φ. Étant donnés ΦS=Φ (c-à-d connus) on veut calculer en tout point la valeur du champ vectoriel F( r).

Dans une première étape on considère que ΦS est une sphère de rayon r, et que Φ se situe en son centre. Dans ce cas les vecteurs de surface sont parallèles à leur densité de flux F n_densite-flux c-à-d que θ=0cos(θ)=1
ΦS = ∮ F(r) * dS
NB : ce n'est plus un produit scalaire : "*" a remplacé "."
et en outre les F(r) sont constants en raison de la symétrie du système ⇒
ΦS = F(r) * ∮ dS    ⇔
ΦS = F(r) * S    ⇔ par n_surface-cercle :
ΦS = F(r) * 4 * π * r2
or
ΦS = Φ    ⇒
F(r) = Φ / ( 4 * π * r2 )    ⇒
F( r) = Φ / ( 4 * π * r2 ) * 1r
On exprime ainsi l'intensité lumineuse en fonction de la distance à la source. Et en particulier il apparaît que la densité de flux de photons est une " fonction vectorielle radiale (cf. 1r) en 1/r2 ".

Application. Le rapport entre l'intensité lumineuse à la surface du soleil et celle de la Terre vaut :
Φ / ( 4 * π * RS2 ) / ( Φ / ( 4 * π * RT2 ) ) = RT2 / RS2 = 150.000.000 / 700.000 ≈ 46.000
⇔ le rayonnement du soleil est donc environ cinquante mille fois plus élevé au niveau du soleil qu'à celui de la terre.

Cette configuration sphérique, pas sa symétrie, a considérablement facilité le développement aboutissant à n_champ-fonction-rayon en rendant possible l'extraction de F(r) hors de l'intégrale, puisque dans cette configuration r est constant, et donc F(r) également par n_force-de-coulomb. Mais dans le cas d'un espace fermé ΦS de forme quelconque, ce n'est plus le cas, car r varie selon le vecteur de surface, et donc F(r). Dans cette situation, l'utilisation de n_∑Φint serait fastidieuse car le calcul intégral serait gigantesque. C'est là qu'intervient le théorème de Gauss, qui va démontrer que n_champ-fonction-rayon demeure la solution de n_∑Φint même en cas de surface gaussienne quelconque !

surface-sphere.gif

Théorème
de Gauss

Pour ce faire la démonstration du théorème de Gauss décompose la sphère originelle en tubes de flux, tels que le flux de protons émis par le centre de la sphère ne passe que par l'entrée et la sortie des tubes, mais pas par leur parois, de sorte que le flux de protons Φ qui sort de l'ensemble de ces tubes est égal à celui qui y entre !

La première étape du développement du théorème de Gauss consiste à décomposer la surface de la sphère en un nombre N de sections hexagonales, dont la surface unitaire ΔS vaut donc ΔS = 4 * π * r2 / N. À chacune de ces ΔS correspond donc un flux Φ/N.

gauss-theoreme.png

Coupe transversale d'une sphère recouverte de tubes de flux de longueur variable. .

On peut alors considérer des tubes de flux de longueurs différentes, ainsi que des tailles arbitrairement petites pour les sections de surface ΔS (qui deviennent des dS, avec un N arbitrairement élevé) ⇒ la surface fermée entourant la sphère avec les tubes de flux peut être de forme quelconque.

D'autre part la loupe illustre le fait que le flux ΦS/N passant au travers de la surface noir est le même que celui passant au travers de la section d'un tube de flux (en bleu) n_flux-est-produit-scalaire. Par conséquent le flux ΦS qui passe au travers de la surface quelconque entourant la sphère avec les tubes de flux est égal à celui qui passe par l'ensemble des tubes, qui est lui-même celui passant par la sphère, soit ΦΦS = Φ où ΦS est une surface fermée de forme quelconque entourant la sphère dont le centre est la source de Φ.

N.d.A. La loupe montre également que l'on peut arbitrairement approcher la propriété de départ du cas symétrique de la sphère, à savoir que les vecteurs de surface sont parallèles à leur densite de flux F n_densite-flux c-à-d que : θ=0cos(θ)=1
ΦS = ∮ F(r) * dS
où ΦS est quelconque (et donc r variable)
or soit :
dS = 4 * π r2 / N     ⇒
ΦS = ∮ F(r) * 4 * π r2 / N     ⇒
si n_champ-fonction-rayon est vrai pour ΦS quelconque ⇒
ΦS = ∮ Φ / N     ⇔
ΦS = Φ
ce qui est vrai ⇒ n_champ-fonction-rayon est donc vrai pour ΦS quelconque.

On a ainsi démontré le théorème de Gauss :
F( r) = Φ / ( 4 * π * r2 ) * 1r   ⇔   ΦS = ∮s F . dS = Φ
qui, en démontrant la validité de la transformation de la relation "⇐" en "⇔", facilite grandement l'utilisation de ΦS = ∮s F . dS = Φ dans les cas où S représente une surface quelconque.

gauss-theoreme-2.png

Coupe transversale d'une sphère recouverte de tubes de flux de longueur variable.

Le théorème de Gauss est accompagné d'un complément qui concerne le cas d'une source externe à une surface fermée, laquelle est analysée comme un agrégat de tubes de flux. Or nous avons vu que dans le cas d'une source externe ΦS est nul n_source-interne-externe.

Ce type de champ est appelé "à divergence nulle", concept intimement lié à la loi de Gauss, et qui traduit le fait que les photons traversent la sphère sans s'accumuler en son sein (ils la traverse à vitesse constante). C'est ainsi également le cas d'un champ électrique ou gravitationnel dans le vide.

Loi de Gauss : électricité
https://philosophie.jortay.net/savoir-scientifique-base#Gauss-electricite

Tous les phénomènes électro-magnétiques peuvent être décrits par le système d'équations de Maxwell (qui sort du cadre de ce cours) :

  • ∇ * B = 0
    exprime la conservation du flux magnétique n_source-interne-externe ;
  • ∇ * E = ρ / ε0
    exprime la distribution de charge continue de la loi de Gauss n_gauss-continu;
  • ∇ x E = - δB / δt
    exprime, avec l'équation suivante, le couplage (effet de boucle) entre champs électrique (E) et magnétique (B).
  • ∇ x B = μ0 * J + μ0 * ε0 * δE / δt

Le champ magnétique est plus souvent caractérisé par la densité de flux magnétique ou induction magnétique B exprimée en Teslas (T), que par son intensité H, ces deux grandeurs étant liées par la relation B = μ * Hμ représente la perméabilité magnétique du milieu.

Dans la présente section et la suivante nous allons montrer que la seconde équation correspond effectivement à la loi de Gauss, sous forme différentielle (alors que dans la section précédente on l'a développée sous forme intégrale).

Repartons du théorème de Gauss :
F( r) = Φ / ( 4 * π * r2 ) * 1r      ΦS = ∮s F . dS = Φ n_theoreme-gauss

L'égalité de gauche correspond à certains phénomènes physiques, qui peuvent être modélisés mathématiquement sous forme de fonction radiale en 1/r2 par rapport à un point déterminé de l'espace. C'est le cas du champ électrique.

En fait il y a généralisation lorsque l'on passe de Coulomb (électricité) à Gauss (lumière) :

  • électricité : champ de Coulomb : champ électrique dû à une charge ponctuelle E = kC * q / r 2 * 1r n_champ-electrique.
  • lumière : champ de Gauss : champ de "densité de flux" de particules, émises par une source ponctuelle de débit Φ F = Φ / ( 4 * π * r2 ) * 1r n_champ-fonction-rayon  et

N.d.A. : ne pas confondre le F de Coulomb, qui est la force électrique, et le F de Gauss, qui est le champ. Autrement dit : le champ de Coulomb E correspond au chams de Gauss F (densité de flux).

coulomb-gauss.jpg

Pour formaliser l'analogie entre ces deux équations il suffit de créer une variable
Φq = 4 * π kC * q
de sorte que n_champ-electrique devient :
E = Φq / ( 4 * π * r 2 ) * 1r
qui ne diffère de n_champ-fonction-rayon que par le remplacement de Φ par Φq (où l'indice q signifie qu'il s'agit d'une constante qui est proportionnelle à la charge électrique qui génère le champ).

Le champ électrique peut donc être vu aussi comme une densité de flux de particules, à tel point que les charges électriques sont parfois appelées "photons virtuels" (cf. théorie quantique des champs). On en déduit ainsi que le champ électrique obéit également à la loi de Gauss : ΦES = ∮s E . dS = ΦqΦES est donc le flux du champ électrique sur la surface fermée S. En particulier si la source est externe, alors le flux électrique net est nul par rapport à la surface fermée S.

gauss-puissance.jpg

Soulignons ici toute la puissance du théorème de Gauss n_theoreme-gauss : en substituant l'égalité de gauche dans celle de droite, on obtient une intégrale :
ΦES = ∮s Φq / ( 4 * π * r 2 ) * 1r . dS     ⇒ par n_produit-scalaire-trigono :
ΦES = ∮s Φq / ( 4 * π * r 2 ) * cos(θ) * dS
où θ est l'angle entre le vecteur de surface (perpendiculaire à la surface par définition) et l'axe passant pas la source et l'origine du vecteur de surface ⇒ comme la surface globale est quelconque (non symétrique) ⇒ θ≠0 ⇔ cosθ≠1, et r et θ varient selon le ds. Il en résulte que le calcul de cette intégrale requiert un ordinateur ... mais le théorème de Gauss nous dit précisément que, même pour une surface quelconque, la solution est tout simplement Φq !

La notion de débit de photons virtuel étant abstraite, on note ΦES en fonction de q plutôt que de Φq :
ΦES = ∮s E . dS = Φq
devient, par n_flux-photons-virtuels :
ΦES = ∮s E . dS = 4 * π kC * q

Permittivité

Cette version de la loi de Gauss fut en outre simplifiée par le chercheur autodidacte Oliver Heaviside, qui introduisit la notion de permittivité du vide :
ε0 = 1 / ( 4 * π * kC ) = 8,85*1012 C2/(N*m2)
, analogie avec la permittivité de l'air, qui est une propriété d'élasticité permettant d'expliquer la propagation des ondes acoustiques dans l'air ⇒
ΦES = ∮s E . dS = q / ε0
qui est la version moderne de la loi de Gauss pour le champ électrique.

De la même manière la forme moderne de la loi de Coulomb exprime le champ électrique en fonction de la permittivité ε0 plutôt qu'en fonction de la constante de Coulomb kC, de sorte que :
E = kC * q / r 2 * 1r     n_champ-electrique devient :
E = q / ( 4 * π * ε0 * r 2 ) * 1r .

Électrodynamique

L'équivalence entre les lois de Coulomb et de Gauss ne concerne cependant que les phénomènes électrostatiques, c-à-d lorsque la charge à la source du champ est statique. Mais lorsque l'on considère que les charges ne sont pas fixes (ce qui est généralement le cas dans le monde physique), on doit prendre en compte le fait que cette dynamique ne se propage pas instantanément sur le champ (temps de propagation des photons virtuels). Or ce retard a pour effet de supprimer la propriété de radialité : le champ n'est plus dans l'axe situé entre la charge et le point de calcul. Il en résulte que la loi de Coulomb n'est plus valable. Par contre la loi de Gauss demeure valable dans le cas de charges non statiques.

champ-electromagnetique.gif

Cette animation montre que lorsqu'un corps chargé se déplace, le champ électromagnétique qu'il génère n'est pas déplacé en bloc mais de proche en proche [source].

gauss-charge-negative.jpg

Charges
négatives

Dans le cas du champ E généré par une charge négative -|q|, celui-ci est orienté vers la charge (cf. #champ-electrique). Et comme d'autre part les vecteurs de surface d'une surface fermée sont sortants par convention (cf. supra #vecteur-surface) ⇒
θ > π / 2   ⇒   cosθ < 0   ⇒ par n_produit-scalaire-trigono :
ΦES = ∮s E . dS < 0
On le démontre trivialement en remplaçant q par -|q| dans s E . dS = q / ε0 n_Gauss-permittivite. La loi de Gauss vaut donc également pour les charges négatives.

Gauss-charges-multiples.png

Charges
multiples

La loi de Gauss devient :
s E . dS = ∑n qn / ε0
dont la démonstration est triviale :
ΦES = ∮s E . dS =
s ( ∑n En ) . dS =
ns En . dS =
n qn / ε0
CQFD

Gauss-charges-externes.png

Charges
externes

Enfin la prise en compte de charges externes est également triviale. Le graphique suivant illustre le fait que le champ généré par les charges externes modifie le champ généré par les charges internes. On montre que le résultat est cependant sans effet, en prenant le cas d'une charge externe qm :
ΦES = ∮s E . dS =
s ( ∑n En + Em ) . dS =
ns En . dS + ∮s Em . dS =
par n_source-interne-externe :
ns En . dS =
n qn / ε0
CQFD
Autrement dit, seules interviennent les charges internes dans la loi de Gauss, que l'on peut donc énoncer comme suit : « l'intégrale de flux d'un champ électrique sur une surface fermée est donnée par la somme des charges que contient cette surface, divisée par la permittivité du vide » .

Distribution de charge continue
https://philosophie.jortay.net/savoir-scientifique-base#Gauss-distribution-continue

Nous allons ici généraliser la loi de Gauss pour les distributions de charges continues. Cette notion est illustrée par une expérience d'électrostatique consistant à accumuler des charges de signes oppposés dans deux boules, jusqu'à ce qu'un certain seuil soit dépassé, provoquant un "claquage" : l'air s'ionise et créé ainsi le passage d'un courant d'une boule vers l'autre, ce que l'on observe sous la forme d'un arc électrique. On va étudier ici ce qui se passe dans ces boules avant le claquage : dans chaque boule la charge est statique de sorte que l'on peut appliquer la loi de Gauss.

À l'échelle microscopique les ions (+) du réseau cristallin constituant la matière métallique de la boule sont entourés d'électrons (-) en agitation thermique. Les ions sont également en agitation thermique mais beaucoup plus faible, de sorte qu'on peut les considérer comme relativement immobiles : il bougent autour d'une position d'équilibre, tandis que les électrons forment un nuage réparti dans l'ensemble du volume de la boule. Le mouvement des électrons n'est pas ordonné tant qu'il n'y a pas de courant. Mais en moyenne, dans le volume déterminé par la boule, on peut considérer que la position des charges est constante. Pour que cette condition soit vérifiée il suffit que le nombre de charges soit constant en moyenne. On est alors dans les conditions de la loi de Gauss : ensemble discret de charges statiques.

Formellement on doit préciser que seules les charges internes sont prises en considération : s E . dS = ∑nint qn / ε0

Cependant la réalité est dynamique plutôt que statique. Pour adapter le modèle à cette dynamique il faut introduire la notion de distribution de charges continue. Il s'agit de partitionner l'espace en petits cubes de volumes identiques ΔV, et dans lesquels les conditions de l'électrostatique (ensemble discret de charges statiques ⇔ ∄ courant) sont vérifiées en moyenne (notamment les sorties d'électrons hors de chaque cube sont compensées en moyenne par des entrées).

Ainsi à chaque ΔV est associée une quantité de charges (ions + électrons) ΔQ = ∑n  qn. Chacun des cubes est considéré comme chargé c-à-d de charge totale non nulle : #charges+ ≠ #charges-.

Gauss-distribution-continue.png

Densité
volumique

On introduit alors la notion de densité volumique de charge :
ρ = ΔQ / ΔV [C/m3] .

Pour exprimer le fait que ρ varie d'un cube à l'autre (et donc aussi ΔQ puisque ΔV est identique pour tous les cubes) on va identifier chacun de ceux-ci au moyen d'un vecteur position :
xm = ( xm , ym , zm )    ⇒
ρ(xm) = ΔQm / ΔV    ⇔
ΔQm = ρ(xm) * ΔV    ⇒
dans n_∑qn/ε0 on remplace alors le terme qn (représentant les charges élémentaires) par ΔQm (représentant la charge contenue par chaque cube) :
s E . dS = 1/ε0 * ∑mint ΔQm    ⇔ par n_densite-volumique-charge :
mintΔQm est la somme des charges contenues par les seuls volumes ΔV contenus dans l'espace déterminé par la surface fermée S
s E . dS = 1/ε0 * ∑mint ρ(xm) * ΔV
qui est une somme discrète ⇒ pour passer à la distribution de charge continue on va considérer que ΔV → 0ΔV = dV
• la variable discrète xm devient une variable continue x ;
• la somme discrète mint devient une intégrale VS, calculée sur le domaine du volume V enfermé par la surface S :
s E . dS = 1/ε0 * ∫vs ρ(x) * dV
où :
ε0 est la permittivité du vide n_permittivite-vide
ρ est la densité volumique de charge n_densite-volumique-charge

Gauss-distribution-continue-2.jpg

Lecture : le membre de gauche est l'intégrale d'un flux E sur une surface fermée ( ∮s ), tandis que le membre de droitre est l'intégrale d'une densité de charge ρ(x) dans un volume ( ∫vs ), ce volume étant celui contenu dans la surface fermée.

NB : les points situés entre la surface de Gauss (S) et la surface de l'objet de volume VS, c-à-d là où il n'y a pas de charge, sont tels que ρ(xm) = 0.
Forme locale et divergence
https://philosophie.jortay.net/savoir-scientifique-base#Gauss-local-divergence
triangle-clipedia.png Vidéo Clipedia : Loi de Gauss : forme locale

La forme continue de la loi de Gauss s E . dS = 1/ε0 * ∫VS ρ(x) * dV n_gauss-continu n'est pas locale : elle met en relation des points de la surface fermée (membre de gauche) avec des points à l'intérieur de cette surface fermée (membre de droite).

Rappelons que, par ΦES = ∮s E . dS = q / ε0 n_Gauss-permittivite, l'intégrale du membre de droite de l'égalité ci-dessus représente la charge électrique enfermée dans VS (le volume V circonscrit par la surface S).

Nous allons ici développer la version locale de la loi de Gauss : div(E) = ρ(x) / ε0
qui met en relation E et ρ(x) en un même point (déterminé par le vecteur position x), et implique la notion de divergence.

Pour passer de la version continue n_gauss-continu à la version locale n_Gauss-local on considère une surface fermée de forme cubique, que l'on réduit à un volume infinitésimal entourant un seul point.

Pour ce faire nous allons devoir faire ici une parenthèse sur le traitement des intégrales calculées sur de très petits intervalles. Commençons à une dimension (c-à-d une seule variable).

integrale-petit-interval.png

Le graphique ci-contre illustre le fait que lorsque l'intervalle δ tend vers zéro, le segment de la courbe f(x) qu'il détermine peut être considéré comme une droite. Dans ces conditions, le point situé au milieu de cet intervalle détermine deux triangles identiques :
• en vert au-dessus de la ligne horizontale hachurée, dans la partie droite de l'intervalle ;
• en blanc en-dessous de la ligne horizontale hachurée, dans la partie gauche de l'intervalle.

On voit alors que la valeur de l'intégrale limδ→0x0–δ/2x0+δ/2 f(x) * dx (la surface en-dessous de la courbe) est égale à la surface du rectangle δ * f(x0).

Ce résultat se généralise facilement au cas de deux dimensions : dans le graphique ci-dessus x0, point central de la base du rectangle dont la surface représente l'intégrale, devient dans le graphique suivant (x0,y0), point central de la base d'un parallélépipède rectangle dont le volume (membre de droite suivant) représente l'intégrale (membre de gauche suivant) : limS→0S f(x,y) * dS = δ2 * f(x0,y0)
dS=dx*dy

integrale-petit-interval-2.png
Fermons ici cette parenthèse sur le traitement des intégrales calculées sur de très petits intervalles, et revenons à notre démonstration du passage de :
s E . dS = 1/ε0 * ∫VS ρ(x) * dV : forme continue de la loi de Gauss ;
à :
div(E) = ρ(x) / ε0 : forme locale de la loi de Gauss.

La première partie de cette démonstration concerne le membre de droite de la forme continue : si l'espace fermé de forme cubique est réduit à un point (déterminé par le vecteur) x, alors ρ(x0) peut être sorti de l'intégrale :
limvS→0s E . dS = limvS→0 1/ε0 * ρ(x) * ∫VS dV    ⇔
limvS→0s E . dS = limvS→0 1/ε0 * ρ(x) * VS    ⇔
limvS→0s E . dS = 1/ε0 * ρ(x0) * δ 3

La seconde partie de la démonstration, plus longue et calculatoire, concerne le membre de gauche de la forme continue. S'agissant d'une intégrale de flux nous allons donc calculer ce flux sur toutes les surfaces du cube.

gauss-local.png

Commençons par celle du haut (NB : le dS ne représente pas celle-ci mais une surface infinitésimale) : nous la dénommons Sz car orientée en z
dS = dS * 1z   ⇒
sz E . dS =
sz E . dS * 1z =
sz E . 1z * dS =
sz Ez(x,y,z0+δ/2) * dS =
par n_integrale-petit-intervalle :
Ez(x0,y0,z0+δ/2) * δ 2

Passons maintenant à l'autre surface orientée en z. Elle est telle que :
dS = - dS * 1z   ⇒ ... ⇒
sz E . ( - dS * 1z ) =
...
- Ez(x0,y0,z0-δ/2) * δ 2

Passons maintenant aux deux surfaces orientées en y :
dS = dS * 1y   ⇒ ... ⇒
sy E . dS * 1y =
...
Ey(x0,y0+δ/2,z0) * δ 2

Et ainsi de suite de suite, de sorte que le calcul des six faces donne finalement que :
1/ε0 * ρ(x0) * δ 3 =
( Ez(x0,y0,z0+δ/2) - Ez(x0,y0,z0-δ/2) ) * δ 2 +
( Ey(x0,y0+δ/2,z0) - Ey(x0,y0-δ/2,z0) ) * δ 2 +
( Ex(x0+δ/2,z,y00) - Ex(x0-δ/2,y0,z0) ) * δ 2    
1/ε0 * ρ(x0) =
( Ez(x0,y0,z0+δ/2) - Ez(x0,y0,z0-δ/2) ) / δ +
( Ey(x0,y0+δ/2,z0) - Ey(x0,y0-δ/2,z0) ) / δ +
( Ex(x0+δ/2,z0,y0) - Ex(x0-δ/2,y0,z0) ) / δ

Or chacun des trois membres de cette somme n'est autre qu'une dérivée (partielle) "au centre", qui n'est qu'une variante de la traditionnelle dérivée (partielle) "à droite" : par n_derivee :
df(x) / dx =
limδ→0 ( f(x+δ) - f(x) ) / δ =
limδ→0 ( f(x+δ/2) - f(x-δ/2) ) / δ

de sorte que :

1/ε0 * ρ(x0) =
∂Ex / ∂x |x0,y0,z0 + ∂Ey / ∂y |x0,y0,z0 + ∂Ez / ∂z |x0,y0,z0
(NB : les delta ronds spécifiques aux dérivées partielles.)
qui est bien la version locale recherchée, exprimant x0 en fonction de (x0,y0,z0) ⇔ ρ et E ne sont considérés qu'en un seul point de l'espace. Et comme celui-ci peut se situer n'importe où dans l'espace, le zéro est en fait inutile ⇒
1/ε0 * ρ(x) =
∂Ex / ∂x + ∂Ey / ∂y + ∂Ez / ∂z ≡ div(E)

Divergence

Cette somme des dérivées partielles des composantes d'un champ est appelée "divergence du champ" et notée div(E) (E pour le champ électrique, F quand le type de champ n'est pas spécifié).

Or nous avons d'autre part que :
1/ε0 * ρ(x) =
1/ε0 * ρ(x) * δ 3 / δ 3 =
par n_gauss-lim :
limVS→0 1 / δ 3 * ∮s E . dS    
limVS→0 1 / VS * ∮s E . dS = ρ(x) / ε0 = div(E)

qui est donc la forme locale de la loi de Gauss. Son interprétation physique s'énonce comme suit : « la divergence en un point représente le flux normalisé du champ vectoriel sur une surface fermée de taille infinitésimale entourant ce point ("normalisé" signifiant ici "divisé par le volume enfermé par la surface fermée") ».

On notera qu'en supprimant le passage à la limite et en faisant passer VS dans le membre de droite on retrouve l'interprétation de la loi de Gauss sous sa forme intégrale :
s E . dS = 1/ε0 * ρ(x) * VS    ⇔
s E . dS = 1/ε0 * ρ(x) * ∫vS dV n_gauss-continu

divergence.jpg

Observons enfin la différence entre définition mathématique (générale) et interprétation physique (particulière) de la divergence :

  • div(E) ≡ ∂Ex / ∂x + ∂Ey / ∂y + ∂Ez / ∂z n_divergence-math est la définition strictement mathématique de la divergence ;
  • div(E) = limVS→0 1 / VS * ∮s E . dS = 1/ε0 * ρ(x) n_Gauss-local en est une interprétation physique.

Cas particulier : dans le vide il n'y a pas de charge (par définition du vide) ⇒
ρ(x) = 0div(E) = 0 (cf. supra l'évocation de la divergence dans la démonstration du théorème de Gauss n_theoreme-gauss ).

Application. Soit le champ :
E(x,y,z) = a * y2 * 1x + 2 * a * x * y * 1y    ⇒
où :
• ∂(a*y2)/∂x = 0
• ∂(2*a*x*y2)/∂y= 2 * a * x
⇒  par n_divergence-math :
div(E) = 2 * a * x    ⇒
ρ(x) = ε0 * div(E) = ε0 * 2 * a * x

Nabla. On obtient enfin la forme la plus fréquente de la loi de Gauss en introduisant la notion de nabla (∇), qui correspond à la formulation du gradient n_gradient sans mention de fonction :
= ∂ / ∂x * 1x + ∂ / ∂y * 1y + ∂ / ∂z * 1z

⇒ soit :
E = Ex * 1x + Ey * 1y + Ez * 1z     ⇒ par n_produit-scalaire-algebrique :
. E = ∂Ex / ∂x + ∂Ey / ∂y + ∂Ez / ∂z    ⇒  par n_divergence-math :
div(E) = ∇ . E

. E = 1/ε0 * ρ où :
ε0 est la permittivité du vide n_permittivite-vide
ρ est la densité volumique de charge n_densite-volumique-charge

Théorème d'Ostrogradski
https://philosophie.jortay.net/savoir-scientifique-base#Gauss-Ostrogradski
triangle-clipedia.png Vidéo Clipedia : Théorème d’Ostrogradski

Ce théorème, qui relie flux et divergence, énonce que « l'intégrale de flux d'un champ vectoriel F sur une surface fermée F est donnée par l'intégrale de la divergence de ce champ sur le volume VS enfermé par cette surface » : s F . dS = ∮vS div(F) * dV.

La démonstration s'obtient à partir du système d'équation exprimant le passage de la forme continue à la forme locale de la loi de Gauss:

continue :
s E . dS = 1/ε0 * ∫VS ρ(x) * dV n_gauss-continu
locale :
div(E) = ρ(x) / ε0 n_Gauss-local

En isolant ρ(x) dans n_Gauss-local et en le substituant dans n_gauss-continu ⇒ annulation des deux ε0
s E . dS = ∮vS div(E) * dV
CQFD

On note le champ E dans le cas du champ électrique, et F lorsqu'on ne spécifie pas de quelle type de champ il s'agit.

Comprenons bien le caractère étonnant du théorème d'Ostrogradski :
s F . dS = ∮vS div(F) * dV
: alors que le membre de droite concerne tous les points constituant le volume, le membre de gauche ne concerne que les valeurs de F à la surface de ce volume. Il en résulte un fait à priori contre-intuitif : quelle que soit la situation (orientation) des champs à l'intérieur du volume – situation qui détermine la valeur de div(F) – l'intégrale de ces div(F) est constante (et vaut la valeur donnée par le membre de gauche).

Nous allons montrer que la nature a priori contre-intuitive de ce résultat n'est qu'apparente. Mais avant il est utile d'approfondir notre compréhension intuitive de la divergence, en montrant que son interprétation physique :
div(F) = ( limVS→0 1 / VS ) * ∮s F . dS n_Gauss-local
recouvre bien sa définition mathématique :
div(F) ≡ ∂Fx / ∂x + ∂Fy / ∂y + ∂Fz / ∂z n_divergence-math.

ostrogradski.png

Pour ce faire on va prendre le cas de la composante en x de la définition mathématique. À celle-ci correspondent les deux faces du cube orientées en x. La somme des flux passant par ces deux faces est donnée par n_Ez(x0,y0,z0-δ/2)*δ2 :
∫  2sx F . dS = Fx(x+δ/2,y,z) * δ2 - Fx(x-δ/2,y,z) * δ2    ⇔
∫  2sx F . dS = [ Fx(x+δ/2,y,z) - Fx(x-δ/2,y,z) ) ] * δ2    ⇔
∫  2sx F . dS = [ Fx(x+δ/2,y,z) - Fx(x-δ/2,y,z) ) ] / δ * δ3    ⇔

où l'on constate que la partie surlignée en jaune correspond bien à la définition d'une dérivée (centrée) : le différentiel de valeur d'une fonction entre deux points séparés d'une distance δ, divisé par δ (de sorte que le δ2 du numérateur devient δ3). Quant à y et z, ils sont constants : on circule sur la ligne reliant les trois points x-δ/2x, x et x+δ/2.

Pour passer à la surface totale du cube il faut prendre en compte les deux autres paires de surface, orientées en y et z. Cette généralisation est triviale puisqu'il y a symétrie en x, y et z ⇒
s F . dS = [ ∂Fx / ∂x + ∂Fy / ∂y + ∂Fz / ∂z ] * Vs    ⇔
1/Vs * ∮s F . dS = [ ∂Fx / ∂x + ∂Fy / ∂y + ∂Fz / ∂z ]    ⇔
1/Vs * ∮s F . dS = div(F)
où l'on retrouve bien n_Gauss-local.

Poursuivons l'interprétation physique de la divergence en analysant le cas d'une dérivée partielle positive. Cela signifie que le flux entrant est plus petit que le flux sortant (cf. graphique supra). Or le flux entrant étant négatif et le flux sortant positif n_source-interne-externe, il en résulte que le flux net est positif. L'approche mathématique de dérivée partielle positive est donc bien cohérente avec l'interprétation physique de flux normalisé net qui est positif.

Fermons cette parenthèse sur l'interprétation intuitive de la divergence, et étudions de plus près le théorème d'Ostrogradski. Nous allons montrer que le théorème contient l'interprétation physique de la divergence. Il suffit pour cela de faire tendre VS vers zéro ⇒ div(F) ne varie qu'infiniment peu ⇒ elle peut être considérée comme constate, et donc extraite hors de l'intégrale : soit :
s F . dS = ∮  vS→0 div(F) * dV   ⇒
s F . dS = div(F) * ∮  vS→0 dV   ⇔
s F . dS = div(F) * VS   ⇔
1/ VS * ∮s F * dS = div(F)
où l'on retrouve bien n_Gauss-local.

Venons-en maintenant à l'objectif que nous nous étions fixé au début de cette section : montrer que le caractère contre-intuitif du théorème d'Ostrogradski n'est qu'apparent. Pour ce faire on va faire la démarche inverse à celle que l'on vient de présenter : retrouver le théorème à partir de la définition/interprétation physique de la divergence.

ostrogradski-intuitif-decomposition.png

Pour ce faire on va décomposer le volume VS en petits cubes de volume ΔVn et de surface Sn tels que n=1,2,3,...,N. On a alors que, pour chaque petit cube de vecteur position xn :
div(F)|xn = limΔVn→0 1/ ΔVn * ∮sn F . dS

ostrogradski-intuitif.png

Le graphique ci-contre représente les champs situés au milieu des six faces d'un cube. Il illustre le fait que pour chaque cube il y aura six calculs à effectuer.

On fait passer ΔVn dans le membre de gauche ⇒ :
div(F)|xn * limΔVn→0 ΔVn = ∮sn F . dS   ⇒
n=1Ndiv(F)|xn * limΔVn→0 ΔVn = ∑n=1Nsn F . dS   ⇔
∫  vS div(F) * dV = ∑n=1Nsn F . dS

NB : avec la notation intégrale le |xn est implicite.

ostrogradski-intuitif-2.png

La conversion du membre de droite en intégrale semble plus problématique car la somme qui y est représentée prend en compte toutes les surfaces de tous les cubes, or l'intégrale de surface ne doit prendre en compte que les seules surface externes. Mais en réalité le problème ne se pose pas. Pour s'en rendre compte prenons le cas de deux cubes adjacent Sn-1 et Sn. Leurs faces connexes ont une contribution au flux qui est nulle car leurs vecteurs de surface dS respectifs sont égaux en valeur absolue (puisque qu'ils correspondent à un même point de champ) mais de signes opposés (puisque le flux est rentrant dans un cas et sortant dans l'autre) ⇒ les produits scalaires correspondant s'annulent.

ostrogradski-intuitif-3.png

Vue en coupe ⇒ seuls 4 dS par cube sont représentables.

Paradoxe résolu ! Et c'est évidemment cette propriété qui dissipe l'apparente contre-intuitivité du théorème d'Ostrogradski : quelle que soit la valeur des F internes (norme et direction), ceux-ci sont de toute façon annulés !

On peut donc passer à l'intégrale dans le membre de droite :
∫  vS div(F) * dV = ∑n=1Nsn F . dS   ⇔
∫  vS div(F) * dV = ∮s F . dS n_ostrogradski
⇔ l'intégrale de la divergence sur un volume est donné par l'intégrale de flux de la fonction sur la surface qui limite ce volume. Il s'agit là d'un outil de calcul mathématique très utilisé en physique.

Méthode de Gauss : la sphère
https://philosophie.jortay.net/savoir-scientifique-base#methode-gauss-sphere
triangle-clipedia.png Vidéo Clipedia : Méthode de Gauss : la sphère

Nous allons montrer ici que la loi de Gauss s E . dS = 1/ε0 * ∫VS ρ(x) * dV n_gauss-continu permet de calculer le champ électrique E (membre de gauche, qui est une intégrale de surface) à partir de la distribution de charges qui en est à l'origine (membre de droite, qui est une intégrale de volume). Cette technique est appelée "méthode de Gauss". Nous allons l'illustrer ici par le cas d'un sphère chargée avec une densité volumique de charge ρ n_densite-volumique-charge constante (dans l'espace et le temps). Cette distribution de charge génère partout dans l'espace un champ électrique E( x), considéré au vecteur position x.

Pour calculer ce champ on pourrait utiliser la formule du champ de Coulomb E = q / ( 4 * π * ε0 * r 2 ) * 1r n_coulomb-permittivite. Une charge q contenue dans un volume infinitésimal peut être considérée comme ponctuelle. La loi de Coulomb permet alors de calculer la valeur du champ généré par cette charge en un point située à une distance r.

gauss-sphere-coulomb.png

Pour connaître r il suffit de connaître la position des deux points dans un référentiel arbitraire. Le graphique ci-joint montre comment, par construction, on trouve que :
• r = || x - x' ||
• 1r = ( x - x' ) / || x - x' ||

E = q / ( 4 * π * ε0 ) * ( x - x' ) / || x - x' ||3

On peut alors reconstituer la sphère par intégration de ces petits cubes, chacun générant sont propre champ en x ⇒ en sommant ces champs on obtient le champ généré par la sphère en x (principe de superposition). À chaque vecteur position x' est ainsi associé un volume infinitésimal dV' dont la charge est alors donnée par le produit de ce volume par la densité volumique ρ : q = ρ * dV' n_densite-volumique-charge. Et si la charge est infinitésimale (c-à-d arbitrairement petite), il en va de même pour le champ qu'elle génère ⇒ il faut remplacer E par dE.

L'égalité précédente devient donc :
dE = ρ * dV' / ( 4 * π * ε0 ) * ( x - x' ) / || x - x' ||3
⇒ le champ généré par la sphère est donc :
E = ∫ dE = ∫ ρ * dV' / ( 4 * π * ε0 ) * ( x - x' ) / || x - x' ||3    ⇔
E = ∫ dE = ∫ ρ(x') / ( 4 * π * ε0 ) * ( x - x' ) / || x - x' ||3 * dV'    ⇔
où l'on précise que la charge volumique ρ(x') n'est pas constante en toutes généralités (NB : ne pas confondre la sphère chargée et la surface de Gauss qui l'entoure).

Cependant le calcul de cette intégrale de volume complexe n'est pas du tout aisé. Heureusement, la loi de Gauss s E . dS = 1/ε0 * ∫VS ρ(x) * dV n_gauss-continu permet de développer une méthode de calcul nettement plus simple, appelée "méthode de Gauss".

gauss-sphere.png

Dans le graphique ci-contre la surface de Gauss S et le volume qu'elle renferme VS sont représentés en blanc. Dans l'équation ci-dessus on constate que le champ E que l'on souhaite calculer se trouve à l'intérieur d'une intégrale. Comment faire pour l'isoler dans le membre de gauche ? Pour répondre à cette question considérons le cas général 0L f(x) dx = I. On ne peut le résoudre en f(x) que si l'on considère cette fonction comme constante f(x)=f
f * ∫0L dx = I    ⇔
f * L = I    ⇔
f = I / L
La méthode de Gauss est fondée sur ce principe : faire en sorte que l'intégrante E soit une constante. Et pour ce faire on va choisir une surface de Gauss qui a cet effet. Intuitivement on devine que cette surface induit la symétrie de la distribution des charges, et qu'en l'occurrence il s'agit donc d'une sphère centrée sur, et entourant, la sphère chargée.

gauss-sphere2.png

Le graphique ci-contre, qui représente la sphère en 2D, montre que le champ d'une distribution de charges sphérique et uniforme (paires de charges diamétralement opposées relativement au rayon passant par le point de champ x) est radial, c-à-d situé sur le rayon correspondant, et donc perpendiculaire à la surface de Gauss ⇒ les dS sont parallèles aux E, ce qui va simplifier le calcul du produit scalaire du membre de gauche de n_gauss-continu. Et comme la sphère de Gauss est centrée sur la sphère chargée il en résulte que les modules E(r) des champs E sont égaux en tous points de la surface de Gauss :
• E = E(r) * 1r
et il en va de même de leurs vecteurs de surface :
• dS = dS * 1r
de sorte que :
E . dS = E(r) * dS    ⇒
s E . dS = ∮s E(r) * dS    ⇒
NB : le caractère vectoriel (et donc variable) de l'intégrale a disparu ⇒
s E . dS = E(r) * ∮s dS    ⇒
s E . dS = E(r) * S    ⇒
s E . dS = E(r) * 4 * π * r2

Il reste à calculer le membre de droite de s E . dS = 1/ε0 * ∫VS ρ(x) * dV n_gauss-continu. Attention, ρ est considérée comme constante dans toute la sphère chargée, mais cela n'implique pas que ρ(x) est constante dans la sphère de Gauss ("le volume VS enfermé par la surface de Gauss S"), qui englobe la sphère chargée. Cependant, dans l'espace différentiel c'est le vide ⇒ ρ = 0 ⇒ l'intégrale de droite, qui concerne la sphère de Gauss (de rayon r), peut être ramenée à la seule sphère chargée (de volume VSc et rayon R) ⇒
1/ε0 * ∫VS ρ(x) * dV = 1/ε0 * ∫VSc ρ * dV    ⇔
1/ε0 * ∫VS ρ(x) * dV = 1/ε0 * ρ ∫VSc dV    ⇔
1/ε0 * ∫VS ρ(x) * dV = 1/ε0 * ρ * VSc    ⇔
1/ε0 * ∫VS ρ(x) * dV = 1/ε0 * ρ 4/3 * π * R3

de sorte que par n_E(r)*4*πr2, n_1/ε0*ρ4/3*π*r3 et n_gauss-continu :
E(r) * 4 * π * r2 = 1/ε0 * ρ 4/3 * π * R3    ⇔
E(r) = ρ * R3 / ( 3 * ε0 * r2 )    ⇔
E = ρ * R3 / ( 3 * ε0 * r2 ) * 1r    ⇔
E = ρ * VSc / ( 4 * π * ε0 * r2 ) * 1r    ⇒ par n_densite-volumique-charge :
E = Q / ( 4 * π * ε0 * r2 ) * 1r
où l'on retrouve donc le champ coulombien n_coulomb-permittivite c-à-d généré par une charge ponctuelle. C'est là un résultat remarquable, et à priori contre-intuitif : le champ est indépendant du rayon de la sphère chargée (ce qui est pratique pour modéliser des corps dont la taille peut être associée à un point, tels que des électrons).

Rappelons cependant que cette équivalence entre lois de Coulomb et de Gauss n'est valable que dans un système statique; Dès que la charge bouge, la loi de Coulomb n'est plus valable (contrairement à la loi de Gauss, qui est donc plus générale). Mais nous verrons également que la méthode de Coulomb demeure incontournable dans des situations statiques non symétriques.

Interprétations habituelles :
• on retrouve la relation en 1/r2 que l'on avait déjà observée dans le cas d'une charge ponctuelle : plus on s'éloigne de la charge, plus le champ diminue ;
• le champ augmente avec la charge Q, ce qui est également intuitif.

Approfondissons maintenant l'analyse en étudiant le cas où r < R c-à-d lorsque le volume de Gauss est à l'intérieur de la sphère chargée. Étant donné la symétrie du système cela n'a pas d'impact sur le membre de gauche de n_E(r)*4*πr2, mais concernant le membre de droite il faut y remplacer R par rn_gauss-sphere-1 devient :
E(r) = ρ * r3 / ( 3 * ε0 * r2 ) * 1r    ⇔
E(r) = ρ / ( 3 * ε0 ) * r * 1r
NB : on a donc plus la relation en 1/r2 !

En résumé :

gauss-sphere3.png

Le graphe de la fonction E(r) illustre la croissance linéaire pour r ≤ R, suivie d'une décroissance en 1/r2 lorsque r devient supérieur à R.


Méthode de Gauss : le cylindre
https://philosophie.jortay.net/savoir-scientifique-base#methode-gauss-cylindre

Dans la section précédente concernant l'application de la méthode de Gauss à une sphère chargée, nous avons vu que la méthode requiert d'identifier une surface de Gauss symétrique (de sorte que le produit scalaire du champ et du vecteur de surface est constant ou nul en tout point). Si la réponse est évidente dans le cas d'une sphère, elle l'est moins dans le cas d'un cylindre. Nous allons voir que dans ce cas, la méthode de Gauss fournit une approximation valable (sous certaines conditions) du champ électrique lorsque le calcul du champ se fait en un point suffisamment proche du centre du cylindre et ceci uniquement lorsque ce dernier est suffisamment long (l’approximation n’est pas quantifiée, elle n’est présentée que de façon intuitive).

gauss-cylindre.png

Tant que l'on se situe au niveau du milieu de la longueur du cylindre chargé, il y a symétrie : le champ est perpendiculaire à l'axe du cylindre chargé. D'autre part cette perpendicularité (et partant la symétrie) est d'autant moins approximable que l'on se rapproche d'une extrémité ou l'autre.

Par conséquent, si l'on considère un cylindre chargé de longueur H (en vert sur le graphique ci-contre), et un point externe situé à la surface d'un cylindre de Gauss (en bleu) de longueur h < H et de rayon r, entourant le cylindre chargé, alors il existe au moins une valeur du ratio ( H - h ) / r au-dessus de laquelle on peut considérer que le champ généré par le cylindre chargé à la surface du cylindre de Gauss est en tous points perpendiculaire à l'axe central. C'est l'option que nous appelons symétrie localisée (et en l'occurrence "centrée").

Un autre option est celle de symétrie infinie : on considère ici une situation purement théorique (idéalisée) où H = ∞ de sorte que la symétrie n'est plus localisée, c-à-d qu'on peut la considérer en tout point de l'espace.

Quelle que soit l'option analytique choisie, ∮ étant une intégrale fermée, il faut prendre en compte la surface latérale SL ainsi que celle des deux bases du cylindre de Gauss : S = SL + SB
s E . dS = ∫sL E . dS + ∫sB E . dS

Notez que dans le membre de droite ce ne sont plus des intégrales de surface fermée.

gauss-cylindre-2.png

Concernant sL E . dS, le graphique ci-joint montre la situation vue du dessus : il y a bien une symétrie radiale par rapport à l'axe du cylindre, et les vecteurs de surface dS sont parallèles à leur champ E. Dans ces conditions, leur produit scalaire est égal au produit de leurs modules.

gauss-cylindre-3.png

Concernant sB E . dS, le graphique ci-contre montre que si les deux bases sont choisies telles que perpendiculaires à l'axe du cylindre ⇒ chaque vecteur de surface est perpendiculaire à son champ, de sorte que leur produit scalaire est nul.

Au total on a donc que :
s E . dS = ∫sL E . dS + ∫sB E . dS    ⇔
s E . dS = ∫sL E * dS    ⇔
s E . dS = E * ∫sL dS    ⇔
s E . dS = E * SL    ⇔
s E . dS = E(r) * 2 * π * r * h

gauss-cylindre-4.png

Pour terminer l'application de la méthode de Gauss, intéressons-nous maintenant au membre de droite de la loi de Gauss s E . dS = 1/ε0 * ∫vS ρ(x) * dV n_gauss-continu. Rappelons qu'il s'agit de la charge totale à l'intérieur du volume de Gauss VS. Quant à la densité de charge ρ(x) elle est considérée comme constante (uniformément répartie) dans le cylindre chargé, mais cela n'implique pas qu'elle l'est également dans le cylindre de Gauss ("le volume VS enfermé par la surface de Gauss S"), qui englobe le cylindre chargé. Cependant, dans l'espace différentiel c'est le vide ⇒ ρ = 0 ⇒ l'intégrale de droite, qui concerne le cylindre de Gauss (de rayon r), peut être ramenée au seul cylindre chargé (de volume VSc et rayon R), où ρ(x) = ρ ⇒
1/ε0 * ∫vS ρ(x) * dV = 1/ε0 * ρ ∫vSc * dV    ⇔
1/ε0 * ∫vS ρ(x) * dV = 1/ε0 * ρ VSc    ⇔
1/ε0 * ∫vS ρ(x) * dV = 1/ε0 * ρ * π * R2 * h

De sorte que par n_E(r)*2*π*r*h, n_1/ε0*ρ*π*R2*h et n_gauss-continu :
E(r) * 2 * π * r * h = 1/ε0 * ρ * π * R2 * h    ⇔
E(r) = ρ * R2 / ( 2 * ε0 * r )    ⇔
E(r) = ρ * R2 / ( 2 * ε0 * r ) * 1r

Interprétation :
• le champ est indépendant de la longueur h du cylindre de Gauss ;
• le champ (externe) diminue en 1/r, alors que dans le cas de la sphère il diminuait en 1/r2 ⇔ la décroissance est moins rapide ;
• alors que dans le cas de la sphère la radialité était définie par rapport au centre de la sphère (r est la distance par rapport à ce point), dans le cas du cylindre elle est défini par la perpendiculaire à l'axe du cylindre (r est la distance par rapport à cet axe) ;

Densité
linéique

Dans le cas de la sphère on retrouvait le champ Coulombien (charge ponctuelle) en exprimant le champ en fonction de la charge totale Q plutôt qu'en fonction de la densité de charge ρ. A-t-on le même résultat dans le cas du cylindre ? :
par n_densite-volumique-charge :
Q = ρ * π * R2 * H    ⇔
ρ * R2 = Q / ( π * H )   ⇒ substitué dans n_gauss-cylindre-1
E(r) = ( Q / H ) / ( 2 * π * ε0 * r ) * 1r   ⇒
soit λ = Q / H = ρ * π * R2 la densité linéique de charge :
E(r) = λ / ( 2 * π * ε0 * r ) * 1r

De sorte que ni le rayon R ni longueur H du volume chargé n'interviennent. Dès lors, de même que la sphère chargée pouvait être théoriquement réduite à un point, le cylindre peut être théoriquement réduit à un fil rectiligne infini.

Enfin, le cas que nous venons d'analyser est tel que le rayon r du cylindre de Gauss est supérieur à celui R du cylindre chargé. Mais qu'en est-il du champ à l'intérieur du cylindre uniformément chargé, c-à-d tel que r < R ? Cette situation ne changeant rien à la symétrie, rien n'est changé concernant n_E(r)*2*π*r*h. Et dans n_1/ε0*ρ*π*R2*h il faut juste remplacer R par r
E(r) * 2 * π * r * h = 1/ε0 * ρ * π * r2 * h    ⇔
E(r) = ρ * r / ( 2 * ε0 )    ⇔
E(r) = ρ * r / ( 2 * ε0 ) * 1r

En résumé :

gauss-cylindre-5.png

Le graphe de la fonction E(r) illustre la croissance linéaire pour r ≤ R, suivie d'une décroissance en 1/r lorsque r devient supérieur à R.

Physiquement le graphe ci-dessus peut être illustré comme dans le graphique ci-dessous : à l'intérieur du cylindre chargé le module du champ est croissant (linéairement) tandis qu'en dehors il est décroissant (en 1/r).

gauss-cylindre-6.png

Enfin le graphique suivant compare les deux cas idéalisés : un fil de longueur infinie dans le cas du cylindre (gauche), et un point dans celui de la sphère (droite).

N.d.A. On notera que le schéma de droite peut être interprété comme celui de gauche vu d'en haut. La différence étant l'épaisseur du cylindre, qui semble pouvoir expliquer () le degré inférieur de l'exposant en r : dans les deux cas on a certes une diminution de densité, horizontalement, lorsqu'on s'éloigne du centre, mais dans le cas du cylindre la densité a une seconde dimension, verticale, qui elle ne diminue pas avec la distance au centre.

gauss-cylindre-7.png

Méthode de Gauss : le plan
https://philosophie.jortay.net/savoir-scientifique-base#methode-gauss-plan
triangle-clipedia.png Vidéo Clipedia : Méthode de Gauss : le plan

L'application de la loi de Gauss trouve une application notamment dans le cas de circuits électriques tels qu'un condensateur, qui n'est autre qu'un couple de plaques de charges opposées (cf. champ dipolaire), ce qui génère un champ entre les plaques (qui va permettre de contrôler les courants et tensions dans le circuit).

La problématique théorique est ici du même type que dans les deux sections précédentes. La méthode de Gauss requiert d'identifier une surface de Gauss symétrique, de sorte que le produit scalaire du champ et du vecteur de surface est constant ou nul en tout point. Si la réponse est évidente dans le cas d'une sphère (à savoir une autre sphère), elle l'est moins dans le cas d'une plaque. Nous allons voir que dans ce cas, la méthode de Gauss fournit une approximation valable du champ électrique lorsque le calcul du champ se fait en un point suffisamment proche du centre de la plaque, et pour autant que celle-ci soit suffisamment étendue et mince.

gauss-plan-1.png

On considère ici le cas d'une plaque uniformément chargée avec une densité volume de charge ρ n_densite-volumique-charge. On comprend déjà intuitivement qu'à l'instar du cylindre ce système ne présente pas la symétrie d'une sphère chargée, et que par conséquent cette symétrie devra être considérée comme localisée en le centre de la plaque, ou non localisée en supposant une plaque de superficie infinie. En effet, d'une part le champ en un point situé sur la perpendiculaire au centre d'une plaque carrée est confondu avec cet axe.

gauss-plan-2.png

D'autre par, comme illustré par la géométrie vectorielle de l'image ci-contre, on peut considérer qu'il existe une certaine distance x à une plaque de surface L*L, en-dessous de laquelle les points sources proches du bord n'ont pas d'impact significatif sur le point de champ considéré, de sorte qu'il existe une zone centrée sur le centre de la plaque et dans laquelle le champ est uniforme c-à- identique en tout point, et en l'occurrence perpendiculaire à la plaque.

Comme dans les deux cas précédent cette limitation de symétrie locale pourra être levée en considérant le cas théorique d'une plaque de surface infinie.

gauss-plan-3.png

La configuration du système impose logiquement la forme du volume de Gauss : celui-ci doit contenir le flux et induire une symétrie maximale ⇒ c'est donc le cylindre qui s'impose. Le membre de gauche de la loi de Gauss s E . dS = 1/ε0 * ∫vS ρ(x) * dV n_gauss-continu se décompose donc à nouveau en deux intégrales de surface (non fermées) : surface latérale (SL) et celle des deux bases (2*SB) :
s E . dS = ∫sL E . dS + ∫sB E . dS
sur la surface latérale les vecteurs de surface sont perpendiculaires à leur champ ⇒ leur produit scalaire est nul, tandis que sur les bases ils leurs sont parallèles ⇒ leur produit scalaire est égal au produit de leurs normes, ⇒

gauss-plan-4.png

s E . dS = ∫sB E * dS    ⇔
s E . dS = E * ∫sB dS    ⇔
s E . dS = E * 2 * SB

Traitons maintenant le membre de droite de la loi de Gauss s E . dS = 1/ε0 * ∫vS ρ(x) * dV n_gauss-continu. C'est une intégrale de volume calculant la charge intérieure à la surface de Gauss, c-à-d la charge de la portion de plaque chargée contenue dans la surface de Gauss, ⇒ par n_densite-volumique-charge :
1/ε0 * ∫vS ρ(x) * dV = 1/ε0 * ρ * e * SB

De sorte que par n_E*2*SB, n_1/ε0ρ*e*SB et n_gauss-continu :
E * 2 * SB = 1/ε0 * ρ * e * SB    ⇔
E = ρ * e / ( 2 * ε0 )   ⇔
E(x) = ρ * e / ( 2 * ε0 ) * 1

NB : 1 = - 1x vers la gauche, et 1 = 1x vers la droite !

Interprétations :
• le champ ne dépend pas de la surface de la plaque ;
• le champ (externe) ne dépend pas de sa distance x à la plaque : quelle que soit la distance à laquelle on se trouve de la plaque chargée le champ est constant !

Densité
surfacique

Dans le cas de la sphère on retrouvait le champ Coulombien (charge ponctuelle) en exprimant le champ en fonction de la charge totale Q plutôt qu'en fonction de la densité de charge ρ. A-t-on le même résultat dans le cas de la plaque ? Par n_densite-volumique-charge :
Q = ρ * e * S    ⇔
ρ * e = Q / S     ⇒ substitué dans n_gauss-plan-1 :
E(x) = Q / S / ( 2 * ε0 ) * 1   ⇒
soit σ = Q /S = ρ * e la densité surfacique de charge :
E(x) = σ / ( 2 * ε0 ) * 1

De sorte que ni l'épaisseur e ni la surface S de la plaque n'interviennent. Dès lors, de même que la sphère chargée pouvait être théoriquement réduite à un point, et le cylindre à un fil rectiligne infini, la plaque peut l'être à un plan d'extension infinie et infiniment mince.

Enfin, le cas que nous venons d'analyser est tel que le champ est à l'extérieur de la plaque, mais qu'en est-il à l'intérieur ? Cette situation ne changeant rien à la symétrie, rien n'est changé concernant n_E*2*SB. Et dans n_1/ε0ρ*e*SB il faut juste remplacer e par 2*x
E * 2 * SB = 1/ε0 * ρ * 2 * x * SB    ⇔
E = ρ / ε0 * x   ⇔
E(x) = ρ / ε0 * x * 1

Ainsi alors que le champ était indépendant de x en dehors de la plaque, ce n'est plus le cas dans celle-ci (on avait donc raison de faire preuve de prudence dans n_gauss-plan-1, en mentionnant E(x) plutôt que E). En particulier le champ est nul si x=0 c-à-d lorsqu'on on se situe au milieu de la plaque, ce qui est logique puisque cette situation est symétrique.

gauss-plan-5.png

On notera une continuité (intuitive) dans la dépendance du champ externe à la distance r au volume chargé, selon la forme idéalisée de celui-ci :
• source ponctuelle (dim=0) : dépendance en 1/r2 ;
• source linéaire (dim=1) : dépendance en 1/r1 ;
• source plan (dim=2) : dépendance en 1/r0=1 c-à-d indépendance ;
que l'on peut généraliser par source de dim = n ⇒ dépendance en 1 / r (2-n).

Dans le cas du plan, le résultat à priori contre-intuitif de non dépendance du champ externe par rapport à la distance n'est qu'apparent :
horizontalement (c-à-d dans le sens du flux) : pas de radialité horizontale, donc pas de baisse de densité lorsqu'on s'éloigne du centre ;
verticalement (c-à-d perpendiculairement au flux) : il y a une épaisseur de flux de sorte que la densité est logiquement constante dans l'espace.
Mais rappelons-nous que ces résultats ne valent que pour une distance proche du corps chargé : au delà on retrouvera une dépendance tendant vers 1/r2 au fur et à mesure que la distance grandit c-à-d que l'objet chargé devient petit relativement à celle-ci.

Potentiel

https://philosophie.jortay.net/savoir-scientifique-base#potentiel
 7.3.1. Potentiel gravitationnel
 7.3.2. Gravitation universelle
 7.3.3. Potentiel électrique
 7.3.4. Loi d'Ohm
 7.3.5. Champ quelconque
 7.3.6. Potentiel coulombien
 7.3.7. Champ et gradient du potentiel
 7.3.8. Équations de Poisson et Laplace
Potentiel gravitationnel
https://philosophie.jortay.net/savoir-scientifique-base#potentiel-gravitationnel
triangle-clipedia.png Vidéo Clipedia : Le potentiel : introduction I

Le potentiel permet de décrire les aspects énergétiques d'un champ de forces. Comme introduction au concept de potentiel électrique, nous allons ici étudier la notion de potentiel gravitationnel. Pour ce faire on va étudié le cas d'une boule qui, dévalant une pente, acquiert ainsi une énergie cinétique.

Quelle vitesse faut-il imprimer à une boule située au bas d'une pente de longueur et pente déterminées pour qu'elle en atteigne le sommet ? Pour résoudre ce problème, commençons par identifier la loi physique générale auquel ce problème fait référence. En l'occurrence il s'agit de la loi de conservation de l'énergie : l'énergie ne se créé ni ne se perd, elle ne peut que se transformer d'une forme en une autre. Ainsi l'énergie cinétique que la boule acquiert en dévalant la pente n'est en réalité que la transformation de l'énergie potentielle qui lui a été conférée par le travail qu'il a fallu exercer pour l'amener en haut de la pente.

potentiel-gravitation.png

Énergie
potentielle

Ensuite il s'agit d'identifier la loi particulière à ce problème. En l'occurrence il s'agit du fait que le travail à fournir pour élever une masse m à une hauteur h est indépendant de l'angle que fait avec le sol la pente par laquelle la masse est élevée (c-à-d indépendant de la longueur du chemin choisi).

Démonstration :
si θ=π/2 ⇒ par n_travail :
W = F * L     et par n_produit-scalaire-trigono :
W = F * L * cos(π/2-θ)     ⇒ par n_cos(a)=sin(90-a) :
W = F * L * sin(θ)     ⇒ par n_F=m*a :
W = m * g * L * sinθ     ⇒ par n_projection1 :
W = m * g * h    ⇔
W = m * g * z
(z est souvent utilisé pour exprimer une variable de hauteur, et h pour exprimer une donnée de hauteur).

En vertu du principe de conservation ce travail est donc stocké dans la boule, sous forme d'énergie potentielle Ep telle que :
ΔEp = W = m * g * z

Ce processus est évidemment réversible : si cette boule est ensuite relâchée au sommet de la pente à une vitesse initiale nulle, alors elle se met à dévaler la pente, en transformant son énergie potentielle en énergie cinétique Ec = m * v2 / 2    n_energie-cinetique, c-à-d en acquérant de la vitesse (ici à accélération constante). Donc, à nouveau le principe de conservation :
| Δ Ep | = | - Δ Ec |    ⇔
m * g * z = m * v2 / 2    ⇔
v = √(2 * g * z)
Ainsi pour toute hauteur z, on peut calculer la vitesse correspondant v(z) (g étant donnée). Et v(z=h) est donc donc la vitesse qu'il faut imprimer à la boule immobile en bas de la pente pour l'y amener au sommet.

Si on fait abstraction des forces de frottement ⇒ la vitesse maximale de la boule qui arrive en bas de la pente reste constante ⇒ on est dans un MRU ⇒ la boule continue indéfiniment sur sa lancée (et on aurait eu également un MRU sur le plateau si la vitesse initiale en bas de la pente avait été supérieure à v(z=h) ). Autrement dit, la vitesse minimale à imprimer pour le trajet bas-haut est la vitesse maximale à la fin du trajet haut-bas, dans le cas d'une boulée lâchée à une vitesse initiale nulle.

Un résultat à priori contre-intuitif de v = √(2 * g* z) n_v=√(2*g*z) est que cette vitesse est indépendante de la masse : quelle que soit celle-ci, la vitesse initiale sera identique pour l'amener en haut de la pente ! On voit que la vitesse ne dépend que du produit g * z, que l'on appelle "potentiel gravitationnel" (noté VG), et que l'on définit plutôt en fonction de l'énergie potentielle équivalente au travail fourni pour gagner ce potentiel :
Ep = W = m * g * z    n_energie-potentielle
VG = Ep / m = g * z [J/kg]
qui est donc l'énergie potentielle par unité de masse, caractérisant ainsi le champ gravitationnel dans sa dimension énergétique : à chaque hauteur z correspond une valeur de VG, laquelle est indépendante de la masse de l'objet considéré (puisque, précisément, c'est l'énergie potentielle par unité de masse). Ainsi pour connaître l'énergie potentielle d'un corps à une hauteur z, il suffit de multiplier sa masse par le potentiel gravitationnel correspondant à cette hauteur.

Découle alors logiquement de la notion de potentiel, celle de différence de potentiel entre deux niveaux de hauteur, qui permet de procéder à des bilans énergétiques. Ainsi le travail à fournir pour déplacer une masse entre deux niveaux quelconques – c-à-d l'énergie potentielle ΔEp ainsi gagnée – vaut m * ΔVGΔVG = VGf - VGi (f pour "final" et i pour "initial").

N.B. La hauteur (en m, km, ...) à laquelle on place le zéro de l'échelle du potentiel (en J/kg) n'a donc aucune importance (notamment, le potentiel zéro ne doit pas nécessairement correspondre à la hauteur zéro) : ΔVG = m * ( zf - zi )zf et zi sont les hauteurs finale et initiale.

Application. Le skieur de 80kg qui a dévalé une pente quelconque, et dont l'altitude a ainsi baissé de 3m, a perdu une énergie potentielle de 80 * ( 10 - 40 ) = 80 * ( 0 - 30 ) = ... = -2.400J, laquelle s'est transformée en différentiel d'énergie cinétique de même valeur absolue mais de signe opposé.

potentiel-gravitation-2.png

Ainsi pour le trajet haut-bas, le travail fournit est négatif c-à-d que l'on reçoit du travail (principe des barrages hydroélectriques). Cependant, la notion de travail négatif étant peu intuitive, on parle plutôt de différence négative d'énergie potentielle.

Ainsi le principe de conservation de l'énergie se formule par :
ΔEp + ΔEc = 0    ⇔
mΔVG + ΔEc = 0

Bilan énergétique. La notion de potentiel gravitationnel vient ainsi compléter celle de champ (d'accélération) gravitationnel : alors que le vecteur accélération g caractérise le champ gravitationnel (vectoriel et uniforme) dans sa dimension de force (F = m * g), le potentiel gravitationnel peut être vu comme un champ (scalaire) qui caractérise le champ gravitationnel dans sa dimension énergétique (Ep = m * VG).

Gravitation universelle
https://philosophie.jortay.net/savoir-scientifique-base#gravitation-universelle

Dans la section précédente g est considéré comme une donnée c-à-d une constante. Nous allons ici étudier la nature de cette constante, et ainsi constater que cette donnée est relative aux référentiels planétaires, via la masse et le rayon de celles-ci.

triangle-clipedia.png Vidéo Clipedia : Le potentiel : introduction II

La force de gravitation universelle :
f = - m * G * M / r 2 * 1r
où :
• M = masse de la planète ;
• G : constante de gravitation universelle ;
• r : distance par rapport au centre de la planète (encore appelée "coordonnée radiale").

De sorte que g = - G * M / r 2 * 1r
⇒ plus un corps est éloigné du centre de la planète, plus son poids diminue. Cette décroissance est en 1/r2 (NB : comme le champ électrique d'une charge ponctuelle ...).

À une distance proche de la surface terrestre on peut considérer que g est une constante, de valeur de g = G * M / R 2 ≈ 9,81 m/s2 (où R=6.370km est le rayon de la Terre), car une altitude de 1.000m par rapport à la surface terrestre (par exemple) ne représente que 1/6.370≈0,2% de Rg = G * M / ( R + 1.000) 2 ≈ 9.81 m/s2.

On arrondit souvent g à 10 m/s2.

Potentiel
gravitationnel

Notons que cette hypothèse de g constant était sous-jacente dans la section précédente. Nous allons maintenant lever cette hypothèse (ce qui revient à se situer à de hautes distances de la surface de la Terre) et voir ce qu'il en devient du potentiel gravitationnel VG = Ep / m = g * z n_potentiel-gravitation-1 lorsque le champ est variable.

Si g est variable alors F = m * g l'est aussi ⇒ W = F * L aussi. Pour calculer W on va donc devoir utiliser le calcul intégral, c-à-d additionner des dW, en posant que g est constant non plus ∀ r mais seulement ∀ dr, c-à-d ∀ Δr de taille arbitrairement petite et donc potentiellement infiniment petite.

gravitation-universelle.jpg

Ainsi calculons le travail nécessaire pour déplacer la masse m entre l'altitude r (par rapport au centre de la Terre) et l'infini. L'infini est une situation théorique qui permet ici de définir un référentiel d'énergie potentielle nulle : si r = ∞n_force-gravitation-universelle f = - m * G * M / r 2 * 1 = 0 ⇒ n_travail W = F * x(t) = 0 ⇒ n_energie-potentielle Ep = W = 0 : l'infini équivaut au vide intersidéral, de sorte que la masse en question n'y a plus d'interaction avec la Terre.

Rappel : dans la section précédente nous avons vu que la hauteur à laquelle on place le zéro de l'échelle du potentiel n'a aucune importance ⇒ on peut le placer où l'on veut, notamment à l'infini.

W = ∫r dW    ⇔ par n_energie-potentielle :
W = ∫r m * g * dr'    ⇔ par n_acceleration-gravitation
NB : notez la distinction à faire entre la variable de position r' et le r de l'intégrale qui est la valeur de départ.
W = ∫r m * G * M / r' 2 * dr'    ⇔
W = m * G * M * ∫r 1 / r' 2 * dr'    ⇔ par n_integrale :
W = m * G * M * [ - 1 / r' ]r    ⇔
W = m * G * M * / r    ⇔
L'interprétation est intuitive : plus r est élevé, c-à-d plus on part de haut (zi ⇔ VGi ), moins grand est le travail à réaliser pour élever la masse jusqu'à l'infini (zf = ∞ ⇔ VGf = 0).

À l'infini on a donc que :
Ep(∞) = 0
et d'autre part le travail à fournir pour élever jusqu'à l'infini une masse m à partir d'une hauteur r (comptée à partir du centre de la Terre) vaut :
W = m * G * M * / r
or par n_energie-potentielle :
Ep(r) = Ep(∞) - W    ⇒
Ep(r) = - m * G * M * / r    ⇒
VG(r) = Ep(r) / m = - m * G * M * / r / m    ⇔
VG = Ep / m = - G * M * / r

gravitation-universelle-2.png

Le graphe ci-joint est celui de la fonction VG(r). Il illustre la notion de "puits de potentiel" : pour envoyer une masse m à l'infini à partir de la surface de la Terre il faut une énergie égale à m * G * M * / r, où G * M * / r est la profondeur du puits de potentiel, ou encore la différence de potentiel libératrice. L'énergie qu'il faut mobiliser pour libérer une masse (en l'occurrence une fusée) de la gravitation terrestre est considérable. Ainsi la vitesse de libération du champ gravitationnel terrestre est la solution de l'égalité entre l'énergie cinétique et Ep(r) :
1/2 * m * v2 = m * G * M * / R    ⇔
v = √(2 * G * M * / R)    ⇔
v = √(2 * G * M * / R2 * R )    ⇔ par n_acceleration-gravitation
v = √(2 * g * R )
Cette vitesse, indépendante de la masse de la fusée, vaut :
√(2 * 0,01 * 6.370 ) ≈ 11,3 km/s

gravitation-universelle-3.png

Le graphique suivant représente la baisse (en 1/r) du potentiel gravitationnel au fur et à mesure que l'altitude (la distance au centre de la Terre) augmente : chaque anneau représente un multiple du rayon terrestre. Il y a isotropie des équipotentiels puisque ce sont des sphères centrées sur le centre de la planète.

Potentiel électrique
https://philosophie.jortay.net/savoir-scientifique-base#potentiel-electrique

On va s'intéresser aux potentiels associés à des champ électriques uniformes. Pour ce faire on va se mettre dans une situation comparable au champ gravitationnel, au moyen d'une plaque d'une certaine surface, située dans le vide (⇒ elle ne subit pas de gravitation), chargée négativement (par exemple en la frottant). La méthode de Gauss nous a montré que cette plaque génère un champ perpendiculaire à sa surface et sur une zone centrée (cf. #methode-gauss-plan). La plaque étant chargée négativement, nous savons par n_champ-electrique que le champ est alors dirigé vers la plaque (des deux côtés de celle-ci (mais seul nous intéresse ici le côté "supérieur", pour l'analogie avec le champ gravitationnel). Si nous plaçons une charge q dans ce champ E, nous savons qu'elle va y subir une force F = q * E n_champ-electrique-2.

potentiel-electrique-intro.png

Considérons maintenant le cas de deux billes dont l'une est chargée positivement (bille verte), tandis que la charge de l'autre est neutre (bille bleue). Vu qu'on se situe dans le vide interstellaire les deux billes sont en apesanteur. Cependant la bille verte, étant chargée négativement, est naturellement collée contre la paroi (qui est négative). Pour éloigner la bille de la plaque (on ne dit pas lever car en apesanteur il n'y ni haut ni bas) d'une distance z, il faut combattre la force d'attraction F en effectuant un certain travail W = F * z = q * E * z n_travail, de sorte qu'à la distance z la bille a acquis une énergie potentielle EP = W. Si de la distance z on relâche la bille, celle-ci retourne vers la plaque en acquérant une vitesse v (avec accélération constante) lui donnant ainsi une énergie cinétique EC = 1/2 * m * v2 telle que EC = EP.

NB : ne pas confondre EP (énergie potentielle) et E (module du champ électrique).

Par définition, et analogie avec le potentiel gravitationnel n_potentiel-gravitation-2, le potentiel électrique d'une charge q est :
VE = EP / q [J/C = V (volt)]

On détermine comme suit l'équation permettant de calculer le potentiel électrique V correspondant à une distance quelconque z :
VE = EP / q     ⇔
VE = W / q     ⇔
VE = F * z / q     ⇔
VE = q * E * z / q     ⇔
VE = E * z

Les équations ci-dessus sous forme différentielle :
ΔV(z) ≡ ΔEP(z) / q = E * (zf - zi)
zf et zi sont les positions initiales et finales d'une trajectoire entre deux niveaux de potentiel.

Unité. On voit ici que la notion de volt est moins intuitive que J/C : il faut bien se rappeler que les volts ce sont des joules par coulomb, puisque la notion de potentiel sert précisément à décrire ce qu'il se passe au niveau énergétique (cf. les Joules) quand on déplace des charges dans un champ électrique !

potentiel-electrique.png

Le terme volt vient du nom de l'inventeur de la pile électrique, Alessandro Volta. Comme son nom l'indique une pile électrique est une pile de disques, alternativement composés de zinc et d'argent : celui du bas était en zinc et celui du haut en argent. Ces disques étaient séparés par un buvard imbibé d'acide. Enfin les deux plaques extrêmes comportent une patte appelée "électrode". Celle en zinc (en bas) arrachant les électrons de l'argent (qui a des électrons périphériques mobiles passant facilement au zinc) est alors chargée négativement, tandis que l'électrode du haut (en argent) est chargée positivement.

Ce différentiel de charge génère un champ électrique E. Mais c'est le potentiel V = EP / q = E * d qui caractérise la pile, via la distance d entre les deux électrodes.

Le travail nécessaire pour déplacer une charge positive de l'électrode négative vers la positive est tel que :
W = F * d    ⇒ par n_champ-electrique-2 :
W = q * E * d    ⇒ par n_potentiel-champ :
W = q * V n_potentiel-travail

Ainsi la connaissance du potentiel électrique V permet ainsi de faire facilement des bilans énergétiques pour des échanges de charges entre les deux électrodes. Ainsi en connaissant q et V (déterminés lors de la fabrication de la pile) on connaît alors l'énergie cinétique provoquée par le retour, sur l'électrode négative, de la charge positive qui aura été relâchée de l'électrode positive. Ainsi soit une pile de 1,5 volt de potentiel, alors une charge de 1C échangée entre les deux électrodes met en jeu une énergie de EP = q * V = 1 * 1,5J.

N.B. Pour que le champ entre les deux électrodes soit uniforme (c-à-d pour que les équations ci-dessus soit valables) il faudrait que ces électrodes soient des plaques.

L'analogie avec le potentiel gravitationnel s'applique également pour la notion de différence de potentiel : ΔEP = q * ΔV n_potentiel-electrique
de sorte que l'énergie potentielle et le potentiel peuvent être aussi définis à une constante près. Autrement dit, il ne doit pas nécessairement avoir correspondance entre le zéro de l'échelle de distance et celui de l'échelle de potentiels. Le potentiel est donc une notion abstraite puisqu'à un même point de l'espace la valeur du potentiel sera fonction de la distance arbitraire à laquelle sera fixé le potentiel zéro !

potentiel-electrique-2.png

Soit une pile de 1V de potentiel. Gauche : si le zéro est sur la borne négative, alors la borne positive est à +1V. Droite : si le zéro est placé sur la borne positive alors la borne négative est à -1V. On pourrait aussi avoir -1/2 sur la borne négative et 1/2 sur la borne positive, etc. Tous ces différents "calages" sont équivalents : Vf - Vi = 1 - 0 = 0 - (-1) = 1/2 - (-1/2) = 1 où les indices f et i sont relatifs à la force qu'il faut appliquer pour remonter le courant de la force "naturelle" du système considéré (ici la pile).

Une pile fournit donc une différence de potentiel, encore appelée "tension électrique", "force électromotrice", ou encore "voltage".

potentiel-electrique-3.png

En résumé, la plaque (ci-contre en bleu clair) chargée négativement génère dans son environnement :

  • E : un champ de forces électriques E = F / q (uniformes) , de nature vectorielle (répartition spatiale de vecteurs, dont l'unité des modules est le N/C), qui modélise les forces exercées sur les charges ;
  • V : un champ de potentiels électriques VE = EP / q , de nature scalaire (répartition spatiale de nombres, dont l'unité est le volt=J/C), qui informe sur la situation énergétique (bilans énergétiques).
potentiel-electrique-4.png

Illustration

Supposons que dans le champ de potentiels uniforme du graphique précédent, le module du champ de force uniforme est fixé à E = F / q = 2 N/C. Notons que cela détermine l'échelle des distances (valeur de V à x=1) : par n_potentiel-champ :
V = E * x    ⇒
V = 2 * x    ⇒
la valeur de V pour laquelle x=1 est :
V(1) = 2 * 1 = 2

Ou, plus explicitement :
F / q = 2    ⇒ si q=1C    ⇒ F=2N
⇒ le travail pour amener cette charge de 1C à une distance de 1m vaut :
2N * 1m = 2J     ⇒
VE = Ep / q = W / q = 2 J/C

La fonction potentiel V(x) = E * x n_potentiel-champ est donc une fonction du champ électrique, dont le module E exprime la sensibilité (pente) du potentiel par rapport à la distance. Et la connaissance du potentiel permet de connaître l'énergie des charges se trouvant dans ce potentiel. Par V(x) ≡ EP(x) / q = E * x n_potentiel-electrique :
1 : champ de forces : V(x) = E * x
2 : champ de potentiels : EP(x) = q * V(x)
la connaissance du champ E permet de calculer le potentiel V, qui permet de calculer l'énergie EP.

Le graphe infra représente ces deux fonctions pour une charge positive q = 0,5 C.

potentiel-electrique-5.png

Dans le graphe ci-dessus, on voit que la pente du potentiel V(x) vaut bien 2 (module du champ électrique), et qu'en raison de la valeur de la charge (0,5 C), l'énergie potentielle vaut la moitié du potentiel (NB : les unités ne sont pas les mêmes : le potentiel est en volts, tandis que l'énergie est en joules).

L'énergie totale est représentée par une horizontale (en mauve), ce qui illustre le principe de conservation de l'énergie. La diagonale hachurée exprime alors la transformation de l'énergie potentielle en énergie cinétique au fur et à mesure que la charge se rapproche à vitesse croissante de la plaque (il y a attraction puisque plaque et charge sont de signes opposés). Cette vitesse est donc causée par la force d'attraction, et est à son tour la cause de l'augmentation (linéaire) de l'énergie cinétique : F ⇒ v ⇒ Ec.

Par analogie avec la gravitation on peut interpréter la droite du potentiel comme le flanc d'une pente où dévalent des billes (les charges positives) : une charge positive descend le potentiel, tout comme elle est tirée par le champ dans la direction de diminution du potentiel.

Procédons au bilan énergétique de cette charge positive lorsqu'elle se situe à une distance x=1 de la plaque. Pour ce faire nous avons à notre disposition deux outils : le champ et le potentiel :

  • Champ : cette charge positive subit une force attractive (puisque la plaque est chargée négativement) ⇒ si elle n'est pas retenue alors elle se dirige naturellement vers la plaque (qui est donc sa localisation naturelle en absence d'autres forces) ⇒ la force d'application (qui s'oppose à la force naturelle du système) est telle que 0 = xi (lieu où la force d'application commencera à être exercée) ⇔ EP(0) = EPi.
  • Potentiel :
    EP(x) = q * V(x)   ⇒
    EP(1) = 0,5 * 2 = 1J

    Plus explicitement : soit la charge positive en x=0 ⇒ pour la pousser en x=1 il faut exercer un travail de :
    W = F * x    ⇔
    W = 1 * 1 = 1J   ⇔
    EPf - EPi = 1J    ⇔
    EP(1) - EP(0) = 1J
    or la distance à laquelle correspond le zéro de l'énergie est arbitraire : en l'occurrence le calage est tel que l'énergie potentielle nulle correspond à x=0 : Ep(0) = 0
    EP(1) = 1J
    Tant que la charge est immobile (retenue) en x=1 il y a égalité entre son énergie potentielle et son énergie totale. Si alors on relâche la charge on constate que l'énergie potentielle diminue, au profit de l'énergie cinétique, qui augmente sous l'effet de la force d'attraction, et par l'intermédiaire de la vitesse croissante (F ⇒ v ⇒ Ec). Ce faisant, la charge négative "descend le potentiel" : en se rapprochant de la plaque elle passe par des valeurs décroissantes du potentiel.

Charge
négative

À plaque inchangée (c-à-d toujours chargée négativement), l'analogie avec la gravitation n'est plus valable dans le cas de charges négatives, puisqu'alors la force devient répulsive. Observons ce qui se passe lorsque q=-0,5C :

  • Champ : cette charge subit une force répulsive ⇒ si elle n'est pas retenue, alors elle s'éloigne de la plaque ⇒ elle ne se situe donc pas naturellement en x=0 ⇒ la force d'application (qui s'oppose à la force naturelle du système) est telle que 0 = xf (lieu où la force d'application arrêtera d'être exercée) ⇔ EP(0) = EPf.
  • Potentiel :
    EP(x) = q * V(x)   ⇒
    EP(1) = -0,5 * 2 = -1J
    La notion d'énergie négative est peu intuitive, mais n'oublions pas que le niveau où est placé le zéro de l'énergie est arbitraire ⇔ ce qui compte ce sont les différentiels !

    Ainsi, plus explicitement : soit la charge négative en x=1 ⇒ pour la pousser en x=0 il faut exercer un travail de :
    W = F * x    ⇔
    W = 1 * 1 = 1J   ⇔
    EPf - EPi = 1J    ⇔
    EP(0) - EP(1) = 1J    ⇒
    0 - EP(1) = 1J    ⇔
    EP(1) = -1J    ⇔
    Et si alors en x=0 on relâche la charge on constate que l'énergie potentielle diminue, au profit de l'énergie cinétique, qui augmente sous l'effet de la force de répulsion, et par l'intermédiaire de la vitesse croissante : on a toujours F ⇒ v ⇒ Ec. La charge négative remonte ici le potentiel : en s'éloignant de la plaque elle passe par des valeurs croissantes du potentiel.

potentiel-electrique-6.png

Dans le cas d'une plaque négative et d'une charge négative, la droite de l'énergie potentielle (ligne hachurée) est celle du bas.

L'analogie avec la gravitation est ici inversée : on peut voir les particules négatives comme de petites bulles d'air dans l'eau, et qui, poussées vers la droite par la force répulsive, remonteraient le long d'une paroi inclinée (la ligne continue du graphe) située juste au-dessus d'elles.

On a donc une règle générale : toute charge (quel que soit son signe) se dirige (mouvement) dans le sens de la diminution de son énergie potentielle, et donc dans le sens de l'augmentation de son énergie cinétique (mouvement). La différence c'est que les charges négatives remontent le potentiel (c-à-d vont donc contre /sont repoussées par le champ), tandis que les charges positives descendent le potentiel (c-à-d suivent /sont tirées par le champ). La direction du champ indique donc toujours la baisse du potentiel. Nous verrons plus loin que cette règle générale vaut également dans le cas d'une plaque positive.

potentiel-electrique-7.png

Cette propriété de la charge négative remontant le potentiel correspond précisément à ce qui se passe dans les circuits, par exemple celui constitué par une pile dont on a relié les deux électrodes par un fil de cuivre (qui conduit l'électricité) : un courant transporte les électrons de l'électrode négative, qui remontent ainsi jusqu'à l'électrode positive. Les électrons "remontent" naturellement le champ électrique, du fond de leur puits de potentiel, en perdant de l'énergie potentielle !

Ici il n'y a donc plus analogie avec le champ gravitationnel, qui maintient la masse au fond du puis, tandis que les électrons le remontent naturellement (si les électrodes sont reliées par un conducteur). Nous avons vu que cela est du au fait qu'on peut donner un signe différent aux charges, tandis que la masse est toujours positive.

Mais en remontant le potentiel les électrons de la pile perdent de leur l'énergie potentielle. Pourtant leur vitesse est constante, ce qui implique qu'ils ne gagnent pas d'énergie cinétique. Comment cela est-il possible, puisqu'il y a conservation de l'énergie ? La réponse est qu'il y a bien conservation, mais que la transformation peut se faire vers diverses forme d'énergies alternatives. En l'occurrence l'énergie potentielle ne se transforme pas en énergie cinétique mais en énergie thermique c-à-d en chaleur. C'est l'effet Joule : une résistance liée à une source de tension produit de la chaleur (principe du chauffage électrique).

Plaque +
Charge +

Passons maintenant au cas d'une plaque positive. Dans ce cas le champ est extraverti n_champ-electrique. Considérons le cas d'une charge d'essai positive q=0,5C, toujours dans un champ tel que E = F / q = 2 N/C.

  • Champ : cette charge positive subit une force répulsive ⇒ la charge n'est pas naturellement contre la plaque ⇒ la force d'application (qui s'oppose à la force naturelle du système) est telle que 0 = xf (lieu où la force d'application arrêtera d'être exercée) ⇔ EP(0) = EPf.
  • Potentiel : soit la charge située en x=1 ⇒ pour la ramener sur la plaque (c-à-d en x=0) il faut exercer un travail :
    W = F * x   ⇒
    W = 1 * 1 = 1J    ⇒
    EPf - EPi = 1J    ⇔
    EP(0) - EP(1) = 1J    ⇔
    0 - EP(1) = 1J    ⇔
    EP(1) = -1J    ⇒
    V(1) = EP(1) / q    ⇔
    V(1) = -1 / 0,5 = -2J
    Analyse :
    • le graphe de EP est celui correspondant à plaque et charge négatives ;
    • le graphe de V est le symétrique de celui de la plaque négative ⇒ le champ de potentiels est le même que celui de la plaque négative au signe près.

La règle générale supra se complète donc par une propriété supplémentaire : lorsqu'on s'éloigne de la plaque, une plaque positive génère donc dans son espace environnant un potentiel qui diminue (dans les valeurs négatives), tandis qu'une plaque négative génère un potentiel qui augmente (dans les valeurs positives).

Plaque +
Charge -
  • Champ : cette charge négative subit une force attractive (puisque la plaque est chargée positivement) ⇒ elle est naturellement contre la plaque c-à-d en x=0 ⇒ la force d'application (qui s'oppose à la force naturelle du système) est telle que 0 = xi (lieu où la force d'application commencera à être exercée) ⇔ EP(0) = EPi.
  • Potentiel : puisque l'on connaît le potentiel de la plaque en x=1, on peut aller plus vite pour ce second point : EP = q * V    ⇒
    EP(1) = -0,5 * V(1)    ⇒
    EP(1) = -0,5 * -2 = 1J

    Plus explicitement : soit la charge négative en x=0 ⇒ pour la pousser en x=1 il faut exercer un travail de :
    W = F * x    ⇒
    W = 1 * 1 = 1J    ⇒
    EP = W    ⇒
    EPf - EPi = 1J    ⇔
    EP(1) - EP(0) = 1J    ⇔
    EP(1) - 0 = 1J    ⇔
    EP(1) = 1J    ⇒
    V(1) = EP(1) / q    ⇔
    V(1) = 1 / -0,5 = -2J
    Analyse :
    • le graphe de EP est celui correspondant à plaque négative et charge positive ;
    • le graphe de V est le symétrique de celui de la plaque négative ⇔ le champ de potentiels est le même que celui de la plaque négative au signe près.
potentiel-electrique-8.png

Le signe + de V+(x) signifie qu'il s'agit du potentiel de la plaque positive.

Le graphique suivant résume les quatre cas de figure.

potentiel-electrique-synthese.png

Toute charge (quel que soit son signe) se dirige dans le sens de la diminution de son énergie potentielle. La différence c'est que les charges négatives remontent le potentiel (c-à-d vont contre le champ), tandis que les charges positives descendent le potentiel (c-à-d suivent le champ). La direction du champ indique donc toujours la baisse du potentiel ⇔ lorsqu'on s'éloigne de la plaque, une plaque positive génère donc dans son espace environnant un potentiel qui diminue (dans les valeurs négatives), tandis qu'une plaque négative génère un potentiel qui augmente (dans les valeurs positives).

Accélérateur
de particules

Pour construire (et améliorer) des accélérateurs de particules chargées – utilisés dans certains appareils médicaux, ou encore pour la recherche fondamentale sur la composition de la matière – il est indispensable de connaître la théorie que nous venons de présenter.

potentiel-electrique-9.png

Voici comment fonctionne un accélérateur (linéaire). Une source de particules (cube en bleu dans le graphique ci-joint) contient des atomes d'hydrogènes qui sont ionisés (débarrassés de leur unique électron) ⇒ il ne reste de chaque atome H que son unique proton. Ces protons sortent de la source à très basse vitesse (v≈0) puis traversent des cylindres de cuivre (qui est conducteur, en jaune dans le graphique). Ceux-ci sont reliés par une source de tension : une différence de potentiel (atteignant des milliers de volts) est créée de sorte que le premier cylindre est chargé positivement et le second négativement (et nous avons vu que le sens du courant va de borne positive à borne négative : #cohesion-electromagnetique). Chaque cylindre fonctionnant comme un plan (cf. supra #methode-gauss-plan), un champ électrique uniforme est ainsi créé entre eux. Ce champ entre les cylindres accélère ainsi les protons qui le traversent.

Application . Comment calculer la vitesse acquise par les protons accélérés ?

Du point de vue de l'ingénieur qui conçoit l'accélérateur, pour dimensionner celui-ci il faut connaître la vitesse en fonction de la tension que l'on va appliquer.

Un façon de résoudre ce problème est de calculer l'accélération : un proton a une certaine masse, or toute masse qui subit une force est accélérée ⇒ on peut donc utiliser les équations du MRUA (cf. supra #cinematique). Cependant une solution plus simple (requérant moins de calculs) consiste à utiliser le principe de conservation de l'énergie, et donc en l'occurrence d'utiliser la notion de potentiel électrique. Nous avons vu qu'à la distance entre ces deux cylindres correspond une différence de potentiel, que l'on peut calculer par V = E * d n_potentiel-champ.

potentiel-electrique-10.png

Supposons un proton situé contre le second cylindre, et que l'on ramène au premier. Pour contrer le champ il faut exercer un travail, qui confère au proton une énergie potentielle : EP = q * V    n_potentiel-electrique-1 ... où q et V sont connus ⇒ EP aussi. Ensuite si on relâche le proton, alors il repart vers le second cylindre, avec augmentation de son énergie cinétique, jusqu'à atteindre une valeur égale à EP (NB : qui ne diminue pas, cf. infra) ⇒ le calcul de la valeur que v aura alors atteinte se fait en résolvant l'égalité :
EC = EP     ⇔
1/2 * m * v2 = q * V     ⇔
v = √( q * V * 2 / m)
où :
• la charge q du proton, est la même que celle de l'électron au signe près (cf. supra #atomes) ;
• la masse m du proton est donnée via le nombre d'Avogadro n_u.m.a. ;
• on fixe V=50.000V ;
⇒ v = 3 * 106 m/s
c-à-d 3.000 km/s, ou encore 1% de la vitesse de la lumière : à cette vitesse les protons mettraient environ deux secondes pour atteindre la lune !

potentiel-electrique-synthese-2.png

N.d.A. L'énergie potentielle ne diminue pas entre les deux cylindres, car, comme montré dans le graphique ci-joint, le système de l'accélérateur est une combinaison de deux des quatre cas étudiés ci-avant : plaque(+) & charge(+) + plaque(-) & charge(+). Or, par symétrie, les deux effets se neutralisent, l'un correspond à une augmentation d'énergie potentielle tandis que l'autre correspond à une diminution de même ampleur).

Ainsi en ajoutant des étages d'accélération (c-à-d des couples de cylindres) on peut atteindre des vitesses proches de celle de la lumière. On atteint ainsi des niveaux d'énergie cinétique considérables qui permettent, en faisant se collisionner des protons, d'étudier leurs débris et partant la composition des particules collisionnées. Les accélérateurs sont utilisés aussi pour l'imagerie médicale (dans ce cas les particules accélérées sont des électrons, générant ainsi des rayons-x) ou encore la protonthérapie (des protons sont accélérés par un accélérateur circulaire appelé "cyclotron").

Loi d'Ohm
https://philosophie.jortay.net/savoir-scientifique-base#ohm
ohm-electroscope.png

Dans les années 1820, des scientifiques ont relié au pôle positif d'une pile volta un électroscope à feuillets d'or. On constatait alors que les feuillets s'écartaient. Cet écartement mesure la tension de la pile.

Cependant à cette époque on n'en comprenait pas la raison, à savoir que les électrons de ces feuillets rejoignant la pile, les feuillets portaient alors des charges de même signe (en l'occurrence positif), et par conséquent se repoussaient.

ohm-boussole.png

Quelques années plus tard Ampère découvrit qu'en reliant les électrodes de la pile par un fil métallique on constatait que l'aiguille d'une boussole placée à proximité du fil était déviée, ce qui pourrait constituer une mesure du courant passant par le fil. Mais il constata aussi que l'effet de tension observée sur les deux feuillets de l'électroscope disparaissait, ce qui rendait impossible la mesure d'une relation entre l'écart des feuillets et la variation de l'aiguille.

Ohm reproduisit alors cette expérience sous diverses formes, et découvrit que dans le système originel la tension disparaissait en raison d'un défaut de la pile volta : elle est composée d'une résistance interne très importante. Il conçut alors une source de tension avec une faible résistance : un thermocouple. La tension est plus faible mais le système présente l'avantage que la tension ne disparaît pas, ce qui permit à Ohm de mesurer la relation entre celle-ci et le courant généré (mesuré par la déviation de la boussole, et d'ainsi confirmer expérimentalement sa théorie mathématique.

ohm-pile.jpg

Le sens du courant, c-à-d du débit de charges.

Celle-ci, la loi d'Ohm, décrit une relation de proportionnalité entre la tension (le voltage) V appliquée à un conducteur, et le courant I résultant de cette tension. Le coefficient de proportionnalité R est appelé "résistance électrique" : V = R * I.

Notons qu'à cette époque Ohm et les autres savants ignoraient que le courant mesuré par l'aiguille de la boussole correspondait à un flux de charges, et que la tension mesurée par l'écartement des feuillets correspondait à une différence de potentiel électrique, elle même liée à l'énergie potentielle des charges responsables du courant.

Pour illustrer le développement mathématique de la loi d'Ohm au regard des connaissances actuelles sur les électrons, reprenons le cas de l'accélérateur de particules présenté dans la section précédente. La particule y est accélérée sous l'action d'une force continue. Maintenant si l'on place des obstacles sur la trajectoire de la charge qe, sa trajectoire ne sera plus rectiligne, de sorte que sa vitesse n'est plus accélérée. Cette situation est celle d'une barre métallique, dont on sait que ses atomes sont agencés en réseau cristallin. Dans cette situation qui est celle d'un matériaux conducteurs, les atomes perdent un électron périphérique, qui devient libre, et n'est mobile que par l'agitation thermique. Mais si en outre ces électrons libres sont soumis à un champ électrique, alors ils vont en suivre le courant.

C'est une propriété des matériaux conducteurs que d'être composés notamment d'un grand nombre d'électrons libres (à l'opposé, les isolants n'en contiennent que très peu).

Nous allons maintenant faire une hypothèse pour simplifier le développement mathématique de la loi d'Ohm : l'électron considéré dans l'accélérateur possède une charge ... positive (rappelons-nous que l'attribution de la charge négative aux électrons est une convention et non un fait physique : cf. #cohesion-electromagnetique). Concrètement, on pose ainsi que le mouvement des électrons vers la gauche (dynamique qui complexifie l'exposé) c'est comme des charges positives qui vont vers la droite (cas de l'accélérateur étudié plus haut).

On va modéliser (i) une vitesse constante, qui est la moyenne des vitesses de l'ensemble des électrons de charge +, et (ii) un débit de charges.

On peut faire à nouveau l'analogie avec la force gravitationnelle, où une bille de plomb lâchée dans un tube d'huile, subit une force de friction fluide, ayant pour effet que son accélération est annulée, de sorte que la vitesse est constante. Une bille d'or de même dimension descendrait deux fois plus vite qu'une bille de plomb car sa densité est deux fois plus élevée. Dans ces conditions de frottement, la vitesse est donc proportionnelle à la force subie : v ∝ m * g.

On va ici modéliser le même type de phénomène, mais cette fois pour la force électrique. Par n_champ-electrique-2 :
v ∝ qe * E    ⇒
puisque qe est une constante naturelle :
v ∝ E    ⇒
v = μ E
μ est la mobilité électronique des électrons libres du matériaux considéré.

D'autre par le débit de charge (le courant) se mesure par :
I = qe * η * Volume / Δt
η est la densité des électrons libres par unité de volume du matériaux considéré (⇔ les matériaux isolants, c-à-d peu conducteurs, ont un η de très faible valeur) ⇔ par n_vitesse :
I = qe * η * ( v * Δt * S ) / Δt
S est la surface de section de la barre de matériaux    ⇔
I = qe * η * v * S    ⇔ par n_mobilite-electronique :
I = qe * η * μ E * S
or : V = E * L   n_potentiel-champ   ⇔ E = V / L   ⇒
I = qe * η * μ * S / L * V    ⇔
I = σ * S / L * V
où :
σ = qe * η * μ
sont trois propriétés physiques propres au matériaux, déterminant sa conductivité électrique (σ) ;
• alors que S / L sont des propriétés géométriques propres à la barre constituée du matériaux ;

V = 1 / σ * L / S * I    ⇔
loi d'Ohm : V = R * I

R = 1 / σ * L / S est la résistance du matériaux utilisé.
CQFD

  • On notera la cohérence intuitive de la relation physique de R avec la conductivité σ, la surface S de la section : "plus le tuyau est large plus ça passe". N.d.A. : concernant l'effet de L sur R, peut-on dire que le plus la barre est longue dans l'espace, plus sa résistance est longue dans le temps ?
  • Ohm avait compris que R = ? * L / S. Ce n'est que plus tard, grâce à la compréhension des composants microscopiques de l'électricité (les électrons), que l'on a pu établir que ?=1/σ.

Une lecture peut être plus intuitive de la loi d'Ohm est I = V / R :
• il ne peut y avoir de courant sans différence de potentiel ;
• le courant est d'autant plus élevé que la résistance est faible.

Ce qui est moins intuitif c'est que dans le vide (on retire la barre) la résistance n'est pas nulle mais ... infinie ! En effet si ∄ barre ⇒ ∄ électrons libres ⇔ η=0 ⇒ par n_conductivite : σ=0 ⇒ par n_loi-ohm : R=∞.

Revenons à la forme classique de la loi d'Ohm V = R * I , qui est celle la plus utilisée dans la pratique : la connaissance du courant I et de la résistance R du matériaux imposent une tension électrique V=R*I aux bornes du conducteur.

ohm-avancee.jpg

Accélérateur de particules

L'effet de la longueur de la barre sur la tension apparaît au travers de R = 1 / σ * L / S n_resistance : plus la barre est longue ⇒ plus la résistance R est élevée ⇒ plus le potentiel doit être élevé pour fournir un courant déterminé.

Un corrolaire de cette propriété est que le potentiel (la tension) diminue progressivement le long du conducteur : plus l'électron est situé vers la droite, plus la distance qui le sépare de la borne négative est petite. Cela est illustré par le graphe de la pente du potentiel (en rouge). C'est la notion de distribution de la tension électrique : la tension n'est pas seulement une valeur donnée pour une pile électrique, c'est aussi une valeur qui diminue tout au long du conducteur soumis à cette différence de potentielle donnée. Cela correspond bien au fait que la tension électrique représente le potentiel électrique c-à-d l'énergie potentielle divisée par la charge n_potentiel-electrique-1. Dans l'analogie avec la gravitation, la particule est alors vue comme une masse descendant le long de cette pente.

Et pourquoi la résistance R varie-t-elle dans le même sens que la longueur L de la barre ? La réponse est donnée par V = E * L n_potentiel-champ : si pour un potentiel donné, la distance entre les deux bornes diminue ⇒ le champ, c-à-d la pente du potentiel, augmente nécessairement ⇒ les charges la descendront d'autant plus vite. À priori on aurait pu penser que l'effet de L sur R était de même type de celui de S sur R, or ce n'est pas le cas : L, qui semblait être un paramètre géométrique, apparaît plutôt de nature dynamique car L intervient sur la valeur du champ c-à-d des forces qui sont en jeu.

On peut poursuivre l'analyse de la loi d'Ohm sous sa forme détaillée I = qe * η * μ * S / L * V ohm-detail. Ainsi par exemple, avec moins de frottements (μ ↑) la masse va accélérer (NB : les frottements sont causés par les obstacles que constituent les atomes de la barre).

Notons enfin qu'Ohm fut très influencé par la loi de Fourrier sur la conduction de la chaleur ΔT = R * H
ΔT est le différentiel de température entre deux "sources de température" (tout comme V est la différence de potentiel) ;
H est le débit de chaleur entre ces deux sources, au travers d'un matériaux ;
R est la résistance thermique de ce matériaux.
Ainsi par des développement mathématiques Fourrier avait également démontré théoriquement une relation linéaire entre ΔT et L.

circuit-electronique.jpg

N.d.A. Le graphique ci-contre illustre un circuit électronique de base, constitué d'une source de potentiel v, générant un courant i, freiné par une résistance R (que l'on peut comparer aux forces de friction de la mécanique). Tout matériaux étant caractérisé par une résistance, correspond ainsi à ce phénomène un composant électronique, parfois appelé "dipôle résistant", et qui fait sens dans la mesure où la résistance de son matériaux diffère de celle du reste du circuit.

Champ quelconque
https://philosophie.jortay.net/savoir-scientifique-base#champ-non-uniforme

Nous avons jusqu'ici supposé le cas de champ uniformes, c-à-d notamment que les vecteurs du champ ont même direction et module. Il en résulte que les trajectoires des électrons dans ce champ sont également uniformes, ce qui facilite grandement leur calcul. Mais lorsque le champ est quelconque, les trajectoires des électrons sont généralement non rectilignes. Une technique de calcul de ces trajectoires est l'intégrale de circulation.

Trajectoire

Pour développer tout cela il nous faut commencer par montrer qu'une différence de potentiel est indépendante de la trajectoire suivie par un corps pour passer d'un niveau de potentiel à l'autre.

Nous allons donc montrer qu'il y a là une analogie directe avec le champ gravitationnel : dans la section #potentiel-gravitationnel nous avions en effet montré que le travail à fournir pour élever une masse m à une hauteur h est indépendant de l'angle que fait avec le sol la pente par laquelle la masse est élevée, c-à-d indépendant de la longueur du chemin choisi.

champ-quelconque.jpg

Le graphique ci-contre illustre la trajectoire quelconque d'un corps entre les positions initiale (i) et finale (f), auxquelles correspondent une différence de potentiel ΔV. Au corpuscule sont associés un vecteur déplacement dl et le champ E.

Commençons par le cas d'un champ uniforme tel que E = 1 N/C et ΔV = 1 J/C ⇒ par n_potentiel-electrique dl = 1. Si l'on déplace alors la charge d'un niveau de potentiel x à x+1 selon un trajectoire qui n'est plus parallèle au champ ⇒ dl augmente. On se rend alors compte qu'il faut adapter ΔV = E * Δl n_potentiel-electrique pour que la modélisation mathématique soit cohérente avec le fait que le champ de potentiels est une "lasagne" indépendante de la trajectoire prise pour passer d'un niveau de potentiel à l'autre. En fait ΔV = E * Δl= F / q * Δl = W / q n'est qu'un cas particulier tel que le vecteur "force" F et le vecteur "déplacement" Δl sont parallèles. Or on sait que la formulation générale du travail, c-à-d pour une forcée exercée dans une direction quelconque par rapport à celle du déplacement, est donnée par le produit scalaire du vecteur force et du vecteur déplacement du point d’application de la force (cf. supra #produit-scalaire).

champ-quelconque-gravitation.jpg

Pour montrer cela dans une autre expérience, plaçons-nous à nouveau d'abord dans le contexte gravitationnel. Un homme placé sur un plateau roulant dans un MRU (cf. supra #cinematique) soulève une masse. La trajectoire de celle-ci ne sera donc plus perpendiculaire au sol. Or le travail effectué par l'homme est inchangé par rapport à la situation de repos : son mouvement implique certes une énergie cinétique, mais celle-ci étant constante durant l'exercice (puisqu'on est en MRU), le bilan énergétique (notion de différentiel) est identique à la situation sans mouvement. C'est donc la projection verticale du déplacement (c-à-d sur la direction de la force gravitationnelle) qu'il faut prendre en compte dans le calcul du travail. Nous avons vu que c'est précisément ce que fait le #produit-scalaire :
W = Fa . Δl = m * g * Δl * cos(θ)    ⇔
W = - m * g . Δl    ⇒ en vertu du principe de conservation de l'énergie :
N.B. L'apparition du signe " - ", est due au remplacement de g par g, et exprime que le travail est calculé à partir de la force appliquée (orientée vers le haut) et non du poids c-à-d la force gravitationnelle (orientée vers le bas). Ce signe - n'implique pas que le travail est négatif : Fa est appliquée vers le haut, ce qui implique que θ<π/2 ⇒ cos(θ)>0 ⇒ W est ici bien positif !
ΔEp = - m * g . Δl    ⇒ par n_potentiel-gravitation-1 :
ΔVG = - g . Δl

Ainsi la différence de potentielle est bien positive, c-à-d que le potentiel augmente, dans le sens opposé à celui du champ ... et inversement (NB : on retrouve ainsi le résultat exposé dans notre graphe synthétique du chapitre consacré au potentiel électrique).

champ-quelconque-electricite.jpg

Champ
équipotentiel

Rien n'empêche d'appliquer au champ électrique les principes développés ci-dessus :
m devient q
g devient E

W = - m * g . Δl
devient
W = - q * E . Δl    ⇒ par n_potentiel-travail :
ΔV = - E . Δl
que l'on comparera utilement à :
ΔV = E * (zf - zi) n_potentiel-electrique
en comprenant la signification du signe - lorsque l'on passe de la norme E au vecteur -E.

champ-quelconque-projections.jpg

Or, par définition du produit scalaire, dans n_champ-equipotentiel, Δl représente des vecteurs qui ont tous la même projection Δz sur E :
ΔV = E * Δz
N.B. il s'agit ici non plus de vecteurs mais de scalaires, d'où la disparition du signe " - ".

champ-quelconque-equipotentiel.jpg

On a ainsi démontré la cohérence de la notion de champ équipotentiel : quelle que soit l'inclinaison, c-à-d la direction suivie pour passer d'un potentiel au suivant, la différence de potentiel est identique !

champ-quelconque-trajectoire.jpg

Et comme chacune de ces trajectoires rectilignes peut être vue comme la somme d'une multitudes de trajectoires également rectilignes mais non parallèles, il en résulte que le principe demeure dans le cas de trajectoires quelconques c-à-d non rectilignes :
n=1N ΔVn = - ∑n=1N E . Δln    ⇔
ΔV = - E . ∑n=1N Δln    ⇔
ΔV = - E . Δl = E * Δz
c-à-d n_champ-equipotentiel.

Pour généraliser au cas de courbes quelconques lisses il suffit, dans n_champ-quelconque-trajectoire-1 de remplacer les Δln   par des dl arbitrairement petits, puis de les intégrer (sommation "continue", c-à-d comportant un nombre infini de termes) :
∫ dV = - ∫ E . dl    ⇔

  • La disparition des indices de n_champ-quelconque-trajectoire-1 se justifie par la nature indénombrable des termes d'une somme continue.
  • Le membre de droite est appelé "intégrale curviligne" (car elle intègre des distances infinitésimales), et plus précisément "intégrale de circulation" (du champ E) en raison du produit scalaire entre le champ et les distances infinitésimales.

∫ dV = - E . ∫ dl    ⇔
et par addition vectorielle (cf. #vecteur-addition-multiplication) :
ΔV = - E . Δl
⇔ on retrouve à nouveau n_champ-equipotentiel.

trajectoire-quelconque-champ-uniforme.jpg

Champ
quelconque

Nous venons de montrer que le principe de champ de potentiel uniforme (plus exactement "champ équipotentiel") est indépendant du chemin suivi entre niveaux de potentiel.

Mais nous avons raisonné dans le cadre d'un champ électrique uniforme. Cette hypothèse de champ constant a permis le passage de n_champ-quelconque-integration-1 à n_champ-quelconque-integration-2 en isolant le champ E hors de l'intégrale de circulation. Mais si on lève l'hypothèse de champ uniforme (c-à-d constant), cela ne sera plus possible ...

trajectoire-champs-quelconques-2.jpg

Ainsi si le champ n'est plus uniforme, alors
n=1N ΔVn = - ∑n=1N E . Δln      n_champ-quelconque-trajectoire-1
devient :
n=1N ΔVn = - ∑n=1N En . Δln

Le graphique ci-contre illustre des vecteurs de modules et directions différents, ce qui requiert de les distinguer par un indice : En ne peut donc plus être extrait de la somme.

trajectoire-champs-quelconques-2.jpg

et
ΔV = ∫ dV = - ∫ E . dl      n_champ-quelconque-integration-1
devient :
ΔV = - ∫i→f E(x) . dl n_champ-quelconque-integration-3
qui indique bien que le champ varie de façon continue de position en position ⇔ on introduit le vecteur position x dans un repère cartésien ⇔ on intègre une fonction des coordonnées de l'espace (PS : on devrait également remplacer dl par dl(x) puisque les vecteurs changent de direction selon leur position, mais les mathématiciens ont pour habitude de ne pas le mentionner). L'égalité ΔV = - E . Δl = E * Δz n'a donc plus de sens dans le cas d'un champ non uniforme.

On doit alors en déduire que l'équipotentialité n'est plus localisée sous la forme de plans, mais de surfaces qui sont d'autant plus complexes que le champ électrique est complexe. Lorsque nous étudierons le calcul du potentiel d'une charge ponctuelle (notion de "champ coulombien") génèrant un champ non uniforme, nous verrons que demeure néanmoins la propriété d'indifférence du différentiel de potentiel par rapport au chemin suivi entre niveaux de potentiel, c-à-d entre surfaces équipotentielles complexes (on dit que le champ électrique est "conservatif").

champ-quelconque-travail.jpg

Pour comprendre intuitivement n_champ-quelconque-integration-3, il est utile de l'interpréter en terme d'énergie potentielle (rappel : VE = EP / q n_potentiel-electrique-1 ). Celle-ci est calculée par le travail réalisé pour passer du point i au point f (travail de la force "appliquée") :
dW = - q * E . dl    ⇒
W = ∫i→f dW = ∫i→f - q * E . dl    ⇒
ΔEP = ∫i→f - q * E . dl    ⇒
ΔV = - ∫i→f E . dl    ⇒
qui est bien n_champ-quelconque-integration-3. Rappelons encore une fois que le signe - exprime le fait que le travail réalisé est celui de la force appliquée contre celle du champ (et la différence de potentiel peut être positive ou négative selon la situation).

Les unités du membre de droite sont :
N / C * m = V    ⇔
N / C = V / m
qui est l'unité la plus fréquemment utilisée du champ électrique.

pile-champ.jpg

Application. Une pile est caractérisée par une différence de potentiel, c-à-d une tension, qui est créée par une réaction électrochimique accumulant des charges négatives sur un pôle et des charges négatives sur l'autre. Il en résulte un champ électrique (dit "dipolaire") sortant du pôle positif et revenant au pôle négatif. Ainsi une pile de 1,5V est telle que l'intégrale du champ - E depuis le pôle négatif jusqu'au pôle positif, selon une trajectoire quelconque vaut 1,5V. NB : on notera dans l'image ci-jointe que le champ -E remonte bien du pôle négatif (bas) vers le pôle positif (haut).

Potentiel coulombien
https://philosophie.jortay.net/savoir-scientifique-base#potentiel-coulombien
triangle-clipedia.png Vidéo Clipedia : Le potentiel coulombien

Lagrange avait introduit la notion de potentiel gravitationnel n_potentiel-gravitation-2, pour les calculs de mécanique céleste, comme par exemple celui de l'orbite lunaire autour de la Terre. L'intérêt de la notion de potentiel est d'exprimer très simplement le principe de conservation de l'énergie, et d'ainsi simplifier les calculs.

Or Coulomb avait découvert entre-temps la loi du champ de force électrique. Laplace avait alors remarqué l'équivalence – au niveau de la radialité (1r) et de la dépendance en 1/r2 – entre l'expression des champs gravitationnel et électrique :

où la constante gravitationnelle -M * G correspond à q / ( 4 * π * ε0 ).

⇒ Laplace a étendu cette équivalence à la notion de potentiel :

Le terme "potentiel coulombien" désigne la distribution spatiale de potentiel, associée au "champ coulombien" d’une charge électrique ponctuelle.

potentiel-coulombien.jpg

Pour calculer l'intégrale de circulation n_champ-quelconque-integration-3 (entre les points xi et xf) il faut y injecter n_coulomb-permittivite, où :

  • E(x) est le champ au vecteur position x, dans un repère dont l'origine est centrée sur la charge q (idem pour xi et xf) ;
  • r est la distance entre la charge q et le point de calcul (x) du champ correspondant à cette charge ; aussi appelée "coordonnée radiale", elle est mesurée relativement au vecteur unitaire radial 1r.
Potentiel
absolu

On pourra alors calculer la distribution de potentiel (ou encore "fonction potentiel") V(x). Celle-ci est telle que :
ΔV = - ∫xixf E . dl = V(xf) - V(xi)    ⇒
si l'on suppose que le référentiel de potentiel zéro est tel que :
V( xi ) = 0    ⇒
ΔV = - ∫xixf E . dl = V(xf)
que l'on appelle "potentiel absolu".
Mais ce que l'on cherche c'est le potentiel en x et non pas en xf    ⇒
ΔV = - ∫xix E . dl = V(x)

Il reste à situer le référentiel de potentiel nul de façon pertinente pour calculer le potentiel de la charge q. Serait-il pertinent de le fixer sur la charge elle-même, à l'instar de ce qu'on avait avec la plaque chargée (cf. #potentiel-electrique) ? Non, ici ce n'est pas la bonne solution car alors r=0E(0)=∞ par n_coulomb-permittivite. On va plutôt, dans la continuité de l'analogie avec la force de gravitation, faire le même choix que pour calculer le potentiel gravitationnel (cf. supra #gravitation-universelle), à savoir l'infini ⇒ E(∞)=0 : ce référentiel est idéal car un charge d'essai située à l'infini ne subit aucune force.

Tous les points situés sur la sphère de l'infini sont donc à un potentiel nul. Notre équation devient alors :
ΔV = - ∫x E . dl = V(x)

potentiel-coulombien-1.jpg

On va commencer par faire ce calcul (passer de l'infini à x, par succession de petits pas dl ) sur l'axe de coordonnée radiale (après on étudiera le cas d'une trajectoire quelconque). Pour ce faire on considère :
• un point courant x', de coordonnée radiale r', et circulant de l'infini au point x ;
E et dl  en ce même point courant x' ;
⇒ on substitue n_coulomb-permittivite dans n_potentiel-coulombien
ΔV = - ∫∞→x q / ( 4 * π * ε0 * r' 2 ) * 1r . dl = V(x)

Reste à traiter l'autre facteur de n_potentiel-coulombien, dl , qui est tel que :
dl = dr' * 1r
où dr'<0 puisqu'on se dirige de l'infini vers x   ⇒
ΔV = - ∫∞→x q / ( 4 * π * ε0 * r' 2 ) * 1r . dr' * 1r    ⇔
ΔV = - ∫∞→x q / ( 4 * π * ε0 * r' 2 ) * dr' * 1r . 1r    ⇔
ΔV = - ∫r q / ( 4 * π * ε0 * r'2 ) * dr'    ⇔
NB : la valeur de la borne inférieure de l'intégrale est supérieure à la valeur de la borne supérieure, ce qui est cohérent avec le fait que les dr' sont négatifs (on ne doit donc pas mettre de signe "-" devant dr' : cela est implicite dans le calcul de l'intégrale, qui a toujours un sens, de la borne inférieure vers la borne supérieure).
ΔV = - q / ( 4 * π * ε0 ) * ∫r 1 / r'2 * dr'    ⇒
en remplaçant r' par x pour simplifier la notation    ⇒
ΔV = - q / ( 4 * π * ε0 ) * ∫r 1 / x2 * dx    ⇒ (cf. #integrale)
ΔV = q / ( 4 * π * ε0 ) * [ 1 / x ]r    ⇔
ΔV = V(x) = q / ( 4 * π * ε0 ) / r
On notera que cette équation du potentiel coulombien est proche de celle du champ coulombien E(x) = q / ( 4 * π * ε0 * r 2 ) * 1r n_coulomb-permittivite
... avec cependant deux différences importantes :
• le champ est vectoriel tandis que le potentiel est scalaire ;
• le champ est dépendant en 1/r2 tandis que le potentiel est dépendant en 1/r.

Soulignons le fait que la formule du potentiel est bien celle d'une distribution : x est quelconque : l'ensemble des points situés à une distance r de la charge q constitue une sphère équipotentielle (N.d.A. : on pourrait la comparer à un oignon dont chaque couche de pelure représente un niveau de potentiel).

Interprétation
physique

Pour illustrer la signification physique de cette notion de potentiel, calculons le travail nécessaire pour amener une charge d'essai q0 depuis l'infini jusqu'à la distance r correspondant au point x : pour ce faire je dois combattre la force électrique qui vaut q0 * E ⇒ on obtient la valeur de ce travail en multipliant n_potentiel-coulombien par q0    ⇒
- ∫∞→x q0 * E . dl = q0 * V(x)
où l'on voit que le potentiel c'est ce travail (c-à-d l'énergie) divisé par la charge d'essai q0.

potentiel-coulombien-2.jpg

Généralisons enfin ce résultat au cas d'un trajet quelconque, et non plus seulement le long d'un axe radial (sans quoi la notion de potentiel n'aurait pas grande utilité). Que se passe-t-il lorsqu'on passe d'une charge d'essai de l'infini au point x ? Dans ce cas les dl ne sont plus alignés sur l'axe radial : ils sont quelconques.

Le champ situé à une distance r' de la charge q se calcule par E(x) = q / ( 4 * π * ε0 * r' 2 ) * 1r n_coulomb-permittivite. Quant aux dl, on a pas besoin de les calculer car ils apparaissent au travers du produit scalaire de ΔV = - ∫∞→x E . dl = V(x) n_potentiel-coulombien.

potentiel-coulombien-3.jpg

Or celui-ci est tel que :
E . dl = q / ( 4 * π * ε0 * r' 2 ) * 1r . dl    
or par n_produit-scalaire-trigono, on sait que le produit scalaire de deux vecteur est la projection de l'un sur l'autre ; or en l'occurrence dr' est la composante radiale de dl :
1r . dl = dr'     ⇒
E . dl = q / ( 4 * π * ε0 * r' 2 ) * dr'     ⇒
qui correspond bien à n_potentiel-coulombien-1 ⇔ un déplacement quelconque (et donc l'intégrale de circulation correspondante) est équivalent à un déplacement radial.


potentiel-coulombien-4.jpg

Cela est illustré par le graphique ci-contre, qui montre que tous les vecteurs dl des deux trajectoires quelconques de i à f ont la même composante radiale. Autrement dit, le travail effectué pour amener la charge de i en f est indépendant du chemin suivi.

potentiel-coulombien-5.jpg

Et de même, dans le cas d'une trajectoire circulaire, l'intégrale de circulation du champ électrique est nulle : ∮ E . dl = 0 ⇔ si on multiplie les deux membres par une charge d'essai quelconque q0 on voit que le travail total pour déplacer la charge sur un aller-retour est nul : l'énergie utilisée pour aller de i à f sera regagnée lors du trajet retour. Autrement dit, le champ électrique est conservatif. On voit ainsi que le concept de potentiel est notamment utile pour expliquer et formuler le principe de conservation.

Notation, définition et calcul d'une grandeur physique

  • ΔV = - ∫∞→r E . dl n_potentiel-coulombien est une définition du potentiel.
  • V(r) = q / ( 4 * π * ε0 ) / r n_potentiel-coulombien-2 est une façon de calculer le potentiel.
  • ΔV = V(r) sont les deux notations du potentiel (à une distance r de la charge q générant le champ E, et tel que V(∞)=0 : cf. notion de potentiel absolu).

Le graphe ci-dessous est celui du potentiel coulombien V(r) = q / ( 4 * π * ε0 ) / r n_potentiel-coulombien-2, d'une charge d'essai q0 (ici positive), située à une distance r d'une charge q (ici positive) générant un champ électrique (extraverti puisque q>0).

potentiel-coulombien-graphe.png

La pente de cette courbe est sa dérivée :
dV / dr = - q / (4 * π * ε0 * r2 )
qui est au, signe près, la composante radiale du champ
E(x) = q / ( 4 * π * ε0 * r2 ) * 1r     n_coulomb-permittivite
ce qui est logique puisque par définition
V(r) = - ∫∞→r E . dl     n_potentiel-coulombien     ⇔
V(r) = - ∫∞→r E . 1r * dr     ⇔
V(r) = - ∫∞→r E * dr     ⇒
V(r) est bien la primitive du champ (avec un signe négatif) E, c-à-d que sa dérivée donne le champ (avec un signe négatif). La pente est bien le module du champ, et elle diminue rapidement avec r car elle diminue en 1/r2 [cf. n_potentiel-differentiel]. C'est également le cas de la force répulsive (flèches bleues dans le graphe supra) en vertu de :
E = F / qe   n_champ-electrique-2     ⇔
F = E * qe     ⇔
F = qe * q / ( 4 * π * ε0 * r2 ) * 1r
NB : il s'agit d'une force répulsive dans un champ extraverti (puisque q>0).

dV / dr = - q / (4 * π * ε0 * r2 ) n_potentiel-differentiel exprime donc un lien différentiel entre le potentiel et le champ, que l'on généralise pour tout potentiel sous la forme dite du "gradient de potentiel" :
= - E
qui permet d'obtenir le champ à partir de la connaissance du potentiel.

Charge
négative

Nous avons considéré jusqu'ici le cas de deux charges positives q et q0. Le graphe suivant ajoute le cas de q<0 (partie inférieure), la charge d'essai q0 demeurant positive. Dans cette configuration, le champ généré par q est intraverti puisque q<0, et la force subie par la charge d'essai est attractive puisque q0 et q sont de signes opposés (cf. supra #champ-electrique).

potentiel-coulombien-graphe-1.png

Analyse synthétique dans le cas d'une charge d'essai q0 positive :

  • partie supérieure (q > 0) :
    • force : le champ généré par q est extraverti (puisque q>0), et la force subie par la charge d'essai q0 est répulsive (puisque q0 et q sont de mêmes signes) ;
    • énergie : la force subie par la charge d'essai q0 étant répulsive ⇒ pour rapprocher q0 de q il faut exercer un travail, ce qui créé de l'énergie potentielle ; et comme l'intensité du champ augmente avec le rapprochement, la force à exercer (et le potentiel ΔV ainsi créé) devient de plus en plus grand au fur et à mesure que q0 est rapprochée de q (notion de "potentiel répulsif").
  • dans la partie inférieure (q < 0) :
    • force : le champ généré par q est intraverti (puisque q<0), et la force subie par la charge d'essai q0 est attractive (puisque q0 et q sont de signes opposés) ;
    • énergie : la force subie par la charge d'essai q0 étant attractive ⇒ pour éloigner q0 de q il faut exercer un travail, ce qui créé de l'énergie potentielle, et comme l'intensité du champ diminue avec l'éloignement, la force à exercer (et le potentiel ΔV ainsi créé) devient de plus en plus faible (notion de "potentiel attractif").

Interprétons maintenant ces deux configurations au regard du principe de conservation.

potentiel-coulombien-energie.png
  • potentiel répulsif : la ligne verticale hachurée en gris correspond à une charge d'essai q0 (>0) dont l'énergie potentielle est relativement élevée : si sa vitesse est nulle (c-à-d si elle est maintenue) alors cette énergie potentielle représente toute son énergie totale ⇒ si cette charge d'essai est lâchée ⇒ elle subit la force de répulsion ⇒ sa vitesse (et donc son énergie cinétique) augmentent, alors que son énergie potentielle diminue d'autant ⇒ à l'infini l'énergie cinétique est égale à la valeur que l'énergie potentielle avait au départ. Notons enfin que plus la charge d'essai est lâchée à une distance éloignée de q, moins grande sera l'énergie cinétique accumulée par q0 à l'infini.
  • potentiel attractif : considérons maintenant que la charge d'essai q0 (>0) est maintenue (c-à-d que sa vitesse est nulle) à l'infini (vide intersidéral ⇒ son énergie totale est nulle) : si elle est lâchée ⇒ elle est attirée par le champ ⇒ son énergie cinétique augmente vers l'infini ⇔ son énergie potentielle diminue à l'infini (notion de "puits de potentiel").
Physique
atomique

Nous allons étudier maintenant un cas concret, à l'échelle d'un noyau atomique, dont l'ordre de 10-14m (cf. supra #modele-atomique). Nous avons vu que le noyau atomique est composé de protons (charges +) et de neutrons (charges 0), les derniers exerçant un force de cohésion (dite "interaction nucléaire" ou encore "interaction forte") entre les premiers (cf. supra #cohesion-nucleaire). Cette "interaction forte" s'oppose donc aux forces électriques répulsives entre les protons du noyau ⇒ on peut en déduire qu'un noyau contient de l'énergie. Nous allons pouvoir mesurer celle-ci à l'aide de V(r) = q / ( 4 * π * ε0 ) / r n_potentiel-coulombien-2.

atome-helium.png

Atome d'helium.

Pour simplifier l'analyse on va considérer le cas d'un noyau contenant seulement deux protons, ce qui est le cas de l'atome d'hélium (He : cf. supra #tableau-periodique). On pose que la distance qui les sépare est de 10-14m (en réalité c'est un peu moins). Pour créer les atomes d'hélium des étoiles ont du exercer une force (cf. supra #orbites-electroniques) pour abaisser à 10-14m une distance que l'on suppose originellement égale à l'infini. L'énergie requise pour ce faire est donnée par :
VE = EP / q   [J/C = V (volt)]   n_potentiel-electrique-1     ⇔
EP = VE * q     ⇒ par n_potentiel-coulombien-2 :
EP = q2 / ( 4 * π * ε0 ) / r     ⇒ par n_permittivite-vide :
EP = q2 * k0 / r     ⇒
EP = ( 1,6 10-19 )2 * 9 109 / 10-14 ≈ 2,3 10-14 J
ce qui est un très petite quantité d'énergie ... sauf que la matière est composée d'un très grand nombre de nucléons : 1g de n'importe quelle matière contient 6,02 1023 nucléons (cf. supra #modele-atomique) ⇒ l'énergie contenue dans 1g de n'importe quelle matière vaut :
6,02 1023 * 2,3 10-14 ≈ 14 109 J ce qui est considérable !

Cette énergie "atomique" est de nature électrique : en libérant les protons de leur force de cohésion induite par le champ coulombien, donc en brisant le noyau (fission nucléaire), on créé de l'énergie cinétique. Comme celle-ci provient de l'énergie potentielle, on peut calculer la vitesse des protons libérés lorsqu'ils arrivent à l'infini :
Ep = m * v2 / 2     ⇔
v = √( 2 * Ep / m )     ⇒ par n_u.m.a.
v = √( 2 * 2,3 10-14 / 1,67 10 -27 ) ≈ 5,25 106 m/s
La vitesse de la lumière, considérée comme la vitesse maximale physiquement possible, est d'environ 3 108 m/s).

Dans une centrale atomique cette vitesse, c-à-d cette énergie cinétique, à l'échelle microscopique correspond à de l'agitation thermique considérable c-à-d à une forte création de chaleur ⇒ qui chauffe de l'eau ⇒ qui produit de la vapeur ⇒ celle-ci est pressurisée ⇒ conduite vers des turbines ⇒ qui font tourner des alternateurs ⇒ qui produisent de l'électricité.

Mécanique
céleste

Nous avons déjà souligné l'équivalence entre les travaux de Laplace en matière d'électricité et ceux de Lagrange en matière de mécanique céleste. Le tableau suivant synthétise ces équivalences :

Force électriqueForce gravitationnelle
Champ E(x) = q / ( 4 * π * ε0 * r 2 ) * 1r     n_coulomb-permittivite g = - G * M / r 2 * 1r     n_acceleration-gravitation
Potentiel V(x) = q / ( 4 * π * ε0 * r )    n_potentiel-coulombien-2 V(x) = - G * M * / r     n_potentiel-gravitation-2

Ainsi pour calculer la force subie par la Lune dans le champ gravitationnel de la Terre (c-à-d le poids de la Lune dans ce champ), il suffit de multiplier n_acceleration-gravitation par la masse de la Lune ⇒
m * g = - G * M * m / r 2 * 1r
De même, pour calculer l'énergie potentielle de la Lune il suffit de multiplier n_potentiel-gravitation-2 par la masse de la Lune ⇒ :
Ep = V * m = - G * M * m / r
où l'on voit par le signe négatif qu'il s'agit d'un potentiel attractif : la Lune est prise dans le puits de potentiel de la Terre.

potentiel-coulombien-hydrogene.png

Faisons maintenant les deux mêmes calculs pour l'atome d'hydrogène, le plus simple des atomes puisqu'il ne comporte qu'un proton et un électron (cf. supra #tableau-periodique). Cet électron joue donc le rôle d'une charge d'essai négative, de sorte qu'il y a attraction vers le noyau (qui génère un champ extraverti puisqu'un proton est de signe +).

En vertu de E = F / q0 n_champ-electrique-2, la force subie par l'électron est donc donnée par :
F = - qe * E(x)     ⇔
F = - qe2 / ( 4 * π * ε0 * r 2 ) * 1r
Et en vertu de VE = EP / qe   n_potentiel-electrique-1 l'énergie potentielle de l'électron est donnée par :
Ep = V * (- qe )     ⇔
Ep = - qe2 / ( 4 * π * ε0 * r )
où l'on retrouve bien également un potentiel attractif : l'électron est pris dans le puits de potentiel du proton.

C'est le "modèle planétaire de l'atome" que Bohr a élaboré en 1913, en décrivant notamment les propriétés d'émission lumineuse de l'atome. Et en 1925 Schrödinger formule les bases de la mécanique quantique, selon laquelle l'électron ne serait pas une particule mais une onde. Sa célèbre équation, qui comporte le potentiel coulombien, montre qu'un atome génère de la lumière à des fréquences (longueurs d'onde) bien précises. L'expérimentation a montré que l'équation de Schrödinger permet de prédire ces fréquence avec une très grande précision.

Champ et gradient du potentiel
https://philosophie.jortay.net/savoir-scientifique-base#champ-gradient-potentiel
triangle-clipedia.png Vidéo Clipedia : Champ et gradient du potentiel
Nous avons vu précédemment que ΔV = - ∫i→f E(x) . dl n_champ-quelconque-integration-3 : la différence de potentiel entre deux points est donnée par l'intégrale de circulation du champs électrique entre ces points. Ainsi la connaissance du champs électrique en tout point de l'espace permet de calculer la différence de potentiel.

Nous avions vu également qu'il en est de même de la distribution de potentiel : on peut calculer le potentiel en un point quelconque, en fonction du champs qu'il subit. Pour ce faire il suffit de considérer que le point initial du déplacement est située à l'infini ⇒ V(x) = - ∫∞→x E . dl n_potentiel-coulombien, que l'on appelle "potentiel absolu".

Rappelons que Coulomb avait mesuré le champ électrique expérimentalement. Ensuite, à partir de sa loi expérimentale E = q / ( 4 * π * ε0 * r 2 ) * 1r n_coulomb-permittivite, il en a déduit la formulation du potentiel en suivant l'idée de Laplace selon laquelle à toute distribution de champ électrique est associée une distribution de potentiels V(x) = - ∫∞→x E . dl n_potentiel-coulombien, (empruntée à la notion de #potentiel-gravitationnel de Lagrange).

Nous allons ici démontrer la démarche inverse : calculer la valeur du champs en tout point de l'espace à partir du potentiel électrique en ce point. Notons que la voie à suivre pour ce faire n'est pas évidente : le champs étant la variable d'une intégrale, on ne voit pas à priori comme l'en extraire. Pour résoudre ce problème on va recourir à la notion de gradient.

potentiel-interpretation.jpg

Rappel. Commençons par rappeler l'interprétation physique du potentiel. Soit une charge d'essai q0 ; elle subit la force q0 * E ; pour la maintenir en place on doit lui exercer la force - q0 * E ; et si l'on veut déplacer la charge le long d'une trajectoire quelconque, il faudra fournir une certaine force exercée sur une distance dl, c-à-d un certain travail (dW) ; cette force n'est pas - q0 * E, mais sa composante tangentielle à la trajectoire (la composante normale à la trajectoire comptant pour rien dans l'effort à fournir) ; cette composante est le produit scalaire - q0 * E . dl = dW n_travail. L'énergie associée à ce travail est évidemment conservée : elle a été transformée en énergie potentielle :
dEp = dW    ⇒
dEp / q0 = - q0 * E . dl / q0   
dEp / q0 = - E . dl
⇒  par :
V = E / q0    n_potentiel-electrique-1   ⇒
dV = - E . dl n_champ-equipotentiel
(NB : la différence de potentiel dV correspond au déplacement dl).
qui, substitué dans :
V(x) = - ∫∞→x E . dl    n_potentiel-coulombien   ⇒
vérifie bien que :
V(x) = ∫∞→x dV

Ce rappel étant fait, entrons maintenant dans le vif du sujet. Pour calculer la valeur du champs en tout point de l'espace à partir du potentiel électrique, commençons par constater qu'il n'est pas nécessaire de considérer ici une intégrale de circulation (cf. supra #champ-non-uniforme) : il suffit d'un seul déplacement infinitésimal de la charge d'essai. Or si ce déplacement est infinitésimal, on peut considérer que le champs y est constant.

Dans ces conditions, l'égalité entre les deux membres de droite des deux égalité précédentes :
- ∫∞→x E . dl = ∫∞→x dV
se simplifie :
- E . dl = dV n_champ-equipotentiel

champ-gradient-potentiel.jpg

On va alors exprimer dV en fonction de dl en représentant celui-ci dans un repère cartésien, et en l'exprimant en fonction de ses composantes (également infinitésimales) :
dl = dx * 1x + dy * 1y + dz * 1x n_vecteur-unitaire. On va alors parcourir dl en trois étapes correspondant chacune à un élément de cette somme. Chacun de ces déplacement correspond à celui d'une des trois coordonnées, alors que les deux autres sont inchangées. Autrement dit, chaque déplacement se fait perpendiculairement au plan des deux autres axes de coordonnées.

derivee-partielle.jpg

On peut alors exprimer les variations de potentiel correspondant à chacun de ces déplacements. Le cas exprimé dans la figure ci-contre correspond à la dérivées partielles de V en x : ∂V / ∂x * dx. La variation de V sur l'axe vertical est bien égale au produit de dx par la pente ∂V/∂x en ce point.

Au bout des trois opérations, la différentielle totale de V vaut alors : dV = ∂V/∂x * dx + ∂V/∂y * dy + ∂V/∂z * dz

On fait alors appel à la notion de gradient : V = ∂V/∂x * 1x + ∂V/∂y * 1y + ∂V/∂z * 1z n_gradient ⇒ en comparant les trois dernières égalités on constate que l'une est le produit scalaire des deux autres :
dV = ∇V . dl
...que l'on compare alors avec :
- E . dl = dV   n_champ-equipotentiel   ⇒
V . dl = - E . dl

Avec cette dernière égalité, nous avons fait pas mal de progrès dans notre tentative de calculer le champs à partir du potentiel. D'une part, connaissant le potentiel, on peut calculer le gradient. D'autre part, on pourrait être tenté de simplifier en supprimant dl, mais rappelons-nous qu'on ne peut diviser par un vecteur (cf. #proprietes-produit-scalaire) !

pas-diviser-par-vecteur.jpg

Dans le cadre du présent développement, il est utile de montrer ici cette (non) propriété. Nous avons vu que le produit scalaire est le produit de la norme d'un vecteur par la norme de la projection d'un autre vecteur (cf. supra #produit-scalaire). Or Le graphique ci-contre montre que différents vecteur peuvent avoir la même projection. Il en résulte que l'égalité des produits scalaires de deux vecteurs avec un troisième (en l'occurrence dl) n'implique par que les deux premiers sont nécessairement égaux. Autrement dit, la simplification qui consisterait à supprimer dl dans les deux membres de l'égalité V . dl = - E . dl n'est pas autorisée.

Cependant, dans le cas présent caractérisé par le fait que dl est quelconque, cette simplification est autorisée. En effet, puisque dl est quelconque, on peut le choisir dans n'importe quelle direction, par exemple uniquement en x :
dl = dx . 1x
(on a donc que dy=dz=0)
or :
- E = - Ex . 1x - Ey . 1y - Ez . 1z    n_vecteur-unitaire
V = ∂V/∂x * 1x + ∂V/∂y * 1y + ∂V/∂z * 1z   n_gradient
⇒ par définition du produit scalaire, l'égalité :
V . dl = - E . dl
devient :
∂V / ∂x . dx = - Ex . dx    
∂V / ∂x = - Ex
Or on obtient évidemment le même type de résultat si on avait choisi :
dl = dy . 1y     ⇒
∂V / ∂y = - Ey
Idem pour la composante z.

On constate donc que V et -E ont les mêmes composantes en x,y,z, ce qui signifie évidemment leur égalité :
V = - E     ⇔
E = - ∇V

Et voilà ! Nous avons ainsi démontré que la connaissance du potentiel V(x,y,z) permet de calculer le champs E en tout point.

Nous allons d'abord illustrer le fait que E = - ∇V n_champ-gradient-potentiel permet de calculer la valeur du champs en un point, à partir de la fonction de distribution du potentiel (fonction des coordonnées du point de calcul dans l'espace). Il suffit pour cela de calculer le gradient V = ∂V/∂x * 1x + ∂V/∂y * 1y + ∂V/∂z * 1z n_gradient , et donc les dérivées partielles qui le constituent (NB : il faut donc que la fonction soit dérivable au point considéré).

Soit la fonction de distribution du potentiel V(x,y,z) = a * x * ( y2 + z2 ) :
∂V / ∂x = a * ( y2 + z2 )
∂V / ∂y = 2 * a * y
∂V / ∂z = 2 * a * z

champ-gradient-illustration.gif

⇒ à partir de la valeur de a (exprimée en volt/m3) et x,y,z (exprimées en mètres), on calcule facilement ces dérivées partielles ⇒ on connaît les composantes du vecteur gradient :
V = a * ( y2 + z2 ) * 1x + 2 * a * y * 1y + 2 * a * z * 1z
... et l'on peut faire cela en tout point.


champ-gradient-illustration-2.jpg

Interprétons maintenant l'illustration de façon qualitative. On suppose la connaissance d'une distribution, représentée dans l'illustration ci-contre par des surfaces équipotentielles vues en coupes (et apparaissant donc comme des lignes). Il résulte de E = - ∇V n_champ-gradient-potentiel un lien entre entre champs électrique et ces équipotentielles : le gradient étant perpendiculaire aux surfaces équipotentielles (cf. supra #gradient-lignes-niveau), le champs l'est donc aussi. Par conséquent il résulte de dV = ∇V . dl n_dV=∇V.dl et de n_produit-scalaire-angle-droit que pour un déplacement dl perpendiculaire au champ, alors dV=0 (en effet, si on est perpendiculaire au champ (cf. illustration ci-dessus), on l'est forcément aussi par rapport au gradient puisque celui-ci est opposé au champs). Concrètement, cela veut dire que ce déplacement a lieu le long d'une équipotentielle. Autrement dit, les surfaces équipotentielles sont partout perpendiculaires au champ.

Voir aussi le lien avec la notion de dérivée directionnelle df / dl = ∇f . 1l n_derivee-directionnelle.

On est donc maintenant capable d'interpréter, de "lire la carte" de distribution du champ électrique, en observant simplement les équipotentielles :

  • orientation : le champ électrique y est perpendiculaire en chaque point ;
  • intensité : plus les équipotentielles sont serrées, plus la variation de potentiel est rapide/importante (la pente de potentiel est élevée : pour un dl donné on aura un variation de potentiel plus grande dans les zones où les lignes de champs sont plus proches).
lecture-champ-dipole.jpg

Illustrons cette lecture dans un cas simple : le dipôle (deux charges de mêmes valeurs absolues mais de signes opposés). Dans le schéma ci-contre les surfaces équipotentielles (sphériques) sont toujours représentées en coupes (rouges).

  • orientation : en partant d'un point quelconque de ces équipotentielles, dans une direction perpendiculaire, on dessine les lignes de champ (bleues). Ainsi à chaque perpendiculaire à une équipotentielle correspond une tangente à une ligne de champ. ;
  • intensité :
    • rouge : la taille des cercles augmente au fur et à mesure que l'on s'éloigne des charges ;
    • bleu : plus les lignes de champ sont espacées plus le champs est faible.

    La où les lignes de champ sont serrées (ce qui indique un champ important), on a aussi des équipotentielles serrées indiquant la direction de plus grande variation de potentiel, le champ allant dans la direction de plus grande variation négative (chute de potentiel) puisque E = - ∇V n_champ-gradient-potentiel (le gradient indique la direction de variation positive du potentiel).

Voilà qui illustre clairement que la connaissance de la distribution de potentiel induit la connaissance des lignes de champ.

champ-gradient-illustration-3.jpg

Coupe d'une sphère.

Passons maintenant à un dernier exemple : le calcul du champ électrique produit par une charge ponctuelle. Pour ce faire faire on va donc partir du potentiel coulombien :
V(x) = q / ( 4 * π * ε0 ) / r n_potentiel-coulombien-2
pour en déduire le champ coulombien :
E = q / ( 4 * π * ε0 * r 2 ) * 1r n_coulomb-permittivite.


champ-gradient-illustration-4.jpg

On applique à nouveau E = - ∇V n_champ-gradient-potentiel pour calculer le champs à partir du gradient V = ∂V/∂x * 1x + ∂V/∂y * 1y + ∂V/∂z * 1z n_gradient. Celui-ci se calcule via les dérivées partielles de la fonction V(x,y,z) ⇒ il faut exprimer le rayon r en fonction de ses coordonnées cartésiennes de l'espace. Pour ce faire on va placer le repère cartésien sur la charge elle-même (c-à-d que celle-ci se trouve à l'origine du repère). Ainsi, le point (x,y,z), dont on veut calculer le champ, permet d'exprimer r le plus simplement : grâce au théorème de Pythagore n_pythagore on sait que :
r = (x2 + y2 + z2)1/2

∂V / ∂x = ∂( q / ( 4 * π * ε0 ) / (x2 + y2 + z2)1/2 ) / ∂x    
par ( F[ G(x) ] )' = F'( G(x) ) * G'(x) n_derivee-fonction-composee, on calcule facilement que :
∂V / ∂x = q / ( 4 * π * ε0 ) * (-1/2) * (x2 + y2 + z2)-3/2 * 2 * x    
∂V / ∂x = - q / ( 4 * π * ε0 ) * x / (x2 + y2 + z2)3/2    
∂V / ∂x = - q / ( 4 * π * ε0 * r3 ) * x
et de même :
∂V / ∂y = - q / ( 4 * π * ε0 * r3 ) * y
∂V / ∂z = - q / ( 4 * π * ε0 * r3 ) * z

V = - q / ( 4 * π * ε0 * r3 ) * ( x * 1x + y * 1y + z * 1z )

champ-gradient-illustration-5.jpg

Or x * 1x + y * 1y + z * 1z est précisément le vecteur position n_vecteur-unitaire du point de calcul. La norme de ce vecteur position étant r, on peut le remplacer par r * 1r1r est le vecteur unitaire radial n_vecteur-unitaire-radial
V = - q / ( 4 * π * ε0 * r3 ) * r * 1r    
V = - q / ( 4 * π * ε0 * r2 ) * 1r
qui combiné avec
E = - ∇V n_champ-gradient-potentiel
permet de retrouver que :
E = q / ( 4 * π * ε0 * r 2 ) * 1r n_coulomb-permittivite
CQFD.

champ-gradient-illustration-6.jpg

Interprétation. Le vecteur gradient est dirigé vers -1r (le vecteur unitaire radial s'éloigne toujours de l'origine, par définition). Le gradient du potentiel pointe dans la direction de croissance du potentiel : le potentiel coulombien varie en effet en 1/r plus r est petit, plus le potentiel est grand. Le champ quant à lui est donc dirigé vers les valeurs décroissante du potentiel.


Équations de Poisson et Laplace
https://philosophie.jortay.net/savoir-scientifique-base#equations-poisson-laplace

Nous allons développer ici les équations de Poisson et Laplace, dans le domaine électrostatique (les équations de Poisson et Laplace sont en fait génériques : elles sont utilisées dans bien d'autres domaines de la physique).

Ces deux équations relient les variables que sont le potentiel électrique V et la densité volumique de charge électrique ρ. L'équation de Laplace est ici un cas particulier de l'équation de Poisson, en l'occurrence l'absence de charge électrique (ce qui est le cas dans le vide) de sorte que ρ = 0 (PS : les travaux de Laplace sont antérieurs à ceux de Poisson, qui généralisera les travaux de Laplace en la matière).

Nous allons voir ici comment Poisson a exprimé la forme locale de la loi de Gauss
. E = 1/ε0 * ρ  n_Gauss-local-nabla ...
où :
ε0 (constante) est la permittivité du vide  n_permittivite-vide
ρ (variable) est la densité volumique de charge  n_densite-volumique-charge

... en fonction du potentiel électrique V, cela en exploitant E = - ∇V  n_champ-gradient-potentiel.

Le développement est assez simple. Par n_Gauss-local-nabla et n_divergence-nabla (la divergence est la somme des dérivées partielles) :
. E = 1/ε0 * ρ = ∂Ex / ∂x + ∂Ey / ∂y + ∂Ez / ∂z

Or d'une part, n_champ-gradient-potentiel et n_gradient donnent que :
E = - ∂V/∂x * 1x - ∂V/∂y * 1y - ∂V/∂z * 1z
Et d'autre part, par n_vecteur-unitaire :
E = Ex * 1x + Ey * 1y + Ez * 1z
⇒ Ex = - ∂V/∂x ; idem pour y et z
⇒ ∂Ex / ∂x = - ∂2Vx / ∂x2 ; idem pour y et z

n_1/ε0*ρ=∂Ex/∂x+∂Ey/∂y+∂Ez/∂z donnne :
. E = 1/ε0 * ρ = - ∂2Vx / ∂x2 - ∂2Vy / ∂y2 - ∂2Vz / ∂z2
soit l'équation de Poisson :
- 1/ε0 * ρ = ∂2Vx / ∂x2 + ∂2Vy / ∂y2 + ∂2Vz / ∂z2
qui exprime donc la divergence en terme de potentiel.

Opérateur

On aurait développer plus simplement, en faisant appel à la notion d'opérateur, en l'occurrence , opérateur différentiel vectoriel. Il s'agit tout simplement de substituer :
E = - ∇V  n_champ-gradient-potentiel
dans :
. E = 1/ε0 * ρ  n_Gauss-local-nabla

. ∇V = - 1/ε0 * ρ   ⇒
Nabla (∇) étant un opérateur vectoriel, on peut lui appliquer toutes les opérations de l'algèbre vectoriel ⇒
. ∇ * V = - 1/ε0 * ρ

N.d.A. Donc, si je comprends bien, cela induit que l'on peut considérer que le gradient de V est équivalent au produit du nabla et de V : V ≡ ∇ * V, et que par conséquent ∂v/∂x = ∂/∂x * V... Soit, mais comment intégrer cela avec la définition de la dérivée n_derivee ?

Occupons-nous alors du produit scalaire de nabla par lui-même, qui par n_produit-scalaire-algebrique vaut :
. ∇ = ∂2 / ∂x2 + ∂2 / ∂y2 + ∂2 / ∂z2

On peut voir le membre de droite de cette égalité comme un opérateur, cette fois scalaire. Par conséquent l'égalité précédant celle-ci-dessus devient :
( ∂2 / ∂x2 + ∂2 / ∂y2 + ∂2 / ∂z2 ) * V = - 1/ε0 * ρ   ⇒
( ∂2 * V / ∂x2 + ∂2 * V / ∂y2 + ∂2 * V / ∂z2 ) = - 1/ε0 * ρ   ⇒
2V / ∂x2 + ∂2V / ∂y2 + ∂2V / ∂z2 = - 1/ε0 * ρ
N.d.A. Ce passage me pose vraiment problème...
soit à nouveau l'équation de Poisson.

Notons que l'opérateur :
. ∇ = ∂2 / ∂x2 + ∂2 / ∂y2 + ∂2 / ∂z2
est appelé "laplacien". Il est malheureusement noté Δ, ce qui peut prêter à confusion car il ne doit pas être confondu avec le signe de différentielle.

Idéalement le laplacien pourrait être noté || ∇|| 2 en vertu de n_pythagore-math, mais cette notation est rejetée par les scientifiques en raison de sa lourdeur. N.d.A. : le fait de choisir une notation en fonction de sa simplicité plutôt qu'en fonction de sa non ambiguïté confirme que les scientifiques ne font pas nécessairement de bon pédagogues.

Le terme "laplacien" se justifie par le cas particulier que Laplace avait posé, soit celui du vide, pour lequel l'équation de Poisson devient :
0 = ∂2Vx / ∂x2 + ∂2Vy / ∂y2 + ∂2Vz / ∂z2  ⇒
l'équation de Laplace :
0 = ΔV
ce qui, si je comprends bien, devrait, étant donné notre système de notation de l'opérateur de multiplication (cf. supra #fractions), être ici noté : 0 = Δ * V, ce qui par ailleurs lève l'ambiguïté par rapport au signe de différentielle (il s'agit bien ici d'un opérateur). Je vais néanmoins appliquer la notation de Clipedia.

La forme courte de l'équation de Poisson est donc :
ΔV = - ρ / ε0
où l'on notera que les unité du laplacien ne sont pas les unités du potentiel, mais 1 sur des longueurs au carré ⇒ les unités permettent d'interpréter le signe Δ.

laplace.jpg

Pour interpréter le sens des flèches, relire #algebre-electricite.

L'équation de Laplace ΔV = 0 n_laplace n'est valable que dans le vide. Le graphique ci-contre illustre le cas d'un système de charges discrètes. L'équation de Laplace étant de nature locale, elle s'applique à tout point de cette illustration, à l'exception des zones de distribution de charges (cercles rouge et bleu), pour lesquelles c'est alors l'équation de Poisson ΔV = - ρ / ε0 n_poisson-courte qui décrit la situation.

laplace2.jpg

De même c'est l'équation de Poisson qu'il faut appliquer pour calculer la distribution de potentiel, dans l'exemple illustré ci-contre, d'un faisceau de charge positives (protons). En l'occurrence il s'agit donc de calculer les dérivées secondes du potentiel, en fonction de la densité volumique de charge ρ caractérisant cette distribution.

geometrie-derivee-seconde.jpg

Rappelons la signification géométrique du signe de la dérivée seconde :

  • f '' > 0 : la pente est croissante en tout point la courbe est au dessus de la tangente en ce point ;
  • f '' < 0 : la pente est décroissante en tout point la courbe est en dessous de la tangente en ce point ;
  • f '' = 0 correspond au point d'inflexion, qui est tel que d'un côté la courbe est supérieur à la tangente en ce point, tandis que de l'autre côté elle est inférieure.

L'interprétation de l'équation de Laplace 2Vx / ∂x2 + ∂2Vy / ∂y2 + ∂2Vz / ∂z2 = 0 est un peu plus complexe à interpréter géométriquement : les courbures de variations du potentiel dans les trois directions de l'espace se combinent de telle sorte que la somme des trois dérivées secondes vaut zéro.

laplace-illustration.jpg

Nous allons illustrer cela en reprenant le cas du dipôle, mais en considérant que les charge ponctuelles sont deux cylindres vus en coupe : dans le repère cartésien l'axe Z sort hors du plan XY (cf. la pointe de flèche "⊙" à l'intersection des axes X et Y), et les cylindres sont de longueur infinie. Donc rien ne varie en z ⇒ si la charge ne varie pas en z alors le potentiel non plus ⇒ les dérivées en z sont nulles ⇒ 2Vx / ∂x2 + ∂2Vy / ∂y2 = 0. L'interprétation algébrique devient alors plus intuitive : les courbures en x et y sont opposées : si en se déplaçant dans la direction x on a une courbure du potentiel positive, alors la courbure du déplacement en y est nécessairement négative.

L'interprétation géométrique correspondante est illustrée par le graphe ci-dessous de la distribution de potentiel des deux cylindres de charges opposées. On y constate bien qu'en chaque point d'un déplacement le long d'une courbe en x (c-à-d parallèlement à l'axe X) correspond un courbe de signe opposé en y. Là où il n'y a pas de charges, c-à-d dans le vide, on aura toujours cette relation des courbures du potentiel.

laplace-illustration-2.jpg

Ci-dessous, un second exemple représentant le graphe d'une fonction V(x,y) = a * x * y

laplace-illustration-3.jpg

Les dérivées secondes en x et y sont clairement toutes deux nulles. Les courbures ont-elles pour autant disparu, de sorte que le graphe serait plat ? Non, évidemment. Ainsi si l'on se déplace sur la bissectrice x=y on obtient une fonction V(x,y) = a * x2 soit une dépendance parabolique. En chaque point de cette bissectrice, sur la surface, on a bien une courbure positive ainsi que, dans la direction orthogonale, une courbure négative. La valeur nulle du Laplacien exprime donc que, dans le vide, toute courbure du potentiel dans une direction est composée par une courbure de signe opposé, dans la direction orthogonale.

Cette surface bleue est dite "doublement réglée" : pour une même valeur d'une des deux variables, l'autre se déplace sur la surface le long d'une droite. Ainsi la pente d'une droite parallèle à l'axe X augmente avec la valeur correspondante de y (considérée comme constante, par rapport aux valeurs de la droite en X), et de même la pente d'une droite parallèle à l'axe Y augmente avec la valeur correspondante de x.

Illustrons maintenant l'équation de Poisson ΔV = - ρ / ε0 n_poisson-courte par le faisceau de protons évoqué plus haut. Il est caractérisé par une densité volumique de charges électriques (en l'occurrence, positives), soit ρ.

protontherapie.jpg

Ce type de faisceau est utilisé notamment dans la "protonthérapie" pour détruire des cellules cancéreuses tout en préservant les cellules environnantes. Le faisceau de proton présente l'avantage d'une précision beaucoup plus grande qu'avec les techniques habituelles des rayons gamma ou X.

laplace3.jpg

Cette précision est cependant limitée. Nous allons le montrer (sommairement) au moyen de l'équation de Poisson, et en supposant que le faisceau de protons est cylindrique. On le décrit dans un repère cartésien, l'axe Z correspondant à celui du déplacement des protons. Dans cette condition, si l'on suppose que le faisceau ne s'élargit pas, on peut alors supposer que tout est invariant en z (densité et donc aussi potentiel), de sorte que
2Vx / ∂x2 + ∂2Vy / ∂y2 + ∂2Vz / ∂z2 = - ρ / ε0
devient :
2Vx / ∂x2 + ∂2Vy / ∂y2 = - ρ / ε0

Cependant dans la réalité le faisceau s'élargit, mais on peut réconcilier la formulation ci-dessus avec la réalité de l'élargissement, par le fait que, en raison de l'extrême étroitesse du cylindre, on peut supposer que les variations en z correspondant à l'élargissement sont très petites relativement aux variations en x et y.

laplace4.jpg

Dans ces conditions on constate que le graphe de ρ(x) est en cloche (mesure le long d'une parallèle à l'axe X), et ses valeurs sont positives (puisqu'il s'agit de protons). Il en est de même pour y étant donné la symétrie du système. Or le membre de droite de n_∂2Vx/∂x2+∂2Vy/∂y2=-ρ/ε0 étant négatif, il en résulte que c'est également le cas du membre de gauche. Et comme la symétrie du système implique que x et y sont de même signe, il en résulte que ce membre de droite est négatif. La courbure du potentiel est donc négative.

Et en vertu de EP = q * V  n_potentiel-electrique-1 c'est également le cas de l'énergie potentielle. Par conséquent un proton situé sur l'axe central du cylindre aura une énergie potentielle maximale. Baignant dans cette énergie potentielle à courbure négative et générée par l'ensemble des protons auquel il appartient, son énergie ne peut donc faire que diminuer : un proton situé près de l'axe central aura une tendance naturelle à s'en éloigner. Ce faisant il acquiert de l'énergie cinétique de sorte que le flux des protons dans ce faisceau va s'élargir, et donc aussi la densité de charge. Ce phénomène est appelé "auto-potentiel" : les protons sont pris dans le potentiel qu'ils génèrent eux-mêmes, et s'éloignent donc du centre du faisceau.

C'est pourquoi les systèmes de protonthérapie sont équipés de lentilles magnétiques, qui permettent de focaliser le faisceau, malgré l'élargissement naturel du faisceau causée par le phénomène d'auto-potentiel.

Une explication alternative au développement ci-dessus pourrait reposer sur la distribution du champs électrique, représenté par les flèches jaunes, orientées vers l'extérieur : le champs "tire" les protons vers l'extérieur. Cependant le champs électrique étant une grandeur vectorielle, pour analyser ce genre de phénomène (faisceau de charges), le calcul est beaucoup plus simple s'il porte plutôt sur la grandeur scalaire qu'est le potentiel, et cela au moyen de l'équation de Poisson (l'alternative consistant à construire le champs étant nettement plus complexe).

Ce calcul est d'autant plus facile grâce au calcul informatique (alors qu'à l'époque de Poisson seule la méthode analytique était disponible), et en particulier la formule dite de discrétisation de la dérivée seconde, qui permet d'approcher la valeur des dérivées secondes :
calcul-poisson-1.jpg
et d'ainsi transformer l'équation de Poisson en un simple système d'équations algébriques :
calcul-poisson-2.jpg
... auquel on peut appliquer un algorithme très simple, qui permet de résoudre l'équation de Poisson pour une densité donnée.

On peut donc mesurer facilement le phénomène d'élargissement du faisceau des protons. Mais l'équation de Poisson peut être appliquée dans d'autres domaines de la physique, sous des formes spécifiques :

  • gravitation : ΔΦ = f où :
    Φ : potentiel gravitationnel ;
    f : distribution de masses, proportionnelle à la masse volumique de l'objet étudié ;
    ⇒ on peut par exemple calculer le potentiel gravitationnel au sein du soleil, et ainsi mieux comprendre le comportement des étoiles.
  • Physique des fluides : Δp = - div( u . ∇u ) où :
    Δp : laplacien de la distribution de pressions ;
    - div( u . ∇u) : champs de vitesses, c-à-d de la vitesse d'écoulement du fluide.

Ondes gravitationnelles

https://philosophie.jortay.net/savoir-scientifique-base#ondes-gravitationnelles

N.B. Cette section concerne une matière qui ne relève plus de la culture générale, mais de la recherche avancée. Il n'est donc pas attendu du lecteur qu'il comprenne toutes les équations mentionnées.

triangle-clipedia.png Vidéo Clipedia : Les ondes gravitationnelles
ondes-gravitationnelles.gif

L'animation ci-contre illustre deux étoiles à neutrons (corps célestes dont la masse volumique est extraordinairement élevée, de l'ordre de mille milliards de tonnes par litre) qui s'étant rapprochées se sont ainsi mises en orbite autour l'une de l'autre. Ces mouvements orbitaux entraînent d'infimes ondulations, dites "ondes gravitationnelles".

La force de gravitation est la force d'attraction exercée l'une sur l'autre par deux masse M et m séparée par une distance r : FN = G * M * m / r 2 n_force-gravitation-universelle

On notera la similitude de cette formule avec FC = kC * q1 * q1 / r 2 n_force-de-coulomb, décrivant la force électrique entre deux corps chargés électriquement.

Différences. La force électrique est d'un ordre de grandeur nettement plus élevé que la force gravitationnelle : FC / FN = 4,17 * 10 42 [source]. Autre différence : la force électrique peut être répulsive.

La variable d'écart r étant au dénominateur et au carré, il en résulte que ces forces diminuent exponentiellement lorsque la distance augmente.

Champ
électromagnétique

De la notion de force on passe à celle de champ gravitationnel, modélisant l'influence exercée par un corps autour de lui.

transport-energie.gif

Dans la section consacrée à la forme vectoriel de la force électrique n_force-de-coulomb-vector nous avions évoqué, via la notion de vecteur radial, le fait que si l'on déplace l'un des deux corps autour de l'autre le vecteur partant du corps immobile décrit le cercle correspondant.

La propagation de cette influence d'un corps vers l'autre ne se fait pas instantanément. Il résulte de la nature spatio-temporelle de la dynamique des forces que la propagation génère une onde (électrique, gravitationnelle). Cette onde transmet un mouvement : dans l'animation suivante celui de la main est transmis à celui de la boule rouge.

onde-corde.gif

Ce sont des principes similaires qui sont appliqués dans la communication par antennes radios dipolaires (... sauf que dans le cas des ondes électromagnétiques, il ne semble pas y avoir de médiation physique (notion d'interaction "à distance").

antenne-dipole.gif

Une antenne est un fil de cuivre le long duquel les électrons se déplacent en aller-retours sous l'action de sources de tensions variables, et ce faisant provoquent une onde électrique.

L'animation suivante montre que lorsqu'un corps se déplace, le champ électromagnétique qui lui est associé n'est pas déplacé en bloc mais de proche en proche.

equations-maxwell.png

Dans la section #Gauss-electricite nous avions évoqué le système d'équations de Maxwell (exprimées ci-contre dans une forme différente).

Il résulte de ce système l'équation d'onde électromagnétique ΔE - 1 / c 2 * ∂ 2E / ∂t 2 = 0
ΔE est l'opérateur laplacien n_laplacien du champ E ;
c est la vitesse de la lumière, indiquant que les ondes électromagnétiques se propagent à la vitesse de la lumière.

Champ
gravitationnel

En réalisant un travail comparable à ceux de Maxwell sur les ondes électromagnétique, mais appliqué cette fois aux ondes gravitationnelles, Einstein a formulé théoriquement en 1916 l'existence d'ondes gravitationnelles sous la forme d'un système d'équations plus nombreuses et complexes, dont : Gμν ≡ Rμν - 1/2 * R * gμν = 8 * π * G / c 4 * Tμν

• Gμν est le tenseur métrique du champ gravitationnel, exprimant le fait que la gravitation est une courbure de l'espace-temps ;
• T contient la masse du corps générant le champ gravitationnel.

courbure-espace-temps.png

Le plan du graphique ci-contre représente une version simplifiée en deux dimensions de notre espace à trois dimensions, l'axe vertical représentant alors le temps (quatrième dimension). La modification de l'espace-temps par la masse de la sphère prend la forme de la courbure de l'espace représenté ici en deux dimensions ...

On notera que l'équation d'onde graviationnelle dérivée par Einstein à partir de son système d'équation est similaire à l'équation d'onde électromagnétique de Maxwell : Δhαβ - 1 / c 2 * ∂ 2 hαβ / ∂t 2 = 0

Δhαβ est le laplacien du tenseur qui est la solution de l'équation ;
c est la vitesse de la lumière, indiquant que les ondes gravitationnelles se propagent aussi à la vitesse de la lumière.

solution-equation-onde-gravitationnelle.png

Mais il est beaucoup plus difficile de vérifier expérimentalement l'existence des ondes gravitationnelles que celles des ondes électromagnétiques, en raison de l'ordre de grandeur nettement inférieur de la force gravitationnelle. Il faut donc être en mesure d'effectuer la mesure sur des masses d'ordres de grandeur tels que les étoiles à neutron illustrée dans l'animation au début de cette section, ou encore des trous noirs.

La vidéo suivante montre que la notion de courbure de l'espace-temps à proximité d'un corps de masse non nulle permet d'expliquer le mouvement orbital.

Optique

https://philosophie.jortay.net/savoir-scientifique-base#optique
 7.5.1. La lumière
 7.5.2. Loi de Snell-Descartes
 7.5.3. Captation d'image
 7.5.4. Lentille convergente
 7.5.5. Relation de conjugaison des lentilles
 7.5.6. Lentille divergente
 7.5.7. La vision
La lumière
https://philosophie.jortay.net/savoir-scientifique-base#lumiere
triangle-clipedia.png Vidéo Clipedia : Qu’est-ce que la lumière ?

Sans forme, sans masse, qu'est-ce donc que la lumière ? Au 19° siècle Maxwell, a développé un modèle mathématique ("équations de Maxwell" ou encore "équations de l'électrodynamique") décrivant la lumière comme une onde électromagnétique plane, c-à-d l'association d'un champ électrique sinusoïdal, exprimé en volts par mètre (V/m), et d'un champ magnétique ,de même période, exprimé en ampères par mètre (A/m). Les ondes électromagnétiques sont donc la manifestation d’une interaction à distance, mais « retardée » (c-à-d non instantanée).

Équations de Maxwell et champ électromagnétique

onde-electromagnetique.png

E : champ électrique ; B : champ magnétique. Nous avons étudié en détail la première de ces équations n_Gauss-local-nabla : ici le membre de droite est nul car la masse est nulle ⇒ ρ=0.

N.d.A. Champ électrique vs magnétique. Un champ électrique existe par la seule présence d'une charge immobile (absence de courant, appareil électrique éteint), et lié à la tension (mesurée en V/m). Le champ est dit magnétique dans le cas de charges en mouvement (courant, appareil électrique allumé), et lié à l'intensité (mesurée en Ampères/m).

Nous allons traiter ici uniquement du champ électrique. Celui-ci est l’expression d’une interaction à distance entre charges électriques (la force électrique). Par définition chaque charge électrique génère un #champ-electrique.

champs-atome.jpg

Deux champs sont exercés sur la charge de droite :
• le champ du proton, extraverti;
• le champ du nuage électronique, extraverti.

Supposons donc une charge positive, par exemple un proton (noyau de l'atome d'hydrogène). Ainsi le champ électrique exprime l'influence à distance que le proton exerce dans son espace environnant, le champ électrique s'exprimant par une force sur toute autre charge située dans le champ. Remplaçons le proton par un atome d'hydrogène c-à-d ajoutons-lui son nuage d'électron. Celui-ci étant de charge négative son champ est orienté vers le noyau, et comme la charge du noyau vaut celle du nuage en valeur absolue, toute charge dans l'environnement de l'atome subit donc une force nulle. Cela est du moins le cas en situation dite d'équilibre ou de repos ...

atome-vibration-2.gif

Avec l'oscillation de l'atome vibrant, les deux champs ne se compensent plus ⇒ l'oscillation de l'atome se répercute dans le champ dipolaire.

Mais si l'on déstabilise l'atome, par exemple en le chauffant, de sorte que son environnement s'agite ⇒ l'atome subit des chocs ⇒ il se met à vibrer. ⇒ cette vibration est répercutée sur le champ électrique ⇒ sur les charges qui y sont situées. Ainsi un atome dans un état asymétrique (c-à-d déformé en raison d’une perturbation extérieure) peut générer une force électrique (un champ électrique) sur une charge située dans son environnement (N.d.A. : la situation moyenne de l'atome oscillant est celle de l'atome au repos).

Ce que Maxwell a découvert est que cette interaction dynamique n'est pas instantanée : la vibration met un certain temps à se propager (cf. le δt dans les équations de Maxwell supra) : plus la charge est éloignée du proton, plus il faut de temps pour que la vibration l'atteigne. Maxwell montre en outre que la vitesse de propagation de cette vibration, c-à-d de cette onde, est celle de la lumière, soit environ 300.000 km/s.

radiation-electromagnetique-2.gif

Le sommet de la vague se propage à la vitesse de la lumière. NB : dans cette animation il est fait abstraction de la diminution du module du champ avec la distance.

Cette non-instantanéité de l'interaction électrique est donc directement liée à la formation des ondes électromagnétiques : celle-ci sont ainsi vues comme la simple manifestation d’une interaction à distance, variable et retardée.

Sens de
la vue

Le sens de la vue (la perception de la lumière) résulte de l’interaction électrique à distance entre des atomes de notre environnement et les molécules photosensibles de la rétine. Lorsque l'onde atteint la rétine qui se trouve au fond de l'oeil, elle transmet la vibration aux charges électriques constituant les atomes des cellules de la rétine.

oeil-antenne.jpg

N.d.A. La relation entre l'oeil et l'objet regardé, est très semblable à la relation entre antennes réceptrice et émettrice.

Ces cellules opèrent alors une réaction électrochimique générant un signal sur le nerf oculaire. Ce signal est alors conduit à la région du cerveau traitant les signaux visuels, sur base desquels le cerveau va former une image, en l'occurrence un point lumineux (N.B. Le graphique ci-dessous montre que le cerveau doit intervenir pour rétablir le bon sens de l'image inversée qui est captée par la rétine recouvrant la paroi intérieure du globe oculaire. Ce phénomène de croisement des rayons lumineux au niveau de la pupille sera approfondi plus loin, lorsque nous étudierons les lentilles).

vision-inversion.jpg

Un corps (ici une flamme) est composé de points, et il en est de même pour son image.

La notion d'onde électromagnétique doit être interprétée avec prudence : rien ne vient "frapper" la rétine ! Il ne s'agit pas d'une onde de déplacement (comme sur un corde), mais seulement de la distribution de la valeur du champ le long du rayon. La notion d'onde n'est que l'expression de la propagation, c-à-d de la non instantanéité, de l'interaction. Or si l'interaction était instantanée, il n'y a pas de raison pour qu'elle n'opère pas. Par conséquent la notion d'onde n'est pas nécessaire pour expliquer le phénomène lumineux ! La seule oscillation du champ électrique au niveau de la rétine suffit à elle seule à provoquer la vision. On ne s'étonnera donc pas de constater que la lumière est invisible ...

triangle-clipedia.png Vidéo Clipedia : La lumière est invisible

Nous avons vu que le champ électrique et le champ magnétique sont des concepts théoriques abstraits (cf. #champ-electrique) qui ne peuvent aucunement se voir dans la mesure où ils ne diffusent pas la lumière. La lumière est donc invisible, tout comme le champ magnétique qui attire une épingle sur un aimant. Pour bien comprendre cela il est utile de définir ce que signifie "être visible" ou encore "voir". Être visible signifie "réfléchir" la lumière. Or un corps ne peut réfléchir la lumière que s'il est composé de matière. Si la lumière est invisible c'est parce qu'elle n'est pas de la matière. Elle ne peut donc ni réfléchir d'autres rayons, ni "frapper" la rétine.

Ainsi les rayons lasers que l'on croit "voir" (par exemple dans les boîtes de nuit) ne sont que des particules en suspension dans l'air (gouttelettes d'eau, poussières, ...), qui réfléchissent la lumière propagée par la source lumineuse : les charges électriques qui composent les atomes de ces particules sont mises en oscillation par le rayon laser, de sorte qu'elle vont réfléchir le rayon laser ⇒ certains des rayons réfléchis vont aller dans la direction de l'oeil de l'observateur. C'est le même phénomène que l'on observe lorsque les rayons du soleil traversent des nuages ou pénètrent dans un sous-bois humide (mais la couleur observée est bien celle de la lumière qui éclaire). Ainsi si la lumière était visible nous ne verrions rien d’autre que la lumière elle-même car elle masquerait les objets qui nous entourent.

Loi de Snell-Descartes
https://philosophie.jortay.net/savoir-scientifique-base#snell-descartes
triangle-clipedia.png Vidéo Clipedia : Les lentilles : introduction
lentille-spherique.png

Une lentille sphérique convergente a la forme d'une intersection de deux sphères (NB : l'image ci-contre ne donne qu'une vue en deux dimensions). L’axe qui passe par les centres des sphères est appelé "axe optique" de la lentille.

Une lentille sphérique est caractérisée par l'indice de réfraction (n spécifique au matériau constituant la lentille), par son épaisseur et par les rayons de courbure de ses faces (c.-à-d. les rayons de chacune des deux sphères). S’ils ont la même valeur (R) la lentille est dite "symétrique".

snell-descartes.jpg

On caractérise la déviation d'un rayon passant au travers d'un dioptre (ici air-verre) relativement à la normale (c-à-d la perpendiculaire) au point d'entrée sur la lentille. Le matériau de la lentille est caractérisé par son indice de réfraction n (n(verre) = 1,5, n(vide) = 1) tel que l'angle réfracté θr est différent de l'angle incident θi. La loi de la réfraction, ou loi de Snell-Descartes nous dit que :
sin(θr) = sin(θi) / n
NB : dès lors que n > 1 ⇒ θr < θi

La partie droite de l'image ci-dessus montre que si les faces d'entrée et de sortie d'un dioptre sont parallèles, la réfraction (déviation) est nulle. La partie gauche de l'image montre que la courbure de la lentille a pour effet de réfracter (dévier) des rayons parallèles, en les concentrant. Ce n'est que pour le seul rayon confondu avec l'axe de la lentille que la réfraction est nulle. Plus on s'écarte de cet axe, plus l'inclinaison de la lentille est élevé par rapport à cet axe ⇒ plus la réfraction est élevée.

Focalisation

Une lentille sphérique (symétrique ou non) induit donc un effet de focalisation des rayons qui la traversent. Cette focalisation est telle que les rayons incidents parallèles à l'axe optique sont réfractés en convergeant vers un même point de l'axe optique, appelé "foyer" de la lentille. Et plus généralement, les rayons seulement parallèles entre eux se croisent dans le "plan focal" de la lentille, plan perpendiculaire à l'axe optique et passant par le foyer.

plan-focal.png

NB1 : cette illustration pourrait correspondre au cas de deux étoiles, dont l'une est dans la ligne de l'axe optique (rayon parallèles à l'axe optique), et l'autre se trouve à côté de la première (⇒ rayon non parallèles à l'axe optique). NB2 : cette illustration 2D ne montre pas la troisième dimension de la réfraction, à savoir que même les rayons (parallèles) sortant du plan de l'illustration se croisent en un même point du plan focal.

La distance f entre le foyer et l'axe la lentille est appelé "distance focale". Celle-ci dépend des caractéristiques de la lentille : la courbure des rayons (déterminée par R) et l'indice de réfraction (n) du matériau composant la lentille. La relation entre ces trois grandeurs est déterminée par la loi de Snell-Descartes :
f ≈ R / 2 * ( n - 1 )
NB : n(verre) ≈ 1,5  ⇒  R = f

lentille-mince.jpg

Loi des
lentilles
minces

La modélisation n_loi-lentilles-minces n'est cependant qu'une approximation, valable uniquement pour une lentille sphérique suffisamment mince, c’est-à-dire dont les centres des sphères qui la dessinent ne sont pas trop proches. Plus précisément, l'épaisseur et le diamètre de la lentille doivent être petits relativement aux deux rayons de courbure (c-à-d les rayons R1 et R2 des deux sphères qui la dessinent).

refraction-zone.jpg

En effet, pour des lentilles trop larges relativement aux rayons de courbure, la concentration des rayons n'est plus ponctuelle, mais répartie sur une zone de réfraction (N.d.A : on comprend déjà ici intuitivement une possible cause d'image floutée). Plus un rayon lumineux est éloigné de l'axe optique, plus tôt il coupe celui-ci, par rapport aux rayons moins éloignés de l'axe optique, qui lui sont pourtant parallèles.

Nous étudions ici le cas des lentilles minces, dont les deux propriétés principales sont donc :

  • des rayons parallèles (entre eux, c-à-d pas nécessairement parallèles à l'axe optique) se croisent en un même point du plan focal 
  • un rayon d'angle d'incidence quelconque passant par le centre de la lentille n'est pas dévié.
    deviation-translation.jpg

    N.B. Il n'y a pas de déviation angulaire, mais il y a cependant une déviation de translation (N.d.A. : sauf pour le rayon confondu avec l'axe optique). Dans le cas d'une lentille mince cette déviation de translation est négligeable. Notons à cet égard que l'on modélise graphiquement une lentille mince par un simple double flèche (), de sorte que la double réfraction du biface est simplifiée en une réfraction unique.

regle-refraction.gif

Règle de
réfraction

Dans le cadre des lentilles minces, ont peut alors appliquer les deux propriétés énoncées supra, pour déduire le trajet de n'importe quel rayon réfracté par la lentille qu'il a traversée : il suffit de tracer sa parallèle passant par le centre de la lentille ⇒ son intersection avec le plan focal détermine le point focal, par lequel passe aussi le rayon dont on a pris la parallèle.

refraction-reversible.jpg

Réversibilité
de la réfraction

La symétrie du phénomène étudié ici implique que dans tous ces raisonnements on peut inverser le sens de propagation de la lumière. Pour s'en rendre compte il suffit d'étudier le cas particulier d'un rayon d'angle d'incidence quelconque, mais dont la réfraction est parallèle à l'axe optique. Le graphique ci-contre montre par construction géométrique que le point où ce rayon croise l'axe optique avant de passer par la lentille, doit être situé à une distance égale à la distance focale.

Captation d'image
https://philosophie.jortay.net/savoir-scientifique-base#captation-image

Qu'est ce qui fait, d'un point de vue physique, que l'on voit un objet ? (l'explication biologique sera développée plus loin). Nous allons montrer que la lentille permet de former une image, pouvant alors être imprimée sur une surface photosensible (rétine de l'oeil ou film d'un appareil photo). Mais pour cela il faut d'abord comprendre ce qui se passe avant que la lentille capte les rayons lumineux réfléchis dans sa direction.

diffusion-surface.jpg

Alors que la surface d'un tuyau de cuivre apparaît à l'oeil nu comme parfaitement lisse, ce n'est plus du tout le cas lorsque l'observation est faite au moyen d'un microscope électronique (cf. photo ci-contre). En raison de ces multiples aspérités, c-à-d angles d'incidences, les rayons lumineux sont réfléchis dans toutes sortes de directions, phénomène appelé "diffusion".

La lumière du soleil est ici représentée en jaune, mais en réalité la couleur des rayons solaires est blanche, ce qui signifie qu'elle comprend toutes les longueurs d'onde lumineuses (c-à-d toutes les couleurs de l'arc en ciel). Or, à l'instar des autres matériaux, le cuivre ne réfléchit pas de la même manière chacune de ces longueurs d'onde : en l'occurrence il réfléchit principalement les couleurs rouges orangées (les autres étant absorbées par le cuivre) : c'est ce qui fait sa couleur.

Mais comment peut-on voir la forme et les couleurs d'un objet ? On peut démontrer mathématiquement, qu'en raison des deux propriétés (*) des rayons réfractés par une lentille mince (celle constituée par l'ensemble "cornée+cristallin" de l'oeil, ou celle d'un appareil photo), tous les rayons diffusés par un même point, puis passant par cette lentille, convergent en un même point.

(*) Cf. supra : (i) des rayons parallèles se croisent en un même point du plan focal ; (ii) un rayon passant par le centre de la lentille n'est pas dévié.

lentille-image.jpg

PS : nous verrons plus loin que si l'objet est éloigné de la lentille par une distance supérieure à la distance focale, la convergence a lieu vers la droite de la lentille, et inversement.

Il apparaît ainsi que la lentille a pour effet de reproduire une image de chacun des points de l'objet diffusant la lumière du soleil (N.d.A. : il s'agit donc d'une image en 3D). Par conséquent, si à l'endroit de cette image se trouve une surface photosensible, alors l'image pourra y être "imprimée" c-à-d "enregistrée".

On comprend alors la problématique, dite de "mise au point", résultant du fait que l'image de l'objet est en 3D, alors que la surface photosensible est en 2D. La mise au point consiste à placer cette surface au niveau des points de l'image (foyers image) que l'on souhaite y imprimer avec le plus de précision (les autres points ne seront pas nets, mais floutés). En pratique c'est la distance entre la surface photosensible et la lentille qui est ajustée.

modele-optique-oeil.jpg

Dans le cas de l'enregistrement d'images par l'oeil :

  • rétine : surface photosensible ;
  • cornée + cristallin : lentille ;
  • cristallin : permet d'ajuster la distance focale via la courbure du cristallin.

Dans le graphique ci-dessus, la pupille est le trou au milieu de l'iris. L'ensemble cornée+cristallin forme un système à deux lentilles, celle du cristallin étant adaptative grâce à sa compression par des muscles situés au-dessus et en-dessous.

Lentille convergente
https://philosophie.jortay.net/savoir-scientifique-base#lentille-convergente
triangle-clipedia.png Vidéo Clipedia : La loupe

Comme chaque point de l'objet diffuse de nombreux rayons lumineux, ceux qui arrivent dans la pupille de l'oeil sont divergents (sauf si le point objet est situé à l'infini, dans lequel cas les rayons qu'ils diffusent peuvent être considérés comme parallèles). Par conséquent, sans adaptation de l'oeil, ces rayons imprimeraient sur la rétine une tache lumineuse ⇔ ce point serait "flouté". Pour que les rayons soient concentrés sur un même point (foyer image) de la rétine, les muscles du cristallin se contractent pour le comprimer ⇒ accentuer son rayon de courbure ⇒ faire converger les rayons. Cependant la faculté d'ajustement du cristallin n'est évidemment pas infinie : au repos il est conçu pour induire une convergence optimale de rayons incidents parallèles, ce qui est approximativement le cas des points situés suffisamment loin de l'oeil. Il existe une distance appelée "punctum proximum" (notée p) en-deçà de laquelle un objet ne pourra pas être vu net, car le cristallin est à son maximum de contraction. Sa valeur est de 10 à 50 cm pour l'humain, selon l'âge, et avec lequel elle augmente (myopie).

Or pour voir un objet plus grand, l'oeil doit s'en rapprocher. Mais que faire s'il à déjà atteint la distance p ? Réponse : utiliser une lentille convergente, aussi appelée "loupe" !

Nous allons voir qu'une lentille convergente est telle que les rayons lumineux diffusés par un même point de l'objet, sont réfractés par la lentille de sorte que la convergence a lieu :

  • vers la droite de la lentille (⇒ formation d'une image réelle, renversée) si l'objet est éloigné de la lentille par une distance supérieure à la distance focale  ;
  • vers la gauche de la lentille (⇒ formation d'une image virtuelle, non renversée) si l'objet est éloigné de la lentille par une distance inférieure à la distance focale (cas de la loupe).

L'illustration ci-dessous illustre ce second cas (et en outre l'observateur est positionné à la distance p de cette image virtuelle, ce qui signifie image net et cristallin contracté au maximum). L'image virtuelle est plus grande ... mais aussi plus éloignée que l'objet ⇒ son impression sur la rétine est-elle plus grande avec la loupe ? La réponse est affirmative, et l'illustration en montre la raison : la loupe a pour effet d'augmenter l'angle de vision (NB : celui-ci correspond à la pente de la réfraction du rayon incident parallèle à l'axe optique).

loupe-1.jpg

Or, étant donné que cet angle est inchangé par la position de l'objet, sa taille sur la rétine serait inchangée si on le modifiait sa position ... sauf que :

  • si rapprochement ⇒ l'image ne serait plus nette puisqu'on serait alors en-dessous du p ;
  • si éloignement ⇒ le cristallin pourrait être relâché puisqu'on serait alors au-delà du p.

NB : cette absence d'effet d'une modification de la distance sur la taille de l'image est du au cas particulier de l'illustration supra, qui est telle que la pupille est placée juste au niveau du foyer.

Qu'en est-il de la position particulière telle que l'objet est situé à distance focale de la loupe ? Nous avons vu que les rayons diffusés par un point situé à distance focale de la lentille sont réfractés par elle en rayons parallèles. Par conséquent l'image virtuelle est située à l'infini (et y est infiniment grande ... pour une taille inchangée sur la rétine).

loupe-2.jpg
loupe-support.jpg

Or nous avons vu également que le cristallin est conçu pour être au repos lorsque les rayons lumineux qui le traversent sont parallèles entre eux. C'est là que réside l'intérêt de la loupe : situer le plan image au-delà du punctum proximum. Ainsi la position idéale d'une loupe est à distance focale de son support d'observation.

On appelle facteur de grossissement d'une loupe le rapport :
G = "angle de vision avec loupe" / "angle de vision sans loupe"     ⇔
G = ( h / f ) / ( h / p )     ⇔
G = p / f
Ainsi une personne âgée dont p=50cm doit utiliser une loupe de focale f=5cm pour augmenter par dix la taille de l'objet observé.

NB : la distance focale f est une grandeur physique, tandis que le "punctum proximum" p est une grandeur biologique.

Enfin qu'en est-il si l'objet est placé à une distance supérieure à la distance focale de la lentille ? Dans ce cas il y a convergence vers la droite de la lentille, et donc formation d'une image réelle. Si celle-ci se situe entre le cristallin et la rétine ou après la rétine ⇒ son impression sur la rétine est floue car à un point de convergence correspondent plusieurs sur la rétine (cette situation est équivalente à la myopie, qui peut être corrigée par des lentilles divergentes).

loupe-3.jpg
Relation de conjugaison des lentilles
https://philosophie.jortay.net/savoir-scientifique-base#conjugaison-lentille

Loi des lentilles. Soient les indices i pour "image" et o pour "objet", dans le graphique cartésien suivant, les couples de triangles équivalents montrent que :
yi / yo = xi / xo (formule du grandissement)
yi / yo = - ( xi - f ) / f

xi / xo = - xi / f + 1    ⇔
1 / xo = - 1 / f + 1 / xi    ⇔
1 / xi - 1 / xo = 1 / f (relation de conjugaison)

Il s'agit de la conjugaison (taille et distance) entre points objet et image, qui sont dits "conjugués".

loi-optique-1.png

Quelques valeurs remarquables de la relation de conjugaison (et dont les valeurs son facilement vérifiables géométriquement) :

  • si  do = f  alors  di = ∞ : un objet dans le plan focal de la lentille a son image àl’infini ;
  • si  do < f  alors  di < 0 : cohérent avec le fait que (puisque do<f) la convergence se fait vers la gauche de la lentille (image virtuelle) ;
  • si  do = di  alors  do = di = 2 * f et l’image a la même taille que l’objet.

    Si la distance séparant l'objet de la lentille est supérieure à 2*f, son image réfléchie par la lentille sera réduite, et inversement, tendra jusqu'à l'égalité au fur et à mesure que la distance objet (do) se rapprochera de 2f.

  • si  do = ∞  alors  di = f : un objet à l’infini a son image dans le plan focal ;

loi-optique-2.png
Lentille divergente
https://philosophie.jortay.net/savoir-scientifique-base#lentille-divergente
triangle-clipedia.png Vidéo Clipedia : Les lentilles divergentes
Lentille
divergente

La lentille sphérique divergente est plus épaisse en ses bords qu'en son centre, contrairement à la lentille convergente. La distance focale d'une lentille divergente est négative, et son foyer est virtuel car déterminé par la prolongation virtuelle des rayons et non par les rayons eux-mêmes.

Plan focal image d'une lentille

plan-focal-image.png

Notez l'inversion des flèches de l'axe vertical

Rappel. La notion de foyer correspond à des rayons incidents parallèles. Le foyer image (réel ou virtuel) est donc toujours l’image (réelle ou virtuelle) d’un point à l’infini sur l’axe optique. Enfin la distance focale f est définie comme la valeur de l’abscisse (x) du foyer image.

photo-lentille-divergente.png

Le schéma suivant montre pourquoi l'image produite est plus petite que l'objet. Le lecteur pourra y vérifier facilement la cohérence avec la relation de conjugaison n_relation-conjugaison.

Il explique également l'effet d'optique illustré par la photo ci-contre : le foyer image est devant la lentille et l'image réduite se situe entre celle-ci et le foyer.

lentille-divergente.png

Par le même type de construction géométrique on pourra facilement vérifier que si xo = f < 0 alors xi = f / 2, et que ce résultat est cohérent avec la formule de grandissement n_formule-grandissement.

Retour inverse. Si de la lumière est renvoyée sur elle-même, elle parcourt exactement le même rayon lumineux en sens contraire, y compris lorsqu’elle subit une réfraction. Cette propriété est la propriété de "retour inverse" de la lumière. Cette propriété est caractérisée par la notion de "foyer objet", dont le plan focal objet est symétrique au plan focal image c-à-d situé à une distance -f du centre de la lentille.

retour-inverse.png

Le graphique ci-dessus montre que les rayons lumineux qui proviennent d’un point du plan focal objet d’une lentille (convergente ou divergente) en ressortent sous forme d’un faisceau de rayon parallèles entre eux. L’image de ce point se trouve à l’infini. Si la lentille est divergente, un tel objet doit être virtuel (non démontré ici).

Le tableau suivant synthétise les propriétés des lentilles divergentes et convergentes.

Lentille
convergente
Lentille
divergente
foyer imageréel (après)virtuel (avant)
foyer objetréel (avant)virtuel (après)
distance focalepositivenégative
Avant/après est déterminé par rapport au sens de la lumière. Notez les symétries verticale et horizontale de ce tableau.
La vision
https://philosophie.jortay.net/savoir-scientifique-base#vision
triangle-clipedia.png Vidéo Clipedia : La vision

Cette vidéo illustre les sections précédentes en expliquant le phénomène biologique de la vision (du seul point de vue de la physique, ainsi notamment les aspects neurologiques ne sont pas traités). C'est une excellente liaison avec le chapitre consacré à la biologie ...

Biologie

https://philosophie.jortay.net/savoir-scientifique-base#biologie
 8.1. La vie
 8.2. La cellule
 8.3. L'ADN
 8.4. Génétique
 8.5. Matière vivante
 8.6. Nutrition
 8.7. Système nerveux et cerveau

La vie

https://philosophie.jortay.net/savoir-scientifique-base#la-vie
triangle-clipedia.png Vidéo Clipedia : La vie

La biologie est la science qui étudie les organismes c-à-d les systèmes biologiques (nous utiliserons souvent le pléonasme "organisme vivant"). Mais comment définir objectivement la vie, c-à-d par une définition permettant de classer sans hésitation tous les corps en deux groupes "vivants" et "non-vivants".

On utilise aussi les termes de corps "animé" vs "inanimé", du latin "animare" (« donner de la vie ») et "anima" (« souffle, vie »).

Classification

L'image suivante illustre l'arbre phylogénétique de la vie, qui montre des relations de parenté entre des groupes d'êtres vivants (ancêtre commun, descendants, groupes frères, ...). Pourtant, il n'existe pas de définition unanime de ce qu'est la vie ! Dans ces conditions on ne s'étonnera pas de constater que cette représentation s'est complexifiée au gré des découvertes scientifiques et du progrès technologique (microscope optique puis électronique *), révélant une grande diversité des formes de "vie". Ainsi l'on sait aujourd'hui que les animaux et les végétaux ne constituent qu'une partie des "organismes vivants".

(*) Alors que le microscope optique exploite les photons, le microscope électronique exploite des électrons, dont la longueur d'onde est 100.000 fois inférieure à celle des photons, et permet ainsi de distinguer des organismes non discernables par les photons (dont les virus, les bactéries étant à peine discernables au microscope optique). Dans les deux cas un faisceau est envoyé, au travers de lentilles, sur le corps observé.

arbre-phylogenetique.jpg

Les procaryotes sont divisés en deux groupes distincts (bactéries et archées). Les eucaryotes descendraient des archées. Source

Et si Darwin s'était trompé...

À deux reprises dans la vidéo le scientifique exprime sa satisfaction concernant le fait que les êtres vivants ont une parenté (7m02s et 7m32s). Je regrette cette démarche, non pas évidemment en raison de leur nature humaniste (que par ailleurs je partage), mais parce que ces incursions idéologiques dans le discours scientifique peuvent conduire à de graves dérives au regard de la méthode scientifique, ainsi qu'à une incapacité à la remise en question (nous avons pu documenter un cas flagrant de telle dérive, dans le domaine de l'ingénierie énergétique).

Ainsi en 2011 Didier Raoult déclarait (NB : en se situant dans une échelle temporelle beaucoup plus courte et récente que celle de l'arbre phylogénétique initié à LUCA) : « Pendant longtemps, on a pensé que nous descendions d'un ancêtre commun : le Sapiens. En mai 2010, coup de théâtre : les résultats d'une analyse de l'ADN prélevé sur des os de néandertaliens ont révélé que 1 à 4 % de nos gènes viennent de Neandertal. Que cela nous plaise ou non, nous sommes apparentés à ce lourdaud, et non pas uniquement à Sapiens "l'intello". Les deux se sont rencontrés et métissés. L'arbre généalogique de l'espèce humaine est anti-darwinien parce que notre ancêtre est tout à la fois Sapiens, néandertalien, une bactérie et un virus ! (...) Dans la vision darwinienne de l'évolution, tout a été créé une bonne fois pour toutes, et s'il apparaît de nouvelles espèces, c'est uniquement par adaptation graduelle des espèces existantes. En fait, la nature ne se contente pas d'évoluer, elle continue d'inventer des espèces. On s'est aperçu qu'une bactérie nommée Wolbachia avait réussi, en infectant un ver, à intégrer 80 % de son chromosome. Elle avait, de fait, fabriqué une nouvelle espèce de ver ! Une évolution brutale et massive qui n'a rien à voir avec l'évolution lente et verticale décrite par Darwin. (...) Le génome humain contient 10 à 15 % de gènes inconnus. Nous ne sommes pas là devant un phénomène d'"évolution", mais bien de "création". » [source].

Définitions

Des biologistes ont proposé les trois critères suivants pour définir la nature vivante d'un organisme :

  • réponse à des stimuli : capacité à réagir et s'adapter à l'environnement (exemple : les feuilles des végétaux se tournent vers la lumière) ;
  • échanges avec l'environnement : notamment ingérer matière & énergie, puis évacuer des déchets ;
  • reproduction autonome : existence d'ancêtres et descendants, multiplication et évolution.

Or les robots répondent à ces trois critères, ou sont en passe de le faire (ils pourraient théoriquement être programmés pour se reproduire tout en améliorant leur capacité). Faut-il en déduire que les robots sont des êtres vivants, ... ou bien que les trois critères ci-dessus ne sont pas pertinents pour définir la vie ?

N.d.A. La notion de machine biologique pourrait conduire à définir la vie comme étant « la capacité à éprouver des sentiments », et à attribuer au sentiment une définition qui ne pourrait être appliquée par une machine.

N.d.A. La définition dénommée "Lyfe" [source] a été conçue afin d'éviter une définition "Terro-centrée". Elle est composée de critères plus proches de la physique et de la chime que de la biologie :

  • structure dissipative : système spatialement "auto-organisé" (apparition de symétries) via des échanges d'énergie avec le reste du monde (NB : proche des deux premiers critères de la définition précédente) ;
  • autocatalyse : capacité d'un système de modifier la vitesse de réactions chimiques endogènes ;
  • homéostasie : autorégulation de propriétés physico-chimiques d'un système, afin de le maintenir dans un état d'équilibre, c-à-d afin de neutraliser l'augmentation de son entropie (NB : implique les deux premiers critères de la définition précédente, ainsi, me semble-t-il, que le critère précédent ...) ;
  • apprentissage : capacité à acquérir un savoir-faire.

Ces deux définitions sont finalement assez proches, sauf pour ce qui concerne leur dernier critère : ainsi l'apprentissage remplace la reproduction ...

triangle-clipedia.png Vidéo Clipedia : Les virus sont-ils vivants ?
capsides-virus.jpg

Capsides (vert) entourant des acides nucléiques (bleu/rouge : ARN ou ADN).

Un virus est un acide nucléique (ARN ou ADN) entouré d'une capside de protéines. Il dispose donc de son propre matériel génétique. L'image ci-contre montre différentes formes de capsides (ces capsides sont composées d'unité protéiques ou capsomères : cf. points vert sombre dans l'image ci-contre).

virus-enveloppe.jpg

Capside dans son enveloppe.

Les capsides sont généralement incluses dans une enveloppe, dont émergent des glycoprotéines.

On a pu vérifier expérimentalement (notamment avec la mosaïque du tabac) qu'en mélangeant de l'ARN viral et des sous-unités protéiques issus ("isolés" à partir) d'un virus, ont provoque un auto-assemblage conduisant à la création d'un virus du même type.

Cependant le virus ne dispose pas de système métabolique du carbone et de l'énergie ⇒ pas de système de Lipman (enzymes du métabolisme cellulaire, permettant de reproduire de l'ADN et de fabriquer des protéines) ⇒ il doit donc parasiter d'autres organismes pour se reproduire. L'image suivante illustre l'utilisation du métabolisme de la cellule hôte pour répliquer l'ADN viral, puis produire les protéines constituant la capside de chaque reproduction.

parasitage.png

Cette reproduction peut prendre deux formes :

  • la lyse, qui conduit à la destruction de l'hôte ;
  • la lysogénie, par laquelle l'ADN viral s'insère dans le chromosome de l'hôte (N.d.A : ce qui ressemble à une mutation ...) ⇒ de nombreuses cellules des organismes vivants contiennent des gènes provenant de virus (à ADN).

    Si cette cellule hôte lysogénée est alors soumise à un stress (rayons UV, ...) le virus a la capacité de se sauver en provoquant un cycle lytique (donc la mort de l'hôte) ! Cependant il arrive que la lysogénie ne soit pas réversible en lyse, ce qui explique que de nombreuses cellules contiennent des gènes provenant de virus.

La multiplication d'un virus au sein de la cellule hôte n'est pas un processus de division mais de réplication : la particule virale se décompose, puis est reconstruite en de multiples exemplaires par auto-assemblage des différents composants que la cellule fabrique sous le contrôle du génome viral [source p.56].

En raison de l'absence de capacité de reproduction autonome, le consensus scientifique est que les virus ne sont pas des organismes vivants. C'était du moins la situation jusqu'à la fin du siècle passé, car depuis lors le progrès technologique a quelque peu bousculé ce "consensus".

sequencage-adn.png

Les techniques de séquençages de l'ADN permettent aujourd'hui d'analyser les séquences de nucléotides qui forment les acides nucléiques ("lettres" de l'ADN) de très nombreux organismes (cf. image ci-contre). Quant à la bio-informatique elle a permis de (i) comparer des séquences de nucléotides (NB : quand on analyse un génome, c'est sur des petits morceaux, qui doivent être recombinés pour obtenir la séquence complète) et (ii) d'établir l'arbre phylogénétique d'un virus ⇒ notamment d'observer l'évolution géographique des mutations (NB : ce qui peut avoir pour effet de faire croire que les mutations seraient plus nombreuses que par le passé, alors que ce n'est que leur recensement qui a été amélioré : ce phénomène fut particulièrement prégnant durant la crise de la covid-19).

naissance-vie.jpg

On a ainsi pu constater que les trois branches de l'arbre phylogénétique des espèces ont une série de protéines en commun, ce qui conduit la plupart des biologistes à en conclure à l'existence d'une origine commune (N.d.A. : pourquoi n'y aurait-il qu'une seule origine : le phénomène décrit ci-dessus ne pourrait-il être le résultat d'évolutions initiées en divers lieux ...?).

En outre cette origine commune serait fondée uniquement sur l'ARN, acide nucléique pourvu de fonctions de mémorisation et de catalyse ⇒ notion de ribozyme (ARN avec activité enzymatique).

La vie se serait développée par des réactions chimiques capables de s'auto-entretenir, et de mémoriser de l'information pour pouvoir la reproduire ⇒ processus évolutif (dont acquisition d'une membrane cellulaire).

Mais une transformation a du avoir lieu, puisque tous les organismes vivants actuellement connus ont leur matériel génétique sous forme d'ADN. Une thèse est que les cellules eucaryotes (cellules à noyau) seraient issues de macro-virus dont l'usine virale (mécanisme permettant à ce type de virus de se protéger des système de défense de l'hôte) se serait transformée définitivement en noyau.

eau-de-mer.jpg

Les virus
et la vie

Les virus sont partout. Ainsi dans cette photo d'une goutte d'eau de mer, les points les plus petits sont des virus (cf. ovale), le plus gros un protiste (cf. cercle), et ceux de taille intermédiaire des bactéries (cf. rectangle). Les virus jouent un rôle majeur dans le cycle du carbone océanique.

Étant donné l'omniprésence des virus, on ne s'étonnera donc pas que les êtres vivants échangent des gènes non seulement par la reproduction, mais aussi en les combinant avec ceux des virus et des bactéries. On estime ainsi qu'environ 70% du matériel génétique sur Terre serait d'origine virale. On sait aujourd'hui que 8% de l'ADN humain est constituée de vestiges de gènes transmis par des virus. Le corps humain contient ainsi dix à cent fois plus de virus que de cellules humaines.

  • Donnée importante concernant le risque épidémiologique : sur 5.000 espèces recensées de ces virus, seulement 2,5% sont jugées pathogènes.
  • Le corps humain contient également plus de bactéries que de cellules humaines. À lui seul, notre tube digestif contient 100 milliards de bactéries [source].

Alors un virus est-il un organisme vivant ou non ? Depuis la découverte, par une équipe dirigée par Didier Raoult, de virus géants (que l'on pensait être des bactéries), dont le virophage Mimivirus, capable d'infecter d'autres virus pour se répliquer, la thèse des virus incapables de se reproduire entre eux s'effondre, et les virus géants peuvent alors être considérés comme des organismes vivants. Quoi qu'il en soit, une chose est évidente : les virus, géants ou pas, sont intimement liés au processus vital.

La cellule

https://philosophie.jortay.net/savoir-scientifique-base#cellule
triangle-clipedia.png Vidéo Clipedia : La cellule

La cellule est elle-même un organisme vivant, avec ceci de particulier qu'elle constitue l'organisme vivant élémentaire c-à-d tel que :

  • ses constituants ne sont pas des organismes vivants (notion de "machinerie cellulaire") ;
  • elle constitue la "brique élémentaire" dont sont faits tous les organismes vivants (NB : il existe des organismes composés d'une seule cellule, tel que l'euglène qui est une algue);

Les cellules exercent des fonctions biologiques. Par exemple les globules rouges – qui sont un des trois types de cellules constitutives du sang (avec les globules blancs et les plaquettes) – ont pour effet de transporter les gaz respiratoires des poumons vers les organes.

eucaryote-procaryote.jpg

Coupe d'une cellule eucaryote schématique, à côté de deux cellules procaryotes.

Il existe différentes façons de classer les cellules en types de cellules, une d'elle consistant à distinguer cellules animales et cellules végétales. Mais la typologie la plus fondamentale est probablement celle distinguant les cellules selon qu'elles comportent ou pas un noyau :

  • procaryotes : cellules sans noyau (typiquement les bactéries) ; taille : 1-10 µm (1 μm = 10−6 m, c-à-d un millième de mm) ;
  • eucaryotes : cellules avec noyau (qui dans l'évolution de la vie sont apparues longtemps après les procaryotes) ; taille : 10-100 µm.

Étymologie : du grec "caryote" : noyau, "pro" : avant (NB : les procaryotes sont apparus avant les eucaryotes), "eu" : bon.

Dans les deux types de cellules la membrane plasmique délimite la cellule et sépare le milieu extracellulaire du cytoplasme. Ce dernier désigne le milieu intracellulaire dans lequel les composantes de la cellule, appelées organelles, sont en suspension (eucaryotes : noyau, mitochondries, appareil de Golgi...).

cellule-bacterienne.jpg

Cellule bactérienne (donc sans noyau) avec sa zone nucléotide (sans membrane : il n'y a pas de noyau) généralement constituée d'un double brin d'ADN circulaire.

La bactérie, probablement l'organisme unicellulaire le plus simple, vérifie les trois critères définissant un organisme vivant :

  • réponse à des stimuli : elle peut détecter de la nourriture et se diriger vers elle, à l'aide de cils situés sur sa membrane ;
  • échanges avec l'environnement : au travers de sa membrane elle ingère matière & énergie, puis évacue des déchets ;
  • se reproduisent de façon autonome : elle se reproduit, par division cellulaire (pincement de la membrane).
cellules-pelure-oignon.jpg

Tissus cellulaire constituant une pelure d'oignon

Certaines cellules circulent dans l'organisme (exemples : globules rouges du sang, bactéries, ...), tandis que d'autres sont jointes entre elles pour former un tissus cellulaire, comme illustré dans cette photo (au microscope optique) d'une pelure d'oignon. On y distingue clairement la membrane et le noyau de chaque cellule du tissus.

euglene.jpg

Euglène : algue unicellulaire (observée au microscope optique).

L'organisme humain est ainsi composé d'environ cent mille milliards (100.000.000.000.000) de cellules. Mais il existe également des organismes unicellulaires c-à-d composés d'une seule cellule. C'est le cas des bactéries, ou encore de l'euglène, une algue, dont le noyau apparaît en rouge sur la photo ci-contre (alors que les bactéries n'ont pas de noyau).

triangle-clipedia.png Vidéo Clipedia : L’usine cellulaire

Le fait que les composants de la cellule ne sont pas eux-mêmes des organismes vivants posent une question passionnante : qu'est ce qui fait qu'un assemblage de corps non-vivants (la "machinerie cellulaire") devient vivant ? Qu'est-ce qui explique ce passage de la matière inerte à la matière animée ?

En fait nous avons déjà posé les prémisses de la réponse à cette question, dans la section #cohesion-electromagnetique, où nous avions montré le rôle fondamental joué par l'électricité dans les interactions dynamiques et chimiques entre atomes, via des forces d'attraction et répulsion. Nous avions vu ensuite le rôle complémentaire joué par la notion de différence de potentiel énergétique dans ces interactions.

Nous allons étudier ici comment ces phénomènes physiques et chimiques peuvent expliquer le passage de matière inerte à matière vivante. Pour ce faire nous allons grimper de l'échelle atomique à l'échelle moléculaire, puis à celle de cellule, et enfin aux tissus organiques. Les tissus organiques sont constitués de cellules organiques, elles mêmes composées de molécules chimiques, elles-mêmes constituées d'atomes.

Le passage de la matière inerte à la matière vivante est le fruit d'interactions entre atomes et molécules, interactions qui ne sont plus soumises au seul hasard, mais visent également un objectif. Celui-ci est de maintenir un équilibre vital entre l'organisme vivant et son environnement (notion de métabolisme). Cette préservation d'un équilibre vital est un mécanisme d'adaptation, qui requiert un système de gestion des fonctions vitales.

metabolisme.jpg
Machinerie
cellulaire

Il y a là une analogie flagrante avec le système d'exploitation d'un ordinateur, qui gère le bon fonctionnement de ses programmes (le système d'exploitation, étant un programme gérant les autres, est qualifié de "méta-programme"). Par exemple lorsque la température des processeurs dépasse un certain niveau, le ventilateur est automatiquement actionné par le système d'exploitation, jusqu'à ce que la température des processeurs soit redescendue en-dessous de la limite maximale programmée.

Le métabolisme des organismes vivants ne gèrent pas que le traitement d'informations (les bits