Voici la suite de mon post précédent, intitulé « Pinnularia gibba? partie 1 ». Dans cette partie 2, après avoir extirpé du web un certain nombre d’images de diatomées ressemblant aux miennes, j’ai effectué dessus des mesures morphométriques classiques et moins classiques. Cet ensemble de données à été soumis à une analyse statistique bien connue « l’Analyse en Composantes Principales (ACP) ».
Le but recherché est de voir si mes références sont proches d’autres P.gibba, et si l’analyse les discrimine d’autres Pinnularia non gibba mais ressemblantes.
Pinnularia gibba? Partie 2
Rappel du principe :
L'Analyse en Composantes Principales (ACP ou PCA en anglais), permet d’explorer des données multidimensionnelles constituées de n individus avec p variables quantitatives.
L’idée est de réduire le nombre de variables, en un espace à k dimensions (k < p) ou les k nouvelles variables seront appelées « composantes principales », déterminant des « axes principaux ». On revient à un espace de dimensions réduites, le plus souvent 2, en déformant le moins possible la réalité, pour permettre une interprétation plus simple.
Recherche des individus :
J’ai donc balayé le web à la recherche de quelques valves subcapitées, de dimensions plus ou moins proches, et de caractéristiques visuelles plus ou moins[*] ressemblantes aux miennes. Au total 17 individus sont rassemblés dans la Fig.1, où se côtoient des images de qualité moyenne à mauvaise.
[*] parfois à dessein
Fig. 1
Origine et référence (en gras) des diatomées utilisées dans l’étude.
A - P.brauniana (Grunow) Studnicka 1888, Diatom Org.ME-10020 D, (https://diatoms.org/images/93624), P.brauniana_diatorg_20
B - P.brauniana (Grunow) Studnicka 1888, Diatom Org.ME-10021 C, (https://diatoms.org/images/93625), P.brauniana_diatorg_21
C - P.brauniana (Grunow) Studnicka 1888, Diatom Org. RI-10010 B, (https://diatoms.org/images/93633), P.brauniana_diatorg_10B
D - P. Braunii var. Amphicephala (A.Mayer) Hustedt (JP Claes Le naturaliste), P.braunii_naturvar_amphi
E - P.gibba ?, _141525
F - P.gibba ?, JLD0070
G - P.gibba ?, JLD0083
H - P.braunii (Grunow) Cleve A.Advocat (viewtopic.php?f=90&t=2053&p=8211&hilit=braunii#p8211), P.braunii_Grunow
I - P.gibba Ehr. (http://galerie.sinicearasy.cz/galerie/c ... e_id=11735) Auteur : JR Johansen, P.gibba_CZ
J - P.microstauron, Florida coastal everglades Lter ( https://fce-lter.fiu.edu/data/database/ ... ecies=4583), P.microstauron_iter
K - P.gibba Ehrenberg 1843: 384 (Algal Flora of Korea p.44 Fig.33G (https://docplayer.net/141573424-Algal-f ... korea.html ), P.gibba_korea_G
L - P.gibba Ehrenberg 1843: 384 (Algal Flora of Korea p.44 Fig.33F), P.gibba_korea_F
M - P.gibba Ehrenberg 1843: 384 (Algal Flora of Korea p.44 Fig.33E), P.gibba_korea_E
N - P.gibba (http://www.diatomloir.eu/Diatodouces/Raphesept.html), P.gibba_diatomloir
O - P.gibba ?, JLD0084
P - P.gibba Ehr. Krammer & Lange-Bertalot 1986 p.423 f.189: 1-9 , f.186: 1-3 (https://forum.mikroscopia.com/topic/7087-pgib/), P.gibbaMk80
Q - P.subgibba var. capitata Metzeltin & Krammer, In Lange-Bertalot, Iconographia Diatomologica 5:191, pl. 176, Figs 1-3. 1998. Periphytic diatoms (Bacillariophyta) in streams from three Conservation Units of central Brazil: Figure 33. (https://www.scielo.br/j/hoehnea/a/VnnDP ... d/?lang=en), P.subgibba_capitata.
Les spécimens suivis du point d’interrogation sont les miens.
Choix des variables :
Au total 11 variables seront testées.
• Dimensions : largeur (l), longueur (L), densité de stries(Stries), largeur apex (la), largeur constriction (lc),
• Rapports : longueur/largeur (L/l), largeur apex/largeur constriction (R1), aire axiale/aire totale (aire ax/tot), largeur apex/largeur valve (la/l),
• Rapports plus exotiques[*] : Compacité = (périmètre valve)/aire valve (Compac), Rectangularité = aire valve/aire rectangle l’englobant (Lxl) (Rectang).
[*]1 AUTOMATIC DIATOM IDENTIFICATION SERIES IN MACHINE PERCEPTION AND ARTIFICIAL INTELLIGENCE* Editors: H. Bunke (Univ. Bern, Switzerland) P. S. P. Wang (Northeastern Univ., USA)
http://kt.ijs.si/DragiKocev/repos/Autom ... cation.pdf
Sur https://terra44pf.pagesperso-orange.fr/morpho.jpg, j’ai indiqué les mesures de base prises pour quantifier les variables correspondantes. L’obtention des aires totale et axiale, passe par l’utilisation de la fonction polygone du logiciel de la caméra « Motic Images Plus 3.0 », donnant en outre le périmètre de la valve utilisé dans le calcul de la variable « compacité »).
Après de multiples essais, j’ai retenu 4 variables pour les calculs.
Logiciel utilisé :
J’ai utilisé Tanagra, gratuit et plutôt convivial. On trouve beaucoup d’exemples traités sur leur site :
Ricco Rakotomalala, "TANAGRA : un logiciel gratuit pour l'enseignement et la recherche", in Actes de EGC'2005, RNTI-E-3, vol. 2, pp.697-702, 2005. (https://eric.univ-lyon2.fr/~ricco/tanag ... nagra.html).
Résultats :
Les 4 variables selectionnées (l,L,stries, R1) passées à la moulinette ACP conduisent à l’histogramme suivant :
https://terra44pf.pagesperso-orange.fr/hist.jpg
Je ne retiens que les 2 premiers axes, qui restituent 89,6 % de l’information (ce qui est très bon), je n’aurais donc à commenter qu’un seul plan factoriel.
Cercle des corrélations :
NB : il est préférable de n’interpréter que les flèches les plus longues, car les plus petites correspondent à des variables dites « mal représentées » sur le plan factoriel.
Fig.2
La Fig.2 montre le premier graphique important, le cercle des corrélations. On voit que nos 4 variables sont très bien représentées, car toutes très proches du cercle (j’ai tracé les vecteurs, le logiciel ne le faisant pas).
Fig.3
Une « Rotation Varimax » permettra d’être un peu plus précis (Fig.3). On gagne un peu en traduction de l’inertie sur la variable R1 (qui passe de 96 à 99%) et Stries (passe de 84 à 87%). Bon… pas de quoi chambouler la planète me direz-vous !
Les variables Stries, R1 et L sont ainsi au plus près des axes factoriels.
L’axe vertical dépend presque exclusivement du rapport R1 (largeur apex/largeur constriction), et exprime ainsi dans sa partie positive ou négative le caractère plus ou moins subcapité de la valve.
L’axe horizontal est défini positivement à gauche par la variable « Stries » et positivement à droite par les variables de dimensions largeur (l) et longueur (L).
L’angle entre Stries et R1 étant proche de 90°, elles sont totalement indépendantes. On observe la même chose entre R1 et L.
Les variables Stries et L, à l’opposé l’une de l’autre sur l’axe horizontal, sont anticorrélées. Autrement dit, dans notre cohorte d’individus, plus la valve est longue et plus la densité de stries diminue. Attention : comme la variable L n’est pas strictement sur le cercle des corrélations, et que l’angle entre les 2 variables est inférieur à 180°, c’est une tendance (Une régression linéaire entre les variables Stries et L, ne conduit qu’à un coefficient de corrélation de -0,7944).
Sur la figure 3, on été rajoutées en vert, les variables qui n’ont pas participé à l’obtention de l’ACP, et ne sont qu’« illustratives ». Rectang, Compac, Aire ax/tot et L/l étant très éloignées du cercle des corrélations, elles ne sont donc pas absorbées par les axes 1 et 2, mais par d’autres axes. Ces variables n’apportent donc presque rien, en terme d’explication sur ce plan factoriel, par rapport à celle obtenue avec les variables actives. Les 2 autres variables explicatives, la et lc, ne participent qu’à un effet taille.
Nuages de points projetés :
Attention : les coordonnées des individus et des variables ne sont pas comparables. Ce sont les directions des variables qui ont un sens.
Fig.4 Nuage des espèces
Globalement (Fig.4) l’axe vertical sépare en 2 parties les individus. A droite de l’axe, on retrouve une majorité de P.gibba (2 groupes en bleu, A et B), à gauche, dispersées, les P.brauniana, P.subgibba et P.braunii.
Dans la partie droite, on repère 2 intrus parmi les P.gibba : P.microstauron et P.braunii.
1 - P.microstauron se retrouve dans cette moitié droite à cause de sa taille (77µ) et à l’extrémité très négative de l’axe vertical, par son rapport R1 le plus faible de tous, valeur exprimant les apex les moins subcapités de tous les individus. Visuellement (Ref.J Fig.1), ce spécimen est plus linéaire que lancéolé, possède une aire axiale différente et restreinte par rapport à ses voisins (Ref.K, L, M de la Fig.1)… Il faut donc être prudent selon les cas, avec des ACP à nombre réduit de variables. Pour plus de discrimination il aurait fallu introduire plus de variables, en particulier le rapport « aire axiale/aire totale » mais cela conduisait à analyser 3 ou 4 plans factoriels donc plus de complexité et de temps de réflexion.
2 - P.braunii du groupe A, est la référence D de la Fig.1. JP. Claes avait proposé P.braunii var. Amphicephala, qu’André a redéfinie en P.gibba (viewtopic.php?f=39&t=11567&p=62284&hilit=pinnularia+braunii#p62284). Cette référence a donc bien sa place dans le groupe A.
Le groupe B positionné au bas de l’axe vertical, contient des P.gibba très proches, qui ont donc des caractères en commun, en particulier celui d’être bien moins capitées que celles du groupe A. Elles sont de longueur moyenne (75 à 82µ), avec une densité de stries de 10/10µ.
Fig.5 Nuage des références
Mes 4 références (JLD0070-0083-0084 et _141525), que j’avais supposé être des P.gibba font partie du groupe A. Elles sont positionnées plus à droite que les 4 autres P.gibba à cause de leur taille qui est supérieure (78 à 91µ) contre 76 à 87,5µ[*], et elles sont autant capitées que les autres P.gibba. La référence JLD0083 (G de la Fig.1), est la plus longue et la plus large (91,1x14,7µ) et possède une faible densité de stries (9/10µ), ce qui explique sa position en limite droite du nuage.
[*]Ne pas oublier que la composante Stries joue aussi son rôle dans ce positionnement, puisqu’une densité de stries inférieure tire les individus dans le sens contraire à cette variable.
Je n’ai volontairement pas commenté les positions des autres Pinnularia occupant la partie gauche de l’axe vertical, ce n’était pas le but de ma « récréation ». Tout ce que je recherchais était de séparer les P.gibba des autres Pinnularia, ce qui me semble avoir été réalisé, et de positionner mes valves dans un espace proche d’autres P.gibba. Mais ceci n’a été réalisé que sur des critères de taille, d’indice subcapité, de densité de stries.
En arrivant au terme de cette ACP, je suis conscient que la rigueur imposerait de relancer une ACP avec 6 ou 7 variables, et d’augmenter la cohorte de P.gibba, mais il aurait fallu alors allouer un temps conséquent à l’analyse. Et entre vélo et jardin… c’est dur à caser!
Bon week-end à tous,
Amicalement,
Jean Luc