re-echantillonage et validation

From: Eric Laloum (laloum@pcm.ecp.fr)
Date: Tue Nov 24 1998 - 12:41:36 MET


Bonjour a tous,

1.

Tout d'abord j'aimerais remercier toute l'equipe des devellopeurs d'ADE
ainsi que l'ensemble de la communaute des ADE-users avec qui je
communique depuis bientot 3 ans. En effet, je viens de soutenir ma these
de doctorat en spectrochimie dont le titre est :
"Classification de calculs biliaires et urinaires a partir de spectres
vibrationnels et de criteres morphologiques. Relation avec des donnees
cliniques".
Je compte creer bientot ma page Web pour y mettre mes travaux, mais si
des personnes sont interessees je peux aussi l'envoyer sur le serveur
d'ADE (section applications) au format Word6 Macintosh. J'ai fait une
grande utilisation des techniques multivariees pour ce travail :
-classification automatique
-ACP
-AFC
-ACM.

2.

Une petite question sur les techniques de re-echantillonage. Un des pb
des analyses multivariees et des cartes qu'elles permettent de dessiner
est que l'on n'a pas trop d'idee sur la validite des tendances
observees. Une variable ou un individu represente par un point
correspond en fait plus a une zone de confiance (une elipse). Je lis
actuellement avec beaucoup d'interet un ouvrage intitule :
Statistique et methodes neuronales, Sylvie Thiria et al., ed. DUNOD,
Paris, 1997.
avec a l'interieur un chapitre de Ludovic LEBART sur la validation et le
rééchantillonage pour les methodes d'analyse factorielle (AFD, AFC et
ACP).
Serait-il envisageable qu'a plus ou moins long terme ADE integre ces
epreuves de validite ?
Je ne comprends toujours pas tres bien comment se font les histogrammes
de tests de permutations dans ADE : est-ce qu'il est effectue vraiment
autant d'analyses (avec les diagonalisations respectives) qu'il y a de
permutations possibles ? Comment se positionnent cette technique par
rapport aux tests de Bootstrap (on selectionne plusieurs
sous-echantillon avec remise dans l'echantillon d'etude) ou de Jacknife
(on divise l'echantillon d'etude en m petits echantillons et on repete n
analyses pour voir comment sont distribues les resultats).

Il me semble que ces techniques non parametriques de calcul repete
intensif sont en fait des outils indispensables pour completer les
Analyses Factorielles et qui permettent a ces methodes de depasser le
cadre purement descriptif auxquel elles sont cantonnees.

3.

reactions ?



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:22:03 MET