LambdaFinder - détermination d'une Lambda Distribution
Introduction
La plupart des méthodes de contrôle statistiques
sont basées sur la loi de probabilité gaussienne. Ainsi, les cartes de contrôle
du SPC notamment se basent sur les propriétés de cette loi afin de définir des
comportements aberrants ou anormaux de procédés étudiés.
La loi gaussienne, ou encore loi normale, possède de nombreuses propriétés « agréables », qui permettent un traitement simplifié des problèmes. En effet, la loi normale est symétrique, on peut en outre se contenter d’étudier N(0,1), puis se ramener par des transformations très simples à la loi qui correspond au phénomène étudié. Enfin, le théorème central limite assure la quasi universalité de cette loi quelque soit le phénomène étudié.
Néanmoins, un certain nombre de phénomènes ne peuvent être modélisés à l’aide d’une loi normale, car celle-ci, quoique pratique, reste, en dehors des hypothèses du théorème central limite, relativement restrictive.
Ainsi, pour palier aux insuffisances pratiques de la loi normale, Pearson donna en 1895 une famille de densités de probabilité à 4 paramètres appelées des lambda distributions. Ces dernières sont basées sur la lambda distribution à 1 paramètre développée par Turkey en 1960, qui fut généralisée à 4 paramètres en 1972 et 1975 par John Ramberg et Bruce Schmeiser.
Outre l’intérêt lié au contrôle statistique des processus, les lambda distributions possèdent l’intéressante propriété d’être définies par leur fonction percentile. Ceci permet de générer aléatoirement, de façon simple et rapide, des nombres suivant une loi de type lambda distribution. Ce qui, dans le cas d’études réalisées par des simulations de type Monte Carlo, comme par exemple une étude aux valeurs extrêmes, est extrêmement pratique !
Pour résumé, les lambda distributions présentent plusieurs atouts majeurs.
La loi gaussienne, ou encore loi normale, possède de nombreuses propriétés « agréables », qui permettent un traitement simplifié des problèmes. En effet, la loi normale est symétrique, on peut en outre se contenter d’étudier N(0,1), puis se ramener par des transformations très simples à la loi qui correspond au phénomène étudié. Enfin, le théorème central limite assure la quasi universalité de cette loi quelque soit le phénomène étudié.
Néanmoins, un certain nombre de phénomènes ne peuvent être modélisés à l’aide d’une loi normale, car celle-ci, quoique pratique, reste, en dehors des hypothèses du théorème central limite, relativement restrictive.
Ainsi, pour palier aux insuffisances pratiques de la loi normale, Pearson donna en 1895 une famille de densités de probabilité à 4 paramètres appelées des lambda distributions. Ces dernières sont basées sur la lambda distribution à 1 paramètre développée par Turkey en 1960, qui fut généralisée à 4 paramètres en 1972 et 1975 par John Ramberg et Bruce Schmeiser.
Outre l’intérêt lié au contrôle statistique des processus, les lambda distributions possèdent l’intéressante propriété d’être définies par leur fonction percentile. Ceci permet de générer aléatoirement, de façon simple et rapide, des nombres suivant une loi de type lambda distribution. Ce qui, dans le cas d’études réalisées par des simulations de type Monte Carlo, comme par exemple une étude aux valeurs extrêmes, est extrêmement pratique !
Pour résumé, les lambda distributions présentent plusieurs atouts majeurs.
- Tout d’abord, la variété de leur forme qui leur permet de modéliser un grand nombre de séries de données fort différentes.
- Par ailleurs, leur définition basée sur leur fonction percentile, qui simplifie les simulations de type Monte Carlo.
- Enfin, la présence de quatre paramètres directement reliés à l’allure de la fonction de densité permet, en agissant sur un paramètre, de façon « manuelle », de modifier à sa guise la forme de la courbe.
Problématique
Le premier objectif du projet était de permettre, à l’aide d’un logiciel convivial et facile d’accès,
de déterminer la lambda distribution associée à une série de données.
La détermination des paramètres d’une lambda distribution passe par la minimisation d’une surface. Ce type de minimisation implique la mise en place d’algorithmes de descente de gradient. Cependant, les surfaces présentant plusieurs minima locaux, le point de départ de l’algorithme revêt une importance primordiale. Ainsi, cette première étape nécessitait la création d’une visualisation en 3D temps réel performante et maniable.
Une fois la lambda distribution déterminée et validée par un test d’adéquation, il est fort intéressant, afin de valider la méthode employée et notamment les estimateurs utilisés, de pouvoir évaluer le biais sur ces mêmes estimateurs. Pour se faire, le logiciel a été muni d’une option de calcul de Bootstrap. Ce dernier réalisé, l’utilisateur peut alors visualiser sur la surface elle-même, ou à l’aide d’histogrammes, la répartition des paramètres obtenus.
Comme cela a été souligné dans l'introduction, un attrait primordial de la lambda distribution est sa simplicité d’utilisation pour des simulations type Monte Carlo. De fait, une fonction d’étude des valeurs extrêmes a été mise en place au sein du logiciel.
Ce troisième objectif atteint, il a fallut se touner vers les propriétés des lambda distributions utiles au contrôle statistique des procédés. Un second logiciel a été réalisé, adaptant les règles du SPC (initialement définies pour des distributions gaussiennes) aux lambda distributions.
La détermination des paramètres d’une lambda distribution passe par la minimisation d’une surface. Ce type de minimisation implique la mise en place d’algorithmes de descente de gradient. Cependant, les surfaces présentant plusieurs minima locaux, le point de départ de l’algorithme revêt une importance primordiale. Ainsi, cette première étape nécessitait la création d’une visualisation en 3D temps réel performante et maniable.
Une fois la lambda distribution déterminée et validée par un test d’adéquation, il est fort intéressant, afin de valider la méthode employée et notamment les estimateurs utilisés, de pouvoir évaluer le biais sur ces mêmes estimateurs. Pour se faire, le logiciel a été muni d’une option de calcul de Bootstrap. Ce dernier réalisé, l’utilisateur peut alors visualiser sur la surface elle-même, ou à l’aide d’histogrammes, la répartition des paramètres obtenus.
Comme cela a été souligné dans l'introduction, un attrait primordial de la lambda distribution est sa simplicité d’utilisation pour des simulations type Monte Carlo. De fait, une fonction d’étude des valeurs extrêmes a été mise en place au sein du logiciel.
Ce troisième objectif atteint, il a fallut se touner vers les propriétés des lambda distributions utiles au contrôle statistique des procédés. Un second logiciel a été réalisé, adaptant les règles du SPC (initialement définies pour des distributions gaussiennes) aux lambda distributions.
Page générée en 1ms - (c)2008 Spipu



