Simulations stochastiques en environnements distribués. Application aux grilles de calcul. (Stochastic simulations in distributed environments. Applications to computational grids)
暂无分享,去创建一个
La revolution informatique initiee lors de la 2e partie du 20e siecle place la simulation informatique en tant que paradigme tres populaire pour l'investigation scientifique, pour la prevision et la comprehension des mecanismes dans des systemes complexes. Parmi les criteres de classification des specialistes de la simulation, on peut distinguer les modeles deterministes et les modeles stochastiques. Contrairement au deroulement d'un modele deterministe, le deroulement et donc les resultats issus d'un modele stochastique sont conditionnes par la realisation de variables aleatoires. Ainsi, ils utilisent des sources de hasard pour en tirer un avantage afin d'estimer statistiquement un resultat. Ce type de modele produit ainsi en un temps raisonnable une approximation pour un resultat souvent incalculable de maniere deterministe. En contrepartie, il est necessaire d'estimer l'esperance et les intervalles de confiance associes aux quantites aleatoires en sortie du modele stochastique. Ce calcul necessite l'execution de plusieurs replications independantes de la meme experience et, de ce fait, une importante somme de calcul. Pour cela, il n'est plus rare que l'execution de larges simulations stochastiques aux echelles actuelles necessitent plusieurs dizaines d'annees sur un ordinateur en sequentiel. L'independance des replications est ainsi un aspect primordial, d'une part pour la qualite des resultats finaux, et d'autre part parce qu'il permet l'acceleration de calculs stochastiques par le biais d'une execution parallele. Toutes les similations stochastiques comprennent par conception un aspect naturellement parallele. De ce fait, les simulations stochastiques, representent une des applications phares pour l'utilisation d'environnements de calculs distribues extensifs, de type grilles de calcul. Les grilles de calcul servent en quelque sorte de super-calculateur pour exploiter en parallele la puissance de dizaine de milliers d'ordinateurs situes dans le monde. Plus de 50% des cycles de super-calculateurs de la planete sont maintenant consommes par des calculs stochastiques, il existe encore malheureusement de mauvaises pratiques en ce qui concerne l'utilisation de generateurs de nombres pseudo-aleatoires (comme par exemple l'utilisation de generateurs de faible qualite par rapport aux attentes du 21e, ou encore la disponibilite meme dans des bibliotheques et des logiciels de simulation de renom de generateurs contenant des erreurs d'implementation). De plus, et c'est plus particulierement la raison d'etre de ce sujet, nous constatons une meconnaissance des techniques de parallelisation de generateurs de nombres pseudo-aleatoires. Nous montrons qu'il existe un risque bien reel de produire des resultats de simulations stochastiques incoherents du fait d'un manque de rigueur et d'une mauvaise comprehension des mecanismes de parallelisation des simulations stochastiques. Cette these presente ainsi une contribution au developpement de methodes et d'outils logiciels permettant de distribuer de maniere rigoureuse les replications de simulations stochastiques. Elle propose des methodes novatrices permettant d'assurer une tracabilite dans le processus complexe de distribution de simulations stochastiques. Ces methodes ont ete integrees dans des outils logiciels libres mis a la disposition de la communaute scientifique. L'utilisation de ces outils associes a la grille de calcul auvergnate "Auvergrid" a permis l'execution de simulations stochastiques dans les domaines de l'imagerie medicale nucleaire et de simulations environnementales. Le temps necessaire a la realisation de ces simulations est equivalent a plus de 70 annees de calcul sur un ordinateur sequentiel. Grâce aux propositions de cette these, nous montrons des resultats sur des applications permettent aussi bien d'explorer les possibilites de colonisation de la Mediterranee par l'algue Caulerpa taxifolia, que d'ameliorer considerablement la reconstruction d'images pour la detection de petites tumeurs avec des scanners PET ou SPECT