|
||||
L'ISPM a gagné le 1er prix de l'Olympiade d'Informatique de Madagascar 2012 pour sa première participation.
D'après le Shangaï ranking of Universities, ISPM est classé parmi les dix meilleures Universités de Madagascar (Top-10) (parmi les 140 universités publiques et privées).
|
Mémoire & Thèse
Liste des Mémoires & Thèses
SYSTEME EXPERT POUR L’ALIGNEMENT MULTIPLE DE SEQUENCES PROTEIQUES ET LA CONSTRUCTION D’ARBRES PHYLOGENETIQUESPrésenté par :
Dirigé par :
Mots clés : bioinformatique, base de connaissance, arbre phylogénétique, alignement, protéine, système expert, arbre de décision
Résumé :
L'alignement multiple de séquences et la construction d'arbres phylogénétiques sont parmi les principales disciplines traitées en bioinformatique. L’alignement multiple de séquences permet de comparer un groupe de protéines afin de déterminer les régions similaires. Un arbre phylogénétique présente les relations de parenté entre organismes vivants et montre le rapprochement entre les différentes espèces. Plusieurs méthodes et algorithmes existent tels que : ClustalO, KAlignMuscle, ClustalW2, Mafft et T-Coffee pour l'alignement multiple de séquences, le NeighbourJoining et le Unweighted Pair Group Method withArithmeticMean (UPGMA) pour la construction des arbres phylogénétiques. La précision des résultats obtenus par ces méthodes dépend étroitement des caractéristiques des données sur lesquelles on les applique. Parfois, pour un ensemble de séquences protéiques donné, un algorithme donne un meilleur résultat que les autres, mais pour un autre ensemble cet algorithme ne peut être pas le meilleur. Pour faire face à ces problèmes, nous avons conçu et créé un système expert basé sur les connaissances pour l'alignement multiple de séquences et la construction d'arbres phylogénétiques. Ce système utilise une base de connaissances dans le but de déterminer l'algorithme le plus approprié pour un ensemble de séquences donné. De plus, nous avons mis en place un service web pour la détermination de région de faible complexité des séquences protéiques. C'est le premier service web disponible pour cette fonctionnalité. Les résultats de l’expérience ont montré que le système est fiable sur la qualité des résultats obtenus. Abstract :
Multiple sequence alignment and phylogenetic tree construction are among the main bioinformatics issues. The multiple sequence alignment is used to compare a group of proteins in order to identify similar regions.A phylogenetic tree shows the relationships between living organisms and shows the distance between the different species. Many methods and algorithms exists such as: Muscle, ClustalW, Mafft and T-Coffee for multiple sequence alignment, Neighbour Joining and Unweighted Pair Group Method with Arithmetic Mean (UPGMA) for the phylogenetic tree construction. The accuracy of the results obtained with these methods depends closely on the characteristics of the data on which they are applied. Sometimes, for a given set of protein sequences, an algorithm gives a better result than the others do but for another set, this algorithm maybe not the best. To deal with these problems, we designed and created a knowledge-based expert system for the multiple sequence alignment and the phylogenetic tree construction. The system uses the knowledge base in order to determine the most suitable algorithm for a given data to generate accurate results. Moreover, we set up a web service for low complexity region determination of protein sequences. It is the first web service available for that purpose. Experiments show that the system provides accurate and high quality results. Présenté le : décembre 2015 |