FR EN
L'ISPM a gagné le 1er prix de l'Olympiade d'Informatique de Madagascar 2012 pour sa première participation.
D'après le Shangaï ranking of Universities, ISPM est classé parmi les dix meilleures Universités de Madagascar (Top-10) (parmi les 140 universités publiques et privées).

Actualités

Contact

INSTITUT SUPERIEUR POLYTECHNIQUE DE MADAGASCAR
Ambatomaro Antsobolo
Antananarivo MADAGASCAR

Téléphone : +261 33 12 171 60
+261 34 36 406 05
+261 32 66 870 49

Email : ispm.mada@gmail.com

Mémoire & Thèse

Liste des Mémoires & Thèses

SYSTEME EXPERT POUR L’ALIGNEMENT MULTIPLE DE SEQUENCES PROTEIQUES ET LA CONSTRUCTION D’ARBRES PHYLOGENETIQUES

Présenté par :
  • RANDRIAMAHENINTSOA Fanaja Harianja
Dirigé par :
  • Professeur RABOANARY Roland (Président du Jury)
  • Monsieur RABOANARY Lala Olivier (Membre du Jury)
Mots clés : bioinformatique, base de connaissance, arbre phylogénétique, alignement, protéine, système expert, arbre de décision
Résumé :

L'alignement multiple de séquences et la construction d'arbres phylogénétiques sont parmi les principales disciplines traitées en bioinformatique. L’alignement multiple de séquences permet de comparer un groupe de protéines afin de déterminer les régions similaires. Un arbre phylogénétique présente les relations de parenté entre organismes vivants et montre le rapprochement entre les différentes espèces. Plusieurs méthodes et algorithmes existent tels que : ClustalO, KAlignMuscle, ClustalW2, Mafft et T-Coffee pour l'alignement multiple de séquences, le NeighbourJoining et le Unweighted Pair Group Method withArithmeticMean (UPGMA) pour la construction des arbres phylogénétiques. La précision des résultats obtenus par ces méthodes dépend étroitement des caractéristiques des données sur lesquelles on les applique. Parfois, pour un ensemble de séquences protéiques donné, un algorithme donne un meilleur résultat que les autres, mais pour un autre ensemble cet algorithme ne peut être pas le meilleur. Pour faire face à ces problèmes, nous avons conçu et créé un système expert basé sur les connaissances pour l'alignement multiple de séquences et la construction d'arbres phylogénétiques. Ce système utilise une base de connaissances dans le but de déterminer l'algorithme le plus approprié pour un ensemble de séquences donné. De plus, nous avons mis en place un service web pour la détermination de région de faible complexité des séquences protéiques. C'est le premier service web disponible pour cette fonctionnalité. Les résultats de l’expérience ont montré que le système est fiable sur la qualité des résultats obtenus.

Abstract :

Multiple sequence alignment and phylogenetic tree construction are among the main bioinformatics issues. The multiple sequence alignment is used to compare a group of proteins in order to identify similar regions.A phylogenetic tree shows the relationships between living organisms and shows the distance between the different species. Many methods and algorithms exists such as: Muscle, ClustalW, Mafft and T-Coffee for multiple sequence alignment, Neighbour Joining and Unweighted Pair Group Method with Arithmetic Mean (UPGMA) for the phylogenetic tree construction. The accuracy of the results obtained with these methods depends closely on the characteristics of the data on which they are applied. Sometimes, for a given set of protein sequences, an algorithm gives a better result than the others do but for another set, this algorithm maybe not the best. To deal with these problems, we designed and created a knowledge-based expert system for the multiple sequence alignment and the phylogenetic tree construction. The system uses the knowledge base in order to determine the most suitable algorithm for a given data to generate accurate results. Moreover, we set up a web service for low complexity region determination of protein sequences. It is the first web service available for that purpose. Experiments show that the system provides accurate and high quality results.

Présenté le : décembre 2015

FAHAIZANA - FAMPANDROSONA - FIHAVANANA