Noyau de Treelets Applique aux Graphes Etiquetes

Benoit Gauzere &
Luc Brun &
Didier Villemin.

La chemoinformatique utilise des methodes issues de l’informatique, plus particulièrement la theorie des graphes et l’apprentissage automatique, afin de classifier ou predire les proprietes de bases de molecules. Dans ce contexte, les noyaux sur graphes fournissent une approche interessante en combinant les methodes d’apprentissage automatique et la representation naturelle des molecules par graphes. Plusieurs methodes basees sur les noyaux sur graphes ont ete proposees pour resoudre des problèmes en chemoinformatique. La decomposition du graphe en sous structures represente une importante famille de noyau. Dans cet article, nous presentons une extension d’un noyau precedemment base sur les sous structures non etiquetees à l’enumeration de sous structures etiquetees. Nous proposons egalement deux methodes iteratives permettant de selectionner un ensemble de sous structures afin d’ameliorer la precision de la prediction. Le noyau a ete valide sur deux jeux de donnees impliquant des graphes etiquetes.