Noyau de Treelets applique aux graphes etiquetes et aux graphes de cycles

Benoit Gaüzère &
Luc Brun &
Didier Villemin.

La chemoinformatique utilise des methodes issues de l’informatique, plus particulièrement la theorie des graphes et l’apprentissage automatique, afin de classifier ou predire les proprietes de bases de molecules. Dans ce contexte, les noyaux sur graphes fournissent une approche interessante en combinant les methodes d’apprentissage automatique et la representation naturelle des molecules par graphes. Parmi les methodes basees sur les noyaux sur graphes, la decomposition du graphe en sous-structures represente une importante famille de noyau. Dans cet article, nous presentons deux extensions d’un noyau precedemment base sur les sous-structures non etiquetees à l’enumeration de sous structures etiquetees et à la prise en compte de l’information cyclique des molecules. Nous proposons egalement des methodes de selection de variables permettant de ponderer un ensemble de sous-structures afin d’ameliorer la precision de la prediction.