Etude des méthodes de classification par compression
Autori
Viac o knihe
La classification par compression est une idée relativement nouvelle, présentée en 2004 par Paul Vitányi et Rudi Cilibrasi. Le principe de la méthode est basé sur l’observation du fait que les algorithmes de compression fournissent une bonne évaluation de la quantité d’information contenue dans les données à classer, sans avoir besoin d’un prétraitement ou d’information auxiliaire. Cette propriété des algorithmes de compression peut être déduite théoriquement à partir de la complexité mathématique de Kolmogorov et aussi intuitivement à partir de l’inégalité triangulaire appliquée à deux segments des données et à un troisième qui est la concaténation des deux premiers. Ce travail présente l’étude, l’analyse et l’implémentation de certaines méthodes de classification par compression.