Heterogeneous Pattern Sampling according to Frequency
par
S3 351
Sciences 3
L’échantillonnage en sortie de motifs constitue une alternative prometteuse aux méthodes exhaustives de fouille de données, souvent limitées par leur coût computationnel et l’explosion combinatoire. Toutefois, les approches existantes sont généralement conçues pour des données homogènes, alors que de nombreux contextes applicatifs manipulent des bases de données hétérogènes combinant, par exemple, des attributs binaires, numériques et séquentiels. SEHP (Sampling frEquent Heterogeneous Pattern) est la première méthode d’échantillonnage en sortie de motifs spécifiquement conçue pour gérer ce type de données. SEHP s’inscrit dans la famille des méthodes en plusieurs étapes et permet d’échantillonner des motifs hétérogènes proportionnellement à leur fréquence, tout en assurant un bon niveau de diversité et un temps de calcul compatible avec un usage interactif.