Compression Huffman

La compression Huffman utilise des codes longs pour les caractères peu fréquents, et des codes courts pour les caractères fréquents, à la façon du Morse (un point pour le caractère le plus fréquent "E"). On obtient ainsi un nombre de bit moyen par caractère proche de l'entropie.
Applet : Entrez un texte quelconque, "analyze" étudie la fréquence de chaque caractère, "tree step by step" regroupe itérativement les deux caractères (ou groupe de caractères) les moins fréquents, et construit ainsi l'arbre d'Huffman.
Les codes sont attribués aux caractères par parcours de l'arbre depuis la racine : "0" aux branches de gauche, "1" aux branches de droite.