Qu'est-ce que la distance de Hamming ?
La distance de Hamming entre deux chaînes de même longueur correspond au nombre de positions où les symboles diffèrent. Elle doit son nom à Richard Hamming et constitue un concept fondamental en théorie de l'information, en théorie des codes et en informatique. Elle indique le nombre minimal de substitutions nécessaires pour transformer une chaîne en l'autre, et joue un rôle clé dans les codes détecteurs et correcteurs d'erreurs.
Comment utiliser ce calculateur
Saisissez vos deux chaînes : il peut s'agir de séquences binaires (comme 1011101), de bases d'ADN ou de n'importe quel texte. Le calculateur les compare caractère par caractère et compte le nombre de positions qui diffèrent. Si les chaînes n'ont pas la même longueur, chaque caractère supplémentaire de la chaîne la plus longue est compté comme une différence.
La formule expliquée
Pour deux chaînes a et b, la distance de Hamming est la somme, sur toutes les positions i, d'un indicateur égal à 1 lorsque ai ≠ bi et à 0 sinon :
$$d(a, b) = \sum_{i=1}^{\min(|a|,|b|)} \left[\, \text{A}_i \neq \text{B}_i \,\right] + \Big|\; |\text{A}| - |\text{B}| \;\Big|$$
Le résultat est toujours un entier positif ou nul, compris entre 0 (chaînes identiques) et la longueur de la chaîne (toutes les positions diffèrent).
Exemple détaillé
Comparons 1011101 et 1001001. En les alignant :
10111011001001
Les positions diffèrent à l'indice 3 (1 contre 0) et à l'indice 5 (1 contre 0). Cela donne une distance de Hamming de 2.
FAQ
Les chaînes doivent-elles avoir la même longueur ? La distance de Hamming classique exige des chaînes de longueur identique. Cet outil fournit néanmoins un résultat utile pour des chaînes de longueurs différentes en comptant chaque caractère excédentaire comme une différence.
Fonctionne-t-il avec du texte non binaire ? Oui. Tous les caractères peuvent être comparés : lettres, chiffres ou symboles.
Quelle est la différence avec la distance de Levenshtein ? La distance de Hamming ne compte que les substitutions à des positions fixes, tandis que la distance de Levenshtein autorise aussi les insertions et les suppressions.