영어 이름은 발음은 비슷하거나 거의 같은데 철자가 다른 경우가 많습니다. 예를 들면 루이스라는 이름의 철자는 Lewis, Luis, Louis, ... 여러가지가 나올 수 있습니다. 그래서 이런 헷갈리는 이름의 경우 전화로 이름을 말할때는 스펠링까지 말하기도 합니다. 1920년대에 미국 국립문서기록관리청(NARA, National Archives and Records Administration)에서 인구조사 기록을 효율적으로 관리하기 위해 유사한 발음을 갖는 이름을 그룹화하기 위한 사운덱스 알고리즘을 개발했는데 모든 문자열을 알파벳+3자리 숫자로 표기하는 방식입니다. 알고리즘은 위키에 잘 나와있으니 찾아보시고요, 결과물을 보면 helo=hello=hallow=H400 이런식으로 색인이 만들어집니다. SO..