벤포드(Benford) 법칙

수학이야기 2010. 10. 8. 12:54
반응형

우리 주위에 있는 여러가지 수들 가운데 맨 앞자리 숫자는 어떤 것이 가장 많을까? 보통 `1,2,3, \cdots , 9`가 같은 확률로 나타날 것이라 생각하기 쉽다. 그러나 신문이나 회계장부따위에 나타나는 숫자들을 조사해보면 맨 앞자리에 1이 오는 것들이 무려 30%나 된다고 한다. 이들 숫자들이 이루고 있는 분포를 말해주는 것이 벤포드 법칙이다.

19세기에 쓰던 로그표들이 뒷부분보다 앞부분이 많이 닳고 헤지는 것을 보고 알려진 이 법칙을 정리한 사람이 벤포드이다. 물리학자인 프랭크 벤포드는 농구 통계, 잡지의 기사 수, '아메리칸 멘 오브 사이언스'에 실린 3백42명의 주소들처럼 아무런 관련이 없는 숫자 2천2백29개를 골라 조사하여 법칙을 찾아냈다. 맨 앞자리 숫자가 `k(k=1,2,3, \cdots , 9)`일 확률을 `P(k)`라고 하면


`P(k)=log(k+1)-logk`

이다. 이 확률의 근삿값은 아래와 같다.

사용자 삽입 이미지

한편, `2^n (n=1,2,3, \cdots)`꼴의 자연수도 벤포드 법칙을 따른다. `2, 2^2 ,2^3, \cdots ,2^{100}`가운데 맨 앞자리 숫자가 1인 수는 30개이다.

많은 수학통계 학자들은 어떤 회계장부가 조작되었는가를 따질 때 이 벤포드 법칙을 쓸 수 있다고 생각하여 시스템을 만들고 있으며 미국 국세청에서 실제 쓰고 있다고 한다. 회계장부에 있는 숫자들을 적당히 고르고 맨 앞자리 숫자들을 조사했을 때 표와 너무 다르게 나타난다면 그 장부는 조작되었을 가능성이 크다고 보고 좀 더 꼼꼼히 살펴보는 것이다.

반응형