통계청 자료로 살펴 보는 코로나 19

수학이야기/확률통계 2020. 11. 26. 09:43
반응형

오늘부터 고등학교는 다시 원격수업을 하게 된다. 요즘 유행하고 있는 코로나와 관련된 수업 자료를 만들려고 한다. 처음엔 지난 학기에 썼던 코로나 유행 상황을 미분 방정식으로 해석하는 글을 그대로 쓸 생각이었다. 통계청에 자료를 보니 로지스틱 모델과 아주 비슷한 모양이 나와 있다. 아쉽게도 5월 말까지 상황을 나타내는 그래프였다.

3. 2020년 여름호 통계프리즘1 최바울.pdf
3.17MB

지난번에 썼던 글을 옮겨 놓는다.

코로나 19 확진자 숫자를 예측하는 그래프는 어떻게 찾았을까? 인구나 바이러스가 늘어나는 걸 예측하는 로지스틱 모형이 있다.

먼저 식량을 비롯한 인구 성장에 필요한 조건이 아주 좋아서 인구가 한없이 성장한다고 가정하면 인구 성장률은 인구에 비례한다. 인구는 $P$이고 단위 시간당 출생률에서 사망률을 뺀 값을 상수$k>0$로 놓자.

$$\frac{d P}{d t}=k P\tag{1}$$

이 미분방정식은 변수 분리 가능하므로 아주 간단하게 풀 수 있다.

$$\frac{1}{P} dP=k dt$$

$$\ln P=kt +C$$

$$P=Ae^{kt}\quad \quad (A=e^{C})$$

당연히 식량이나 자원은 한정되어 있으므로 인구가 지수함수로 무한하게 성장할 수 없다. 주어진 환경에서 증가할 수 있는 최대 인구를 $M$이라고 한다면 인구가 한계 상황에 가까워지면 출생률은 줄고 사망률은 늘어날 것이다. 이것을 식으로 나타내면 아래와 같다.

$$k=r(M-P)$$

여기서 $r>0$은 상수라고 할 때, 위에 있는 미분방정식 (1)을 다시 고치면 아래와 같다.

$$\frac{d P}{dt}=r(M-P)P=rMP-rMP^2\tag{2}$$

이 방정식으로 만든 모델을 로지스틱 성장(logistic growth)이라 한다. 그래프를 그리기 위해 방정식 (2)를 미분하면 아래와 같다.

$$\begin{split}\frac{d^2 P}{dt^2}&=\frac{d}{dt}(rMP-rP^2)\\ &= rM\frac{dP}{dt} -2r P \frac{dP}{dt} \\&=r(M-2P)\frac{d P}{dt}\end{split}\tag{3}$$

그래프 개형을 그려보자.

1. $P=M/2$라면 $d^2 P/dt^2=0$이다.

2. $P<M/2$라면 $M-2P>0,\;\;dP/dt>0$이므로 $d^2 P/dt^2>0$이다.

3. $M/2<P<M$라면 $M-2P<0,\;\;dP/dt>0$이므로 $d^2 P/dt^2<0$이다.

아래로 볼록하면서 증가하다가 위로 볼록하면서 증가한다.

4. $M<P$라면 $M-2P<0,\;\;dP/dt<0$이므로 $d^2 P/dt^2>0$이다. 아래로 볼록하면서 감소한다.

코로나 19 확진자 수도 당연히 한계가 있다. 이제 우리나라는 변곡점을 지난 것으로 보인다.

이때까지만 해도 희망이 있었다. 하지만 12월이 가까운 오늘도 코로나 19 바이러스 유행은 여전하다. 오히려 새로운 파도가 밀려오는 느낌이다. 설상가상! 내가 살고 있는 강원도 원주는 유행에서 빗겨 나 있었는데 지난달부터 확진자가 갑자기 늘었다. 그나마 며칠 전부터 추가 확진자가 나오지 않아서 다행이다.

갑자기 6월 이후 상황도 궁금하다. 찾아보니 6월 이후 데이터는 별로 없어 직접 만들기로 했다. 다행스럽게도 통계청에서 마이크로 데이터를 내려받을 수 있다. 엑셀로 그래프를 그려 보았다.

2차 파도까지는 원인이 분명한데 3차 파도는 꼭 집어 말할 원인이 없다. 말 그대로 조용한 감염이 널리 퍼지고 있는 모양새다. 상황이 끝나고 전체적인 그래프가 로지스틱 모형과 비슷해지려면 기간이 1~2년이 아니라 5~6년은 되어야 할 듯하다. 그렇게 생각하면 변곡점에 다다를 날도 아직도 멀었다. 조금은 우울한 전망이다. 하지만 세상 모든 생명은 다 죽음으로 수렴한다. 바이러스도 수렴할 것이다. 앗, 바이러스는 생명이 없는 것인가!

반응형