Article
Sequence Data Based Situation Report for COVID-19
#코로나19 #COVID-19 #Corona virus #SARS-CoV-2
written by 이현중
“코로나19”는 바이러스를 지칭하는 것이 아닌, “코로나바이러스 감염증”을 의미한다.
2020년 3월 11일, WHO에서는 세계적으로 급속히 퍼져나가는 코로나바이러스에 대해 팬데믹(pandemic)을 선언했다. 팬데믹은 범지구적으로 전염병 또는 감염병의 유행을 의미한다. 2000년대 이후 호흡기 증후군을 유발하는 바이러스는 현재 창궐하고 있는 SARS-CoV-2와 더불어 2003년 SARS-CoV, 2015년 MERS-CoV 등이 있다. 신종 바이러스의 명칭과 그로 인해 유발된 증후군의 명칭을 정확히 구분해 본다면 질병관리본부에서 명명한 “코로나19”는 “코로나바이러스 질환 (COVID-19)”과 부합하며, 질환을 유발하는 바이러스의 이름은 앞서 언급한 “SARS-CoV-2”이다[Table 1]. 2020년 1월 13일에 WHO에서 시급하게 신종 코로나바이러스를 2019-nCoV (2019-Novel Coronavirus)로 명명했었고, 2020년 2월 11일에 새로이 SARS-CoV-2로 정정하여 사용하기 시작했다. 이름에서 유추할 수 있듯이 2000년대 초에 유행했던 사스 바이러스와 유전적으로 비슷하기 때문이다[1]. 이전 사스나 메르스는 바이러스의 계통학적 이름과 감염증의 이름이 연관되었으나, 이번 코로나19는 바이러스와 그 증후군의 명칭이 서로 다르게 명명되었다.

Table 1 Nomenclature of Virus and Syndrome Causing Respiratory Syndrome
“SARS-CoV-2”는 사스와 메르스를 주도한 바이러스와 같은 속(Genus)에 해당한다.
계통 분류로 보자면 SARS-CoV-2는 Coronaviridae과에 해당하는 바이러스로, 해당 과에 속하는 여러 바이러스는 주로 인간을 포함한 포유류를 숙주로 삼는다[Table 2][2]. Coronaviridae과의 하위에는 4종류의 속으로 분류된다; Alphacoronaviruses (Alpha-CoV), Betacoronavirus (Beta-CoV), Gammacoronavirus (Gamma-CoV), Deltacoronavirus (Delta-CoV). 코로나19를 유발하는 바이러스는 사스와 메르스를 주도한 바이러스와 함께 Betacoronavirus속에 속한다. 이 바이러스는 viral envelopes에 쌓여 있으며, 동물원성 감염증의 원인이 되는 single-stranded RNA를 지닌다.

Table 2 Taxonomy of Selected Coronaviruses (Gorbalenya, A. E., et al., 2020)
SARS-CoV-2에 감염되면 열, 마른 기침, 피로감 등의 여러 징후가 함께 나타나는 증후군을 보이며, 심각한 경우 객혈 및 폐렴 등이 나타난다. 전 세계적으로 이 바이러스에 확진된 케이스는 416,686건, 사망자는 18,589명으로 약 4.5%의 사망률을 보이며, 우리나라의 경우 확진자 9,241명, 사망자 131명으로 약 1.4%의 사망률을 보인다 (WHO experience.arcgis.com [링크] 및 보건복지부 [링크] 제공, 2020.03.26 기준).
“SARS-CoV-2”는 3만 개의 nucleotides에서 유래한 단백질로 숙주를 공격한다.
2020년 3월 26일을 기준으로 820건의 SARS-CoV-2 유전체 서열과 1,084건의 단백질 서열이 보고되었으며, 미국 국립생물공학정보센터 (NCBI, National Center for Biotechnology Information)를 통해 공유되고 있다(국가생명연구자원정보센터 [링크] 제공). SARS-CoV-2는 14개의 ORFs (Open Reading Frames)와 27개의 protein coding genes를 포함하는 약 29.8kb nucleotides로 이루어져있다[3]. SARS-CoV-2는 이러한 유전체 내에 네 종류의 구조 관련 단백질 정보를 내포하고 있는데 spike (S) protein, nucleoprotein (N), membrain (M) protein 그리고 envelop (E) protein이 그것이다. S protein은 자신의 receptor binding domain (RBD)을 숙주 세포의 angiotensin-converting enzyme 2 (ACE2)와 결합하여 바이러스를 세포 내로 진입시키는 중요한 역할을 한다[4]. N protein은 바이러스의 유전체인 RNA와 결합하여 nucleocapsid 형태를 형성하는 기능을 하며, M protein은 viral genome과 capsid의 복합체인 nucleocapsid를 membrane과 결합시킨다. E protein은 바이러스의 외벽을 구성하는 기본적인 구조 단백질이다[Figure 1].

Figure 1 3D medical animation still shot showing SARS-CoV-2 (AVIJEET RANJAN, scientificanimations.com) 이미지 [링크]
숙주 없이 살아남기 힘든 SARS-CoV-2, 어떤 숙주를 거쳤을까.
이러한 구조를 가진 SARS-CoV-2의 유전체 서열 데이터를 다른 종에서 추출한 코로나바이러스의 것과 비교하여 SARS-CoV-2의 중간 숙주를 찾고 있다. 사람에게서 분리한 코로나바이러스와 얼마나 염기서열 또는 아미노산 서열이 비슷한지 비교분석하여 약 98% 일치함을 알아냈다[1]. 하지만 박쥐로부터 바로 사람으로 감염되기는 어렵기 때문에 중간 숙주를 필요로 하는데, 지금까지 제시된 매개체는 뱀과 천산갑이다. 하지만 뱀은 포유류인 사향고양이(사스의 중간 숙주)나 낙타(메르스의 중간 숙주)와는 달리 파충류로 분류되므로 그 신빙성이 떨어졌다. 천산갑은 메타지놈 분석을 통하여 발견된 중간 숙주 후보이다. 중국 광둥에서 분리한 천산갑의 코로나바이러스는 사람에게서 분리한 SARS-CoV-2의 유전체와 약 97% 일치했으며, 중국 광시에 서식하는 천산갑에서의 코로나바이러스는 약 93% 일치했다[Table 3][5]. 하지만 사스의 중간 숙주로 꼽힌 사향고양이에서 분리한 코로나바이러스와 SARS-CoV의 유전적 유사성은 약 99% 이상이었던 점을 감안하여 천산갑이 박쥐와 사람 사이의 코로나바이러스 중간 숙주라고 단언하기에는 불충분했다.

Table 3 Genomic comparison of SARS-CoV-2 with Bat-Cov RaTG13, Guangdong pangolin CoV and Guangxi pangolin CoV (Lam, Tommy Tsan-Yuk, et al., 2020)
SARS-CoV-2의 탐지와 치료 등 다양한 목적의 연구가 필요하다.
우리나라에서는 코로나19의 확진자 증가 추세가 더뎌졌지만, 해외의 경우에는 확진자 수가 급격하게 증가하고있다. 현재 식약처의 신속 승인으로 보급된 코로나19 진단키트는 민감도와 정확도에서 한계가 있는 것이 사실이다. 실제로 음성이지만 양성으로 판별(위양성)되거나 양성이지만 음성으로 판별(위음성)되는 경우를 배제할 수 없으며, 이 오류는 확진자의 동선을 철저하게 살피고 공개하고 있는 정부의 방역 체계에 훼방을 놓을 수 있다.
백신과 치료제 개발에는 숙주의 면역체계에서 SARS-CoV-2를 탐지하는 항체를 찾는 것이 핵심이다. 중국 우한병원에서는 2020년 2월 9일부터 코로나19로부터 회복기에 있는 12명의 환자들의 혈액에서 B cell 을 분리하여 single-cell RNA library를 구축했다[6]. 이 연구에서 약 143,000개의 B cell에서 약 15,000 IgG antibody sequence를 확인했으며, 이 중에서 높은 농도를 보인 138개의 IgG 항체를 탐지했다. 해당 항체들은 이후 동물 실험과 타겟 치료를 위해 in vitro로 생산되고 있다. 그런데 2020년 2월 24일에 보고된 내용에 따르면, 서울대병원에서 분리된 SARS-CoV-2의 전장유전체를 분석한 결과 중국에서 분리된 SARS-CoV-2의 염기서열과 비교할 때 9곳에서 돌연변이가 확인되었다[7]. 5곳의 돌연변이는 ORF1ab에서, 2곳의 돌연변이는 ORF3a, 1곳의 돌연변이는 S gene 그리고 나머지 한 곳의 돌연변이는 E gene에서 발견되었다. 돌연변이에 의해 변형된 바이러스는 우리 몸의 면역체계에서 발현되는 항체 종류의 차이를 야기할 수 있다. 따라서 현재 중국에서 생산중인 138개의 IgG 항체 외에도 바이러스의 돌연변이로 유발되어 발현된 다른 항체들을 확인하기 위해 single-cell RNA sequencing과 같은 분석 연구가 필요한 실정이다.
References
[1] Lu, Roujian, et al. "Genomic characterisation and epidemiology of 2019 novel coronavirus: implications for virus origins and receptor binding." The Lancet 395.10224 (2020): 565-574. [2] Gorbalenya, A. E., et al. "The species Severe acute respiratory syndrome-related coronavirus: classifying 2019-nCoV and naming it SARS-CoV-2." Nature Microbiology (2020). [3] Wu, Aiping, et al. "Genome composition and divergence of the novel coronavirus (2019-nCoV) originating in China." Cell host & microbe (2020). [4] Hoffmann, Markus, et al. "SARS-CoV-2 cell entry depends on ACE2 and TMPRSS2 and is blocked by a clinically proven protease inhibitor." Cell (2020). [5] Lam, Tommy Tsan-Yuk, et al. "Identification of 2019-nCoV related coronaviruses in Malayan pangolins in southern China." BioRxiv (2020). [6] News report, "BIOPIC of Peking University collaborate with Youan Hospital and Sino Biological use 10x Genomics single cell technology to find a variety of fully human antibodies to COVID-19". [7] Park, Wan Beom, et al. "Virus isolation from the first patient with SARS-CoV-2 in Korea." Journal of Korean Medical Science 35.7 (2019).