“현재 축적된 유전체 데이터를 빅데이터로 보긴 어렵다. 나아가 향후 우리가 원하는 정보는 단순한 유전체 정보가 아닌, 한 개인의 ▲임상 데이터 ▲유전체 데이터 ▲라이프로그 등이 한 데 어우러진 형태의 빅데이터다. 이런 빅데이터를 통해 정밀의학(precision medicine)을 실현해 나갈 수 있다”
성주헌 서울대학교 보건대학원 유전체역학 교수는 25일 국립암센터에서 열린 2018년도 의생명 2차 과학포럼-우리가 만들어갈 Health Big Data의 미래’에서 이같이 말했다.
성 교수의 발표 내용을 토대로, 현재 유전체 데이터의 상황을 살펴보고, 향후 유전체 데이터가 의료 분야에서 어떻게 적용되고 발전해 나가야 할지 짚어본다.
◆유전체 데이터 결국 EHRㆍ코흐트 데이터와 결합해야
성 교수는 “보건ㆍ의료 영역에서 유전체 데이터 자체가 의미가 있는 것이 아니라, 임상 영역에서 치료의 효율성을 높이기 위한 자료로서 가치를 지닐 때 의미가 있다”고 강조했다. 치료의 효율성을 높이기 위해 유전체 데이터는 ▲EHR(Electronic Health Record; 전자 건강 기록) ▲코호트 데이터와 결합돼야 한다고 설명했다.
이와 관련해 성 교수는 “EHR 자체도 굉장히 방대한 양의 데이터이지만, 여기에 지놈(Gemome) 데이터까지 붙인 EHGR 데이터는 세계적으로도 새로운 패러다임이다. 이러한 데이터가 구축된다면, ▲진단 ▲치료 ▲신약개발에 있어 엄청난 가치를 지닌 데이터가 될 것이다”고 설명했다. 이어 “코호트 데이터 역시 유전체 정보와 결합하면 맞춤 검진의 주요 데이터로 활용될 수 있다”고 덧붙였다.
현재 유전체 데이터의 주요 이슈는 ‘유전자 변이에 대한 해석(interpretation)’으로 제기됐다.
이와 관련해 성 교수는 “현재 유전체 변이를 찾는 연구가 많이 진행되고 있다. 나아가 변이의 위치(locui) 대략적으로 파악하고, 파악된 위치를 토대로 시퀀싱(sequencing; 유전자 염기서열 분석) 과정을 통해 변이를 정확히 파악하는 단계까지 현재 이뤄지고 있다”고 현재 유전체 연구 양상을설명했다. 이어 “이러한 과정에서 더 나아가 유전자 변이를 확인한 후, 이 변이를 ‘해석(interpretation)’하는 것이 중요하다. 유전자 변이의 해석이 가능하다면, 그 다음 단계인 번역(translation; 생체 내에서 DNA로부터 복제된 mRNA의 염기서열을 단백질의 아미노산 배열로 고쳐 쓰는 작업) 과정으로 나아갈 수 있다”고 강조했다.
◆유전체 데이터 해석은 질환관 반드시 연계돼야
유전체 데이터 해석을 위해선 ▲population data ▲질환 별 데이터베이스(DB)를 축적해야 한다고 제시됐다.
Population data는 현재 세계적으로 12만명이 넘는 사람의 유전체 변이의 빈도(frequency)를 나타낸 정보다. A단계로 표시되면 의학적 결정(decision)을 내리는 데 결정적 증거로 작용할 수 있으며, 유전체 정보의 가장 기본적인 정보라 할 수 있다. 이와 관련해 성 교수는 “상당히 많은 유전체 시퀀싱 데이터(sequencing data)가 군집화(population)돼 있다. 이런 데이터 베이스를 계속 다운받을 수 없으므로 주기적으로 다운받아 시스템을 구축하는 작업이 필요해 보인다”고 말했다.
우리나라는 특히 질환 별 데이터베이스 구축이 시급하다는 지적이 나왔다. 이와 관련해 성 교수는 “우리나라 유전체 연구를 10년 넘게 해 오면서 가장 부족한 부분이 이 질환 관련 유전체 연구라고 생각한다. 이런 것들 것 엄청난 투자가 있었음에도 제대로 이뤄지지 못 했던 부분에 대해서 짚어봐야 한다. 질환별로 주요 질환에 대한 국제 컨소시움이 약 10만명 단위로 구축돼 있다. 우리나라가 여기에 제대로 규모로 명함을 내밀만한 연구가 없다. 하지만 지금이라도 이런 접근 방식을 시도해 보는 것이 필요하다”고 평가했다.
◆유전체 기반 번역(translation) 연구 핵심은 번역 과정에 molecule
유전체 해석이 끝난 뒤에는 어떻게 이것을 translation 단계에 활용하는 것에서 핵심요소는 번역에 관여하는 molecule(분자, 입자)인 것으로 제시됐다.
이와 관련해 성 교수는 “Translation에서의 핵심은 단백질(protein)이나 유전자 발현(gene expression)보다 molecule에 해당하는 부분이다. 이 molecule에 대한 데이터는 전 세계적으로 아직 데이터의 양이나 질이 가장 떨어지는 분야다. 최근 Watson drug for discovery가 굉장히 많이 팔리고 있는데, 그 이유는 왓슨이 가장 강점을 보이는 부분이 molecule에 관한 부분이기 때문이다. Target과 관련된 데이터가 Watson drug for discovery에 많이 축적돼 있다”고 설명했다.
끝으로 성 교수는 “기존에는 약물을 만드는 방식이 질환(disease)을 기반으로 약물을 만들었다. 최근에 유전체에서 질환을 예측(prediction)해서 약물 개발로 연결시키는 추세를 보이고 있다”고 말했다.