국립보건연구원이 21만명의 보건의료 연구데이터를 공개한다.
질병관리청 국립보건연구원은 21만명 보건의료 연구데이터의 클라우드 활용 플랫폼(OPEN KoGES)을 구축하고, 10월 29일부터 다양한 연구자들의 데이터 활용 과제 공모를 시작한다고 밝혔다.
‘OPEN KoGES’는 한국인역학조사사업(Korea Genome and Epidemiology Study: KoGES)에서 생산한 21만명의 코호트자료를 통합검색부터 분석 인프라까지 지원하는 클라우드 서비스 플랫폼이다.
이번에 공개하는 공유 플랫폼은 제한적인 데이터의 규모와 활용 측면에서 벗어나, 연구자들에게 데이터의 접근성과 안정적인 분석환경을 제공해 임상·역학데이터와 유전체 데이터를 통합해 분석할 수 있도록 개선했다.
이를 통해 국립보건연구원이 보유 중인 보건의료 연구데이터 중 가장 활용도가 높은 한국인유전체역학조사사업(KoGES)의 데이터를 연구자가 명령이나 텍스트를 입력하는 것이 아니라, 사용자가 아이콘, 메뉴, 버튼, 창 등의 그래픽요소를 사용해 컴퓨터 등 디지털기기와 편리하게 상호작용할 수 있는 시각적 환경을 제공하며, 표준화된 임상·역학 데이터(21만 명)와 함께 기존 7만여 명에서 2배 이상 확대된 16만명의 유전체 데이터를 공개한다.
그간은 각각의 임상·역학 데이터와 유전체 데이터를 별도로 분석해 활용했으나, 개선된 데이터 활용 플랫폼에서는 임상·역학데이터와 결합된 유전체 데이터를 같이 제공함으로써 시간 흐름에 따른 질병 발생과 유전적 요인의 비교 연구도 가능해질 것으로 보인다.
또한, 보다 빠르고 편리한 데이터 제공을 위해 데이터 제공 절차를 간소화하고, 국립보건연구원에 직접 방문 없이 연구실 등에서 원격으로 접속해 데이터의 검색부터 고급 분석까지 한 번에 가능해진다.
아울러 시스템의 설계단계부터 클라우드 기술을 적용해 클라우드의 장점을 최대한 활용할 수 있는 방식인 ‘클라우드 네이티브 방식’을 도입해 데이터의 신속성, 안정성, 확장성 등을 강화해, 연구자가 데이터를 편리하고 안전하게 접근할 수 있게 된다.
클라우드 서비스는 연구자들이 과제 공모를 통해 활용할 수 있도록 보건의료연구자원정보센터 누리집(coda.nih.go.kr)에서 10월 29일부터 11월 11일까지 신청을 받을 예정이다.
끝으로 국립보건연구원은 추후 연구자 대상으로 클라우드 활용을 통한 분석(초·중급, 고급과정) 교육을 지원하고, 성과를 교류할 수 있는 기회의 장을 마련해 누구나 쉽게 데이터 활용이 가능하도록 할 예정이다.