시장조사기관 Frost & Sullivan에 따르면, 2016년부터 2021년까지 세계 블록체인 시장규모는 61.5%의 연평균성장률을 보이며, 약 2억 달러의 시장규모로 성장할 것으로 전망됐다. 이에 대해 안지영 한국바이오경제연구센터 연구원은 <Bio Economy Report>에서 “블록체인 기술은 공공분야로 빠르게 확산되고 있다. 2015년 에스토니아는 국가에서 블록체인 기술을 최초로 도입했다. 에스토니아 국민들은 정부가 관리하는 데이터베이스에 기록돼 있는 정보에 접근할 수 있고, 그 정보를 관리한다”며 블록인 기술이 단순히 기업뿐만 아니라 국가 차원에서 활용되고 있음을 언급했다./그렇다면 보건산업 분야에서 블록체인 기술은 어떻게 활용되고 있을까? 최근 보건의료데이터를 블록체인 기술을 활용해 통합하자는 논의가 있는데, 과연 현실성 있는 내용일까?/메디포뉴스는 이에 대한 물음을 답하고자 ▲블록체인의 개념 ▲보건산업에서의 블록체인 활용 사례 ▲현 단계에서 블록체인 기술의 한계점을 전한다. 이 같은 내용은 생명공학정책연구센터에서 발간한 <BioIN> vol.49에 수록된 ‘블록체인 기술과 의료 분야에서의 활용’(김주한 서울대 의대 의료정보학 교수), ‘보건의료 데이터 비식별화: 문제점과 대안’(신수용 삼성융합의과학원 디지텔헬스학과 조교수), 한국바이오경제연구센터에서 발간한 <Bio Economy Report> ‘블록체인 기술과 바이오헬스 산업’(안지영 한국바이오경제연구센터 연구원)을 토대로 했다.[편집자주]
◆블록체인의 핵심은 RSA 알고리즘과 해쉬 함수
블록체인 기술은 거대한 분산 공개 장부 운영 기술이다. 즉, 모든 거래 정보는 네트워크 내 모든 노드에 공개하고, 누구나 거래 정보를 생성할 수 있고, 거래 정보를 모든 노드에 복사해서 사본을 저장해 각 사본끼리 동기화시킨다. 노드의 개념을 이해하기 위해서 로컬 네트워크 A에 컴퓨터 20대와 허브 2개, 공유기 2개, 라우터가 있다고 가정해 보자. 이들 네트워크 A에 속한 장비들을 통틀어 하나의 노드라고 한다. 우리가 흔히 알고 있는 블록체인은 퍼블릭 블록체인으로, 이 블록체인은 네트워크 참여가 모두 개방돼 있는 것이 특징이다. 때문에 누구든 참여할 수 있어 수만 대의 노드에 사본 기록이 다중화 돼 기록이 사라지는 일을 원천적으로 방지할 수 있으나, 공개는 피할 수 없다. 물론 이때 말하는 공개는 정보가 공개되는 것은 아니다.
블록체인 기술을 이해하기 위해선 ▲비대칭 암호화 알고리즘(RSA 알고리즘) ▲해쉬 함수를 이해해야 한다.
비대칭 암호화 알고리즘의 핵심은 공개키와 개인키의 조합이다. RSA 알고리즘 기술을 적용하면, 공개키와 개인키는 비대칭 쌍을 이룬다. 즉, 개인키로 암호화(encoding) 것은 공개키로 복호화(decoding) 가능하며, 공개키로 암호화(encoding)한 것은 개인키로만 복호화(decoding)할 수 있다. 블록체인 기술이 적용되기 이전에는 암호화와 복호화에 모두 동일한 키를 사용해 수신자와 공유해야 했지만, 블록체인 기술이 적용되면서 수신자와 동일한 키를 보유할 필요가 없게 됐다. 예를 들어 A라는 사람과 B라는 사람이 블록체인 기술(RSA 알고리즘 기술)을 활용해 문서를 공유한다고 가정해 보자. A와 B는 각각의 공개키와 개인키를 가지고 있다. A와 B는 공유하고자 하는 문서에 대한 공개키를 가지고 있고, 각각 자신의 정보를 담은 문서에 대한 개인키를 가지고 있다. A는 자신의 문서에 대해 개인키로 암호화 한 뒤 B에게 문서를 보낼 수 있고, B는 공개키를 통해 복호화할 수 있다.
해쉬 함수는 분산 공개 장부의 진위 여부를 판별해 주는 기술이다. 원본과 해쉬값을 묶어서 보내면 원본이 원본이라는 ‘진본성’을 확인해 주는 것이다. 블록체인 기술은 앞서 말한 RSA 알고리즘과 해쉬 함수 기술이 결합할 때 완성한다. 해쉬 함수를 통해 진본성이 확보되는 것이고, RSA 알고리즘을 통해 공개 장부의 송신자가 보장되는 것이다. 즉, 해쉬값을 송신자(문서 작성자)의 개인키로 암호화해서 보내면, 수신자는 송신자의 공개키로 해쉬값을 복호화한다. 이후, 수신한 원본을 해쉬함수에 넣어서 획득한 해쉬값과 앞서 공개키로 복호화한 해쉬값이 같은지 확인되면, 문서의 송신자(작성자)와 진본성을 완벽하게 보장할 수 있게 된다.
◆제약산업, 바이오헬스 산업, 의료산업까지 활용 분야 무궁무진
안지영 연구원은 블록체인 기술이 활용될 수 있는 분야로 ▲바이오산업 ▲제약산업 ▲의료산업을 꼽았다.
바이오헬스 산업에서는 유전체 데이터 관리에 블록체인이 이용될 수 있다. 이에 대해 안 연구원은 “블록체인 기술은 인간의 DNA를 효과적으로 관리해 민감한 DNA 정보를 중간 거래 기관 없이 병원이나 연구수로 전달할 수 있게 한다. 개인의 프라이버시에 민감한 데이터의 보안성을 유지하면서 판매자에게 데이터를 전달할 수 있는 있는 것이 이 분야에서 블록체인 기술의 강점이다”고 언급했다. 현재 유전체 데이터 관련 블록체인 사용되는 대표적인 기업은 ▲Encrypgen ▲Nebula가 있다. Encrypgen은 프라이빗 블록체인을 기반으로 이용자들이 같은 DNA 테스트용 소프트웨어를 통해 수집된 자신의 DNA 프로파일을 등록한다. 이를 통해 의사, 연구원, 제약회사 등 잠재적 구매자들과 연결해 주는 블록체인 기반의 플랫폼을 제공한다. Nebula는 블록체인 기술을 활용해 23andMe와 같은 유전체 회사 없이도 유전체 소유자와 구매자간의 직접 거래를 가능하게 하는 비즈니스 모델을 가지고 있다.
제약산업에서는 블록체인 기술을 활용해 신약개발의 정확성을 더 높여줄 수 있을 것으로 전망된다. 이에 대해 안 연구원은 “시장조사 기관 Frost &Sullivan에 따르면, 유전체 데이터를 고려하지 않은 채 신약개발이 이뤄져 매년 3,000억 달러가 낭비됐다. 때문에 제약산업에서는 블록체인 기술을 도입해 환자 중심의 제약 발전 모델을 개발해 이러한 오류를 극복하고 미래 지향적으로 정확한 제약 방법을 개발 중이다”고 언급했다. 블록체인을 활용해 신약개발을 하는 글로벌 제약사로는 ▲화이자(Pfizer) ▲바이어(Bayer)가 있다. 화이자는 블록체인 기술을 활용해 대용량 데이터를 보관하고 임상정보를 관리하고 있고, 바이어는 현재 블록체인 방법론을 고안 중이다.
의료사업에서는 더욱 다각적인 활용이 이뤄지고 있으나 개인정보 보호법 등의 규제와 충돌하고 있는 양상이다. 이에 대해 안 연구원은 “의료 정보의 생태계에 블록체인을 활용함으로써 보험업자, 의료기관, 환자를 연결할 수 있다. 의료산업은 데이터의 보안과 개인 사생활 침해를 제한하고자 엄격한 규제와 정책을 가지고 있으나 이를 해결할 수 있는 것 또한 블록체인 이다”고 언급했다. 의료사업에서 블록체인 기술을 주목해 볼만한 곳은 ▲IBM의 Watson Health ▲구글의 Deepmind health ▲메디블록이 있다.
IBM의 Watson Health 사업부는 지난해 1월 미국 FDA와 함께 블록체인 기술을 이용해 의료 연구 및 기타 목적으로 환자 데이터를 안전하게 공유하기 위해 2년간의 공동 개발 계약을 체결했다. IBM과 FDA는 ▲전자의료기록, ▲임상 실험, ▲유전체 데이터 ▲모바일 기기, 웨어러블 기기, IoT와 같이 여러 출처로부터 얻은 데이터를 통해서 새롭고 보다 정확한 의료 데이터 구현을 모색 중이다. 이러한 데이터를 한데 모아 거래할 수 있는 블록체인 기술을 적용해 모든 거래에 대해 감사 추적을 유지함으로서 데이터 교환 프로세스에 대한 투명성 확립을 목적으로 한다.
구글 딥마인드 헬스는 영국 국가보건서비스(NHS) 등과 협력해 환자가 실시간으로 개인 데이터에 어떤 일이 일어나는지 추적하는 기술을 개발한다. 또한 영구 주요 대학병원과 NHS와 연계해 환자 정보를 실시간으로 추적하는 서비스도 도입하는데, 이때 각종 의료 정보 데이터를 암호화한 다음 이를 자동으로 블록체인에 기록하는 방식을 취한다.
메디블록은 1월 경희대학교치과병원과 MOU를 맺고 치과종합검진센터에 블록체인 기술 기반 개인의료정보 플랫폼을 도입할 예정이라고 밝혔다.
◆보건의료 데이터 블록체인 도입에 앞서 비식별화 문제부터 해결해야
질병 진단, 예후 예측, 신약 개발 등에 보건의료 데이터를 활용하기 위해선 비식별화 과정이 필요하다는 주장이 제기됐다. 비식별화란 개인을 알아볼 수 있는 개인식별정보를 제거하는 것이다. 이에 대해 신수용 삼성융합의과학원 디지털헬스학과 조교수는 “보건의료 빅데이터 활용에서는 비식별화된 데이터를 사용하는 것이 일반적인 방법이다. 하지만 우리나라에서는 현재 비식별화에 대한 법ㆍ제도적 근거가 미흡해 많은 논란이 있다”고 지적했다.
신 교수는 비식별화에 대한 우리나라 법ㆍ제도의 문제점으로 ▲’개인정보’라는 용어의 모호성 ▲비식별 조치 가이드라인의 비정형데이터 누락 ▲k-익명성 준수의 현실적 어려움 ▲재식별화 상황 배제 ▲새로운 개인식별 정보 부재를 꼽았다.
개인정보는 개인식별정보와 명확히 나누기가 힘들다. 때문에 개인식별정보를 제거해야 하는 비식별화 과정이 쉽지 않을 수 있다. 예를 들어 몸무게, 키는 개인정보이나 개인을 식별할 수 없기 때문에 개인식별정보는 아니다. 이처럼 개인정보와 개인식별정보를 명확하기 힘든 경우 비식별화 과정에 어려움이 따를 수 있다.
현재 마련된 비식별 조치 가이드라인에 대한 문제점도 지적됐다. 이에 대해 신 교수는 “보건의료 데이터는 대부분의 데이터들이 비정형데이터(텍스트, 이미지, 영상 등)인 상황에서 이에 대한 보완이 반드시 필요하다”고 언급했다.
k-익명성은 공개된 정보를 연결해 민감한 정보를 알아내는 방법을 막기 위한 프라이버시 보호 모델이다. 현행 가이드라인에서는 k-익명성 준수를 필수요소로 제시하고 있지만, 현실적으로 이를 준수하기 힘들다는 것이 신 교수의 견해다. 이에 대해 신 교수는 “환자들이 병원이 방문하게 되면 새로운 검사 등으로 항목이 계속 추가된다. k-익명성을 준수하기 위해선 각 항목을 군집화 해야 하는데, 데이터의 활용도가 사라진다. 가이드라인에서는 단순한 진단명, 연령, 성별 등에 대해서 k-익명성이 적용된 사례를 보여주고 있는데, 실제 연구를 위해선 각 검사들이 결과값이 필요하다. 군집화된 데이터는 연구에 활용할 수 없다”고 언급했다.
가이드라인에서는 재식별화에 대한 상황도 배제됐다. 이에 대해 신 교수는 “비식별 환자 데이터 중에서 특정 임상 시험에 필요한 환자를 발견해 임상 시험에 참여시키고자 하는 경우이거나, 후속 연구를 위해 추가적인 환자의 개인 정보 획득이 필요한 경우가 있다. 이 경우 연구자가 임의로 재식별화하는 것이 아니라 공식적인 재식별 절차를 명시하는 것이 필요하다”고 지적했다.
마지막으로 새로운 개인식별정보 부재가 지적됐다. 이에 대한 신 교수는 “유전체 데이터는 활용되는 상황(context)에 따라 개인 식별성을 가질 수 도 있고, 없을 수도 있다. 해당 환자의 진료 정보와 결합해 사용될 경우 식별성이 크지만 유전체 서열만으로는 식별성이 전혀 없다. 이에 대한 정부 차원의 명확한 기준이 필요하다”고 주장했다.
우리나라 기업은 그 동안 fast-follower 역할을 해왔다. 이 과정에서 정부가 기업을 지원해 주는 국가주도형 경제 정책을 펼쳤다. 하지만 이제 우리나라 기업도 fast-follower가 아닌 game changer가 돼야 한다는 의견이 주를 이룬다. 이를 위해선 우리나라 기업 역시 누군가를 모방만 하는 것이 아니라, 새로운 분야에서 판도를 뒤흔들만한 기술과 역량이 요구되고 있다. 아직 세계적으로 발전 국면에 있는 블록체인 분야에서 우리나라 기업 역시 게임 체인저가 될 수 있다. 이 과정에서 정부 역시 과거처럼 기업을 지원해 준다는 프레임에서 벗어나 합리적인 규제를 통해 기업 생태계를 조성해야 할 것이다.