2024.03.28 (목)

  • 구름많음동두천 20.9℃
  • 구름조금강릉 22.7℃
  • 흐림서울 21.7℃
  • 맑음대전 24.6℃
  • 맑음대구 25.7℃
  • 구름조금울산 23.8℃
  • 맑음광주 23.4℃
  • 구름조금부산 25.1℃
  • 맑음고창 23.7℃
  • 구름많음제주 23.0℃
  • 구름많음강화 21.1℃
  • 구름조금보은 22.0℃
  • 맑음금산 23.5℃
  • 구름조금강진군 24.4℃
  • 구름조금경주시 25.0℃
  • 구름조금거제 24.9℃
기상청 제공

기관/단체

한 명당 1천 달러 수준…보건의료 빅데이터 선결 과제는 '활용'

의료정보, 민감한 용도로 활용될 가능성 크다

보건의료 빅데이터의 가치는 타 산업 정보의 두 배를 상회하는 수준으로, 상업적 가치가 뛰어난 이 의료 데이터를 어떻게 안전하게 관리 · 활용할지를 모두가 머리를 맞대어 고민해야 한다. 보건복지부는 이 문제를 일방적으로 기획하는 방식이 아닌 각계 의견을 수렴하여 사회적 합의안을 도출하겠다고 강조했다.

18일 오후 2시 고려대학교 의과대학 문숙의학관에서 '의료 빅데이터의 활용과 정보보호' 주제로 열린 '의학과 법' 심포지엄에서 한국 IBM 조가원 실장이 '보건의료빅데이터 활용을 위한 개인정보 해결방안: 기술중심' 주제로 발제했다.



의료 분야에 대한 보안 위협이 증가하고 있다. 여러 산업 중 의료분야는 타 산업 대비 36%나 많은 보안이벤트가 발생하며, 보안사고는 64% 더 발생한다. 이는 개인정보 중 의료정보가 가장 고가로 매매되기 때문이다. 유출데이터 평균가는 158달러 수준이지만 의료정보는 355달러에 이르며, 고객손실비율은 평균 2.8%의 두 배 수준으로 높다.

조 실장은 "개인정보를 모두 암호화하고 통제하기는 쉽지 않다. 이 때문에 개인정보보호법에서는 주민등록번호, 운전자번호 등 고유 식별 정보에 한정해 암호화하고, 접속 기록을 보관하며, 접근 통제할 것을 규정하고 있다."고 말했다.

미국이 제정한 HIPAA(Health Insurance Portability and Accountability Act, 건강보험 이전과 책임에 관한 법)에서는 개인정보보호 요건으로 △데이터 암호화 △책임추적성을 위한 사용자 모니터링 △데이터 무결성 △멀웨어 방지 △시설 보호 △보안 정책 문서화 △사고대응 관리 문서화 △주기적인 HIPAA 통제 평가 △데이터의 안전한 폐기 △모든 데이터 사용자에 대한 교육을 언급하고 있다.

조 실장은 "국내뿐만 아니라 해외에서도 마찬가지로 늘 중요한 것은 교육이다. 기술이 안 된 상황에서 사용자들이 교육만 받아도 보안 위험성이 상당 부분 낮아진다."고 강조했다.

행정자치부 등은 2016년 7월 빅데이터 사용 시 적용되는 '개인정보 비식별 조치 가이드라인'을 발간했다. 가이드라인에서는 사전검토 단계에서 개인정보 해당 여부를 검토하고, 비식별 조치 단계에서는 가명처리, 총계처리, 데이터 삭제, 범주화, 데이터 마스킹 등 다양한 비식별 기술을 활용하며, 사후관리 단계에서는 비식별 정보의 안전한 활용 · 오남용 예방을 위해 필수적 보호조치 사항을 명시했다.

비식별화 방법은 △그 자체로 개인 식별이 가능한 정보 삭제 △다른 정보와의 결합에 따른 재식별 위험 최소화 △정보가 식별될 수 있는 리스크를 고려한 철저한 사후관리 등이 있다.

빅데이터에서 얘기하는 개인정보는 크게 식별자와 속성자로 나뉜다. 식별자는 주민등록번호나 휴대전화번호 등 개인 또는 개인과 관련한 사물에 고유하게 부여된 값이나 이름을 뜻하며, 속성자는 성별이나 혈액형 등 다른 정보와 결합해 특정 개인을 알아볼 수 있는 정보이다.

비식별화는 △가명 처리 △총계 처리 △데이터 삭제 △데이터 범주화 △데이터 마스킹 등이 있다. 

가명처리와 관련해 조 실장은 "어떤 질병의 치료법을 연구하고자 빅데이터를 활용할 때 이름이나 주민등록번호가 꼭 필요하지 않다. 향후 해당 케이스에 대한 연구를 시행해 다시 상세 정보를 보고자 할 때는 필요한 정보를 찾아내는 ID가 필요하지만, 빅데이터 활용에서는 끝까지 추합해 데이터를 식별하지 못하게끔 하라고 돼 있어 데이터를 삭제하거나 가명 처리한다."라고 설명했다.

조 실장은 "데이터 삭제 시 일부 데이터를 삭제했는데도 해당 데이터를 다시 식별화할 방법이 있다. 최근 제약 관련 회사에서 개인정보 데이터의 일부를 제공해 소송당한 사례가 있다. 그 회사는 1~3차에 걸쳐 개인정보를 유출했는데, 1 · 2 · 3차의 비식별 방법을 다르게 했다. 이 때문에 1차는 개인정보보호법 위배, 2 · 3차는 안전하다고 판결이 났다."면서, "어떻게 해석하냐에 따라서 같은 암호화여도 재식별이 가능해진다. 여기에는 기술적 요건이 맞물려 있다."라고 언급했다. 

비식별 정보를 이용하거나 제3자에게 제공하려는 사업자 등은 해당 정보의 재식별 가능성을 정기적으로 모니터링해야 한다. 비식별화한 데이터여도 최소한의 권한을 부여하며, 접근통제 및 지속적 모니터링이 이뤄져야 한다.

개인정보 관리는 △개인정보가 어디에 있는지 △데이터 소유자가 누구인지 △개인 정보 저장소에 취약점은 없는지 △개인 정보 저장소는 암호화돼 있는지 △개인정보에 대한 접근 권한이 누구에게 있는지 △누가 개인정보에 접근하고 있는지 △비인가자 접속을 어떻게 통제할 것인지 △위험으로부터 개인정보를 어떻게 보호할 것인지 등을 살펴야 하며, 이 같은 요소를 늘 모니터링하는 사람은 의사이다. 

이와 마찬가지로 빅데이터의 경우도 데이터 수집 · 저장 · 분석 · 가시화 · 폐기되는 과정에서 보호해야 할 요소가 산재해 있다.

조 실장은 "클라우드 데이터에 대한 암호화를 통해 신뢰도 · 가용성을 확보해야 한다. 또, 지속적으로 발생하는 랜섬웨어에 대비해 안전한 백업 정책을 마련하는 일을 고민해야 한다."면서, "보안은 한 곳이 뚫리면 전부 뚫리게 된다. 통합적 · 지능적 보안 체계가 필요하다."라고 강조했다.

의료분야 보안을 위한 5가지 수칙으로 조 실장은 △데이터 보안 및 개인정보보호 체계 구축 △클라우드 보호 △상호운영성을 위한 접근 관리 △신기술 도입에 따른 보안기술 적용 △보안 관제 및 사고대응 체계 개선을 언급했다.

조 실장은 "고도화된 보안 정책으로 접근 이력을 모니터링할 수 있는 강력한 보호 통제 방안과 더불어 클라우드 도입 시 안전성 · 신뢰성 확보를 위한 보안 역량을 고민해야 한다."면서, "새로운 취약점을 발생시키는 모바일 앱, 웨어러블 기기, IoT 등을 어떻게 관리할지 등을 검토하면 더욱 안전한 의료환경 하에서 빅데이터를 활용할 수 있다."라고 했다.

발제 후 지정토론이 이어졌다. 토론자로 참석한 보건복지부 오상윤 의료정보정책과장은 "인터넷상에서 기계적으로 클릭만 하다 보니 내가 제공하는 개인정보 내용이 뭔지 모르겠고, 해당 사이트가 개인정보를 전부 필요로 했는 지도 모르겠다. 홈페이지 가입 등에서 활용하는 일반적인 개인정보와 오늘 논의하는 의료정보는 약간의 차이가 있다. 개인정보보호법에서 의료정보는 민감정보로 분류돼 있고, 의료보험 등 여러 측면에서 대단히 민감한 용도로 활용될 가능성이 크다."라고 말했다.

지난해 5월 워너크라이(WannaCry)라고 불리는 대규모 랜섬웨어 공격이 자행돼 전 세계 PC가 심각한 몸살을 앓았다. 이 과정에서 수많은 개인 개정, 비밀문서 등이 유출됐으며, 의료정보가 한 건당 1천 달러 수준으로 거래됐다는 사실도 밝혀졌다. 

오 과장은 "어두운 시장에서는 의료정보를 상업적 가치가 있는 정보로 취급하고 있다."면서, "지지난 주 참석한 국제회의에서는 가명화가 무엇인지, 그에 대한 처리 방법은 무엇인지, 가명 정보를 어디까지 활용할 수 있는지, 데이터 활용 시 우려되는 리스트 · 베네핏이 무엇인지 등을 논의했다. 현재는 국제적으로 확립된 기준 · 원칙이 없는 상황이다."라고 언급했다.

어떤 나라는 가명 정보여도 개인정보와 동일한 선상에서 보호하며 상업 목적으로 활용 시 제한하지만, 어떤 나라는 좀 더 자유롭게 활용한다. 오 과장은 "우리나라는 아직 여기에 대한 정리가 돼 있지 않다. 이 부분에 대해 향후 사회적 토론이 필요하다. 다른 나라 사례를 참조할 수 있지만, 결국 우리나라 정보는 우리가 결정해야 한다."라고 말했다.

복지부에서는 보건의료 빅데이터 전반에 걸친 법 · 제도의 단계적 정비를 검토하고 있다. 오 과장은 "정부가 일방적으로 기획하거나 정부가 정리한 내용으로 국민을 설득하는 방식이 아니다. 이해관계자, 시민사회, 전문가 의견을 수렴해 정리하는 것이 맞다. 현재는 관련 정책심의위원회를 구성해 토론 중이지만 내용 · 이슈를 공유하고 문제의식을 진단하는 것만으로도 시간이 꽤 걸릴 것 같다."고 했다.

정부가 추진하는 △보건의료 빅데이터 시범사업 △분산형 바이오헬스 빅데이터 사업 △마이데이터 사업 △헬스케어 빅데이터 쇼케이스 △진료정보교류사업 등은 어느 한 가지 조건을 제약하여 데이터를 활용하려는 사업이다. 

빅데이터 사업은 비식별처리를 통해 공익적 목적으로 활용한다. 즉, 목적을 통제하고 방법을 가명화 등으로 제한한다. 분산형 바이오헬스 빅데이터 사업은 완전히 익명화된 자료이기 때문에 개인정보가 아니라고 간주하여 산업적 목적으로 다양하게 활용할 수 있다. 마이데이터 사업은 비식별정보여도 개인이 사용권한을 가진다. 빅데이터 쇼케이스 사업도 마찬가지로, 3백여 명의 동의자로부터 정보를 기부받아 활용하는 방식이다.

오 과장은 "개인정보 보호 측면도 대단히 중요하다. 이 부분을 절대로 간과해서는 안 된다. 개별 의료기관에서 수집된 진료정보를 바로 빅데이터화해서 분석하는 것은 개인정보보호법 위반이기 때문에 불가능하다. 다만 기술적으로 표준화된 것을 바탕으로 활용한다면 얘기가 달라진다."면서, "동의 · 보호 · 활용 전부 대단히 중요하기 때문에 이에 대한 진지한 사회적 논의가 필요하다. 디테일하고 실용적인 접근, 개인정보보호법 · 제도, 의료정보 등에 관해 건설적인 토론을 통해서 사회적 합의를 해나가는 것이 필요하다. 정부는 그러한 대화의 장을 마련하고, 국민이 이런 이슈에 관심을 가질 수 있도록 노력해나갈 계획이다."라고 덧붙였다.

한편, 토론에는 △보건복지부 오상윤 의료정보정책과장 △고대의대 의학통계학교실 이준영 교수 △서울대의대 핵의학과 강건욱 교수 △울산대의대 심장내과 김영학 교수가 참석했다.