라이프로그(life log)는 개인의 일상(life)에 대한 기록(log)를 뜻하며, 요즘은 흔히 페이스북, 인스타그램 등에 기록 등이 라이프로그 데이터로 축적돼 있다. 헬스케어 분야에서는 최근 정밀의학(precision medicine)이 대두되면서 임상 데이터, 유전체 데이터와 접목된 라이프로그 데이터의 활용도가 주목 받고 있다. 라이프로그는 기록과 수집 방식에 따라 ▲수동적으로 수집되는 기록 ▲능동으로 수집되는 기록으로 분류될 수 있다. 예를 들어, 웨어러블 기기를 통해 사용자가 버튼만 누르면 자동적으로 축적되는 데이터는 수동적으로 수집되는 데이터고, 자신이 먹은 식사를 앱을 통해 직접 기록하고 등 사용자의 일정 부분의 행위가 요구되는 기록은 능동적으로 수집되는 데이터다./메디포뉴스는 25일 국립암센터에서 열린 2018년도 의생명 2차 과학포럼-우리가 만들어갈 Health Big Data의 미래’에서 김영인 눔 전략이사가 발표한 내용(Digital health care 빅데이터: 의료분야 연계와 전망)을 토대로 ▲라이프로그의 종류 ▲라이프로그 수집과 해석의 어려움을 전한다.[편집자주]
◆라이프로그, 환자 중심 데이터에서 확장돼 모든 건강 관련 기록 의미
초기에 헬스케어 분야에서 라이프로그 데이터로 인식됐던 것은 ‘Patient Generated Health Data(PGHD; 라이프로그와 유사한 개념이지만 환자로 데이터 제공 주체를 제한)’ 였다가 점차 환자가 아닌 일반으로 데이터 주체를 확장해 나가는 개념으로 변했다.
이러한 라이프로그는 ▲활동량 정보 ▲영양 데이터 ▲자가 측정 임상 데이터 ▲커뮤니케이션 데이터가 있다.
활동량 정보는 라이프로그 중 가장 먼저 모이기 시작한 분야로, 착용하고 있으면 수동적으로 데이터가 모인다는 관점에서 다량의 데이터를 수집할 수 있게 됐다. 최근 사용성 이슈로 시장의 급속한 하락을 보이고 있다.
영양 데이터는 활동량 데이터 다음으로 대두되고 있는 분야로, 스마트폰을 활용한 손쉬운 식사 기록이 가능하며, 식생활 변화를 통한 체중 감량 및 만성질환 예방에 활용할 수 있다. 데이터의 밀도가 높은 편이지만 사용성에 따라 데이터의 수집량 및 통계적 분석에 대한 편차가 큰 편이다. 이와 관련해 김 이사는 “활동량 데이터에 비해 영양 데이터는 비교적 능동적인 데이터로 수집될 수 있다. 음식에 대한 구체적인 기록이 남아 단순히 개인 뿐만 아니라 연구에도 활용될 수 있는 데이터다”고 설명했다.
자가 측정 임상 데이터는 자가 측정용 의료기기를 활용해 측정된 임상 데이터를 의미한다. 임상 현장에서 측정하던 데이터를 일상 환경에서 연속적으로 측정 가능하다. 또한 임상 환경에서 인지하지 못하는 현상 및 변이(fluctuation)를 관찰 할 수 있다. 현재 기기의 숙련도에 따른 정확성에 대한 논란이 있다. 이와 관련해 김 이사는 “자가혈당측정기는 이미 출시된 지 꽤 시일이 지났고, 대신 이런 부분을 조금 더 자동화해서 모으거나 서비스 플랫폼에 붙여 단순히 자신이 측정하는 것에서 넘어서 전문가의 도움을 받거나 해석하는 것까지 추가되면서 자가 측정 임상 데이터의 양이 점점 증가하고 있다”고 말했다.
커뮤니케이션 데이터는 ▲헬스케어 서비스와 사용자의 대화 로그와 ▲사용자 간의 그룹 활동 데이터를 의미한다. 헬스케어 서비스와 사용자의 대화 로그는 메시지 기반의 커뮤니케이션 데이터로, 의료인뿐만 아니라 준의료인까지 포함하는 포괄적인 제공주체와 향후 인공지능 엔진학습의 주요 데이터가 될 것으로 전망된다. 사용자 간의 그룹 활동 데이터는 동일한 질환으로 진단받은 환자군의 그룹 소통 데이터로, 페이스북, 인스타그램 등의 SNS 채널에서 수집되는 데이터까지도 확장 가능하다.
커뮤니케이션 데이터와 관련해 김 이사는 “최근 의료진과 환자 간의 소통이 의료 현장에서 중요짐에 따라 커뮤니케이션 데이터의 중요성이 점점 높아지고 있다. 또한, 단순히 건강과 관련이 없는 데이터라 할지라도 개인적으로 SNS 등에 올리는 포스트, 페이스북, 인스타그램 등에 올리는 사진 등이 의료데이터와 붙어 시너지를 낼 수도 있지 않을까에 대한 고민도 있다. 사실 지금 상황에서는 뜬 구름 잡는 소리로 보일 수 도 있다. 조금 더 구체적인 형태로 건강과 관련된 이슈로 하는 환자 간 커뮤니티, 특정 질환으로 묶인 그룹 간 커뮤니케이션 같은 경우 조금 더 임상적 자료로 가치가 있을 것으로 예상된다. 대표적으로 미국의 ‘Patient like me’ 같은 플랫폼이 이런 역할을 하고 있다”고 평가했다.
◆라이프로그 데이터 임상데이터의 공백 채워질 수 있어
라이프로그의 특성은 ▲분절적인 데이터 수집을 연속적으로 확장 ▲새로운 형태의 데이터 확보를 통해 위험도 예측 향상 및 적절한 개입 가능 하다는 것이다. 즉, 분절적인 데이터 수집을 연속적으로 확장할 수 있다는 것은 기존의 임상 데이터는 내원ㆍ입원 시에 집중적으로 형성되고, 사용자의 일상생활(Daily life)과 관련된 데이터는 공백이 존재했다. 이러한 상황을 라이프로그 데이터를 통해 임상 데이터를 연속적으로 모을 수 있다는 것이다. 새로운 형태의 데이터 확보를 통해 위험도 예측 향상 및 적절한 개입이 가능하다는 것은 질병의 위험도 및 임상적 결과 예측에 활용할 수 있는 변수의 양을 증가 시켜주고, 라이프로그 데이터를 기반으로 적절한 시기에 개입이 가능하다.
그러나 현재 라이프로그의 치명적인 단점으로 수집에 대한 번거로움과 아직 데이터 양이 충분하지 않다는 것이 지적됐다.
이와 관련해 김 이사는 “라이프로그는 수집 자체가 굉장히 번거롭기 때문에 데이터의 양도 임상데이터에 비해 적을뿐더러, 시간이 지날수록 데이터가 수집되는 밀도가 감소한다. 과거에는 이런 비슷한 시도를 하다, 라이프로그 데이터가 데이터로서 가치가 적다고 여겨 버리는 경우가 많았다. 디지털 매체와 발달로 기록의 번거로움이 해소되고 있는 상황이나, 여전히 사용자의 참여에 따라 데이터 수집이 좌우된다”고 말했다.
◆사용자의 지속사용을 늘리는 것이 라이프로그 데이터의 숙제
라이프로그의 수집과 해석에 대한 이슈로는 ▲사용자의 지속 사용 여부 ▲데이터 자체의 한계점이 제기됐다.
사용자들이 지속적으로 라이로그를 수집에 참여시키기 위한 방법으로 김 이사는 ▲보상 ▲사용자의 상황 ▲의료진 피드백을 제시했다. 즉, 라이프로그 데이터를 사용자가 수집할 때, 구체적인 보상체계와 이 보상체계 중 가장 명확한 것이 의료진의 구체적인 피드백이라는 것이다. 이와 관련해 김 이사는 “실제로 1차 의료 현장에서 환자들이 식사기록, 혈당측정 등과 같은 라이프로그를 기록해도, 의사가 환자에게 세심한 피드백을 주지 않는다는 불만이 상당히 많다. 의사 입장에서는 이런 기록에 대한 피드백을 어떻게 줘야 할지 잘 알지 못 하니, 무심히 넘어가는 경우가 많은 것이다”고 지적했다.
라이프로그 데이터의 근본적인 한계점으로는 ▲검증(validation)여부 ▲공백값 처리 방법이 제시됐다. 이와 관련해 김 이사는 “공백값을 예측을 해서 넣을 것인가, 공백값을 그대로 둘 것인가 등과 관련해 기존의 의학 연구에서 사용했던 기존 임상연구 방법으로는 대입하기가 어렵다. 이러한 문제점 때문에 딥러닝, 머신러닝 분석법이 필요하다”고 설명했다.