2주전 Washington D.C에서 개최된 AWS Summit 중 흥미로운 연구를 우연하게 하나 알게 되었다. 핏빗과 같은 웨어러블 데이터를 AI 알고리즘과 연결해서 COVID-19의 양성 반응을 예측하는 스탠포드 대학 연구였다. 연구의 취지는 코로나 테스트 킷 보급이 늦어지고, 테스트 결과의 지연으로써 코로나 확산이 계속 진행될때 이를 해결할 수 있는 방안을 고민하면서 시작되었다. 웨어러블 데이터는 수집하기에 용이하고 코로나 테스트킷과 같은 특별 테스트가 필요하지 없다는 장점이 있다. 아래의 포스팅은 AWS Summit에서 내가 이해한 내용과 웹사이트를 정리해서 적었음을 알려드린다.
스텐포드 대학 연구 제목은 Infectious Disease and COVID-19 Wearables Study이다. 한국어로 번역하면 감염되는 질병 (코로나)와 웨어러블의 관계 스터디 정도가 될 듯하다.
2021 AWS Washington DC Summit 후기는 아래의 포스팅을 참조하기 바란다.
웨어러블 데이터와 코로나의 상관관계
스탠포드 연구팀은 AI 알고리즘과 Fitbit과 같은 웨어러블 데이터를 연계하여 현재 상관 관계를 찾고 있고, 어느 정도의 연관성은 이미 찾았다. 데이터의 양이 많으면 많을수록 AI 알고리즘의 예측 능력이 향상될 것이다. 결국 웨어러블 유저들이 코로나 양성 반응을 직접 테스트킷으로 테스트하기 전에, 웨어러블 데이터에 의거하여 예측 가능하게 되는 것이다. 이로 인해 코로나와 같은 바이러스의 확산을 미리 예방하려는 것이 연구의 최종 목적이다.
톰 크루즈의 영화 "마이너리티 리포트"에 나오는 내용이 단순히 영화속 이야기만이 아닌 듯하다. 마이너리티 리포트의 요점은 미래의 범죄를 과거의 데이터로 예측하여서 이를 사전에 막는다는 내용이었다. 아래의 표를 예로 들자면, A라는 사람은 웨어러블 핏빗과 같은 기기를 이용해서 데이터를 알고리즘을 통해서 분석한다. 이때 아무런 증상이 없지만, 알고리즘과 같은 패턴의 이상 증후가 보이면 더 이상의 확산을 피하기 위해서 스스로 self-isolation 즉, 자가 격리를 한다. 반면 B라는 사람은 아무런 증상이 없고, 데이터 역시 없기 때문에 다른 사람들에게 피해를 줄 수 있는 확률이 더 높다.
나도 스탠포드 헬스케어 이노베이션 랩 (Stanford Healthcare Innovation Lab) 연구에 참석할 수 있나요?
연구에 참석하기 위해서는 웨어러블이 필요하다. 웨어러블 뿐만 아니라 스마트폰의 종류 또한 중요한데, 아래 테이블이 바로 어떤 웨어러블과 스마트폰이 이 연구 조사에서 원하는 데이터를 수집할 수 있는지 보여주는 표이다. Fitbit과 Android를 가지고 있는 나는 이 연구에 참석 가능하다. 임산부는 이 실험에 참석할 수 없으며, 심장병이 있는 사람들도 참석할 수 없다. 또한 나이제한이 있는데 18-70세까지만 가능하다.
핏빗 중 어떤 데이터를 수집하나요?
스탠포드 연구팀이 수집하는 것들은 다음과 같다. 걸음수, 운동량, 스트레스로 인한 몸의 반응, 신체온도, GPS 위치, 혈액중 산소양, 혈압, 수면 퀄리티, 심장박동수 등이다. 이러한 메트릭은 웨어러블 기계마다 좀 다르지만, 이러한 메트릭과 코로나와 같은 전염성 바이러스와의 상관 관계를 데이터와 알고리즘으로 찾는 것이 최종 목적이다.
이 연구를 위해서 2가지 수집군이 있는데, A그룹은 미국에 거주한 사람들 200명을 대상으로 진행중이다. 이들에게는 웨어러블 데이터 뿐만 아니라, COVID Test Kit도 함께 사용된다. 즉, AI 알고리즘에 의해서 예상한 데이터와 테스트킷의 결과를 비교하는 것이다.
두번째 수집군 B는 A그룹에 비해 간단하며, AI 알고리즘이 가지고 있던 패턴과 웨어러블 데이터의 패턴이 비슷하게 작동할 경우, 이에 대해서 앱을 통해서 Alert을 보낸다. 이것에 대해서 그때마다 앱을 통해서 답변을 하는 형태이다. 웨어러블의 데이터는 실제로 바이러스 뿐만 아니라 신체적, 정신적 스트레스, 환경의 변화 등으로도 데이터가 변하기 때문에 이러한 데이터의 변화가 코로나 이외의 팩트들로 이루어졌는지 확인하는 절차이다.
수집한 핏빗 데이터는 안전한가요?
"The study has been approved by the Chief Security and Privacy Officers of Stanford University, and ahs been rigorously vetted by the Stanford Institutional Review Board." 즉 스탠포드 자체 내에서만 이 데이터의 수집에 대한 안전성을 보장해줄뿐 그 이외에 다른 보호 장치는 없는듯 하다. 이 부분이 사실 조금 아쉬운 부분이기도 하다. 이 모든 과정이 자발적으로 참석하는 것이기에 실험에 참석했다 하더라도 언제라도 그만둘 수 있다. 데이터 수집은 핏빗을 통해서 하는 것이 아니라 MyPHD라는 앱을 통해서 핏빗과 연동하는 것이다.
결론
우리는 웨어러블 뿐만 아니라 모든 데이터가 AI 알고리즘으로 Analysis되는 시대가 되었다. 크레딧카드의 사용 내역, 자동차 GPS의 움직임, 인터넷 검색 내용, 소셜미디어 포스팅 등으로 이미 전세계는 사람들을 식별하고, 어떤 종류의 사람인지 구별할 수 있게 되었다. 개인의 데이터 프라이버시의 문제는 항상 이러한 Big data와 동전 양면의 관계에 존재하는 듯하다. 우리에게 편리한 기술은 그 이면에 다른 단점이 있기 마련이다. 개인적으로 나는 이러한 데이터의 분석, 그리고 기술의 발전이 결국 인간과 사회에 더 좋은 방향으로 발전되기를 기대하고 응원한다. 비록 단점들과 악영향들도 생기고 있지만, 이 또한 우리가 잘 대응하길 응원한다.