로그인|회원가입|고객센터
Top
검색버튼 메뉴버튼

Medical Imaging AI

꽉 막힌 의료 데이터 ‘숨통’을 틔워라

이주헌 | 373호 (2023년 07월 Issue 2)
Article at a Glance

왜 의료 AI 분야에서는 챗GPT처럼 사회에 반향을 일으키는 혁신 성과가 먼저 나오지 못하는 걸까? 그 이유는 실생활 데이터와 의료 데이터의 차이에서 찾을 수 있다. 소셜미디어 데이터, 소비자 데이터, 금융 데이터 등의 실생활 데이터는 광범위하게 공개돼 있을 뿐만 아니라 라벨링을 거쳐 그라운드 트루스가 확립돼 있는 경우가 많다. 데이터 식별과 분류에 전문적인 지식이 필요하지 않기 때문에 일반인을 활용해 비용을 절감할 수 있기 때문이다. 이에 반해 의료 데이터는 공개가 제한될 뿐만 아니라 데이터 정제와 후처리에 시간과 비용이 많이 들어 그라운드 트루스 데이터를 얻기 어렵다. 이런 개방성과 사용 가능성의 제한은 의료 AI 알고리즘 개발 및 상용화의 걸림돌로 작용하고 있다.



인공지능(AI)이 배우고 분석할 수 있는 데이터의 수는 하루가 다르게 기하급수적으로 늘어나고 있다. 이제는 AI 와 결합되지 않은 전자제품, 휴대폰 앱을 찾기 어려울 정도다. 이렇듯 AI가 실생활에서 뗄 수 없는 관계가 돼 가는데 왜 의료 분야는 AI 의 발전상을 따라가기에 급급하고 시장을 선도하는 혁신을 내놓지 못하는 것일까? 챗 GPT와 같이 사회에 반향을 일으키는 괄목할 만한 성과가 의료 분야에서 먼저 나오지 못하는 이유는 무엇일까? 필자는 그 차이가 데이터 자체의 수와 접근성에 있다고 본다. 이 글을 통해 AI 개발에 요구되는 실생활 데이터와 의료 데이터의 특징과 차이점을 짚어보려 한다.

GettyImages-1327568873


AI 알고리즘 개발을 위한 실생활 데이터

실생활 데이터에는 소셜미디어 데이터, 소비자 데이터, 금융 데이터 등이 포함돼 있다. 그리고 AI 알고리즘 개발을 위해 점점 더 많은 실생활 데이터가 활용되는 추세다. 이미 구글, 아마존, 메타 등의 기업들은 방대한 실생활 데이터를 바탕으로 혁신을 주도하고 있으며 실생활 데이터를 활용해 자연어처리, 컴퓨터 비전, 음성 인식 등 광범위한 애플리케이션을 위한 AI 알고리즘을 만든다.

예를 들어, 페이스북과 인스타그램 같은 소셜미디어 플랫폼은 사용자의 행동, 선호도, 관심사에 대한 대규모 데이터를 생성하며, 이 데이터를 콘텐츠 개인화, 제품 추천, 사기 탐지 등의 AI 알고리즘 개발에 이용한다. 아마존과 같은 전자상거래 플랫폼도 사용자 구매, 검색 정보, 브라우징 기록 데이터 등을 수집해 제품 추천을 개선하고 원가 전략을 최적화하며 시장 동향을 파악한다.

그중에서도 특히 이미지 분석을 위해 공개적으로 접근 가능한 데이터는 AI 알고리즘 개발에 크게 기여할 수 있다. 오늘날 AI 연구의 전성기를 가져온 인공 신경망 모델인 알렉스넷(AlexNet)도 이미지넷(ImageNet)같이 공개된 이미지 데이터를 이용한 챌린지를 통해 개발됐다. 이미지넷에는 수백만 개의 이미지와 수천 개의 범주에 대한 인간 주석 레이블 및 경계 상자(Bounding box)1 가 포함돼 있는데 이것이 머신러닝에 기여하면서 넓게는 AI, 좁게는 딥러닝의 출현에 중대한 공로를 세웠다. 공개적으로 접근 가능한 다른 실생활 이미지 데이터세트와 플랫폼도 크게 늘었다. 이런 데이터들에는 이미지넷보다 높은 해상도를 가지거나 사람이 단 주석이 더해진 것들도 있다. 특히 LAION이라는 비영리 조직은 LAION-5B와 같은 대규모 텍스트-이미지 페어(text-image pair) 데이터세트를 공개했는데 이 데이터세트에는 수십억 개의 클립 필터된 이미지-텍스트 페어가 포함됐다.

가입하면 무료

  • 이주헌[email protected]

    피츠버그대 방사선학과 교수

    필자는 연세대 전기전자공학부를 졸업하고 미국 텍사스 오스턴대 전기컴퓨터공학과에서 석박사 학위를 받았다. 현재 미국 펜실베이니아주 피츠버그대 방사선학과 교수로 미국에서 손꼽히는 대형 병원인 피츠버그대 의료센터(University of Pittsburgh Medical Center)에서 유방암 영상 데이터를 이용한 유방암 인공지능 연구를 이끌고 있다.

    이 필자의 다른 기사 보기
인기기사

질문, 답변, 연관 아티클 확인까지 한번에! 경제·경영 관련 질문은 AskBiz에게 물어보세요. 오늘은 무엇을 도와드릴까요?

Click!