Tech

스와미 시바수브라마니안 AWS 머신러닝 부사장 

머신러닝 장벽 없애기 

머신러닝(기계학습), 더는 글로벌 IT 공룡의 전유물이 아니다. 막연하게 IT 기술을 도입하며 ‘혁신’이란 명패를 걸던 시대는 지났다. 데이터를 모으고 분석해 새로운 길을 열어야 기업도 변신에 성공할 수 있다. AWS는 코로나19 팬데믹을 뚫고, 백신 개발과 제조 혁신이란 성과를 앞세워 머신러닝 서비스 대중화에 사활을 걸었다.

▎ 사진:AWS
“94% 유효성을 가진 코로나19 백신 후보 물질을 찾는 데 통상 20개월이 걸리는데, 이번엔 42일 이내에 마칠 수 있었고. 백신 개발도 63일 만에 해냈다.”

지난해 12월 9일 언택트로 진행된 아마존웹서비스(AWS) ‘리인벤트 2020’ 연설에서 스와미 시바수브라마니안 AWS 머신러닝 부사장이 한 말이다. 미국 식품의약국(FDA)도 리인벤트 행사 마지막 날인 18일(현지시각) 모더나가 개발한 코로나19 백신의 긴급 사용을 승인했다. 화이자-바이오엔테크의 백신에 이어 미국에서 사용 가능한 두 번째 백신이 된 셈이다.

근소한 차이지만 화이자, 모더나 모두 역사상 최단기 백신 개발의 주역이란 타이틀을 얻었다. 클라우드와 인공지능(AI), 이를 활용한 머신러닝(ML) 기법이 있어 가능했다. 코로나19 백신 이전에도 제약·바이오업계는 머신러닝이 백신과 신약 개발에 신기원을 제시할 거라 예상한 바 있다. 머신러닝으로 100만 건 이상의 논문을 탐색하고, 약물의 화합물 구조 정보와 생체 내 단백질 결합 특성을 수초 만에 계산할 수 있어서다. 기존 방식으로는 수십 명의 전문 연구원이 논문 분석에만 수년, 신약개발에만 15년이 걸렸다.

하지만 문제는 머신러닝 자체가 높은 장벽 그 자체였다. 머신러닝을 활용할 고도화된 인프라 구축부터 어디서부터 어떻게 시작해야 할지, 흩어진 데이터를 모아 분석하는 일까지 모든 게 소수 글로벌 대기업만 누리던 호사였다. AWS는 모더나 백신 개발뿐만 아니라 전 산업군에서 머신러닝을 도입하려는 수요가 폭발하면서 ‘그’ 장벽을 허무는 데 2020년을 투자했다. 관련 신규 서비스로는 ‘헬스레이크’가 있다.

“헬스케어 기업들은 백신과 신약 개발뿐만 아니라 수술이나 환자 관리에 머신러닝을 적극적으로 도입하고 있다. 벌써 3M, 앤썸, 아스트라제네카, GE헬스케어, 화이자, 필립스 등이 AWS 클라우드와 머신러닝을 활용하고 있다. 질병 진단부터 진료, 처방, 모니터링 정보, 보험청구서, 실험실의 연구보고서 등 곳곳에 흩어진 데이터를 모아 분석하면서 임상 결과를 다각도로 분석할 수 있고 최적의 치료 방법을 찾아낼 수 있다. 수천만 건에 이르는 의료계 정형·비정형 데이터를 판독할 수 있는 데이터로 나오는 순간부터 헬스케어 분야는 새로운 기회를 맞았다.”

‘리인벤트 2020’ 연설에 앞서 12월 2일 진행한 언택트 인터뷰에서 시바수브라마니안 부사장이 한 말이다. 코로나19 덕에 머신러닝의 진가를 인정받았고, 제조기업들도 앞다퉈 도입에 나섰다. AWS는 이에 부응했다. 이미 AWS 클라우드상에 머신러닝 플랫폼 ‘세이지메이커’가 구축돼 있지만, 그보다 개발자와 데이터 과학자가 망설였던 ‘벽’까지 허물겠다며 ‘세이지메이커 스튜디오’를 출시했다. 전문적으로 설명하면 기계학습 모델을 쉽게 빌드, 훈련, 디버깅, 배포, 모니터링하게 해주는 웹 기반의 통합 개발 환경(IDE)이다. 쉽게 말해 기계학습 개발에 필요한 모든 기능을 통합해준다는 뜻이다. 개발자는 원클릭으로 스튜디오를 생성한 후, 통합 비주얼 화면상에서 코드를 작성하면 데이터가 시각화되고 모니터링돼 공유할 수 있다. 개발자와 데이터 과학자 모두가 머신러닝 과정을 눈으로 확인하며 공유할 수 있게 된 거다. 15년간 AWS에서 딥러닝 관련 프레임워크를 구축하고, AI·머신러닝 분야를 총괄하는 시바수브라마니안 부사장과의 대화가 이어졌다.

“이제부터 머신러닝 황금기”


▎코로나19 백신을 개발한 미국 제약사 모더나는 AWS 클라우드 머신러닝(기계학습)을 활용해 백신 구조를 예측하고 다양한 시뮬레이션을 했다. 통상 20개월이 걸리는 백신 개발 기간을 두 달로 단축할 수 있었다. 사진은 AWS 클라우드 머신러닝으로 후보물질을 살펴보는 모더나 연구원. / 사진:모더나,
앤디 재시 AWS CEO의 기조연설도 대다수 머신러닝 얘기였다.

재시 CEO와 발표 내용을 가지고 토의하다 머신러닝 관련 세션을 아예 따로 만들기로 했다. 그만큼 중요해서다. 지난해 업계 최초로 공개했던 세이지메이커는 업계에서 일반 개발자와 데이터 과학자에게 머신러닝이 뭔지 쉽게 접근할 기회를 준 게임체인저였다. 그 후 고객과 수많은 피드백이 오갔고, 또 한 번 진화할 수 있었다. 만나는 사람마다 ‘머신러닝 황금기’가 도래했다는 얘기를 하는 이유다.

머신러닝, 아직도 쉽게 접근하기 어려운 개념이다.

그렇다고 새로운 기술도 아니다. 아마존은 이커머스 사업을 할 때부터 세계 최초 무인 자동화 매장 ‘아마존 고’를 열기까지 거의 모든 영역에서 머신러닝 기술을 활용해왔다. 고객의 동선부터 자주 소비되는 물품, 재고 확인, 배송 가능 여부까지. 실시간으로 동시다발적 사항을 확인하고 분석해 서비스를 제공하고자 했다. 시작부터 돕기 위해서 아마존 모니트론(Amazon Monitron)으로 센서, 게이트웨이, 클라우드를 한데 엮고자 했다. 머신러닝 역량을 구축하기 위한 계획 수립부터 실행까지 ‘엔드 투 엔드(end-to-end)’ 머신러닝 솔루션이라고 보면 된다. 기업이 도입하기 수월해지자 여러 분야에서 자연스레 실증 사업으로 이어졌다. 우리는 기술 자체를 설명하기보다는 기술이 끌어낼 ‘변화’를 알리는 데 더 집중한다. 제조기업에는 유지보수, 작업자 안전, 제품 품질, 공장자동화 등에 어떻게 쓰이는지 직접 보여주는 식이다.

서비스는 어떻게 진화했나.

다양한 소스에서 데이터를 뽑아내는 방식부터 바꿨다. 신규 서비스 ‘데이터 랭글러(Data Wrangler)’는 머신러닝을 구축하기 전에 데이터를 취합하는 일이 전 과정의 80%나 차지한다는 걸 알고 출시한 서비스다. 클릭 몇 번만으로 데이터를 준비할 수 있게 바꾼 것. 이 밖에도 머신러닝 알고리즘이 쉽게 나타낼 수 있는 잠재적인 편향성을 제거하는 세이지메이커 클래리파이(Sagemaker Clarify), 머신러닝 저장과 공유에 특화된 데이터 스토어 ‘피처 스토어(Feature Store)’, 머신러닝에 특화된 지속적 통합/전달(CI/CD) 서비스 ‘파이프라인(Pipeline)’, 머신러닝 훈련 성능을 2배 높여주고 각종 스마트 기기와도 연동할 수 있는 머신러닝 모델 모니터링 기능 등을 새로 출시했다.

이러다 개발자들이 일자리를 잃겠다.

개발자가 하는 일이 자동화되는 건 분명하다. 하지만 실제 개발자들이 일자리를 잃을까 봐 걱정(?)하기보단 오히려 반기는 분위기다. 나도 개발자 출신이라 단순 반복해야 하는 업무의 고충을 잘 알고 있다. 예전에 개발자로 일할 때 새벽 2시에 시스템 장애가 발생하면 어김없이 출근해 코드 매트릭스, 로그 기록을 뒤져봐야 했다. 하지만 AWS가 출시한 데브옵스 구루(DevOps Guru)를 활용하면 개발자나 운용자가 시스템 문제를 바로 파악할 수 있다. 머신러닝은 기업이 ‘선택과 집중’을 잘 하도록 돕는 도구인 셈이다.

확실히 코로나19가 경영환경에 미치는 영향이 컸다.

그렇다. 안 바뀐 게 뭔지 따지는 게 빠를 정도다. 코로나19 팬데믹을 거치면서 고객들의 혁신에 대한 갈구는 더 커졌고, 속도도 빨라졌다. 백신 기업 말고도 다양한 제조 기반 기업이 머신러닝, 애널리틱스, 사물인터넷(IoT) 등의 기술을 도입해 디지털 트랜스포메이션을 꾀하고자 했다. 이것도 먼 미래 계획이 아니라 우리에게 당장 실현할 수 있는 게 뭔지 물었다. AWS는 과거 대형 기술 기업이나 소수 스타트업만 사용했던 머신러닝 기술을 누구나 활용할 수 있게 하는 쪽에 방점을 뒀다. 기술혁신 욕구가 커지면서 머신러닝 영역에서는 백 엔드(back-end)의 문서처리, 공급망 예측 최적화, 콜센터 및 산업 제조 자동화, 시스템 운영 부서와 개발부서를 통합하는 데브옵스 등 다양한 AWS 서비스가 제조기업의 개발 부문에 필요하다는 사실이 부각됐다.

단순히 기업의 혁신 욕구 때문인가.

코로나19 탓에 시장 욕구가 완전히 달라졌다. 일단 일반적인 커뮤니케이션 형태가 변했다. 사람들은 온라인으로 기업과 소통하길 바랐고, 고객센터는 늘 북새통을 이루면서 과부하가 일어나기 일쑤였다. 민간, 공공 분야가 비슷하게 겪은 현상이다. 몇 가지 사례를 소개하면 미국 로드아일랜드 주정부가 아마존 커넥트(Amazon Connect)를 사용해 클라우드 기반 콜센터를 구축했고, 아메리칸 익스프레스 계열사인 캐비지가 아마존 텍스트랙트(Amazon Textract)를 가지고 물밀듯 쏟아져 들어오는 소상공인 대출신청서를 처리하게 도왔다. 데이터를 인지하고, 분류해 정리하고 모으는 일만 해도 사람 손으로 하면 몇 개월이 걸릴지 알 수 없는 일이다. 분석은 더 요원한 일이 된다. 머신러닝을 이걸 한 번에 엮는다.

일하는 방식 바꾸는 머신러닝


▎센서와 게이트웨이로 구성된 아마존 모니트론 서비스 장비. / 사진:AWS
기업들이 머신러닝을 도입할 때 가장 힘들어하는 점은 뭔가.

우리가 각종 인프라와 개발 도구를 여럿 제시하지만, 실제 문제에 어떻게 활용할지 두려워한다. 도입하겠다고 해놓고도 막상 실적이나 효율 개선에 실패하면 어떻게 할지 막판까지 고민한다. 어떤 기업은 아예 실제 문제를 대놓고 해결해달라고도 요청한다. 그래서 머신러닝 문화 조성에도 신경 쓰고 있다. 예컨대 머신러닝이라고 해서 개발자만 참여한다면 큰일이다. 비즈니스 전문가도 고객의 니즈가 뭔지 함께 고민하고 털어놔야 한다. 머신러닝은 어찌 보면 조직 전체의 문화를 바꿀 수 있는 하나의 수단이다. 워크플로 전체를 아우르는데 왜 머신러닝 모델의 구축, 훈련, 배치 등 도구를 써야 하는지 공감해야 한다.

또 다른 조언을 한다면.


▎AWS 리인벤트 2020 기조연설에 나선 스와미 시바수브라마니안 AWS 머신러닝 부사장. / 사진:AWS
다시 얘기하지만, 머신러닝 도입은 개발자 몫이 아니다. 전부의 몫이다. 기술혁신을 하겠다는 최고경영자의 의지가 선행돼야 한다. 그 후 개발자와 비즈니스 기획자를 비롯해 전 구성원이 뛰어들어야 한다. 이유가 있다. 머신러닝을 도입하기에 앞서 데이터의 우선순위를 결정하는 것과 기업이 닥친 비즈니스 문제가 뭔지 정확하게 파악하는 일이 중요하기 때문이다. 포뮬러1 레이싱팀이 보여준 사례에서 뼈저리게 느꼈다. 지난 69년간 쌓인 데이터가 팀의 레이싱 역량을 어떻게 바꿔줄지 몰랐기에 지원팀과 드라이버 등 전 구성원이 퍼포먼스 통계분석에 머리를 맞대야 했다. 지금은 차량에 장착된 120개 센서에서 초당 110만 개 텔레메트리 포인트에서 생산한 데이터로 드라이빙 전략을 짠다. 개발자한테만 떠넘겨서 끝나는 문제가 아니다.

다른 사례도 소개해달라.

정말 많다. 첫 번째 사례는 일본의 GE헬스케어다. GE헬스케어는 아마존 룩아웃 포 비전(Lookout for Vision)으로 제품 결함을 완벽히 잡아냈다. 스웨덴 냉동 피자 업체인 다프가드는 피자를 만드는 일에 머신러닝을 썼다. 치즈량이 적당한지, 토핑이 제대로 올라갔는지, 페퍼로니 피자에 닭고기가 아닌 페퍼로니가 올라갔는지 등을 이미지 분석으로 검수했다. SK텔레콤, 인터파크, 대한항공, GS 등 한국 기업도 적극적이다. SKT는 자사 5G 모바일 에지 컴퓨팅(MEC) 기술에 AWS의 퍼블릭 클라우드 기술과 서비스를 접목해 5G에지 클라우드 생태계 구축에 나섰고, 인터파크는 머신러닝 서비스로 제품 추천 엔진을 고도화했다. 대한항공은 머신러닝 기술로 항공기 엔진 마모를 예측·정비·유지하는 시스템을 마련했다. GS그룹의 발전 부문 자회사인 GS EPS는 아마존 룩아웃 포 이큅먼트(Lookout for Equipment)를 도입해 공장 운영팀이 전문 지식이 없어도 장비용 머신러닝 모델을 구축할 수 있게 했다.

하고 싶은 말이 있나.

AWS가 매년 혁신적인 서비스를 내놓지만, 특별한 비법이나 비결이 있는 건 아니다. 만물박사도 아니고, 오로지 고객과 함께 고민하는 게 전부다. 우리는 ‘거꾸로 일하는 것(working backwards)’을 원칙으로 고객 문제 해결에 뛰어든다. 리인벤트 행사에서 숱한 기업 관계자를 연사로 선정해 정보를 공유하는 건 이 같은 철학에서 출발한다. 머신러닝은 특별한 게 아니다. 이제 모든 기업이 이 기술의 혜택을 누려야 할 때가 왔다고 생각한다.

- 김영문 기자 ymk0806@joongang.co.kr

202101호 (2020.12.23)
목차보기
  • 금주의 베스트 기사
이전 1 / 2 다음