추천하는 대상:
- MLOps를 도입하기 위한 고민을 하는 분
한줄평: 머신러닝 모델을 배포하는 것은, 잘 돌아가는 걸 확인하는 하나의 단계일 뿐, 그 외 해야할 일은 많다.
더 이상 선택요소가 아니게 된 MLOps
머신러닝이라는 기술에 대한 고도화가 이루어져 다양한 분야에서 활용되고 있는 현 시점에서, MLOps 라는 방법론 한번 슬쩍 접하는 것이 아닌 필수 사항이 되어가고 있다. MLOps는 현재 명확하게 정립되지 않아 논문이 아닌 수많은 블로그 포스트들로 다루어지고 있고, 또 수많은 도구들이 나타나 서로가 편리하다고 주장을 하고 있는 상황이다. 요즘 들어 나오고 있는 MLOps 관련 강의들 또한 이러한 도구들의 사용법에 대해 다루는 경우를 많이 볼 수가 있다.
하지만 누구나 현재 가지고 있는 자원과 또는 지원 받을 수 있는 자원이 다르고, 다룰 수 있는 능력의 정도가 다르기에, 더더욱 개념부터 더 확실하게 숙지하고 현재 나의 일에 어떻게 적용시킬 수 있을지 고민해보는 과정이 필요하다고 느끼고 있다.
MLOps 도입가이드 의 원제는 “Introducing MLOps”으로, 제목 그대로 MLOps에 대한 전반적인 내용을 다루고 있다. 이 책에서는 MLOps에 대한 전반적인 내용을 폭 넓게 다루며, 실제 구현보다는 각 개념과 필요성에 대한 설명에 초점을 맞추고 있다.
- MLOps의 개념 및 이해관계자들
- MLOps의 핵심 기능과 필요성
- MLOps 적용 방법
- 모델 개발
- 상용화 준비
- 상용 배포
- 모니터링
- 반복
- 거버넌스
- 적용 사례
한가지 눈에 띄는 점이라면, 책의 저자가 미국과 프랑스에 오피스를 두고 있는 AI/ML 전문 기업인 데이터이쿠(Dataiku) 라는 점이다. 데이터이쿠에서 일하고 있는 9명의 임원과 스태프들이 이 책의 각 부분을 맡아 집필했는데, 1~3명의 소수가 책을 쓰는 것과는 확연히 차이점을 보이고 있다. 그만큼 이 책은 한 기업에 속한 여러 전문가가 각자의 전문성을 발휘할 수 있는 주제를 맡았다는 점에서, 인상적이다.
MLOps는 리스크 관리
이 포스트에서 이 책이 다루는 MLOps에 대한 내용을 전부 다 다룰 수는 없고, 또한 시중의 다른 자료들과 겹치는 부분도 많다. 하지만 가장 인상적인 부분을 하나 꼽아보자면, 리스크를 줄이고자 하는 차원에서의 MLOps의 필요성에 대해서 서술한 부분이다.
“결국, 모델을 상용 환경에 배포하는 작업은 머신러닝 모델 생애주기의 최종 단게는 아니다. 단지 성능과 정상 작동 여부를 확인하는 시작점이 될 뿐이다. (중략) 더 많은 머신러닝 모델을 상용 환경에 배포할수록, MLOps는 비즈니스에 치명적일 수 있는 잠재적 리스크를 줄이는데 더 필수적인 요소가 된다."
머신러닝 모델은 운용하는 과정에서 다양한 리스크를 맞이할 수 있다. 앞서 언급했듯이, 어느 조직이나 활용 가능한 리소스가, 리소스를 갖추기 위한 지원의 정도가 다르다. 따라서 이 책에서 제시한 리스크 매트릭스를 활용하여, 머신러닝 모델의 리스크를 정량적으로 판단하고, 이에 따라 MLOps의 적용 범위와 정도를 정할 수 있을 것이라 기대된다. 만일 리스크가 크지 않다면 MLOps 시스템을 구축하는 과정에서 우선순위가 높지 않을 수 있고, 만일 리스크가 크지만, 이에 대비할 수 있는 리소스가 갖춰지지 않았다면 이에 대비하는 작업을 우선적으로 시행할 수 있을 것이다.
마무리하며
MLOps 도입 가이드 는 책의 두께 두껍지 않아 빠르게 읽고, 필요한 부분을 참고할 수 있다. 다만, 앞서 말한 바와 같이 MLOps에는 많은 이해관계자가 필요하고, 각자 가지고 있는 환경과 리소스가 다르기에, 한번에 모든 것을 갖추기보다, 핵심적으로 필요하거나, 시급한 부분을 취사 선택하는 것은 독자의 몫(= 나의 몫)이다. 가벼운 길잡이로 활용해보자.
한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.