머신 러닝 파워드 애플리케이션 (저자: 에마뉘엘 아메장)

머신 러닝 파워드 애플리케이션 (저자: 에마뉘엘 아메장)

추천 대상:

  • 머신러닝이 적용된 제품을 만들고자 하는 분
  • 머신러닝 엔지니어로 취업/이직하고자 하는 분

한줄평: 데이터 수집, 전처리, 학습 … 이제 이걸 가지고 뭘 하지?

머신러닝 모델은 서비스가 될 때 진정한 가치가 있다

“머신러닝에 대해 배운다” 라고 하면 대부분의 커리큘럼은 갖가지 알고리즘과 그 작동 방식에 대해 배우는 것부터 시작한다. 가장 간단한 형태의 모델부터 최신의 복잡한 구조의 모델까지 훑고, 토이 데이터셋으로 실습까지 진행한다. 머신러닝이라는 기술을 구현하기 위한 대략적인 지식을 얻게 되었다면, 그 다음에는 이 질문이 떠올라야 한다.

“그럼 이제 이걸 가지고 뭘 하면 되지?”

머신러닝, 딥러닝, 인공지능이라는 신박한 기술이 소개되어 사람들을 매료시키던 시대는 이제 지났다고 할 수 있다. 기술은 실제로 사용이 되어야 그 가치가 있는 것과 마찬가지로 머신러닝 모델 또한 사용자에게 서비스가 될 때 진정한 가치가 있다. 우리는 지금 이 기술을 활용한 제대로 된 제품을 만들어 내야 하는 시기에 있다.

머신러닝 파워드 애플리케이션 은 책 제목 그대로 머신러닝 기술에 기반한 제품(서비스)를 만들기 위한 내용을 담고 있다. 따라서, 현업에서 머신러닝 기술을 연구하는 단계가 아닌, 실제로 적용한 비즈니스 진행시켜야 하거나, 머신러닝 엔지니어로서 취업/이직을 고려하는 사람에게 적합하다. 단, 이 책은 머신러닝에 대한 기본적인 개념이 잡혀 있다는 것을 전제로 하고 있기 때문에, 초심자에게는 권하지 않는다. (머신러닝 개발자와 커뮤니케이션이 자주 발생하는 기획자는 업무에 참고할 만 하다.)

머신러닝 제품화 길잡이

머신러닝 파워드 애플리케이션 은 머신러닝 기반 제품을 만들기 위한 아주 좋은 가이드북이다. 책에서 참고할 수 있는 내용들은 다음과 같다.

1. 문제를 해결하기 위한 머신러닝 모색

  • 문제를 해결하고 편의를 제공하기 위한 어플리케이션 정의
  • 문제를 어떻게 정의하고, 적합한 모델을 선정하여 필요한 데이터를 준비해야할 지 파악하는 과정
  • 머신러닝 기반 제품 개발의 전체적인 프로젝트의 일정의 계획하는 과정
다양한 문제에 따른 접근 방법 예시

다양한 문제에 따른 접근 방법 예시

2. 가장 간단하게 만드는 엔드투엔드 파이프라인

간단하지만 핵심 기능을 하는 제품부터 만들어보자

간단하지만 핵심 기능을 하는 제품부터 만들어보자

  • 가장 필요로 하는 서비스를 제공하기 위한 최소한의 기능을 하는 엔드투엔드(End-To-End) 파이프라인 설계
  • 가장 간단한 파이프라인의 성능을 평가하는 다양한 시각 (모델 성능, 사용성, 비용, 속도 등)
학습과 추론 파이프라인 예시

학습과 추론 파이프라인 예시

3. 모델 학습과 디버깅

토이프로젝트와 실제 산업에서의 차이

토이프로젝트와 실제 산업에서의 차이

  • 모델 학습 과정
    • 토이 프로젝트가 아닌 실제 제품 개발을 위한 데이터 준비 과정
    • 반복적인 과정을 거친 모델 학습 과정
  • 실제 서비스되는 모델의 정상적인 동작을 위한 테스트 과정

4. 모델 배포와 모니터링

스트리밍 배포 방식

스트리밍 배포 방식

배치 배포 방식

배치 배포 방식

  • 사용자가 실제로 머신러닝 모델을 사용하기 위한 다양한 배포 방식
  • 배포 과정에서 생길 수 있는 다양한 문제점들
  • 모델의 이상 작동을 포착하고, 데이터 분포를 감지하기 위한 모니터링의 중요성
데이터 변화에 따른 재학습 주기 예시

데이터 변화에 따른 재학습 주기 예시

이상탐지를 통한 모델의 비정상적인 동작 포착 예시

이상탐지를 통한 모델의 비정상적인 동작 포착 예시

마무리하며

이 책은 기본적으로 다양한 예시를 들어 머신러닝 기반 제품이 만들어지는 과정을 설명한다. 따라서 읽는 사람에 내용의 흐름이 약간은 혼란스러울 수 있다. 일반적인 내용만 파악하더라도 실제로 만들고자 하는 서비스를 구현하는데에는 충분히 참고할 수 있는 책이기 때문에, 예시와 예제 코드에 너무 집중할 필요는 없다고 생각한다.

또한 위에서 서술한 바와 같이 머신러닝의 기초적인 내용은 다루지 않기 때문에, 어느 정도 개념이 잡힌 상태에서 읽는 것을 권장한다.

+) 현업 CTO / 머신러닝 엔지니어 / 데이터 사이언티스트 들의 인터뷰는 피가 되고 살이 되는 조언들이 담겨있으니 꼭 읽어보자 !!


한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.