직무/업무 분석을 위해 구글링을 하며
여러 정보를 모으던 중...
필자는 아주 정리가 잘 되어 있는 Github 페이지 하나를 발견하게 된다.
바로!
Team-Neighborhood의 Github 페이지!
https://github.com/Team-Neighborhood/I-want-to-study-Data-Science
Team-Neighborhood의 Github 페이지를 관리하고 계신
변성윤 님의 글을 읽고 위 궁금증에 대하여 직관적으로 이해할 수 있었다.
위 페이지에서 많은 글을 볼 수 있지만,
개인적으로 굉장히 도움을 많이 받았던 글은 아래와 같다.
아래의 내용을 통해 데이터 관련 분야의 직군에 대한
전반적인 흐름을 독자들 또한 이해할 수 있을 것이라 장담한다.
데이터 분야의 직군은 크게 4가지로 나눌 수 있다.
※ 어떤 분야나 다양한 직군이 존재하지만 데이터 분야의 직군은 시간이 지나며 점점 빠르게 변하고 있습니다.
※ 이 자료는 제 경험 + 수많은 채용 공고를 보고 얻은 생각으로 작성했습니다. 따라서 잘못된 내용이 있을 수 있습니다.
※ 일반적으로 생각할 땐 데이터 분석가, 데이터 엔지니어, 머신러닝 엔지니어, 데이터 사이언티스트로 구분할 수 있습니다.
▶ 데이터 분석가는 "기획자"적 성향이 강하며
▶ 데이터 엔지니어는 "개발자"적 성향이 강하고
▶ 데이터 사이언티스트는 "연구자"적 성향이 강합니다.
▶ 여기에 머신러닝 엔지니어는 "개발자"적 성향이 강합니다.
※ 데이터 사이언티스트와 머신러닝 엔지니어의 경계는 모호합니다. 요즘은 리서치 엔지니어라는 직군도 생겼습니다.
※ 이 문서에선 데이터 사이언티스트는 "연구자" 머신러닝 엔지니어는 "개발자" 성향이 강하다고 정의하겠습니다.
데이터 분석가
● 데이터 엔지니어(혹은 백엔드 개발자)가 Database에 데이터를 저장해주면, 그 데이터를 기반으로 데이터 분석을 합니다.
● 모니터링해야 되는 데이터 또는 특정 데이터의 경우 대시보드를 생성하고 관리합니다.
○ KPI(Key Performance Indicator) : 핵심 성과지표 설정
○ 사내에서 정한 KPI를 모니터링합니다. 수치가 올랐다면 왜? 내려갔다면 왜? 원인 분석을 합니다.
○ KPI가 설정되지 않은 경우 KPI를 설정하기도 합니다.
● 새로운 기능이 추가되는 경우나 특정 로그를 보고 싶은 경우 데이터 로그 설계합니다.
데이터 엔지니어
● 앱 또는 웹에서 나오는 데이터를 수집 - 가공해 데이터 분석가가 사용하기 쉽게 저장합니다.
● 데이터 파이프라인 생성 : 데이터의 흐름을 관리합니다.
● 데이터 분석가가 사용할 대시보드를 개발합니다.
○ 작은 회사에선 백엔드 개발자가 이 역할을 하는 경우도 있습니다.
○ 요즘 추세는 1) 백엔드 개발을 하는 데이터 엔지니어 또는 2) 머신러닝/딥러닝을 하는 데이터 엔지니어 또는 3) 데이터 엔지니어링 위주로 하는 데이터 엔지니어로 나뉘는 것 같습니다.
머신러닝 엔지니어
● 자신이 속한 도메인(Computer Vision, Natural Language Process 등)에서 필요한 모델을 개발합니다.
● 개발한 모델을 Production(실제 제품)에 적용합니다.
● 모델의 성능을 모니터링하고 모델의 성능을 개선하거나 더 나은 모델을 만듭니다.
● 여기서 핵심은 Production에 적용하는 것!
데이터 사이언티스트
● 보통 R&D 조직에 속하며 논문 연구를 합니다.
● 데이터 분석 쪽의 일을 한다면 통계 모델링을 수행합니다.
● 머신러닝 엔지니어가 하는 일(모델 개발, 모델 성능 개선, 추가 모델 개발)을 하기도 합니다.
{ 기타 }
기획자
● 넓게 볼 경우 기획자 직군도 기획을 위한 데이터를 보곤 합니다. Google Analytics, Facebook Analytics, Facebook 광고 데이터, 사내 대시보드 등
● 직접 Database에 SQL 쿼리를 날리거나, 간단한 데이터 조작을 위해 Python 또는 R을 익히곤 합니다.
● 기획자에서 데이터 분석가로 직군을 변경하는 분들도 종종 봤습니다.
그로스 해커
● 그로스 해커는 기획자와 마찬가지로 성장을 위해 데이터를 보곤 합니다.
● 기획자와 마찬가지로 쿼리를 날려 데이터를 보거나 대시보드, 각종 Analytics를 사용합니다.
● 제품 개발이 아닌 성장에 집중하는 포지션입니다.
데이터 시각화
● 데이터 시각화 직군은 따로 두는 기업은 많지 않습니다.(언론사에서 종종 봤습니다.)
● 디자이너면서 데이터 시각화를 할 수도 있고, 개발자면서(프론트엔드 개발자) 데이터 시각화를 할 수도 있습니다.
● 디자이너의 경우 일러스트를 사용하고, 개발자의 경우 Java Script를 사용합니다.
● 두 직군 결국 목적은 동일합니다. 데이터 분석 결과를 시각적으로 표현해 쉽게 이해할 수 있도록 하는 것입니다.
● 다른 직군에서도 Tableau, Zeppelin 등을 사용해 시각화합니다.
'career plan' 카테고리의 다른 글
프레임워크 공부를 멈춰라 (0) | 2021.08.23 |
---|
댓글