데이터조직 만들기

  • 첫 데이터엔지니어 채용

    • 사용자 행동데이터도 제대로 없고, Replication DB 를 통해서 서비스 데이터를 보는 환경
    • 데이터엔지니어로 전향을 희망하는 경력자를 타겟으로 JD 를 작성하자.
    • 그리고 DataPipeline 에 집착하는 엔지니어보다 비즈니스 가치를 만들어 낼 수 있는 엔지니어를 우선시!
  • Data Infra
    • ETL pipeline 을 잘 잡아야 한다. 주의해야할 점은 도구에 얽매이지 말고 문제해결에 집중해라
    • AWS 를 사용한다면, 대부분의 저장소는 S3로 해결가능하다. (Redshift 등은 초반이 고려대상은 아니다.)
    • DataLake 는 S3로 했음.
  • Data Driven
    • 분석도구를 보다보면 다양한 툴들이 있는데, 무엇보다도 중요한건 팀이 데이터 중심으로 워킹하고 있는지이다.
    • 목적이든 기능이든 팀에서 적극적으로 데이터 중심으로 의사결정하고 실험할 수 있는 조직이 되어야 한다.
    • 기획/사업/PM 포지션에서는 데이터를 적극적으로 챙겨야하고, 엔지니어들도 데이터에 관심이 있도록 해야한다.
    • 즉, 누구나 빠르게 데이터를 남겨야 하고, 바로 피드백을 받을 수 있는 구조를 만들어야 한다.

링크