쏘카 데이터 그룹 - 데이터 사이언티스트 인턴 9개월 후기

데이터 사이언티스트 인턴기

Posted by yamani on August 19, 2020 · 30 mins read

안녕하세요 :)

쏘카 데이터 그룹의 야마니(이유림)입니다! 😃

최근 데이터, 인공지능 등에 대한 관심이 커지고 있습니다. 데이터는 여러 분야에 두루 적용될 수 있기 때문에, 다양한 업계에서 데이터 분석과 관련된 전문가를 필요로 하고 있죠😎, 이에 맞추어 많은 대학에서 머신러닝 및 데이터 관련 학과를 개설하고 있습니다. 기업에서도 데이터 조직을 만들어 데이터 인프라를 구축하고, 데이터를 기반의 업무 문화를 만들기 위해 노력하고 있습니다. 🔥🔥🔥

하지만 회사의 데이터 인프라가 어느 수준인지, 회사에서 데이터를 어떻게 활용하고 있는지는 회사 관계자가 아니면 알기 힘듭니다.🥺 뿐만 아니라 진행하는 업무의 종류와 중요도, 문화는 회사마다 큰 차이가 있습니다. 따라서 데이터 분야의 취업을 준비하는 많은 대학생분들이 충분한 정보를 접하지 못하곤 합니다. 지인을 통하거나 공개된 발표 자료를 토대로 추측해야 합니다.

저는 대학교 4학년이던 2019년 11월부터 2020년 7월까지 총 9개월간 쏘카 데이터 그룹에서 인턴으로 근무했습니다. 그 경험을 바탕으로 쏘카 데이터 그룹에서는 어떤 일을 하고, 어떤 방식으로 하며, 어떤 문화를 가졌는지 알려드리고자 ‘야마니의 인턴기’를 적게 되었습니다. 대학생분들이 제 글을 통해 궁금했던 것을 조금이라도 알아갈 수 있다면 좋겠습니다. 😊

목차는 다음과 같습니다

2020년 2월에 찍은 쏘카 데이터 그룹 단체 사진. 저는 뒷줄 왼쪽에서 두번째 검은 옷을 입고 웃고 있습니다.




입사 전

1) 회사 고르기 : 왜 쏘카로 결정했나요?

저는 학부에서 전자공학을 전공했습니다. 회로, 통신, 컴퓨터 등 여러 수업🔌🖥️을 들었는데, 그중에서도 확률과 머신러닝 분야가 가장 재미있었습니다. 대학교 2학년과 3학년 때는 IT 회사의 인공지능 연구 부서의 인턴을 경험했습니다. 사실 학부 졸업 후 바로 대학원에 진학할 계획이었지만, 한편으로는 학교 밖에서 ‘세상🌏 돌아가는 모습’을 보고 싶다는 열망도 항상 있었습니다. 고민 끝에, 데이터 분야의 인턴을 경험하고 대학원에 진학할 예정이었습니다.

많은 회사 중에서, 어느 곳으로 갈 것인가를 결정해야 했습니다. 제가 고려한 것은 아래 두가지 입니다.

  1. 회사가 나의 강점💪을 살려주는가?

    변성윤님, 김상우님 등 구성원들의 발표 자료나 블로그 글들을 자주 접해서 쏘카 데이터 그룹은 멋진 분들이 계신 곳이라는 생각이 들었습니다. 저는 ‘제가 배우고 싶은 멋진 분’들과 일할 때 더욱 좋은 성과를 보이는 사람이라고 생각해서 쏘카가 저의 강점을 살려주는 곳이라고 생각했습니다. 또한 데이터 그룹의 인원 규모가 매년 커지고 있는 점을 보고 데이터 기반의 업무 문화를 만들려는 회사의 의지를 보여준다고 생각했습니다.

  2. 회사의 사업 분야🚙가 나에게 매력적❣️인가?

    혹시 통학하시는 분?🖐️ 저 또한 프로 통학러인데요, 학부 2학년부터 3년 간 왕복 3시간 반 통학을 해왔습니다. 시간, 돈, 앉아 갈 수 있는지 등 통학에서 가장 중요하게 여기는 점들은 사람마다 다른데, 이에 비해 선택할 수 있는 교통 수단은 제한되어 있다고 느꼈죠. 자연스럽게 소비자의 욕구를 더 잘 충족시킬 수 있는 다양한 이동 수단에 대해 관심을 가지게 되었습니다. 🚇🚌🚕🚲

    기존 렌터카 산업은 ‘자차를 사용할 수 없는 여행지에서 차량을 대여해주는 서비스’로 정의됩니다. 그러나 쏘카의 카셰어링 서비스는 ‘일상 생활에서 언제든지 편하게 사용할 수 있는 이동 수단’으로 변모하며 사용자에게 새로운 교통 수단을 제공하고 있고, 앞으로 소유의 개념이 약해지면서 이런 수요가 더욱 증가하리라 생각했습니다. 또한 공유 기반의 차량이 서울의 교통 문제를 해결할 수 있을 것이라는 믿음이 있었죠.

따라서 쏘카에 지원하기로 결정했습니다. 🚗

학과 건물에서 바라본 서울의 야경. 저 멀리 밝게 빛나는 세상이 어떻게 돌아가는지 궁금해하곤 했습니다.




2) 회사와 첫 만남 : 면접은 어떻게 진행되었나요?

지원서 접수 후, 면접은 총 세 차례에 걸쳐 진행되었습니다.

  1. 30분의 전화📞 면접에서는 데이터 분석과 관련한 기본적인 지식 수준을 물어봅니다.
    • 데이터 관련 전반적인 내용을 잘 이해하고 있는지 물어보는 질문이 많았고, 깊이 있게 이해하고 있는지 등을 물어보는 질문도 있었습니다.🧐
  2. 첫 대면 면접은 1시간 30분 ~ 2시간 정도 진행됩니다. 간단한 코딩 테스트를 보고 지원서에 적은 내용을 바탕으로 심층적인 면접을 진행합니다. 코딩 테스트는 알고리즘 구현, SQL 등의 테스트가 있었습니다.
    • 대면 면접은 코딩 테스트와 심층 면접으로 이루어졌습니다.👀 코딩 테스트에서는 알고리즘 문제가 주어졌기 때문에, 최대한 논리 전개 과정을 잘 설명하면서 문제를 풀었습니다. 이후엔 심층 면접이 이어졌습니다. 저는 주로 수업에서 진행한 프로젝트에서 제가 맡았던 부분과 협업 과정을 중심으로 이야기했습니다. 프로젝트 주제, 분석 방법 선정 등 여러 단계에서 왜 이런 선택을 했는지에 대한 사고의 흐름도 설명했죠. 또한 머신러닝 관련한 학부, 대학원 수업을 찾아 들으며 데이터 분석에 대한 관심을 꾸준히 키운 점도 어필했습니다.💬
    • 또한 교통과 관련한 여러 아이디어를 제안했습니다. 쏘카에 지원하던 당시 교통공학 수업을 수강해 교통과 데이터를 접목하면 유의미한 시너지 효과가 날 수 있다는 것을 알게 되었죠. 예를 들어 정부에서 데이터 기반으로 신호등을 운영하고 도로를 어디에 만들지를 결정하는 등 효율적으로 교통 인프라를 구축할 수 있습니다. 그렇다면 공유 차량을 운영하는 쏘카는?🚘 자가용과 대중교통의 장점을 살린 새로운 교통수단을 제공할 수 있습니다. 또한 환승을 자연스럽게 만든다면 각각 존재하던 기존의 교통수단들을 하나로 연결하는 것도 가능합니다. 만약 지하철과 타다, 전동 킥보드가 기다림 없이 환승이 가능하고 필요한 장소에 딱! 존재한다면 더욱 편리한 이동이 가능하겠죠. 이를 가능하게 하는 것은 데이터 기반의 운영이죠. 이처럼 심층면접에서 데이터를 통해 교통을 더 개선할 방안들, 그중에서 쏘카에서 적용 가능한 것들에 대해서 자유롭게 이야기했습니다.
  3. 마지막 대면🤠 면접은 회사의 CTO, 인사 담당자와 함께 1시간 진행됩니다. 지원서 내용을 기반으로 면접을 진행하고, 회사에 대해 궁금한 점도 자유롭게 질문할 수 있습니다.

전화 면접을 봐주셨던 디케이 데이터 그룹장님

결과는? 데이터 그룹장님, 전략팀장님 등 주요 회사 구성원들 앞에서 ‘아이디어를 쏘카에서 실현하기 위한 구체적인 방안’에 대해서 발표하게 되었습니다. 아래와 같은 꼼꼼한 코멘트도 받았습니다. 👩‍🏫 👨‍🏫

  • 이런 법적인 이슈들이 있어 이 아이디어는 구현이 힘들 수 있습니다.
  • 이 아이디어는 회사에서 이렇게 시도를 해 보았는데, 이런 결과가 있었습니다.
  • 회사의 이 부분에 이 아이디어를 이렇게 적용해볼 수 있을 것 같습니다.

아이디어를 자유롭게 시도할 수 있는 학교 프로젝트가 1차 방정식이라면, 회사의 경우 여러 법적인 제약과 사업성을 모두 고려한 고차 방정식이란 것을 알 수 있었습니다. 연차에 관계없이 구성원을 모두 존중하는 회사라는 것도 느낄 수 있었죠.😊 (입사 후에는 이렇게 자리를 만들어 주셨던 이유를 알게 되었습니다. 하고 싶은 것이 많고 열정이 클수록 때로 쉽게 실망하는 법이죠. 따라서 제가 회사의 사업 범위가 제한되어 있다고 느끼지 않고 회사 생활에 만족할 수 있도록 자리를 만들어 주셨다고 합니다. 이 이유를 듣고 더욱 회사를 신뢰할 수 있게 되었습니다)

그렇게 3번의 면접을 통해 2019년 11월 4일, 첫 출근을 하게 되었습니다. 🚃

입사 전후로 많이 도움을 주신 동아리 선배님들. 현재 같은 동아리에서 6명이 쏘카에서 함께 일하고 있습니다.




입사 후

1) 쏘카 데이터 그룹 인턴은 어떤 일을 하나요?

저는 타다데이터팀으로 입사했습니다. 타다데이터팀의 주 업무는 타다 서비스를 효율적으로 운영하기 위한 데이터 분석과 모델링입니다. 첫 두 달은 학교 수업 및 졸업 프로젝트를 병행하기 위해 주 4일 출근하며 회사에 적응했습니다. 저장되어 있는 데이터의 체계와 종류를 파악하고, 노션에 정리된 기존 업무를 훑어보았습니다. 12월부터는 본격적으로 업무를 시작했습니다. 🔥

저는 무엇보다 인턴과 정직원 구분 없이 모두 주도적으로 업무를 수행한다는 점이 좋았습니다. 업무를 할 때, 정규직과 인턴을 따로 구분하지 않습니다. 저는 공항을 오가는 ‘타다 에어’✈️ 서비스를 담당해 데이터를 활용한 운영 방안을 제공하는 역할을 맡았습니다. 예를 들면 아래와 같습니다.

  • 2019년 설 예상되는 타다 에어 사용자는 n명이고, 따라서 m대의 차량을 인천공항에 배치해야 합니다.
  • 타다 에어가 98%의 확률로 예약 시각에 늦지 않기 위해서 최소 t분 전에 사용자에게 이동해야 합니다. 해당하는 t의 계산법은 … 입니다.

사용할 데이터 종류, 알맞은 분석 방법을 결정하는 것부터 관련 운영 부서와 커뮤니케이션하는 모든 과정을 직접 진행했습니다. 데이터 분석이 운영에 접목되는 과정과 전반적인 업무 방식을 알아 갈 수 있었죠. 또한 제가 제공한 데이터로 인한 결과를 즉각적인 운영 지표📈로 확인 할 수 있었고, 따라서 맡은 업무에 대해서 더욱 책임감을 가질 수 있었습니다.

제가 입사한 타다데이터팀. 입사 후에 정말 많은 도움을 받았습니다. 그중에서도 오른쪽에서 두번째 초록색 옷을 입은 분이 카일 팀장님.




2) 쏘카 데이터 그룹은 어떤 일을 하나요?

이후 2020년 3월부는 데이터 사이언스팀으로 이동해 쏘카 관련 업무를 수행했습니다.🚗 데이터 사이언스팀은 쏘카 운영 결정을 위해 필요한 데이터를 분석하고, 사업팀과 자주 회의하며 의견을 조율합니다. 저는 수요 예측 및 증감차, 가격이 적절한지 판단하는 업무를 했는데 예를 들면 아래와 같습니다.

  • 쏘카의 수요는 크게 5가지로 나눌 수 있습니다. 각 Trend를 분석했을 때, 코로나로 인한 영향을 가장 많이 받은 수요는 b이며, 지역으로는 g입니다. 수요를 나눈 기준은 아래와 같습니다.
  • 과거의 데이터를 기반으로 보았을 때, 2020년 4월에는 서울 강남구에는 n대, 서초구에는 m대 … 증차하는 것이 손익을 가장 최대화할 것으로 예상됩니다.
  • 강릉 KTX 역에 있는 쏘카존을 앱에서 클릭한 사용자 중에 p%는 이웃한 z번 쏘카존을 클릭합니다. 따라서 성수기 강릉역 증차 시에 함께 증차해야 합니다.

위와 같이 데이터 사이언스 팀은 전반적인 운영 결정을 최적화합니다. 외에도 머신러닝/딥러닝 모델을 만들고 운영하는 데이터 모델링팀, 쏘카 비즈니스 전반을 통해 나아갈 방향을 결정하는 비즈니스 데이터팀, 데이터 분석을 쉽게 할 수 있는 데이터 인프라를 만들어주는 데이터 엔지니어링팀, 데이터 기반 오퍼레이션 자동화를 담당하는 데이터 오퍼레이션팀이 있습니다.🏢 🏢

저는 요즘 개인 프로젝트로 강화학습 모델을 사용해 적절한 가격💰을 찾는 모델을 만들고 있습니다. 책과 논문을 읽고, 구현된 오픈소스 코드를 이해하는 등 공부가 많이 필요한 프로젝트입니다. 현재까지 운영되어 왔던 방식을 개선하면서 동시에 안정적인 모델을 만들어야 하므로 난이도가 높은 편이죠. 하지만 회사에서도 집중할 수 있는 환경을 제공해주고, 도움을 받을 수 있는 외부 강화학습 전문가를 초빙하는 등 적극적으로 지원해주고 있습니다. 무엇보다 적성에도 맞아 즐겁게 임하고 있습니다.

출근 후, 하루의 일정을 확인하는 모습. 사진 잘 찍어주신 데이터 엔지니어링팀 제프 감사합니다.




3) 데이터 분석에서 무엇이 중요한가요?

데이터를 보다 보면 마치 눈👀을 감고 코끼리🐘의 다리, 발, 코를 만지고 있는 기분이 들 때가 있습니다. 데이터는 현상의 작은 부분만 설명하고 있고, 직접적인 현상은 데이터를 조합하여 분석가가 유추해야 합니다. 따라서 분석가의 사전 지식과 분석 방법, 시각화 방법에 따라 데이터는 다양하게 해석될 수 있습니다. 백문이 불여일견!🙂 예시를 준비했습니다. 예시들은 모두 제가 임의로 만든 데이터입니다.

야마니는 서울의 각 쏘카존을 모니터링하면서, 각 존별로 증차량과 감차량을 결정하는 일을 맡게 되었습니다. 이 때, 한양대 옆에 위치한 쏘카존의 이용 시간이 감소하고 있는 것을 포착하게 됩니다. 다른 서울의 쏘카존들과 비교해보면 그 감소폭은 더욱 두드러집니다. 그럼 한양대 옆 쏘카존(줄여서 한양대존)의 차량 수를 줄여야📉 할까요?

하지만, 한양대존의 매출을 확인해보니 오히려 증가했다는 것을 확인할 수 있었습니다. 이용 시간은 줄었지만 시간당 매출이 높아지면서 매출이 증가한 것으로 보입니다. 그럼 한양대존의 차량 수를 늘려야 할까요? 그런데 왜 이렇게 매출이 급격히 오른 걸까요? 답을 찾기 위해 정리된 과거 분석 결과를 살펴보던 중, 연령 별로 시간 당 매출이 많이 차이가 난다는 것을 알게 되었습니다.📜

그렇게 한양대존의 매출을 연령 별로 나누어 살펴보니, 20대는 감소하고 30대 이상은 증가했다는 것을 확인했습니다. 대학교의 비대면 수업으로 인해 20대의 사용량이 줄고, 30대 이상은 출퇴근 시의 쏘카 이용이 증가한 경향이 반영된 것으로 보입니다. 그러면서 자연스레 존의 전체 사용량은 줄었지만 매출은 증가하는 현상이 나타났던 것입니다.

이 때, 운영을 담당하시는 분이 사실 한양대존의 증가한 30대 이상의 수요는 뚝섬 근처에서 발생했을 것이라고 알려주시죠.🤔 한양대존 사용자들이 어디서 예약을 했는지 위치를 살펴보니, 뚝섬 근처의 업무 지구였습니다. 또한 뚝섬의 쏘카존(줄여서 뚝섬존)은 차량이 매우 부족한 상태라는 것도 확인할 수 있었습니다. 뚝섬존의 차량이 부족하게 되자, 중랑천 너머의 한양대존까지 쏘카를 빌리러 오는 것이었죠.🏃‍♂️

이제 확실해졌습니다. 증차가 필요한 곳은 한양대존이 아니라 뚝섬존📈입니다. 한양대존의 차량도 뚝섬존으로 옮기는 것이 맞아 보입니다.

그림과 함께 예시를 들어 살펴보았습니다. 실제로는 개별 쏘카존을 살펴보기 보다는, 전체 쏘카존을 분석하고 정량적인 예상 매출, 손익을 비교하여 최종적인 증차 쏘카존과 증차량을 결정합니다. 하지만 위의 예시를 통해서 데이터 분석에서 1. 꼼꼼한 문서화와 2. 동료들과 업무 공유 및 논의가 매우 중요하다는 것은 확실히 알 수 있습니다. 🚚




4) 쏘카 데이터 그룹은 어떻게 일하나요?

쏘카 데이터 그룹에서는 노션을 활용하여 업무를 기록합니다. 업무를 잘 기록하기 위해서는 꼼꼼히 내용을 정리하는 것도 필요하지만, 짜임새 있게 잘 정리하는 것도 중요합니다. 우선 하나의 프로젝트는 여러개의 태스크로 이루어져 있고, 태스크 간의 발전 과정을 한눈에 파악할 수 있도록 정리해야 하죠.📋 또한 태스크와 프로젝트에서 반드시 적어야 하는 사항들, 예를 들어 일정, 업무 적용 방법, 정량적 평가 방법 등을 포함해야 합니다. 이처럼 꼭 필요한 항목은 템플릿으로 저장하여 통일된 형식📝으로 정리합니다.

노션 사용과 관련한 내용은 노션에서 진행한 쏘카 데이터 그룹의 노션 사용기를 참고해주세요 :)

쏘카 데이터 그룹에서 사용하는 프로젝트와 태스크 템플릿. 프로젝트는 큰 그림을 파악할 수 있고, 태스크는 각 프로젝트 단계를 더 자세하게 기록하고 있습니다.

노션 칸반을 이용해 태스크를 단계 별, 팀 별, 프로젝트 별로 한눈에 파악할 수 있도록 정리합니다.

또한 ‘데일리 스크럼’과 ‘주간 정기 회의’를 통해 업무 공유 및 회의를 진행합니다.

  • 데일리 스크럼 : 매일 아침 출근 후 ‘데일리 스크럼’ 시간에는 각자 하루의 업무를 공유합니다.🗣️ 같은 팀 사람들이 어떤 업무를 하고 있는지 알 수 있고, 만일 관련한 데이터를 이미 살펴본 동료가 있는 경우 도움을 받을 수 있습니다.
  • 주간 정기 회의 : 1주일에 한번 진행되는 주간 정기 회의는 일주일간 업무 진행 상황을 공유하는 시간입니다. 🙋‍♀️🙋‍♂️ 지난주와 대비해서 업데이트된 사항을 간단하게 적어 정기회의 전에 공유합니다. 이 후 회의 시간에 각자 프로젝트 진행 상황과 분석 결과를 자세하게 설명하면서, 팀 동료들과 함께 논의합니다.

이처럼 매일 간단하게, 매주 자세하게 팀 동료들과 업무를 공유하고 피드백을 받습니다. 과정에서 동료들과 서로 도움을 주고 받고, 좋은 인사이트를 나누게 되죠.👍




5) 쏘카 데이터 그룹은 어떤 문화가 있나요?

업무 이야기할 때 빠질 수 없는 것이 사내 문화입니다. 쏘카에서는 매달 대표가 직접 회사의 방향성을 전 직원에게 공유하는 ‘타운홀 미팅’을 진행합니다.👨‍🏫 회사 비즈니스에 대한 큰 그림을 설명하고, 각 부서의 업무와 신사업에 대해서도 소개합니다. 타운홀은 전체 구성원들이 하나의 목표를 공유하고 유기적으로 협력할 수 있도록 도와주는 시간이죠. ‘타운홀 미팅’ 외에도 ‘쏘모임’ 이라는 이름으로 사내의 각종 소모임을 지원합니다.

회사 차원으로 이루어지는 프로그램 외에도, 데이터 그룹만의 독자적인 문화도 빼놓을 수 없습니다. 데이터 그룹은 자체적으로 구성원들이 더 가까워 질 수 있도록 다양한 프로그램을 운영하고 있습니다.

  1. 핍스 : 같은 데이터 그룹이라도 팀이 다르고 프로젝트가 다르면 대화의 기회가 많지 않습니다. 따라서 한 달에 두 번 데이터 그룹 내에서 다른 팀분들과 섞여 함께 점심을 먹습니다.🍚 피플 매니저님이 2달마다 조를 바꾸기 때문에 모든 구성원과 골고루 친해질 수 있죠.
  2. 해피아워 : 한 달에 한번 함께 외부에서 여가 활동을 합니다. 🤗 🤣 데이터 그룹원이 돌아가며 자신이 하고 싶은 테마를 선정합니다. 지금까지 영화를 보거나 보드게임을 하고, 가락시장에서 맛난 저녁을 함께 먹는 등 다양한 활동을 함께 했습니다.
  3. 피플 매니저 및 면담 : 데이터 그룹은 피플 매니저가 있습니다.👨‍⚕️ 피플 매니저는 데이터 관련 발표, 블로그를 꾸준히 하고 계신 변성윤님(https://zzsza.github.io/)이 해주고 계십니다. 한 달에 한 번 피플 매니저와 회사 생활의 고민도 이야기하고, 개인의 커리어를 잘 쌓기 위한 방법도 논의합니다. 그 외에 팀장님, 그룹장님과 면담을 하면서 회사에 바라는 점과 업무 외적인 진로 고민을 이야기할 수 있습니다. (저는 회사 입사 후에도 진로 고민이 정말 많았는데, 제가 진정으로 하고 싶은 것이 무엇인지 답을 내릴 때 면담이 많이 도움이 되었습니다)

피플 매니저님과 면담하며 작성해주시는 개인 정보와 업무 정리. 월별 면담 일지를 보면 매달 조금씩 성장하고 있는 것을 한눈에 파악할 수 있습니다.

이렇게 쌓인 사람들간의 친밀도는 업무에도 도움을 주곤 합니다. 저는 수학적 기반이 필요한 업무를 선호하고, 자율적으로 업무를 진행하는 것을 선호합니다. 이를 팀장님, 그룹장님과 이야기하면서 저의 강점을 강조하여 어필했는데, (핍스나 해피아워를 통해 업무 외적으로도 가까워졌기에 솔직하게 이야기할 수 있었다고 생각합니다) 결과적으로 데이터를 수학적 모델로 분석하는 증감차 업무나, 모델 기반으로 가격제 업무 등 적성에 맞는 일을 맡을 수 있었죠. 🚕

데이터 그룹 해피아워 시간에 함께 한 보드게임. 이 날 정말 많이 웃었던 기억이 납니다.




6) 쏘카 데이터 그룹은 어떻게 공부하나요?

회사 생활에서의 가장 큰 고민 중 하나는, 회사의 업무와 개인 성장 사이의 괴리가 아닐까 싶습니다. 특히 데이터 분석 방법과 분석 툴, 프로그래밍은 계속 새로운 것들이 등장하기 때문에 끊임없이 배워야 합니다. 데이터 그룹에서는 구성원들의 자기 개발을 위해 어셈블, 읽쓰정, 세미나, 스쿨 등의 프로그램을 운영하고 있습니다.


어셈블

먼저 ‘어셈블’은 격주로 진행되며 데이터 그룹 전체의 세미나입니다. 2명의 발표자가 각자 30분씩 데이터 그룹 전체를 대상으로 발표합니다. 발표의 주제는 본인이 공유할 가치가 있다고 생각되는 것으로 선정하게 됩니다. 예를 들어 데이터 그룹에서 함께 사용하는 데이터 테이블의 형식과 처리 과정을 설명하거나, 공유하면 유익한 분석 결과를 공유합니다.💁‍♀️ 아래 내용은 제가 분석한 내용을 수정한 예시입니다.

  • 쏘카의 수요는 크게 5가지로 나눌 수 있습니다. 각 trend를 분석했을 때, 코로나로 인한 영향을 가장 많이 받은 수요는 b이며, 지역으로는 g입니다.
  • 활용) 타겟 쿠폰 : 최근 a 수요의 손익이 증가하고 있습니다. 따라서 수요를 장려하기 위해 y 연령 이하, m회 이상 사용자에게 c 쿠폰을 보내야 하고, 예상되는 손익 증가는 주당 ~원입니다.

어셈블에서 쏘카의 수요를 분류하는 방법을 공유하였고, 다양한 업무에도 활용되었습니다. 이처럼 어셈블은 유의미한 내용을 그룹 내에 공유하고, 각자 하는 일에 대해서 알아가는 시간입니다.

어셈블에서 발표한 자료. 데이터 그룹의 여러 프로그램들이 저 스스로의 동기부여에 많은 도움을 줍니다.

제 발표 외에도 데이터 엔지니어링팀의 하디의 “똥 코드 깨끗하게 만들기” 발표도 있었습니다. 파이썬을 클린하게 짜는 방법에 대해서 재치있게 설명해주셔서 매우 재미있었죠. 데이터 사이언스팀의 캐롯이 발표해주신 “수학적 모델링과 최적화”는 비즈니스 문제를 최적화 문제로 바꾸는 과정을 배울 수 있었습니다. 다들 정말 흥미롭게 들었어요! 😍😘




읽쓰정

다음으로는 팀별 스터디인 ‘읽쓰정’이 있습니다. ‘읽고 쓰고 정리하고’의 줄임말인 ‘읽쓰정’은 스스로 공부한 내용을 공유하는 시간입니다.📔 매주 2-3명이 각자 10분 정도 자신이 공부한 내용의 핵심을 설명합니다. 업무 외에 개인적으로 공부한 내용이면 분야와 상관없이 주제로 다룰 수 있습니다. 데이터 관련 다양한 이론과 라이브러리에 대한 설명, 논문 읽는 방법, 책 소개, 논문 리뷰 등 매우 다양한 주제로 진행됩니다. 꾸준히 개인 공부를 하게 도와주는 활동입니다.📚📖




세미나와 스쿨

위의 어셈블과 읽쓰정은 개인이 각자 공부한 내용을 공유하며, 팀에서 진행하는 고정 활동입니다. 반면에 세미나와 스쿨은 함께 공부하며, 선택적으로 참여할 수 있습니다. 세미나의 경우 각자 인프런 강의를 듣고 일주일에 한번 함께 자료를 공부하거나, 함께 코드를 리뷰하는 등 자유롭게 진행됩니다.👯

스쿨은 주최자가 정기적으로 1시간 정도 수업하고, 데이터 그룹에서 원하는 사람들이 참석하는 형식입니다. 통계학을 주제로 한 리미 스쿨이 있었고, 인생관과 신입 교육을 한 카일 스쿨🏫도 진행 중입니다. 저 또한 머신러닝을 주제로 야마니 스쿨을 진행했습니다. 수업을 준비하면서 내용을 더 깊이 이해할 수 있었고, 제가 아는 것을 다른 사람들에게 잘 설명하는 방법에 대해서도 배워갈 수 있었습니다.👩‍🎓👨‍🎓

수업을 위해 만들었던 야마니 스쿨 자료. 10회에 걸쳐 매주 자료를 만들고, 수업을 하면서 내용을 확실히 이해할 수 있었습니다.

업무시간 외에도 공부를 하기 위해 노력하고, 스쿨과 세미나에 적극적으로 참여하는 동료들을 보며 저도 꾸준히 공부하게 됩니다. 이렇게 적극적으로 배우고 나누고자 하는 멋진 동료들과 함께 있다는 것이 쏘카 데이터 그룹의 큰 장점 중 하나라고 생각합니다. 🚀




7) 쏘카 데이터 그룹에서 무엇을 배웠나요?

대학생 때는 수업을 같이 듣는 학과 친구, 같은 학교의 또래 친구 등 주로 자신과 비슷한 사람들을 만나곤 합니다. 하지만 회사에선 연령부터 전공, 살아온 삶이 다른 사람들을 만나게 되고, 자연스럽게 스스로에 대해서 더 잘 알아가게 됩니다.🧘🧘‍♀️🧘‍♂️ 저는 회사에 와서 제가 잘하는 것은 무엇인지, 제가 좋아하는 것은 무엇인지 더 잘 알 수 있었습니다. 아래는 저의 예시입니다.

  • 야마니 스쿨과 어셈블을 통해 사람들 앞에서 발표하고 설명하는 것을 좋아한다는 것을 알 수 있었습니다.
  • 업무에서 복잡한 학습 모델을 정교하게 다듬는 것 보다는 비즈니스의 문제를 효과적으로 풀 수 있는 수학 모델을 구상하는 것을 좋아하고, 이런 업무를 할 때 퍼포먼스가 좋다는 것을 알 수 있었습니다.

자신에 대해 깊게 이해하게 되면서, 회사에서 제가 잘할 수 있는 부분이 무엇인지 고민하게 되었습니다. 대체 불가능한 사람이 되기 위해 무엇을 강화하고 무엇을 보완해야 할 지에 집중하게 되었다고 할까요.🙂

진로, 스스로의 강점, 회사 생활에서 보완할 점 등에 대해서 고민하며 적었던 2020년의 기록들. 회사에서의 경험들이 제가 한 발자국 더 성장하는 데에 많은 도움이 되었습니다.

업무를 다루는 방법에서도 유의미한 발전이 있었습니다. 사실 학교에서는 정제된 데이터를 이용하여 모델을 만들고, 성능 자체보다는 작동원리와 수학적 기반에 집중하는 편입니다. 하지만 실무에서는 노력 대비 최대의 효과를 보여주는 모델을 선택해야 하고, 그 효과가 운영에서 바로 나타날 수 있어야 합니다.⏳⌛

프로젝트의 완성도를 0에서 100으로 표현한다면, 학부 시절의 저는 99에서 100을 만드는 것에 관심이 많았던 학생이었습니다. 현재의 것을 조금 더 개선할 수 있는 발전된 기술을 연구하는 것만이 엔지니어의 역할이라고 생각했습니다. 반면에 데이터 그룹의 업무는 빠르게 0에서 99를 만드는 것으로 설명할 수 있습니다. 완성도를 100까지 올리는 것보다는, 노력 input에 비해 프로젝트 완성도를 효과적으로 올리기 위해 노력하는 것이죠. 즉, 프로젝트 시작부터 운영에 접목하는 전 과정을 최대한 효율적으로 진행하는 것에 집중합니다.📶👨‍💻👩‍💻

노력에 대비한 프로젝트 완성도의 그래프. 처음에는 단위 노력 input 당 완성도 증가량이 크지만(기울기가 가파르지만) 점점 감소하는 것을 볼 수 있습니다.

따라서 저 역시 수요 분석, 증차, 존 관리, 가격제 등 다양한 업무를 맡으면서 손익을 효과적으로 개선하기 위한 방향을 고민할 수 있었습니다. (예시를 들어 설명하는 것이 좋으시죠?👇) 아래는 업무에서 마주치게 되는 여러 고민입니다. ‘종류 1’은 공부를 통해 배울 수 있는 영역이라면, ‘종류 2’는 회사에서 배울 수 있는 영역이라고 생각합니다. 쏘카 데이터 그룹은 두 종류를 모두 배울 수 있는 곳이었죠. 1️⃣➕2️⃣

  • (종류 1️⃣) 어떤 분석 방법을 사용해야 통계적으로 오류가 없을까? 또 데이터의 특성이 잘 드러날까?
  • (종류 1️⃣) 이 문제는 어떻게 수학적으로 모델링하고 최적화할 수 있을까?
  • (종류 2️⃣) 매출에 큰 영향을 주는 수요는 무엇이고, 따라서 어떤 조치를 취하는 것이 좋을까?
  • (종류 2️⃣) 손익을 많이 증가시킬 수 있으려면 어느 지역의, 어느 시기의 가격제를 먼저 개선해야 할까?

또한 여러 업무를 맡는 것은 회사의 사업이 이루어지는 전체 과정을 이해하는 데에도 많은 도움이 되었습니다. 관련한 운영 부서와 잘 협업하는 방법도 배워갈 수 있었죠. 분석 결과를 어떻게 전달해야 실무적으로 잘 활용될 수 있는지, 어떻게 가공해야 사업팀에서 자동화가 쉬울지 등을 고려하게 되었습니다. 🛥️🛳️🚢




마무리


데이터 분야 인턴은 어떻게 준비해야 할까요?

데이터 분야에 관심이 많은 대학생분들께 추천하는 것은 아래와 같습니다.

인턴 결정 단계에서! 🌱

  • 어떤 일을 왜 하고 싶으신지 진지하게 고민해보세요.
    • 앞으로 일을 해야 하는 시간은 길어요. 우리는 왜 데이터 관련 일을 하고 싶은지, 나아가 더 자세히(데이터 분석가, 데이터 엔지니어, 데이터 사이언티스트, 비즈니스 분석가 등) 왜 하고 싶은지 등을 고민하면 좋을 것 같아요.
  • 대학원 진학을 생각하더라도, 인턴 경험을 해보면 좋아요.
    • 인턴십은 회사의 조직이 어떻게 구성되어 있는지, 회사가 어떻게 운영되는지 직접 볼 수 있는 좋은 기회입니다. 또한 산업에서 실제로 사용하는 데이터를 사용해 볼 수 있는 기회에요.
  • 지원하는 회사에서 인턴이 맡는 업무를 정확히 파악하면 좋습니다.
    • 인턴에게 주도적인 업무를 주지 않는 경우가 많으니 꼭 확인해야 합니다. 회사 이름보다는 업무가 중요합니다.
  • 업무를 조금이라도 경험하고 싶다면 기간은 최소한 4~6개월 이상을 추천합니다.
    • 만일 회사의 분위기만 대강 파악하는 것이 목표라면 아예 방학에 짧게 진행하는 것이 좋습니다. 업무를 경험하고 싶다면? 최소 4~6개월은 필요한 것 같아요.

인턴 준비 과정에서! 🌿

  • 데이터 분석 분야라면 SQL의 기본적인 문법은 숙지하는 것을 추천해요.
    • 회사마다 구체적인 데이터 관리 방법은 다르겠지만 기본적으로 데이터는 Database에 있고, 그 데이터를 추출하기 위해 SQL이 많이 사용됩니다.
  • 면접 전에 데이터를 통해 회사가 부가적으로 얻을 수 있는 수익은 무엇일지 생각해보면 좋습니다.
    • 회사는 데이터 분석 자체가 목적이 아닌 수익 창출이 궁극적인 목표입니다. 따라서 비즈니스를 함께 고민할 줄 아는 분석가, 문제 정의를 할 줄 아는 분석가를 선호할 수밖에 없죠.
  • 왜 이 회사를 지원했는지, 회사에서 희망하는 바가 무엇인지 생각해봐도 좋아요.
    • 회사에서 자주 나오는 질문 중 하나인데, 왜 회사를 지원했는지 회사의 어떤 점이 끌렸고, 어떤 일을 하고 싶은지 등을 미리 고민해보면 좋아요.

부족하지만 최대한 추천하기 위해 노력했는데, 꼭 여러분께 도움이 되었으면 좋겠습니다. 😊😋




앞으로 계획은 무엇인가요?

원래 계획대로라면 저는 2020년 9월에 대학원에 입학할 예정이었습니다. 공부가 재미있었고 주체적으로 연구하는 방법을 배우고 싶었습니다. 쏘카 인턴을 지원한 것은 세상을 조금 경험하고 대학원에 가기 위해서였죠.

쏘카 데이터 그룹에 온 후로 책이나 논문으로 정의되지 않는 것을 익히게 되었습니다. “쏘카 데이터 그룹에서 무엇을 배웠나요?”에서 설명해 드린 것처럼 실무적인 부분들, 즉 손익과 매출의 측면에서 문제를 바라보는 관점을 배울 수 있었습니다. 동시에 “쏘카 데이터 그룹은 어떻게 공부하나요?”에서 설명한 것처럼 업무 외적으로 스터디나 스쿨에서 배우는 것도 많았죠. 즉, 쏘카 데이터 그룹에서 저는 업무 실력을 향상시키고 공부를 병행하는 습관을 기를 수 있었습니다.

인턴쉽이 마무리될 즈음 진로 고민도 많아졌습니다. 특히 제가 10년, 15년 후에 어떤 사람이 되고 싶은지 깊이 생각해 보았죠.

  1. 비즈니스 센스가 있고 + 산업의 니즈를 연구 결과로 만족시켜 줄 수 있는 연구자
  2. 연구 관리 능력을 갖추고 + 비즈니스에 알맞는 기술 전략을 수립하는 사업가

2번, 사업가가 되고 싶다는 결론을 내릴 수 있었습니다. 이 경우, 연구를 잘 관리하는 것도 필요한 능력입니다. 하지만 회사의 비즈니스를 정확하게 파악하고 수익성 있는 결정을 내리는 능력이 가장 중요합니다. 따라서 현재 쏘카에서 배우는 것들이 너무 소중했고, 멋있는 동료들과 많은 것을 배울 수 있는 쏘카에서 정직원으로 함께하기로 결정했습니다.🎊🎊

현재 목표는 회사에서 실력으로 신뢰를 줄 수 있는 사람이 되는 것입니다. 점차 회사의 다양한 사업에도 참여하고 개인적으로도 꾸준히 공부해서 분석 실력과 업무 실력을 두루 갖춘 엔지니어로 성장하는 것이 다음 목표입니다. (이렇게 블로그 글에 호언장담했으니 열심히 하는 것만 남았네요😁) 그렇게 하나씩 쌓아가는 과정이 즐거움 아닐까요?😊😋 인생의 목표은 언제든지 바뀔 수 있다고 생각합니다. 저 또한 과거에 수많은 여러 꿈들이 있었고 여러분도 마찬가지일 테지요. 중요한 것은 자신이 진정 원하는 길을 위해 꾸준히 노력하는 것이라고 생각합니다. 때론 막연하고 두렵겠지만 의미 있는 도전을 이어가다 보면 어느새 훌쩍 성장해 있는 여러분을 발견할 수 있을 거예요.🍀

쏘카 데이터 그룹 채용에 관심 있다면 저희 채용 페이지에 방문하셔서 공고를 확인해주세요. 데이터 분석가/데이터 사이언티스트, 데이터 엔지니어, 비즈니스 분석가 등 상시 채용 중입니다!

긴 글 읽어주셔서 감사합니다. 혹시 제가 작성한 내용에 궁금하시거나 다른 내용이 있다면 말씀해주세요! 추후엔 머신러닝과 AI 관련한 글로 찾아뵙겠습니다!



쏘카는 언제나 쏘카 서비스를 함께 만들며 기술적인 문제를 함께 풀어나갈 능력있는 개발자/디자이너/기획자/데이터 사이언티스트 등을 모시고 있습니다. 자세한 내용은 쏘카 채용공고 페이지를 확인 부탁드립니다 :)