코로나 바이러스(Covid-19) 영향으로 언텍트(비대면) 시대가 활성화되면서 우리의 삶에서 데이터 수집과 분석이 얼마나 중요한지 피부로 느낄 수 있는 시대에 살고 있다. 특히 4차 산업혁명으로 현재의 데이터는 원유라고 불릴 만큼 비중이 커지면서 자연스럽게 데이터 전문가의 중요성이 부각되고 있다. Woolworths Group(Countdown모기업) 데이터 사이언티스트(Data scientist)로 근무하고 있는 김진용(Steve Kim)씨를 만나 보았다.
데이터 사이언티스트(Data scientist)로 활동
Woolworths Group(카운트다운의 모기업)에서 데이터 사이언티스트(Data scientist)로 근무하고 있다. 현재 빅데이터 분석팀에서 1년 넘게 근무하고 있으며 그 기간동안 물류, 가격, 프로모션, 마케팅, 오퍼레이션, 파이낸스 등 다방면의 부서들에게 빅데이터를 활용한 최적화된 솔루션을 제공하고 있다. 각 부서의 임원들에게 본인이 만든 통계학 모델이 기존 방법보다 왜, 그리고 얼마나 좋은지에 대한 프레젠테이션도 많이 하고 있다. 올해에는 코로나로 인해서 온라인을 통한 주문(order)이 폭발적으로 증가하고 있는데 원할 한 재고관리를 위해서 수요를 미리 예측해야 하는 것이 굉장히 중요해졌다. 따라서 이와 관련 예측 알고리즘도 본인의 주도하에 개발하고 있다.
우연한 기회였지만 철저한 준비로
오클랜드 대학을 졸업하고 전공(통계와 수학)을 제대로 살리지 못한 채 평범한 회사원으로 일하고 있었다. 하지만 지난 2015년 뉴스를 통해서 4차산업 혁명에 대한 글을 접하게 되면서 많은 변화가 생겼다. 그 후에 다니게 된 회사에서 데이터 사이언티스트(Data scientist)로 일하는 동료를 알게 되었고 그가 하는 일을 지켜보면서 그 직업에 대한 흥미를 갖기 시작했다. 그리고 알게 된 중요한 사실은 데이터 사이언티스트(Data scientist)라는 직업이 본인이 전공했던 수학과 통계학 지식이 굉장히 많이 요구된다는 점이였으며 드디어 내 전공을 살릴 수 있는 기회라고 생각했다. 그 동료와 항상 같이 점심 먹으면서 데이터 사이언티스트의 업무에 대해, 그리고 어떻게 되는지 많은 대화를 이어 갔다. 또한 그 동료의 매니저이자 회사의 임원인(Chief data scientist)에게 내 자신을 어필하기 위해서 계속 이메일을 보냈다. 어렵게 그와 면담할 수 있었으며 그는 데이터 사이언티스트가 되는 길에 대해 중요한 조언을 해주었다. 먼저 해야 될 것은 데이터 부서에서 데이터를 다루는 스킬(SQL)을 마스터하고 그 후에는 프로그래밍 언어(R, Python)를 마스터한 후, 머신러닝을 익혀서 실생활에 계속 적용하는 훈련을 하라는 조언을 듣게 되었다. 임원(Chief data scientist)의 조언대로 첫번째 관문을 넘기 위해서 구직회사(seek.co.nz)를 통해서 데이터 관련 직종(data engineer, database administrator, data analyst)의 직업을 검색하기 시작했다. 하지만 대부분은 3-5년 이상의 경력이 필수라고 되어있으며 주니어 레벨을 뽑는 회사는 단 한군데도 없었다. 이는 현재도 거의 비슷한 상황이며 그 이유는 데이터라는 것은 회사에서 가장 중요하고 민감한 자산이기 때문에 대부분 경력 있는 사람만 다루게 하기 때문이다. 처음부터 아주 큰 난관에 빠졌다. 이대로 포기해야만 하는 순간이었지만 우연한 기회가 찾아왔다. 회사 데이터팀의 팀장(lead)이 해당 직원들에게 데이터를 다루는 핵심 언어(SQL) 자격증을 취득하라는 이야기를 듣게 되었다. 마이크로소프트에서 주관하는 해당 시험은 SQL 2-3년 경력자가 몇 달 공부해야 만 통과할 수 있는 나름 난이도 있는 시험이었다. 데이터팀 부서 직원들에 한해서 그 자격증을 따고 싶은 사람들만 회사에서 온라인 수업료와 시험 비용을 지불해주겠다고 하였다. 당연히 본인에게는 해당이 안되었다. 하지만 근무 후 저녁, 주말에 거의 매일 본인의 사비를 들여서 SQL을 공부하였으며 마침내 3달만에 자격증을 취득할 수 있었다. 그때 당시 그 자격증을 갖고 있는 사람은 회사 직원들 중 유일했다. 데이터 직원(Data lead)이 사실을 알게 되었지만 아쉽게도 이미 데이터 부서는 보충 인원이 필요 없을 정도로 정원이 차 있었다. 하지만 이 기회를 놓칠 수는 없었다. 일단 무보수로 몇 달 동안 일하면서 SQL실력을 키우게 되었다. 목표를 위해서 한걸음 나아가니 그 다음부터는 큰 자신감이 생겼으며 데이터 사이언스(data science) 관련 자격증도 하나둘씩 모으기 시작했다. 또한, 온라인 대회(data science competition)에 참가하면서 Github를 통해 포트폴리오를 꾸며 나아가며 내공을 쌓았다. 그 후 여러가지 크고 작은 프로젝트에 참여하였으며 마침내 꿈에 그리던 데이터 사이언티스트(data scientist) 타이틀을 달게 되었다.
4차산업 혁명의 핵심 분야, 데이터 전문가
4차산업 혁명의 핵심 분야는 <빅데이터>와 <AI>인데 이 두 분야를 동시에 다루는 전문가를 데이터 사이언티스트(Data scientist)라고 한다. 즉, 빅데이터로 저장되어 있는 과거 기록을 분석, 통계, 프로그래밍의 기술을 활용해 컴퓨터가 스스로 학습할 수 있는 알고리즘을 만들고(머신러닝) 이를 통해서 미래를 예측하거나 최적화된 솔루션을 제시하는 것으로 요약할 수 있다. Covid-19으로 인해서 언텍트 시대가 열리면서 우리는 이제 완전히 4차산업혁명의 시대로 진입하게 되었으며 자연스럽게 데이터 전문가들의 중요성이 이전보다 훨씬 중요해졌다. 우리가 알고 있는 대부분의 IT기업들은 데이터 전문가들을 적극적으로 활용하고 있다. 각종 SNS및 동영상 플랫폼에 있는 추천기능, 택시플랫폼에 있는 시간 예측기능, 전자기계에 탑재되어 있는 소리, 이미지 인식기능, 자동차 자율주행 기능 등등 우리가 사용해본 적이 있거나 곧 사용하게 될 기술들은 전부 과거 데이터를 활용하여 머신러닝으로 만들어진 결과물이다. 또한 많은 기업들이 경영 또는 운영의 난관에 대해서 과거에는 비즈니스 매니저들의 경험과 노하우를 통해서 일(decision making)을 했으나 이제는 점점 데이터 분석을 통한 데이터 주도형 해결책(Data Driven Solution)을 내리고 있다. 미국의 아마존(Amazon)이라는 대기업이 데이터 전문가들을 적극 활용하여 물류와 이커머스에 큰 혁신을 일으킨 것으로도 유명하다.
한인 후배들에게 한마디
본인이 데이터 사이언티스트가 되기 위해서 많은 난관을 넘었다. 하지만 그럴 때마다 내가 데이터 사이언티스트되어서 많은 알고리즘을 만들고 있는 내 모습을 상상했다. 그리고 데이터 사이언티스트로서 세상을 위해 일을 하는 내 모습을 상상했다. 그러자 위기가 기회로 보이는 경우도 생겼으며 그 기회를 놓치지 않았다. 내 모토는 “노력하는 자는 즐기는 자를 이길 수 없고 즐기는 자는 자신보다 목표가 뚜렷한 자를 이길 수 없다”이다. 아직은 내가 많이 부족해서 누군가에게 조언해줄 수 있는 단계는 아니지만 한마디 해야 한다면 “목표를 잃지 않고 세상에 감사하면 언젠가는 원하는 일이 이루어진다”이다.
한 발 앞서 있는 데이터 전문가를 위해 노력
데이터 그리고 머신러닝(machine learning), AI 분야는 지금 이 순간에도 새로운 테크놀로지가 나오고 있다. 일단은 시대에 뒤쳐지지 않는 데이터 사이언티스트가 되기 위해 많은 노력을 하고 있다. 인생의 가장 큰 목표는 세상을 이롭게 하는 데이터 사이언티스트의 역할을 하는 선한 영향력을 끼치는 사람이 되는 것이다.
글, 사진: 김수동 기자