데이터 분석이 하나의 트렌드가 되었다.
IT 업계에서 사용자들을 파악하기 위해 사용되던 것이 구매 전환율을 올리는 데 사용되더니
어느 순간 HR Analytics, People Analytics 등 HR 부서에서의 데이터 분석이 대두되었다.
HR 부서에서 데이터를 분석하는 것은 그리 새로운 일이 아니다.
급여와 근태 업무 시에, 인력 운영을 위해 현업에서 자체적으로 데이터를 파악하고 사용하고 있었다.
물론 그렇지 않은 경우도 많다. 최악의 경우는 데이터를 담당자 로컬 PC에 저장해서 (그것도 1,2년 주기로 담당자가 바뀌는데!) 데이터가 모이지 않은 경우도 많다.
어찌 되었던 ERP 시스템을 사용해서 HR 업무를 진행하는 경우가 많으니, HR 데이터를 적극 활용하는 것은 예정된 수순이었다.
HRD 또한 마찬가지이다.
실무에서는 교육 사전-사후 설문조사, 혹은 성취도 평가를 통한 교육 효과성을 확인해왔고,
주관식 설문의 경우 간단한 텍스트 빈도분석을 통해 데이터를 활용해오고 있었다.
다만 한가지 아쉬운 점은 교육 데이터는 ERP에 업로드가 잘 안되다 보니 더욱 로컬 데이터에 의존하곤 한다.
어찌되었든 HRM, HRD 전반적으로 데이터 분석은 그리 새로운 일이 아니었다.
하지만 이런 사소한 분석은 fancy 하지 않아보이기에,
더 있어보이는 비즈니스 파트너로서 인사이트를 줄만한! 무언가를 원하는 분위기가 형성되었다고 본다.(뇌피셜.)
그도 그럴 것이 마케팅에서는 '그로쓰해킹' 이라며 최신 머신러닝 기법을 사용하여 이해할 수 없는 무언가를 해오는데 HR은 뭘 해야 하는가!
그래서인가, 기본적인 통계 분석 부터 천천히 수행해도 앞으로 1,2년은 할 것이 많은데
우선 당장 가지고 있는 데이터에 머신러닝 기법을 적용해 무언갈 해보려고 한다. (물론 업체를 쓴다. 내가 속한 조직 또한 그렇다.)
객관적인 접근을 수행하기 위해 데이터를 활용한다는 취지엔 찬성하지만
이러한 분석은 대체 '왜' 해야하는가?(Why)
그 분석 결과로 '무엇을' 할 것인가?(What)
그리고 어떻게 현실에 맞게 '적용'할 것인가?(How)
가 명확할 때 데이터를 더 잘 사용할 수 있다.
즉 데이터를 모아서 잘 분석하는 것은 중요하지만, 그 전에 선행될 것은 '왜' 분석해야 하는 지 정의하는 것이다.
왜 분석해야 하는 지 주제가 없으면 EDA(Exploratory Data Analysis : 탐색적 데이터 분석)라는 그럴 듯한 탈을 쓰고
조직간 차이 분석, 직급간 차이 분석을 해보다 현업에 아무런 시사점을 주지 못하고 시간을 지지부진하게 보내게 될 수 밖에 없다.
물론 EDA는 잘만 하면 주제를 잡는데 매우 큰 도움을 줄 수 있다. 하지만 나는... 이것 저것 해보다가 아무것도 하지 못했었다...눈물..
해당 데이터 분석 프로젝트가 힘을 받기 위해선 (혹은 의사결정권자의 관심사병이 되어 강제적으로라도 푸시를 받기 위해선)
경영전략과 연계된 분석 주제를 발굴하는 것이 가장 좋다.
하지만 나와 같은 주니어는 경영전략과 연계된 어마무시한 분석 주제를 발굴하는 것이 어려우니,
본인의 업무에서의 pain point를 해결할 만한 작은 분석 주제부터 발굴해서 수행하는 것이 가장 베스트라고 생각한다.
첫 술에 배부르고자 그동안 HRD의 숙원이었던 HRD의 성과를 측정할 수 있도록 하겠다! 며 접근한다면,
팀장님은 좋아하시겠지만 당장 성과에 영향을 미치는 다양한 혼재변수를 파악하고
신뢰롭지 않은 성과 평과 결과에 대해 원망하다가 1년이 다 가게 될 것이다.
(물론 영업, 생산기술과 같이 교육이 다이렉트로 성과에 영향을 미친다고 전제할 수 있는 직무는 조금 나을 것이다.)
이 글을 쓰는 이유는 내가 배운 것을 정리하고, 혹시나 나와 같은 처지(...)에 있는 누군가를 돕고자 함이다.
2020년 한 해 동안 선례도 없고 사수도 없이 HRD 데이터 분석이라는 업무를 진행했다.
초보 수준의 프로그래밍을 깔짝거리고 데이터 분석도 대학원 시절 해왔지만
회사의 실제 데이터를 다뤄본 적 없는 주니어에겐 HRD 데이터 분석이라는 업무는 자존감 브레이커였다.
그래서 이러한 업무를 어떻게 수행하는 것이 좋은 지, 내가 겪은 시행 착오는 무엇이며 어떻게 극복했는 지 (극복하는 것이 좋았을 지)를 공유하고자 한다.
또한 HR Analytics를 검색 했을 때 나오지 않는 문법과 코드들을 최대한 공유하고자 한다.
사실 Iris 데이터도 참 좋지만, 사용자 구매 데이터도 정말 좋지만 !
HR 데이터를 어떻게 전처리 하는 것이 좋은 지, 전처리 할 때 유용한 문법들은 무엇인 지를
내가 실제로 사용했던 코드를 통해 공유하고자 한다. 물론 코드의 퀄리티는 보장하지 못한다.
지금부터 남기는 나의 회고가 미래의 누군가에겐 큰 도움이 되기를 바라며
주니어 실무자의 고군분투기를 시작해본다.
※작성된 글은 작가 본인의 생각에 기반되어 있거나 보고 들은 것이기에 데이터분석 전문가 분들께서 보았을 때는 부족한 점이 많을 수 있습니다. 수정되어야 하거나 좋은 의견 있으시다면 언제든지 둥글게 둥글게 댓글달아주세요.
'🔏ARCHIVE' 카테고리의 다른 글
나는 왜 이 일을 하는가 (0) | 2020.11.15 |
---|