데이터 리터러시란 | 정의와 역량, 필요성, 활용 방법과 성공 사례

인사이트

데이터 리터러시란 | 정의와 역량, 필요성, 활용 방법과 성공 사례

2023년 06월 29일

우리는 하루에도 셀 수 없을 정도로 많은 양의 데이터와 공존하는 시대를 살고 있습니다. 데이터 분석가, 데이터 사이언티스트, 데이터 엔지니어 등 데이터 분야 종사자가 아니더라도 비즈니스와 생활 영역에서 내가 가진 데이터를 어떻게 활용할 것인지 고민해야 하는 상황을 맞닥뜨리기도 합니다. 따라서 ‘데이터 리터러시’는 이제 우리 삶과 가까운 익숙한 용어인데요.

용어의 뜻을 정확하게 알지 못해도 많은 사람들이 경험하고 있는 ‘데이터 리터러시’의 정의 및 필요 역량, 그리고 필요성, 활용 방법과 성공 사례 등을 자세히 알아보겠습니다.

Unsplash, Claudio Schwarz

데이터 리터러시란

데이터 리터러시 정의

사전에서 정의하는 리터러시(문해력, literacy)는 ‘글을 읽고 이해하는 능력’입니다. 따라서 ‘데이터 리터러시’란 데이터를 읽고 이해한 것을 바탕으로 분석 결과를 전달하는 능력이라고 정의할 수 있습니다.

데이터는 글, 수치, 이미지 등 다양한 형태로 존재합니다. 꼭 데이터 직군 종사자가 아니더라도 데이터 리터러시를 활용할 수 있는데요. 예를 들어, 학습이나 업무의 과제 해결을 위해 자료(데이터)를 조사하고 필요한 부분을 추출하여 발표, 리포트 등의 결과물에 활용했다면 해당 데이터를 이해하고 분석해 문제를 해결한 것이기 때문에 이 또한 데이터 리터러시를 활용한 사례로 볼 수 있습니다.

이처럼 내가 사용하고자 하는 데이터를 이해하고 활용할 수 있다면 데이터라는 명확한 근거를 기반으로 더 신뢰할 수 있는 결과물을 만들어 낼 수 있습니다.

데이터 리터러시 역량이란

데이터 리터러시란, 데이터를 읽고 이해한 것을 바탕으로 분석 결과를 전달하는 능력이라고 정의했습니다. 그렇다면 데이터를 잘 읽고, 잘 이해해서, 잘 활용한다는 건 어떤 것일까요? 데이터 리터러시 역량을 갖춘다는 것은 무엇인지 더 자세히 알아보겠습니다.

데이터 리터러시 역량을 키우기 위해서는 해결하고자 하는 문제를 명확히 정의할 수 있어야 합니다. 데이터를 통해 문제를 해결할 때는 크게 2가지 접근 방법이 있는데요. 원하는 데이터를 수집한 후 이 데이터로 어떤 문제를 해결할 것인지 정의하는 방법과 문제를 먼저 정의한 후 그에 맞는 데이터를 수집하여 문제를 해결하는 방법입니다. 여러분들은 어떤 방법이 더 효과적이라고 생각하시나요?

상황에 따라 다를 수 있기 때문에 명확한 정답이 있는 것은 아니지만 데이터 리터러시 관점에서는 후자가 더 좋은 방법입니다. 만약 전자의 방법을 사용한다면 무지성으로 데이터를 탐색하고, 풀어야 하는 문제를 수집한 데이터에 끼워 맞추는 형식으로 정의를 할 수 있습니다. 문제를 풀기 위해 데이터를 이해하는 것이 아닌 데이터를 이해하기 위해 문제를 만들어내는 일이 발생하는 것입니다.

따라서 어떤 문제를 풀고 싶고, 이 문제를 풀기 위해 어떤 데이터가 어떤 형태로 존재해야 할지 머릿속으로 그려본다면 전자의 방법처럼 무지성으로 데이터를 탐색하여 목적 없이 데이터를 이해하고 활용하려는 상황을 피할 수 있습니다. 또한, 문제를 풀기 위해 해당 데이터를 선택한 이유와 데이터를 분석・활용한 방법을 더 잘 설명할 수 있을 것입니다.

데이터 리터러시의 세부 역량으로는 데이터 수집, 관리, 가공 및 분석, 시각화, 해석 및 기획 역량 등이 있고, 이 모든 세부 역량도 별개의 프로세스가 아닌 명확히 정의한 문제를 풀기 위한 도구로 사용 되어야 합니다.

데이터 리터러시 필요성

기술 발전으로 데이터가 넘치는 시대. 우리는 일상에서도 문제 해결을 위해 관련 데이터를 수집 및 가공하고, 활용할 수 있는 능력이 필요합니다. 또 개인마다 주어진 환경, 삶의 방식 등이 다르기 때문에 같은 데이터를 다르게 해석하는 경우도 많아 우리는 비판적으로 정보를 평가하고 신뢰할 수 있는 데이터를 구별할 수도 있어야 하는데요. 따라서 수많은 정보와 데이터 사이에서 개인의 자기결정력과 문제 해결 능력을 향상시켜주는 데이터 리터러시는 현대 사회의 필수 역량으로 자리 잡고 있습니다.

4차 산업혁명으로 빅데이터가 주목받으며 기업 또한 데이터의 중요성을 깨달았습니다. 기존처럼 경험과 도메인 지식만으로 의사 결정을 한다면 매우 빠르게 변화하는 데이터 산업 흐름에 대응하기 어렵기 때문에 많은 기업이 데이터 부서를 신설하는 등 데이터 중심 사고를 갖기 위해 여러 시도를 하고 있습니다.

기업이 확보한 많은 데이터를 기반으로 의사 결정을 한다면 비즈니스 문제를 더욱 빠르게 파악할 수 있습니다. 또 문제 해결을 위해 어떤 조치를 언제, 왜 취해야 하는지 그 목적과 방법을 훨씬 수월하게 전략적으로 계획할 수도 있죠. 비즈니스 관점에서 데이터를 분석하고 자유자재로 활용할 수 있다면 해당 산업에서 큰 차별점을 갖게 될 것입니다.

데이터 리터러시의 핵심 역량은 문제 정의입니다. 어떤 영역이든 해결하고자 하는 문제, 즉 목적을 뚜렷하게 설정한 후 데이터 수집과 정제, 분석 그리고 결론 도출 등 세부 역량을 발휘해야 데이터 리터러시의 효과를 극대화할 수 있습니다. 개인과 비즈니스 영역 모두 교육을 통해 데이터 리터러시 역량을 강화한다면 빠르게 변화하는 환경에 발맞출 수 있는 발판을 효율적으로 준비할 수 있습니다.

데이터 리터러시 활용 방법

데이터 리터러시를 어떻게 활용할 수 있을까요? 쉬운 이해를 위해 예를 들어 설명해 보겠습니다. 축구 경기 데이터를 분석하는 A 기업이 B 구단(클라이언트)으로부터 지난 경기 내용을 분석해달라는 요청을 받았다고 가정하겠습니다.

목적 설정

A 기업은 클라이언트 B 구단으로부터 지난 경기 데이터를 분석해달라는 요청을 받았습니다. 하지만 요청이 포괄적이고 범위가 넓기 때문에 해당 구단에 적합한 전술 제시로 목적을 더욱 명확하게 설정했습니다. 단순히 데이터 분석에만 그치면 데이터에서 발견한 사실만을 나열할 수 있기 때문에 클라이언트에게 가장 필요한 태스크를 수행할 수 있도록 전술을 중점적으로 데이터를 분석하기로 한 것입니다.

데이터 선택 및 수집

A 기업은 데이터 분석을 위해 지난 경기 영상에서 11명의 선수 각자의 스탯과 활동 영역, 경기장 환경 등의 정보를 수집하여 데이터 베이스에 저장했습니다. 또 더욱 근거 있는 결과를 도출하기 위해 최근 10개 경기 영상의 데이터를 추가하였습니다.

인사이트 도출

A 기업은 수집한 데이터를 분석한 결과, 여러 사실을 발견했습니다.

  • 첫째, 11명의 선수들이 공을 소유하고 있는 비율의 편차가 매우 심했습니다. 팀의 에이스로 분류되는 선수 한 명이 전체에서 약 20% 비율로 경기 내내 공을 소유하고 있었습니다.
  • 둘째, 수비 지역에서 공격 지역까지의 롱패스 횟수가 많은 것에 비해 공격수가 롱패스를 받아 슈팅으로 연결하는 횟수는 단 3번에 불과했습니다.
  • 마지막으로, 11경기를 치르며 총 2승 3무 6패의 성적을 거두었는데 2승을 기록한 경기 모두 세트피스(코너킥, 프리킥)를 통해 득점한 경기였습니다.

육안으로만 기억하기에는 어렵지만 유용한 내용들을 데이터 분석을 통해 발견한 것입니다. 하지만 여기에서 그친다면 위에서 언급한 것처럼 사실 나열만 한 것일 뿐 ‘전술 제시’라는 목적에 부합하지는 않습니다.

따라서, A 기업은 데이터 리터러시를 기반으로 도출한 인사이트를 바탕으로 B 구단에게 다음과 같은 전술을 제시합니다.

  • 축구는 팀 경기로 성공적인 경기를 위해서는 팀플레이가 중요함. 따라서 한 명의 선수에 의해 경기 결과가 좌지우지되지 않도록 모든 선수가 골고루 공을 소유할 수 있도록 점유율을 높일 것
  • 수비 지역에서 공격 지역까지 이어지는 롱패스 성공률이 낮기 때문에 미드필드 지역의 중간 단계를 거치는 짧은 패스를 활용하여 공격을 전개할 것
  • 세트피스의 득점력이 좋기 때문에 세트피스를 대비한 전술을 다양하게 연습할 것

데이터 리터러시 활용 성공 사례

“to give customers what they want, and get it to them faster than anyone else.”

글로벌 패션 브랜드 자라(ZARA)는 데이터 리터러시를 활용하여 고객이 원하는 것을 누구보다 빠르게 제공한다는 미션을 추구하는 기업입니다. 고객이 원하는 것을 가장 빠르게 실현하는 방법은 실시간으로 고객의 니즈를 파악하여 제품과 서비스에 적용시키는 것일 텐데요.

자라는 매일 소비자와 판매 데이터를 분석해 실시간에 가깝게 디자인과 생산에 반영했습니다. 데이터를 통해 각 지점의 특성, 각 제품의 매출을 파악해 새 제품의 디자인과 생산 물량을 맞춰 빠르게 유통한 것이죠. 이를 통해 유행에 민감한 패션 산업의 중요한 이슈인 재고 관리 비용을 최소화하고 영업 이익률 57%라는 성공 사례를 기록하기도 했습니다.

자라의 예시를 통해서도 우리는 데이터 리터러시를 활용할 때 구체적이고 명확한 문제 정의가 얼마나 중요한지 알 수 있습니다. 단순히 매출을 높인다는 문제 정의만으로 데이터를 활용하려 했다면 그 방향성이 모호했을 것입니다. 하지만 고객 관점의 재고 및 유통 관리라는 명확한 문제 정의가 있었기 때문에 소비자와 제품 간의 특성을 실시간에 가깝게 파악하여 문제를 성공적으로 해결할 수 있었습니다.

지금까지 데이터 리터러시에 대해 알아보았습니다. 데이터 리터러시 효과를 가장 극대화하기 위해서는 문제와 목적을 먼저 명확하게 설정하고 이를 달성하기 위해 데이터를 수집, 활용해야 한다고 여러 번 강조했는데요. 이 글을 통해 수많은 데이터와 공존하는 현대 사회에서 각자의 목적에 따라 필요한 데이터를 얻고, 활용하여 효과적으로 문제를 해결할 수 있는 데이터 리터러시 역량을 쌓을 수 있길 바랍니다.

<참고 자료>데이터 활용 시대의 필수 역량, 데이터 리터러시 제대로 하는 3가지 방법데이터 리터러시 중요성조직의 인력에 데이터 리터러시가 필요한 이유데이터 리터러시 비즈니스 성공 사례4차 산업혁명, 데이터를 읽어내는 ‘데이터 리터러시’4차 산업혁명의 원유, 데이터를 다루는 역량에 대하여데이터 문해력(도서)

이태건・김현승 R&D Learning Architect (인공지능(AI) 부트캠프)
편집 최인성 Content Manager


🚀 비즈니스 성과로 이어지는
데이터 리터러시 기업교육이 궁금하다면?

목록 보기

추천글