주제: 사용자 데이터를 효과적으로 분석하는 법
사용자 데이터를 효과적으로 분석하는 법 | 요즘IT
사용성 평가나 설문 조사 그리고 인터뷰와 같은 사용자 조사는 고객 관점에서의 사업 기회 발굴과 디자인 개선에 대한 인사이트를 제공해 줍니다. 그렇지만 단순히 사용자 조사로 수집된 데이
yozm.wishket.com
요약
1. 기술 통계
: 빈도나 평균과 같은 데이터의 특성을 파악하는 데 활용됨
- 범주형 데이터
- 선호하는 디자인 타입이나 과제 성공 여부 등과 같은 데이터를 분석해 빈도나 백분율과 같은 통계값을 구할 수 있음
- 수치형 데이터
- 만족도나 수행 시간 등을 분석해 평균이나 표준 편차와 같은 통계 값을 구할 수 있음
- 중심 경향 지표
- 참가자의 전형적인 행동을 파악할 수 있는 지표
- ex. 평균, 중앙값, 최빈값
1) 시각화 방법
- 범주형 데이터
- 주로 백분율로 분석해 사용자의 행동이 어느 영역에 많이 분포되는지 확인 가능
- 파이 차트: 직관적인 비율 확인
- 누적 막대그래프: 다수의 비율 확인 용이
- 수치형 데이터
- 주로 평균으로 분석해 사용자의 행동이 어디에서 더 많이 발생하는지 확인 가능
- 막대그래프: 분리된 카테고리에 대한 연속적인 값 표현 ex. 만족도, 시간, 에러 수
- 선 그래프: 연속적인 특성을 가질 때 ex. 연령대, 태스크나 여정 단계
- 이러한 평균에 대한 결과는 신뢰 구간을 통해 더욱 정교하게 해석할 수 있음
- 사용자 데이터
- 사용자 조사 데이터를 좀 더 구체적인 목적으로 활용하기 위한 분석, 시각화 방법
- 방사형 그래프: 특정 대상에 대해 여러 평가 항목들로 비교해 전체적인 경향을 유추하고 싶을 때 활용
- 산점도: 한 쌍의 연속적인 데이터를 수평과 수직 축 상의 좌표 값으로 나타내는 방법으로 서로 다른 두 척도 비교 및 변수 간의 관계 확인 가능
2. 추론 통계
: 표본을 통해 모집단을 추론하거나 가설을 검정하기 위한 방법
- 집단 간의 차이를 밝히는 분석 방법
- ex. t-검정, 분산분석
- 변수들 간의 연관성을 파악하는 분석 방법
- ex. 상관분석, 회귀분석
- 기본 개념
- 모집단: 전체 사용자 집단
- 표본: 사용자 조사의 참가자
- 추론 통계는 이러한 표본으로부터 모집단의 속성을 추정하는 과정
- 이 때, 표본으로부터 수집된 데이터가 모집단을 대표할 수 있는지 검증 필요
- 표본으로 수집된 데이터가 정규성이 확보되는지 확인 (정규 분포인지)
- 30명 이상의 표본이 있다면 정규성을 가정하고 추론 통계 진행
- 흔히 유의 수준 5%로 알려져 있는 p-value가 0.05 이하인지를 확인하여 통계적 유의성 파악
- 통계적으로 유의미하다 = 분석된 결과가 다시 재현해도 반복적으로 나타난다
1) 대표적인 추론 통계 방법
- t 검정과 분산분석
- t 검정: 비교하는 대상이 2개일 때 (A집단과 B집단)
- 아래 이미지의 경우 p-value값이 0.004로 통상적으로 사용하는 유의 수준인 0.05보다 낮기 때문에 통계적으로 유의미하게 개선안의 정확도가 높아졌다고 해석 가능
- 분산분석(ANOVA): 비교하는 대상이 2개를 초과했을 때
- 이러한 경우 p-value가 0.05 이하로 3개 집단 간의 유의성이 검증되었더라도 어느 그룹에서 차이가 있었는지 파악하기 위한 사후 검증 과정(Post-Hoc test) 필요
- t 검정: 비교하는 대상이 2개일 때 (A집단과 B집단)
- 상관 분석과 회귀 분석
- 상관 분석
- 2개 이상의 변수들의 선형적인 관계를 살펴보기 위한 분석 방법
- 상관 분석을 통해 변수들 간의 관계가 유의미한 관련이 있는지에 대한 검증 결과인 p-value값과 상관계수 r값 도출
- 상관계수 r: 변수들 간의 관계가 긍정 또는 부정적인지, 얼마만큼 연관되는지 나타냄
- 에러 수와 수행 시간의 r값이 0.3이라면, 에러 수와 수행 시간 간에 정적 상관성(양의 상관관계)이 있다고 봄
- 상관계수 r: 변수들 간의 관계가 긍정 또는 부정적인지, 얼마만큼 연관되는지 나타냄
- 회귀 분석
- 하나의 종속 변수에 대해 다수의 독립 변수들이 어떻게 영향을 미치는지에 대한 인과 관계 분석
- ex. 가격, 마케팅 비용 등의 여러 요인들 중 매출에 가장 큰 영향을 주는 요인이 무엇인지 분석하는 데 활용 가능
- 회귀 분석을 통해 도출할 수 있는 것
- 회귀 모형의 적합도: p-value
- 모델 설명력: R2
- 각 독립 변수가 종속 변수에 미치는 영향력을 나타내는 회귀계수: Beta
- 아래 이미지의 경우 회귀 모형의 적합성(p-value=0.000)과 높은 설명력(R2=60.4%)으로 의미 있는 결과로 볼 수 있음
- 3가지 요인 모두 AI 스피커 수용에 긍정적으로 영향(Beta)을 미치며 영향력은 유용성 > 사용성 > 의인화 순
- 상관 분석
3. 현업에서 활용하는 법
사용자 조사로 수집된 정량 데이터를 적절하게 분석하고 시각화해 의미 있는 정보를 제공한다면, 의사결정을 효과적으로 지원할 수 있음
- 분석하기 vs 해석하기
- 현업에서는 정량 데이터를 직접 분석하고 시각화한 보고서를 작성해 이해관계자들에게 전달하거나 전달받은 보고서를 해석해 더 나은 서비스를 만드는 데 필요한 고객 인사이트 발굴
- 기술 통계: Excel의 간단한 함수를 통해 빈도나 평균을 구하고 적합한 그래프를 만들어 보고서 작성 가능
- 추론 통계: 심리학적 실험 설계 방법이나 통계 분석과 같은 전문적인 지식과 함께 통계 전용 분석 툴에 대한 활용 기술 습득 필요
- 그래프 생성 시 주의점
- 수직 축의 눈금 크기를 다르게 하거나 밑부분을 생략하지 않아야 함
4. 통계적 유의성과 디자인 의사결정
- 디자인에 대한 사용자의 취향 차이가 크거나 디자인 간 경쟁력 차이가 압도적이지 않을 경우 통계적으로 유의미하지 않은 결과 발생
- 이러한 경우 사용자 유형에 따라 데이터를 분석해 서비스가 타겟으로 하는 사용자 유형이 좀 더 선호하는 컨셉이 무엇인지 파악 가능
- 긍정 답변의 비율이 더 높은 컨셉이 무엇인지 분석하는 것도 또 다른 대안
- 데이터가 바로 답을 말해주지 않는다면 데이터가 수집된 환경에서 포함되어 있지 않았던 맥락적 상황 검토 필요
- 서비스의 방향성
- 변화하는 트렌드
- 사업적인 해석
- 좋은 의사결정에는 데이터가 제공하는 객관성과 함께 이를 해석하는 사람의 직관이 함께 요구됨
공통 인사이트
- 어떤 데이터냐에 따라 효과적인 시각화를 사용하므로써 현업에서 업무시 의견의 신뢰성을 높일 수 있다. 데이터 해석에 주관적인 의견은 불필요하다고 생각했으나 해석하는 사람의 인사이트를 통해 풍부한 의견을 제공할 수 있다는 것을 배웠다. 다양한 자료를 통해 해석하는 능력을 포함하여 개인적인 역량을 기를 수 있다.
- ‘결국은 좋은 의사결정에는 데이터가 제공하는 객관성과 함께, 이를 해석하는 사람의 직관이 함께 요구됩니다.' 라는 문장 인상적. 직관이라는 것은 한순간에 배울 수 있는 것이 아니기 때문에 다양한 데이터를 들여다보고 분석적 사고를 하면서 직관을 기르기 위해 노력하는 것도 중요하겠다.
'아티클 스터디' 카테고리의 다른 글
[아티클] 이커머스에서 고객 지표 이해하는 법 (feat. 태블로) (0) | 2025.02.10 |
---|---|
[아티클] 그 데이터는 잘못 해석되었습니다 (0) | 2025.02.05 |
[아티클] 알라미의 A/B 테스팅 일지 #1 (0) | 2025.01.23 |
[아티클] A/B 테스트 제대로 이해하기⑤: A/B 테스트에 적정한 표본과 주의 사항 (0) | 2025.01.21 |
데이터 분석 캠프 1일차 TIL (0) | 2024.11.25 |