카테고리 없음

AdSP 3과목 4장: 통계 분석

sawo11 2025. 2. 18. 22:17

확률

  • 모든 사건의 확률은 0과 1 사이
  • 서로 배반인 사건들의 합집합의 확률은 각 사건들의 확률의 합
  • 두 사건 A, B가 독립이라면 사건 B의 확률은 A가 일어난다는 가정 하에서의 B의 조건부 확률과 동일
  • 연속형 확률변수는 가능한 값이 실수의 특정 구간 전체에 해당하는 확률변수이며 연속형 확률밀도함수를 가짐
    • 확률변수 X가 구간 또는 구간들의 모임인 숫자 값을 가짐

표본조사 유의점

  • 표본편의는 표본추출 과정에서 특정 대상이 다른 대상에 비해 우선적으로 추출될 때 생기는 오차
  • 표본편의는 확률화에 의해 최소화하거나 없앨 수 있음
  • 표본값으로 모집단의 모수를 추정할 때 표본오차의 비표본오차가 발생할 수 있음
  • 응답오차, 유도질문 등은 표본조사에서 유의할 점

P-value

  • 귀무가설이 사실인데도 불구하고 사실이 아니라고 판정할 때(1종 오류)의 실제 확률

모분산의 추론

  • 모집단의 변동성 또는 퍼짐의 정도에 관심이 있는 경우, 모분산이 추론의 대상이 됨
  • 정규 모집단으로부터 n개를 단순 임의 추출한 표본의 분산은 자유도가 n-1인 카이제곱분포를 따름
  • 모집단이 정규분포를 다르지 않더라도 중심극한정리를 통해 정규 모집단으로부터의 모분산에 대한 검정을 유사하게 시행 가능
  • 이표본에 의한 분산비 검정은 두 표본의 분산이 동일한지 비교하는 검정으로 검정통계량은 F분포를 따름

통계적 추론

  • 추정: 표본을 이용하여 모집단의 특성치에 대한 추측값을 제공하고 오차한계를 제시하는 과정
  • 추정의 목적은 표본통계량에 기초하여 모수의 근사값을 결정하는 것
  • 표본 평균을 활용해 모평균을 추정하는 것 등을 예로 들 수 있음
  • 신뢰수준 95%의 의미는 모수가 신뢰구간 내에 존재할 확률이 95%라는 것
  • 구간추정은 모수의 참값이 포함되어 있으리라고 추정되는 구간을 결정하는 것이며 실제 모집단의 모수는 신뢰구간에 포함되지 않을 수 있음

이산형 확률분포

  • 기하분포
  • 초기하분포
  • 이항분포
  • 베르누이분포
  • 다항분포
  • 포아송분포

연속형 확률분포

  • 지수분포

척도의 종류

  • 명목척도
    • 측정 대상이 어느 집단에 속하는지 분류할 때 사용하는 척도
    • ex. 성별 구분
  • 순서척도
    • 측정 대상의 특성이 가지는 서열 관계를 관측하는 척도
    • ex. 서비스 선호도
  • 비율척도
    • 절대적인 기준인 원점 0이 존재하며 모든 사칙연산이 가능
    • 순서뿐만 아니라 그 간격도 의미가 있음
    • ex. 온도
  • 구간척도
    • 측정 대상이 갖고 있는 속성의 양을 측정하는 것
    • 구간이나 구간 사이의 간격이 의미가 있음
    • ex. 나이, 무게 등

비모수적 방법

  • 모수적 방법
    • 통계적 추론에서 모집단의 모수를 검증하기 위해 사용
  • 비모수적 방법
    • 모집단의 분포에 대해 아무런 제약을 가하지 않음
    • 관측된 자료가 특정 분포를 따른다고 가정할 수 없는 경우 이용
    • 분포의 모수에 대한 가설을 설정하지 않고 분포의 형태에 대해 가설 설정
    • 관축값의 절대적 크기에 의존하지 않는 관측값들의 순위나 두 관측값 차이의 부호를 이용해 검정 실시

자유도

  • 전체 자유도 df = 관측치 - 1
  • 그룹 자유도 = 그룹 수 - 1

회귀분석의 가정

  • 독립성
  • 선형성
  • 정규성
  • 등분산성
  • 비상관성