확률
- 모든 사건의 확률은 0과 1 사이
- 서로 배반인 사건들의 합집합의 확률은 각 사건들의 확률의 합
- 두 사건 A, B가 독립이라면 사건 B의 확률은 A가 일어난다는 가정 하에서의 B의 조건부 확률과 동일
- 연속형 확률변수는 가능한 값이 실수의 특정 구간 전체에 해당하는 확률변수이며 연속형 확률밀도함수를 가짐
- 확률변수 X가 구간 또는 구간들의 모임인 숫자 값을 가짐
표본조사 유의점
- 표본편의는 표본추출 과정에서 특정 대상이 다른 대상에 비해 우선적으로 추출될 때 생기는 오차
- 표본편의는 확률화에 의해 최소화하거나 없앨 수 있음
- 표본값으로 모집단의 모수를 추정할 때 표본오차의 비표본오차가 발생할 수 있음
- 응답오차, 유도질문 등은 표본조사에서 유의할 점
P-value
- 귀무가설이 사실인데도 불구하고 사실이 아니라고 판정할 때(1종 오류)의 실제 확률
모분산의 추론
- 모집단의 변동성 또는 퍼짐의 정도에 관심이 있는 경우, 모분산이 추론의 대상이 됨
- 정규 모집단으로부터 n개를 단순 임의 추출한 표본의 분산은 자유도가 n-1인 카이제곱분포를 따름
- 모집단이 정규분포를 다르지 않더라도 중심극한정리를 통해 정규 모집단으로부터의 모분산에 대한 검정을 유사하게 시행 가능
- 이표본에 의한 분산비 검정은 두 표본의 분산이 동일한지 비교하는 검정으로 검정통계량은 F분포를 따름
통계적 추론
- 추정: 표본을 이용하여 모집단의 특성치에 대한 추측값을 제공하고 오차한계를 제시하는 과정
- 추정의 목적은 표본통계량에 기초하여 모수의 근사값을 결정하는 것
- 표본 평균을 활용해 모평균을 추정하는 것 등을 예로 들 수 있음
- 신뢰수준 95%의 의미는 모수가 신뢰구간 내에 존재할 확률이 95%라는 것
- 구간추정은 모수의 참값이 포함되어 있으리라고 추정되는 구간을 결정하는 것이며 실제 모집단의 모수는 신뢰구간에 포함되지 않을 수 있음
이산형 확률분포
- 기하분포
- 초기하분포
- 이항분포
- 베르누이분포
- 다항분포
- 포아송분포
연속형 확률분포
척도의 종류
- 명목척도
- 측정 대상이 어느 집단에 속하는지 분류할 때 사용하는 척도
- ex. 성별 구분
- 순서척도
- 측정 대상의 특성이 가지는 서열 관계를 관측하는 척도
- ex. 서비스 선호도
- 비율척도
- 절대적인 기준인 원점 0이 존재하며 모든 사칙연산이 가능
- 순서뿐만 아니라 그 간격도 의미가 있음
- ex. 온도
- 구간척도
- 측정 대상이 갖고 있는 속성의 양을 측정하는 것
- 구간이나 구간 사이의 간격이 의미가 있음
- ex. 나이, 무게 등
비모수적 방법
- 모수적 방법
- 통계적 추론에서 모집단의 모수를 검증하기 위해 사용
- 비모수적 방법
- 모집단의 분포에 대해 아무런 제약을 가하지 않음
- 관측된 자료가 특정 분포를 따른다고 가정할 수 없는 경우 이용
- 분포의 모수에 대한 가설을 설정하지 않고 분포의 형태에 대해 가설 설정
- 관축값의 절대적 크기에 의존하지 않는 관측값들의 순위나 두 관측값 차이의 부호를 이용해 검정 실시
자유도
- 전체 자유도 df = 관측치 - 1
- 그룹 자유도 = 그룹 수 - 1
회귀분석의 가정