통계란?
통계는 표본을 통해 모집단의 특성을 파악하는 것
통계학에는 두가지가 있다. 기술 통계학 / 추론 통계학
기술 통계학 - 손으로 쓰는 통계
추론 통계학 - 말 그대로 추론한다는 것.
통계분석 절차
모집단에서
-> 표본을 추출하여
-> "통계적 추론" 하여
-> 모수추정치, 검정통계량을 구하여
-> 추론을 하여
-> 모집단 예측을 한다.
기본 용어들
모집단 (Population)
정의 : 파악하고자 하는 대상, 관심의 대상이 되는 모든 개체의관측 값이나 측정 값의 집합.
ex) 전 국민의 평균 수명, 전 국민의 출신 지역 등
표본 (Sampling)
정의 : 통계적 판단을 위해 모집단에서 선택된 작은 집단
모집단이 요리사의 스프라면, 표본은 스프의 한 수저이다.
표본으로 모집단을 추론한다!
모수 (Parameter)
정의 : 모집단의 특성을 대표하는 미지의 상수
통계량 (Statistic)
정의 : 모수 추정을 위해 표본에서 계산되어진 수치
산술평균 or 평균 (Mean)
정의 : 측정된 값들의 합을 측정된 개수로 나눈 값
기호 : μ (뮤, mean의 m에 대한 그리스 문자)
장점 : 모든 값을 반영하여 쉽게 이해가 됨.
단점 : 극단적인 값에 영향이 큼.
중앙값 (Median)
정의 : 측정된 값들을 올림차순으로 정렬했을 때 중앙에 위치하는 값.
장점 : 극단적인 값에 대해 왜곡되지 않음.
단점 : 수학적 특성이 결여됨.
최빈수 (Mode)
정의 : 측정된 값에서 가장 빈도가 큰 값.
특징 : 명목, 서열, 등간, 비율 데이터에서 사용됨.
분산 (Variance)
정의 : 평균과 데이터 값들과의 차이를 제곱한 값의 평균
표준편차 (Standard Deviation)
정의 : 분산에 제곱근을 취한 값
표본의 분산, 표준편차의 계산식의 분모는 n-1이다.
범위 (Range)
정의 : 최대값에서 최소값을 뺸 값
Range = Xmax- Xmin
사분위범위 (Inter Quartile Range)
정의 : 3사분위수에서 1사분위수를 뺸 값
IQR = Q3-Q1
표본 평균 : xBar
표본 표준편차 : s
모표준편차 : σ (시그마) 표준 편차를 줄이는 것이 품질 향상의 핵심!
모평균 : μ(뮤)
수학적인 기호 : 대문자
통계적인 기호 : 소문자
통계분석 절차
통계의 사기?
통계는 깨끗한 학문이지만 사기치려는 사람이 통계를 이용할 수 있다.
-> 샘플링을 원하는 데이터에사 통계를 구하는 경우 데이터를 믿을 수 없음
솔직함과 용감함이 필요!
'배움 - 차근차근 기록하자 > [학습] 통계 🟢' 카테고리의 다른 글
[교육] 기초 통계 교육 - 2.1 정규분포 (0) | 2021.05.26 |
---|---|
[교육] 기초 통계 교육 - 1.3 표본 표준편차 (0) | 2021.05.26 |
[교육] 기초 통계 교육 - 1.1 기초통계량 및 그래프 (0) | 2021.05.26 |
[교육] 기초 통계 교육 - 시작 (0) | 2021.05.26 |
최근댓글