๊ธฐ์ ํต๊ณ ๊ณ์ฐ๊ธฐ๋?
์ด ๋๊ตฌ๋ ๋ฐ์ดํฐ์ ์ ๊ฐ์ฅ ๋ง์ด ์ฐ์ด๋ ๊ธฐ์ ํต๊ณ๋์ผ๋ก ์์ฝํด ์ค๋๋ค. ๋ฐ์ดํฐ ๊ฐ์, ํฉ๊ณ, ํ๊ท , ์ต์๊ฐ, ์ต๋๊ฐ, ๋ฒ์, ๋ถ์ฐ, ํ์คํธ์ฐจ๋ฅผ ๋ชจ๋ ๋ณด์ฌ ์ฃผ์ฃ . ์ซ์ ๋ชฉ๋ก์ ๋ถ์ฌ๋ฃ๊ธฐ๋ง ํ๋ฉด ํต์ฌ ์งํ๊ฐ ํ๊บผ๋ฒ์ ๊ณ์ฐ๋ฉ๋๋ค. ๊ณผ์ ๋ ์คํ ๋ณด๊ณ ์, ์ฌ๋ฌด ๋ถ์, ํ์ง ๊ด๋ฆฌ, ํน์ ๋ฐ์ดํฐ๋ฅผ ๋น ๋ฅด๊ฒ ํ์ธํ๊ณ ์ถ์ ๋ ์ ์ฉํฉ๋๋ค.
์ฌ์ฉ ๋ฐฉ๋ฒ
์
๋ ฅ๋์ ์ซ์๋ฅผ ์ผํ๋ ๊ณต๋ฐฑ์ผ๋ก ๊ตฌ๋ถํด ์
๋ ฅํ๊ฑฐ๋ ๋ถ์ฌ๋ฃ์ผ์ธ์(์: 4, 8, 15, 16, 23, 42). ์
๋ ฅํ ์ซ์๊ฐ ์ ์ฒด ์ง๋จ ์ ๋ถ๋ผ๋ฉด ๋ชจ์ง๋จ(Population)์, ๋ ํฐ ์ง๋จ์์ ๋ฝ์๋ธ ์ผ๋ถ๋ผ๋ฉด ํ๋ณธ(Sample)์ ์ ํํ์ธ์. ์ด ์ ํ์ ๋ฐ๋ผ ๋ถ์ฐ์ \(n\)์ผ๋ก ๋๋์ง \(n-1\)๋ก ๋๋์ง๊ฐ ๋ฌ๋ผ์ง๋๋ค. ๊ณ์ฐ ๋ฒํผ์ ๋๋ฅด๋ฉด ๋ชจ๋ ํต๊ณ๋์ด ๊ณง๋ฐ๋ก ๋ํ๋ฉ๋๋ค.
๊ณต์ ํ๋์ ๋ณด๊ธฐ
ํ๊ท (mean)์ ๋ชจ๋ ๊ฐ์ ๋ํ ๋ค ๊ฐ์๋ก ๋๋ ๊ฐ์ ๋๋ค. $$\bar{x} = \frac{\sum x}{n}$$ ๋ถ์ฐ(variance)์ ๋ฐ์ดํฐ๊ฐ ์ผ๋ง๋ ํผ์ ธ ์๋์ง๋ฅผ ๋ํ๋ ๋๋ค. ๊ฐ ๊ฐ์ด ํ๊ท ์์ ์ผ๋ง๋ ๋จ์ด์ก๋์ง ๊ตฌํด ์ ๊ณฑํ๊ณ , ๋ชจ๋ ๋ํ ๋ค์, \(n\)(๋ชจ์ง๋จ) ๋๋ \(n-1\)(ํ๋ณธ)๋ก ๋๋๋๋ค. $$\sigma^2 = \frac{\sum (x-\bar{x})^2}{n}$$ ํ์คํธ์ฐจ(standard deviation)๋ ๋ถ์ฐ์ ์ ๊ณฑ๊ทผ์ ์์ด ๊ฐ์ผ๋ก, ๊ฒฐ๊ณผ๋ฅผ ์๋ ๋จ์๋ก ๋๋๋ ค ์ค๋๋ค. $$\sigma = \sqrt{\sigma^2}$$ ๋ฒ์(range)๋ ๊ฐ์ฅ ํฐ ๊ฐ์์ ๊ฐ์ฅ ์์ ๊ฐ์ ๋บ ๊ฒ์ ๋๋ค. $$\text{๋ฒ์} = \text{์ต๋๊ฐ} - \text{์ต์๊ฐ}$$
์์ ๋ก ์ตํ๊ธฐ
๋ฐ์ดํฐ์ 2, 4, 4, 4, 5, 5, 7, 9๋ฅผ ์ดํด๋ด ์๋ค. ํฉ๊ณ๋ 40์ด๊ณ \(n = 8\)์ด๋ฏ๋ก ํ๊ท ์ $$40 \div 8 = 5$$ ์ ๋๋ค. ํธ์ฐจ ์ ๊ณฑ์ ํฉ์ด 32์ด๋ฏ๋ก ๋ชจ์ง๋จ ๋ถ์ฐ์ $$32 \div 8 = 4,$$ ํ์คํธ์ฐจ๋ $$\sqrt{4} = 2$$ ๊ฐ ๋ฉ๋๋ค. ์ต์๊ฐ์ 2, ์ต๋๊ฐ์ 9์ด๊ณ , ๋ฒ์๋ \(9 - 2 = 7\)์ ๋๋ค.
์์ฃผ ๋ฌป๋ ์ง๋ฌธ
๋ชจ์ง๋จ๊ณผ ํ๋ณธ, ์ด๋ ๊ฒ์ ์ ํํด์ผ ํ๋์? ๋ฐ์ดํฐ๊ฐ ์ ์ฒด ์ง๋จ ๊ทธ ์์ฒด๋ผ๋ฉด ๋ชจ์ง๋จ(\(\div n\))์ ๊ณ ๋ฅด์ธ์. ๋ ํฐ ์ง๋จ์ ์ถ์ ํ๊ธฐ ์ํด ์ผ๋ถ๋ง ๋ฝ์ ์๋ฃ๋ผ๋ฉด ํ๋ณธ(\(\div n-1\))์ ์ ํํด์ผ ํ๋ฉฐ, ์ด๋ ๊ฒ ํ๋ฉด ํธํฅ ์๋ ์ถ์ ๊ฐ์ ์ป์ ์ ์์ต๋๋ค.
์ด๋ค ๊ตฌ๋ถ ๊ธฐํธ๋ฅผ ์ธ ์ ์๋์? ์ผํ, ๊ณต๋ฐฑ, ์ธ๋ฏธ์ฝ๋ก , ํญ, ์ค๋ฐ๊ฟ ๋ชจ๋ ์ธ์๋ฉ๋๋ค. ์์์ ์์๋ ์ง์ํฉ๋๋ค.
ํ๋ณธ ํ์คํธ์ฐจ๊ฐ ๋ ํฌ๊ฒ ๋์ค๋ ์ด์ ๋? \(n\) ๋์ \(n-1\)๋ก ๋๋๋ฉด ๊ฐ์ด ์กฐ๊ธ ๋ ์ปค์ง๋๋ค. ํ๋ณธ์ ๋ชจ์ง๋จ์ ํผ์ง ์ ๋๋ฅผ ๊ณผ์ํ๊ฐํ๋ ๊ฒฝํฅ์ด ์๋๋ฐ, ์ด๋ฅผ ๋ณด์ ํ๊ธฐ ์ํ ๊ฒ์ ๋๋ค.