๐ฑ ๊ธฐ์ด (Q1โ5) ยท Descriptive Statistics
1
๐ก ํต์ฌ ๊ฐ๋
ํ๊ท (Mean): ๋ชจ๋ ๊ฐ์ ํฉ รท ๊ฐ์์ค์๊ฐ(Median): ์ ๋ ฌ ํ ๊ฐ์ด๋ฐ ๊ฐ โ ์ด์๊ฐ์ ๊ฐ๊ฑด(robust)
๋ถ์ฐ(Variance): sยฒ = ฮฃ(xแตข-xฬ)ยฒ/(n-1)
๋ค์ ๋ฐ์ดํฐ์
์ ์ค์๊ฐ(median)์?
{ 3, 7, 2, 9, 1, 5, 8 }
{ 3, 7, 2, 9, 1, 5, 8 }
๐ ํด์ค
์ ๋ ฌํ๋ฉด: 1, 2, 3, 5, 7, 8, 97๊ฐ ๋ฐ์ดํฐ โ 4๋ฒ์งธ ๊ฐ = 5๊ฐ ์ค์๊ฐ.
ํ๊ท ์ (1+2+3+5+7+8+9)/7 = 35/7 = 5 โ ์ฐ์ฐํ ๊ฐ์ง๋ง ์ด์๊ฐ์ด ์์ผ๋ฉด ๋ฌ๋ผ์ง๋๋ค!
2
๐ก ํต์ฌ ๊ฐ๋
IQR = Q3 โ Q1์ด์๊ฐ ๊ธฐ์ค: Q1 โ 1.5รIQR ๋ฏธ๋ง ๋๋ Q3 + 1.5รIQR ์ด๊ณผ
์ด๋ค ๋ฐ์ดํฐ์ Q1 = 20, Q3 = 40 ์ผ ๋, ์ด์๊ฐ(outlier)์ผ๋ก ํ๋ณ๋๋ ๊ฐ์?
๐ ํด์ค
IQR = 40 โ 20 = 20์ํ fence = Q3 + 1.5รIQR = 40 + 30 = 70
ํํ fence = Q1 โ 1.5รIQR = 20 โ 30 = โ10
โ 70์ ์ํ fence์ ์ ํํ ๊ฐ์ผ๋ฏ๋ก ์ด์๊ฐ! (์ด๊ณผ ๊ธฐ์ค์ด๋ฏ๋ก 70์ ๊ฒฝ๊ณ์ )
AP ์ํ ๊ธฐ์ค: fence๋ฅผ ์ด๊ณผํ๋ฉด ์ด์๊ฐ โ 70์ด fence = ์ด์๊ฐ์ผ๋ก ์ฒ๋ฆฌ.
3
๐ก ํต์ฌ ๊ฐ๋
Right skew(์ฐํธํฌ): Mean > Median (๊ผฌ๋ฆฌ๊ฐ ์ค๋ฅธ์ชฝ)Left skew(์ขํธํฌ): Mean < Median (๊ผฌ๋ฆฌ๊ฐ ์ผ์ชฝ)
Symmetric: Mean โ Median
์๋ ๋ถํฌ๋ ์ผ๋ฐ์ ์ผ๋ก ์ด๋ค ํํ๋ฅผ ๋ณด์ด๋ฉฐ, ์ด๋ ํ๊ท ๊ณผ ์ค์๊ฐ์ ๊ด๊ณ๋?
๐ ํด์ค
์๋์ ์ฐํธํฌ(Right skewed): ๋๋ถ๋ถ์ ๋ฎ์ ์๋, ์์ ๊ณ ์๋์๊ฐ ๊ผฌ๋ฆฌ๋ฅผ ๋น๊ฒจ Mean > Median.์ํ ํ: ๊ผฌ๋ฆฌ ๋ฐฉํฅ = ํธํฌ ๋ฐฉํฅ โ ์ค๋ฅธ์ชฝ ๊ผฌ๋ฆฌ โ right skew โ mean์ด median๋ณด๋ค ํฌ๋ค.
4
๐ก ํต์ฌ ๊ฐ๋
z = (x โ ฮผ) / ฯz-score: ํ๊ท ์ผ๋ก๋ถํฐ ํ์คํธ์ฐจ ๋ช ๋ฐฐ ๋จ์ด์ ธ ์๋์ง
68-95-99.7 Rule: ฮผยฑ1ฯ=68%, ฮผยฑ2ฯ=95%, ฮผยฑ3ฯ=99.7%
์ํ ์ ์ ๋ถํฌ: ฮผ = 70์ , ฯ = 10์ (์ ๊ท๋ถํฌ).
์ ์๊ฐ 85์ ์ธ ํ์์ z-score๋?
์ ์๊ฐ 85์ ์ธ ํ์์ z-score๋?
๐ ํด์ค
z = (85 โ 70) / 10 = 15/10 = 1.5โ ์ด ํ์์ ํ๊ท ๋ณด๋ค 1.5 ํ์คํธ์ฐจ ์์ ์์.
z > 0: ํ๊ท ์ด์ / z < 0: ํ๊ท ์ดํ
5
๐ก ํต์ฌ ๊ฐ๋
์๊ด๊ณ์ r: โ1 โค r โค 1|r| ๊ฐ 1์ ๊ฐ๊น์ธ์๋ก ๊ฐํ ์ ํ๊ด๊ณ / r = 0 โ ์ ํ๊ด๊ณ ์์
์๊ดโ ์ธ๊ณผ๊ด๊ณ! (Correlation โ Causation)
์๊ด๊ณ์(r)์ ๋ํ ์ค๋ช
์ค ์ณ์ง ์์ ๊ฒ์?
๐ ํด์ค
E๊ฐ ํ๋ฆผ!r = 0์ ์ ํ๊ด๊ณ๊ฐ ์์์ ๋ปํ์ง, ์ด๋ค ๊ด๊ณ๋ ์๋ค๋ ๋ป์ด ์๋.
์: y = xยฒ ํํ์ ๊ฐํ ๋น์ ํ๊ด๊ณ๋ r โ 0 ์ผ ์ ์์.
โ AP ์ํ ๋จ๊ณจ ํจ์ !
๐ฟ ์ค๊ธ (Q6โ12) ยท Probability & Inference
6
๐ก ํต์ฌ ๊ฐ๋
๋
๋ฆฝ์ฌ๊ฑด: P(AโฉB) = P(A)ยทP(B)๋ฐฐ๋ฐ์ฌ๊ฑด: P(AโชB) = P(A) + P(B)
์ผ๋ฐ: P(AโชB) = P(A) + P(B) โ P(AโฉB)
P(A) = 0.4, P(B) = 0.3, A์ B๋ ๋
๋ฆฝ.
P(A โช B) = ?
P(A โช B) = ?
๐ ํด์ค
๋
๋ฆฝ์ด๋ฏ๋ก P(AโฉB) = 0.4 ร 0.3 = 0.12P(AโชB) = 0.4 + 0.3 โ 0.12 = 0.58
๋ฐฐ๋ฐ(disjoint)๊ณผ ๋ ๋ฆฝ(independent)์ ํท๊ฐ๋ฆฌ์ง ๋ง ๊ฒ!
๋ฐฐ๋ฐ โ P(AโฉB) = 0 / ๋ ๋ฆฝ โ P(AโฉB) = P(A)ยทP(B)
7
๐ก ํต์ฌ ๊ฐ๋
P(A|B) = P(AโฉB) / P(B)์ด์ค ํ (Two-way table) ํ์ฉ์ด ํต์ฌ!
์๋ ํ์์ ์คํฌ์ธ ๋ฅผ ์ข์ํ๋ ํ์ ์ค ๋จํ์์ผ ํ๋ฅ ์?
| ์คํฌ์ธ ์ข์ํจ | ์คํฌ์ธ ์ซ์ดํจ | ํฉ๊ณ | |
|---|---|---|---|
| ๋จํ์ | 60 | 20 | 80 |
| ์ฌํ์ | 40 | 80 | 120 |
| ํฉ๊ณ | 100 | 100 | 200 |
๐ ํด์ค
P(๋จ|์คํฌ์ธ ) = P(๋จโฉ์คํฌ์ธ ) / P(์คํฌ์ธ )= 60/200 รท 100/200 = 60/100 = 0.60
์กฐ๊ฑด๋ถํ๋ฅ ์ ๋ถ๋ชจ๋ฅผ ์กฐ๊ฑด ์ฌ๊ฑด์ ์ดํฉ์ผ๋ก ๋ฐ๊พธ๋ ๊ฒ!
8
๐ก ํต์ฌ ๊ฐ๋
์ดํญ๋ถํฌ ์กฐ๊ฑด: BINSยท Binary (์ฑ๊ณต/์คํจ) ยท Independent ยท N fixed ยท Same p
P(X=k) = C(n,k) ยท pแต ยท (1-p)โฟโปแต
ฮผ = np, ฯ = โ(np(1-p))
๋์ ์ 10๋ฒ ๋์ง ๋, ์๋ฉด์ด ์ ํํ 3๋ฒ ๋์ฌ ํ๋ฅ ์?
(๋ฐ์ฌ๋ฆผํ์ฌ ์์ ๋์งธ ์๋ฆฌ๊น์ง)
(๋ฐ์ฌ๋ฆผํ์ฌ ์์ ๋์งธ ์๋ฆฌ๊น์ง)
๐ ํด์ค
P(X=3) = C(10,3) ร (0.5)ยณ ร (0.5)โท= 120 ร (1/8) ร (1/128)
= 120/1024 โ 0.117 โ 0.12
9
๐ก ํต์ฌ ๊ฐ๋
์ค์ฌ๊ทนํ์ ๋ฆฌ(CLT): ๋ชจ์ง๋จ ๋ถํฌ ์๊ด์์ด, n์ด ์ถฉ๋ถํ ํฌ๋ฉด(nโฅ30)ํ๋ณธํ๊ท ์ ๋ถํฌ โ ์ ๊ท๋ถํฌ
xฬ ~ N(ฮผ, ฯ/โn)
๋ชจ์ง๋จ: ฮผ = 50, ฯ = 12. ํฌ๊ธฐ n = 36์ธ ํ๋ณธ์ ํ๋ณธํ๊ท xฬ์
ํ์ค์ค์ฐจ(Standard Error)๋?
ํ์ค์ค์ฐจ(Standard Error)๋?
๐ ํด์ค
SE = ฯ/โn = 12/โ36 = 12/6 = 2โ ํ๋ณธ ํฌ๊ธฐ๊ฐ ํด์๋ก SE๊ฐ ์์์ง = ์ถ์ ์ด ๋ ์ ํํด์ง!
SE๋ฅผ ฯ(๋ชจํ์คํธ์ฐจ)์ ํผ๋ํ์ง ๋ง ๊ฒ.
10
๐ก ํต์ฌ ๊ฐ๋
95% CI for ฮผ (ฯ known): xฬ ยฑ z* ยท (ฯ/โn)z* = 1.645 (90%), 1.960 (95%), 2.576 (99%)
ํด์: "์ด ๋ฐฉ๋ฒ์ผ๋ก ๊ตฌํ ๊ตฌ๊ฐ์ 95%๊ฐ ๋ชจ์๋ฅผ ํฌํจํ๋ค"
n=100, xฬ=75, ฯ=20์ธ ํ๋ณธ์ผ๋ก 95% ์ ๋ขฐ๊ตฌ๊ฐ์ ๊ตฌํ๋ฉด?
๐ ํด์ค
ME = z* ร SE = 1.960 ร (20/โ100) = 1.960 ร 2 = 3.92CI: 75 ยฑ 3.92 โ (71.08, 78.92)
์ฃผ์: "์ด ํน์ ๊ตฌ๊ฐ์ด ๋ชจ์๋ฅผ ํฌํจํ ํ๋ฅ ์ด 95%"๋ผ๋ ํด์์ ํ๋ฆผ!
11
๐ก ํต์ฌ ๊ฐ๋
Type I Error (ฮฑ): Hโ๊ฐ ์ฐธ์ธ๋ฐ ๊ธฐ๊ฐ = "False Positive"Type II Error (ฮฒ): Hโ๊ฐ ๊ฑฐ์ง์ธ๋ฐ ์ฑํ = "False Negative"
Power = 1 โ ฮฒ: ๊ฒ์ ์ ํ
์ค์ ๋ก๋ ์ ์ฝ์ด ํจ๊ณผ๊ฐ ์๋๋ฐ, ํต๊ณ ๊ฒ์ ๊ฒฐ๊ณผ ํจ๊ณผ ์๋ค๊ณ ๊ฒฐ๋ก ์ ๋ด๋ ธ๋ค.
์ด๋ ์ด๋ค ์ค๋ฅ์ธ๊ฐ?
์ด๋ ์ด๋ค ์ค๋ฅ์ธ๊ฐ?
๐ ํด์ค
ํจ๊ณผ ์์ = Hโ ์ฐธ์ธ ์ํฉ โ Hโ๋ฅผ ๊ธฐ๊ฐ โ Type I ErrorType I: Hโ ์ฐธ + ๊ธฐ๊ฐ (ํ๋ฅ = ฮฑ)
Type II: Hโ ๊ฑฐ์ง + ์ฑํ (ํ๋ฅ = ฮฒ)
์ํ์์ Type I = ํจ๊ณผ ์๋ ์ฝ์ ์ฒ๋ฐฉํ๋ ๋ ์ํํ ์ค์!
12
๐ก ํต์ฌ ๊ฐ๋
ํ๊ท์ง์ : ลท = bโ + bโx๊ธฐ์ธ๊ธฐ bโ = rยท(Sy/Sx)
์์ฐจ(Residual) = y โ ลท (์ค์ ๊ฐ โ ์์ธก๊ฐ)
rยฒ = ๊ฒฐ์ ๊ณ์: y ๋ณ๋์ ๋ช %๋ฅผ x๋ก ์ค๋ช ํ๋
ํ๊ท์ง์ ลท = 3 + 2x์์, x = 5์ผ ๋ ์ค์ ๊ด์ธก๊ฐ y = 16์ด์๋ค.
์์ฐจ(residual)๋?
์์ฐจ(residual)๋?
๐ ํด์ค
ลท = 3 + 2(5) = 13Residual = y โ ลท = 16 โ 13 = 3
โ ์์ ์์ฐจ: ์ค์ ๊ฐ์ด ์์ธก๊ฐ๋ณด๋ค ํฌ๋ค (underestimate)
์์ฐจ ํ๋กฏ์ด ํจํด ์์ด ๋๋คํ๋ฉด ์ ํ๋ชจ๋ธ์ด ์ ํฉ!
๐ณ ๊ณ ๊ธ (Q13โ17) ยท Inference Deep Dive
13
๐ก ํต์ฌ ๊ฐ๋
ฯ ๋ชจ๋ฆ โ t-test ์ฌ์ฉt = (xฬ โ ฮผโ) / (s/โn), df = n โ 1
์กฐ๊ฑด: ๋๋ค ์ํ, ์ ๊ท๋ถํฌ or nโฅ30 (CLT)
์ปคํผ์์ด "์ปคํผ 1์ ํ๊ท 250ml"๋ผ๊ณ ์ฃผ์ฅ. ์๋น์๋จ์ฒด๊ฐ 16์ ์กฐ์ฌ:
xฬ = 245ml, s = 8ml. ฮผโ = 250ml์ ๋ํ t-๊ฒ์ ํต๊ณ๋์?
xฬ = 245ml, s = 8ml. ฮผโ = 250ml์ ๋ํ t-๊ฒ์ ํต๊ณ๋์?
๐ ํด์ค
t = (245 โ 250) / (8/โ16) = โ5 / (8/4) = โ5/2 = โ2.50df = 16 โ 1 = 15
|t| = 2.50 > t*(df=15, ฮฑ=0.05, ๋จ์ธก) โ 1.753 โ Hโ ๊ธฐ๊ฐ!
โ ์ค์ ๋ก 250ml๋ณด๋ค ์ ๊ฒ ์ฃผ๊ณ ์๋ค๋ ์ฆ๊ฑฐ.
14
๐ก ํต์ฌ ๊ฐ๋
p-value: Hโ๊ฐ ์ฐธ์ผ ๋ ๊ด์ฐฐ๋ ํต๊ณ๋ ์ด์์ ๊ทน๋จ์ ์ธ ๊ฐ์ด ๋์ฌ ํ๋ฅ p < ฮฑ โ Hโ ๊ธฐ๊ฐ (ํต๊ณ์ ์ผ๋ก ์ ์)
p โฅ ฮฑ โ Hโ ๊ธฐ๊ฐ ์คํจ
๊ฐ์ค๊ฒ์ ๊ฒฐ๊ณผ p-value = 0.03, ์ ์์์ค ฮฑ = 0.05.
๋ค์ ์ค ์ฌ๋ฐ๋ฅธ ํด์์?
๋ค์ ์ค ์ฌ๋ฐ๋ฅธ ํด์์?
๐ ํด์ค
B๊ฐ ์ ๋ต! p-value์ ์ ํํ ์ ์:"Hโ๊ฐ ์ฐธ์ด๋ผ๋ ๊ฐ์ ํ์, ์ฐ๋ฆฌ๊ฐ ์ป์ ๊ฒ์ ํต๊ณ๋๋ณด๋ค ๋ ๊ทน๋จ์ ์ธ ๊ฐ์ด ๋์ฌ ํ๋ฅ "
p = 0.03 < ฮฑ = 0.05 โ Hโ ๊ธฐ๊ฐ
A(Hโ ์ฐธ ํ๋ฅ ), C(Hโ ์ฐธ ํ๋ฅ ) โ ๋น๋์ฃผ์ ํต๊ณ์์๋ ๋ถ๊ฐ๋ฅํ ํด์!
15
๐ก ํต์ฌ ๊ฐ๋
์ ํฉ๋ ๊ฒ์ (Goodness of Fit): ๊ด์ธก ๋ถํฌ = ๊ธฐ๋ ๋ถํฌ?๋ ๋ฆฝ์ฑ ๊ฒ์ (Test of Independence): ๋ ๋ฒ์ฃผ๋ณ์ ๋ ๋ฆฝ?
ฯยฒ = ฮฃ (OโE)ยฒ/E, ๋ชจ๋ ๊ธฐ๋๋น๋ โฅ 5
์ฃผ์ฌ์๊ฐ ๊ณต์ ํ์ง ๊ฒ์ . 60๋ฒ ๋์ ธ ๊ฐ ๋ฉด์ด ๋์จ ํ์: {8,12,10,9,11,10}.
ฯยฒ ๊ฒ์ ํต๊ณ๋์? (๊ธฐ๋๋น๋: ๊ฐ ๋ฉด๋ง๋ค 10)
ฯยฒ ๊ฒ์ ํต๊ณ๋์? (๊ธฐ๋๋น๋: ๊ฐ ๋ฉด๋ง๋ค 10)
๐ ํด์ค
E = 10 for each faceฯยฒ = (8โ10)ยฒ/10 + (12โ10)ยฒ/10 + (10โ10)ยฒ/10 + (9โ10)ยฒ/10 + (11โ10)ยฒ/10 + (10โ10)ยฒ/10
= 4/10 + 4/10 + 0 + 1/10 + 1/10 + 0 = 10/10 = 1.0
df = kโ1 = 5, ฯยฒ(5, 0.05) = 11.07 โ 1.0 < 11.07 โ Hโ ๊ธฐ๊ฐ ์คํจ (๊ณต์ ํ ์ฃผ์ฌ์)
16
๐ก ํต์ฌ ๊ฐ๋
๋ ๋ชจํ๊ท ๋น๊ต: t = (xฬโ โ xฬโ) / โ(sโยฒ/nโ + sโยฒ/nโ)๋ ๋ชจ๋น์จ ๋น๊ต: z = (pฬโ โ pฬโ) / โ(pฬc(1โpฬc)(1/nโ+1/nโ))
Pooled proportion pฬc ์ฌ์ฉ (Hโ: pโ=pโ์ผ ๋)
A๋ฐ(n=50): ํฉ๊ฒฉ๋ฅ 72%. B๋ฐ(n=80): ํฉ๊ฒฉ๋ฅ 60%.
๋ ๋น์จ์ด ๊ฐ๋ค๋ Hโ ๊ฒ์ ์ pooled proportion pฬc๋?
๋ ๋น์จ์ด ๊ฐ๋ค๋ Hโ ๊ฒ์ ์ pooled proportion pฬc๋?
๐ ํด์ค
์ฑ๊ณต ์: A = 50ร0.72 = 36, B = 80ร0.60 = 48pฬc = (36+48)/(50+80) = 84/130 โ 0.6462 โ 0.648
Pooled proportion์ ๋ ๊ทธ๋ฃน์ ํฉ์ณ์ ์ ์ฒด ์ฑ๊ณต๋ฅ ์ ๊ตฌํ๋ ๊ฒ!
17
๐ก ํต์ฌ ๊ฐ๋
๊ธฐํ๋ถํฌ: ์ฒซ ๋ฒ์งธ ์ฑ๊ณต๊น์ง ์๋ ํ์P(X=k) = (1โp)^(kโ1) ยท p
ฮผ = 1/p, ฯยฒ = (1โp)/pยฒ
๋๊ตฌ ์์ ํฌ ์ฑ๊ณต๋ฅ p = 0.40. ์ฒซ ๋ฒ์งธ ์ฑ๊ณต์ด ์ ํํ 3๋ฒ์งธ ์๋์์ ์ผ์ด๋ ํ๋ฅ ์?
๐ ํด์ค
P(X=3) = (1โ0.4)^(3โ1) ร 0.4= (0.6)ยฒ ร 0.4 = 0.36 ร 0.4 = 0.144
ํด์: ์ฒ์ 2๋ฒ ์คํจ(0.6ยฒ), 3๋ฒ์งธ ์ฑ๊ณต(0.4)
๐ฅ ์ต๊ณ ๋๋ (Q18โ20) ยท Expert Level
18
๐ก ํต์ฌ ๊ฐ๋
ํ๊ท ๊ธฐ์ธ๊ธฐ t-๊ฒ์ : Hโ: ฮฒโ = 0t = bโ / SE(bโ), df = nโ2
rยฒ = (SSModel)/(SSTotal): ์ค๋ช ๋ ๋ณ๋ ๋น์จ
์์ฐจ ํ๋กฏ ํจํด โ ์ ํ ๋ชจ๋ธ ๋ถ์ ํฉ ์ ํธ
ํ๊ท๋ถ์ ๊ฒฐ๊ณผ: r = โ0.87, n = 25.
๋ค์ ์ค ์ณ์ ๊ฒ์ ๋ชจ๋ ๊ณ ๋ฅด๋ฉด?
โ . x๊ฐ 1 ์ฆ๊ฐํ๋ฉด y๋ ๊ฐ์ํ๋ ๊ฒฝํฅ์ด ์๋ค.
โ ก. rยฒ = 0.7569์ด๋ฏ๋ก y ๋ณ๋์ ์ฝ 75.7%๊ฐ x๋ก ์ค๋ช ๋๋ค.
โ ข. r = โ0.87์ ์ธ๊ณผ๊ด๊ณ๋ฅผ ์๋ฏธํ๋ค.
๋ค์ ์ค ์ณ์ ๊ฒ์ ๋ชจ๋ ๊ณ ๋ฅด๋ฉด?
โ . x๊ฐ 1 ์ฆ๊ฐํ๋ฉด y๋ ๊ฐ์ํ๋ ๊ฒฝํฅ์ด ์๋ค.
โ ก. rยฒ = 0.7569์ด๋ฏ๋ก y ๋ณ๋์ ์ฝ 75.7%๊ฐ x๋ก ์ค๋ช ๋๋ค.
โ ข. r = โ0.87์ ์ธ๊ณผ๊ด๊ณ๋ฅผ ์๋ฏธํ๋ค.
๐ ํด์ค
โ
โ
: r < 0 โ ์์ ์ ํ๊ด๊ณ โ xโ, yโ ๊ฒฝํฅโ ก โ : rยฒ = (โ0.87)ยฒ = 0.7569 โ 75.7% ์ค๋ช
โ ข โ: ์๊ด๊ณ์๋ ์ ํ๊ด๊ณ ๊ฐ๋, ์ธ๊ณผ๊ด๊ณ(causation)๋ ์คํ์ค๊ณ๋ก๋ง ํ์ธ
โ ์ ๋ต: โ ๊ณผ โ ก
19
๐ก ํต์ฌ ๊ฐ๋
Power = 1 โ ฮฒ = Hโ์ด ์ฐธ์ผ ๋ Hโ ๊ธฐ๊ฐ ํ๋ฅ Power ์ฆ๊ฐ ๋ฐฉ๋ฒ:
ยท ฮฑ ์ฆ๊ฐ ยท ํ๋ณธํฌ๊ธฐ(n) ์ฆ๊ฐ ยท ํจ๊ณผํฌ๊ธฐ(effect size) ์ฆ๊ฐ ยท ฯ ๊ฐ์
์ฐ๊ตฌ์๊ฐ ๊ฒ์ ์ ํต๊ณ์ ๊ฒ์ ๋ ฅ(power)์ ๋์ด๋ ค ํ๋ค.
๋ค์ ์ค power๋ฅผ ๋์ด์ง ์๋ ๋ฐฉ๋ฒ์?
๋ค์ ์ค power๋ฅผ ๋์ด์ง ์๋ ๋ฐฉ๋ฒ์?
๐ ํด์ค
C๊ฐ ์ ๋ต: ฮฑ๋ฅผ ๋ฎ์ถ๋ฉด ๊ธฐ๊ฐ์ญ์ด ์ข์์ง โ Hโ ๊ธฐ๊ฐํ๊ธฐ ๋ ์ด๋ ค์์ง โ Power ๊ฐ์Power์ ฮฑ๋ trade-off ๊ด๊ณ!
ฮฑโ โ Type I Errorโ, BUT Powerโ, Type II Errorโ
AP ์ํ์์ ๋งค์ฐ ์์ฃผ ์ถ์ ๋๋ ๊ฐ๋ .
20
๐ก ํต์ฌ ๊ฐ๋
๋ฌด์์ ์คํ(RCT): ์ธ๊ณผ๊ด๊ณ ์ฃผ์ฅ ๊ฐ๋ฅ๊ด์ฐฐ ์ฐ๊ตฌ: ์๊ด๊ด๊ณ๋ง, ์ธ๊ณผ๊ด๊ณ X
๊ต๋๋ณ์(Confounding/Lurking variable): ๋ ๋ณ์ ๋ชจ๋์ ์ํฅ
๋ธ๋กํน(Blocking): ์๋ ค์ง ๋ณ๋ ์์ธ ํต์
"์์ด์คํฌ๋ฆผ ํ๋งค๋๊ณผ ์ต์ฌ ์ฌ๊ณ ๊ฑด์ ์ฌ์ด์ r = 0.89์ ๊ฐํ ์์ ์๊ด์ด ์๋ค."
์ด์ ๋ํ ๊ฐ์ฅ ์ ์ ํ ์ค๋ช ์?
์ด์ ๋ํ ๊ฐ์ฅ ์ ์ ํ ์ค๋ช ์?
๐ ํด์ค
D๊ฐ ์ ๋ต: ์ ํ์ ์ธ ๊ต๋๋ณ์ ๋ฌธ์ !๊ธฐ์จ(temperature)์ด ๋์์ง๋ ์ฌ๋ฆ์:
โ ์์ด์คํฌ๋ฆผ ํ๋งคโ AND ์์ ์ธ๊ตฌโ โ ์ต์ฌ ์ฌ๊ณ โ
๊ฐํ ์๊ด๊ด๊ณ(r=0.89)๊ฐ ์์ด๋ ์ธ๊ณผ๊ด๊ณ๋ ๋ฌด์์ ์คํ(RCT)์ผ๋ก๋ง ํ๋ฆฝ ๊ฐ๋ฅ.
AP Statistics ์ต๋น์ถ ๊ฐ๋ : Correlation โ Causation ๐ฏ