(a) Min=55, Q1=65, Median=73.5, Q3=85, Max=95
(b) IQR=85–65=20. 이상치 기준: < 65–30=35, > 85+30=115 → 이상치 없음
(c) 점수가 55~95에 고르게 분포. 중앙값(73.5)이 평균(74.7)보다 약간 작아 대칭에 가깝거나 약한 오른쪽 치우침
(a) z = (88–72)/8 = 2.0
(b) 민준이의 점수는 평균보다 표준편차 2배만큼 높음 (상위 약 2.3%)
(c) x = 72 + (–1.5)×8 = 72–12 = 60점
(a) μ±σ = 420~620 → Empirical Rule에 의해 약 68%
(b) 상위 16% = 하위 84% → μ+σ = 520+100 = 620점
(c) z=(700–520)/100=1.8 → P(X>700)=1–0.9641=0.0359 ≈ 3.59%
(a) 90th percentile: x=163+1.28×6=163+7.68=170.68 cm
(b) z₁=(155–163)/6≈–1.33, z₂=(169–163)/6=1.0
P(155<X<169) = P(Z<1.0)–P(Z<–1.33) = 0.8413–0.0918 = 0.7495 ≈ 74.95%
(a) 처리: 수면제 vs 플라세보(설탕 알약), 반응변수: 수면 시간 또는 수면의 질
(b) ① 단맹검(single-blind)으로 연구자 편향 가능 ② 지원자 모집으로 자기선택 편향 가능
(c) 이중맹검법(Double-blind) 도입 + 무작위 배정 실시
(a) Cluster Sampling(군집 추출). 한 학교 1학년만 조사 → undercoverage bias 발생 가능 (학년·지역별 특성 반영 안 됨)
(b) 학년별로 층화: 수면 시간이 학년(학업 부담·나이)에 따라 다를 수 있어 층화 시 대표성 향상
(a) P(과학|수학) = P(수학∩과학)/P(수학) = (30/200)/(80/200) = 30/80 = 0.375
(b) P(과학)=70/200=0.35. 0.375≠0.35 → 독립이 아님 (연관성 있음)
(c) P(수학∪과학) = (80+70–30)/200 = 120/200 → 나머지 = 80/200 = 40%
(a) P(모두 정상) = (0.97)³ = 0.912673 ≈ 0.9127
(b) P(적어도 1개 불량) = 1–0.9127 = 0.0873
(c) P(정확히 1개) = C(3,1)·(0.03)¹·(0.97)² = 3×0.03×0.9409 ≈ 0.0847
(a) X ~ B(10, 0.7)
(b) E(X)=np=7, SD(X)=√(10×0.7×0.3)=√2.1≈1.449
(c) P(X=7)=C(10,7)×(0.7)⁷×(0.3)³=120×0.0824×0.027≈0.2668
(d) P(X≥8)=P(X=8)+P(X=9)+P(X=10)
(a) E(상금)=1,000,000×0.0001+10,000×0.005+1,000×0.01+0×나머지
= 100+50+10 = 160원
(b) 기대 이익 = 160–1,000 = –840원
(c) 합리적이지 않음 — 복권 1장당 평균 840원 손실
(a) X̄ ~ N(μ=8, σ_x̄=3/√36=0.5), 즉 X̄ ~ N(8, 0.25)
(b) z=(9–8)/0.5=2.0 → P(X̄>9)=1–0.9772=0.0228
(c) n=144 → σ_x̄=3/√144=3/12=0.25 (n이 4배 증가하면 SE는 절반)
(a) np=400×0.52=208≥10, n(1–p)=400×0.48=192≥10 → 정규 근사 가능
(b) μ_p̂=0.52, σ_p̂=√(0.52×0.48/400)=√0.000624≈0.025
(c) z=(0.48–0.52)/0.025=–1.6 → P(p̂≤0.48)=0.0548
(a) 4.2±2.01×(1.1/√50)=4.2±2.01×0.1556=4.2±0.313=(3.887, 4.513)시간
(b) 이 방법으로 반복 추출 시 95%의 구간이 모평균을 포함한다
(c) ME ∝ 1/√n → ME를 절반으로 줄이려면 n을 4배: 50×4=200명
(a) p̂=0.6, 0.6±2.576×√(0.6×0.4/1000)=0.6±2.576×0.01549≈0.6±0.0399=(0.560, 0.640)
(b) np̂=600≥10, n(1–p̂)=400≥10 → 조건 충족
(c) 틀림. 모수는 고정값이므로 "확률"이 아닌, 반복 추출 시 99%의 구간이 모수를 포함한다는 의미
(a) H₀: μ=500, Hₐ: μ<500 (단측 검정)
(b) t=(488–500)/(24/√30)=–12/4.382≈–2.74
(c) p=0.008<0.05 → H₀ 기각. 배터리 평균 수명이 500시간 미만이라는 통계적 증거 있음
(d) Type I 오류: 실제 수명이 500h 이상인데 기각 → 제조사 부당 피해
(a) Type I 오류: 약물이 실제 효과 없는데 효과 있다고 결론 → 효과 없는 약이 시판됨 (환자 피해)
(b) Type II 오류: 약물이 실제 효과 있는데 없다고 결론 → 효과 있는 약이 사장됨 (치료 기회 상실)
(c) ① 표본 크기 n 증가 ② 유의수준 α를 높임 (단, Type I 오류 증가 감수)
(a) 공부 시간이 1시간 늘면 예측 시험 점수는 평균 8점 증가
(b) 공부 시간이 시험 점수 변동의 81%를 설명함
(c) ŷ=50+8×5=90점
(d) r²=0.81이고 기울기 양수 → r=+0.9
(a) H₀: 성별과 음악 장르 선호는 독립, Hₐ: 독립이 아님 (연관성 있음)
(b) df=(2–1)(3–1)=2
(c) p<0.05 → H₀ 기각. 성별과 음악 장르 선호 사이에 통계적으로 유의한 연관성 있음
(d) 모든 셀의 기대빈도 E≥5이어야 함
(a) 같은 학생을 두 번 측정 → 두 점수는 독립이 아닌 쌍을 이루므로 대응표본 사용
(b) t=d̄/(sd/√n)=4.5/(3.0/√25)=4.5/0.6=7.5
(c) df=n–1=24. p<0.0001 → H₀ 기각. 교수법 A가 통계적으로 유의하게 효과적
(a) p̂남=0.6, p̂여=0.5, 차이=0.1
SE=√(0.6×0.4/500+0.5×0.5/500)=√(0.00048+0.0005)=√0.00098≈0.0313
CI: 0.1±1.96×0.0313=0.1±0.0614=(0.039, 0.161)
(b) 구간이 0을 포함하지 않아 성별 간 차이 통계적으로 유의. 남성이 여성보다 약 4~16% 높음
(c) 인과관계 불가 — 관찰 연구이므로 성별이 SNS 사용을 "유발"한다고 볼 수 없음