보건통계의 활용
1. 변수 종류
variable
|
값이 달라질 수 있는 것 예) 키, 체중, 성, 연령, 혈압
|
constant
|
값이 달라지지 않는 것 예) 파이(=3.14)
|
independent variable
|
설명변수(원인)
ex) 직종
|
dependent variable
|
결과변수,반응변수
ex) 주사바늘 자상 발생
|
qualitative variable
|
수치로 나타낼 수 없는 변수 예) 성, 혈액형, 직종 등
빈도(분율) 자료, 정성적인 특성, 편의 또는 범주용 변수
|
quantitative variable
|
수치로 나타낼 수 있는 변수
예) 체중, 키, 온도
평균 자료
|
discrete variable
|
하나하나 셀 수 있는 정수값을 가지는 변수 예) 학생수, 과목수, 학점수
|
continuous variable
|
소수점 이하의 값을 가질 수 있는 변수 예) 체중, 키, 온도
|
변수
|
Nominal Variable(단순 분류)
|
질적변수
|
Ordinal Variable(분류+서열)
| ||
Interval Variable(분류+서열+distance)
|
양적변수
| |
Ratio Variable(분류+서열+distance+절대 영점)
|
자료 정리: 변수 1개
1. 질적자료: 빈도, 백분율(도수분포표)
2. 양적자료: 대푯값과 산포도
1) 대푯값
-산술평균:
관찰치의 합을 구한 후 관찰수로 나눔
|
극단 영향
|
-중앙값:
관찰치를 크기 순으로 배열한 후 중앙(50%)에 해당하는 값,
|
극단 영향 無
정규분포 아닐 경우 왜도
|
-최빈값:
관찰치 중 가장 흔히 나타나는 값
|
2) 산포도: 자료가 퍼져있는 정도
-범위: 최대값과 최소값의 차이
-사분위수 범위: 제 3사분위수-제 1사분위수
-분산: (관찰치-평균)^/자유도(=N-1)
-표준편차: 분산의 제곱근(kurtosisX, skewnessX)
|
자료정리: 변수 2개
1. 질적변수(자료)+질적변수(자료): 분할표, 교차표, X^검정
증례)
특성
|
빈도
|
자상발생
| ||
예
|
아니오
| |||
성
|
남
|
20
|
5(25.0)
|
15(75.0)
|
녀
|
80
|
15(18.0)
|
65(82.0)
| |
직종
|
간호사
|
30
|
8(26.7)
|
22(73.3)
|
의사
|
30
|
7(23.3)
|
23(76.7)
| |
용역
|
40
|
5(12.5)
|
35(87.5)
|
2. 질적변수(자료)+양적변수(자료): t 검정, 분산분석(중앙값, 범위)
증례)
특성
|
연간 자상건수
| |
평균±표준편차
| ||
성
|
남
|
13.2±5.2
|
녀
|
15.2±7.8
| |
↑t검정↓분산분석
| ||
연령
|
30-39
|
14.2±6.3
|
40-49
|
12.2±4.3
| |
≥50
|
8.7±3.5
| |
3. 양적변수(자료)+양적변수(자료)
상관계수(r): 직선상관
-각 순서쌍이 가상의 직선으로부터 얼마나 근접하고 있는가?
-두 변수간의 직선적 상관정도=직선 주위에 점이 몰리면 근접
-1≤r≤1
|1| 일치, 상관수준 高
r=0 독립적 관계, 상관 無
+,- 방향
증례)
연령(양적변수)과 자상건수(양적변수)