shapro-wilk 가 가장 많이 쓰이고요, N 수가 많아지면, 유의성도 증가하기 때문에 graphical method 를 고려해야합니다. 흔히들 30개 이상이면 정규성을 만족시키지 않아도 그냥 하는 경우가 많은데, 이 경우는 잘못된 것입니다. 모집단의 표본의 평균이 정규분포한다는거지, 모집단이 정규분포한다는 게 아닙니다. 그 경우에는 transformation 을 하거나 non-parametric method 를 써야 합니다. multiple test 가 많은 continuous variable 을 엄밀한 normality test 없이 하는 경우도 microarray 나 GWAS 에서 아주 좋은 논문들에서도 흔하게 보이는 실수입니다.
-_-; (2014-11-16 15:04)
공감0비공감0
님이 뭔 실험을 어떻게 해서 무슨 데이타를 얻는지를 먼저 설명해야지요.... 질문이 바르지 않으면 답은 산으로 갑니다.
ㄱㄴ (2014-11-19 07:17)
공감0비공감0
Shapiro-Wilk normality test가 정답.
먼저 히스토그램을 그려서 감을 잡아 보시고, Shapiro-Wilk normality test로 확인을 해 보세요.
R에서 shapiro.test()를 하시면 됩니다.
ㄱㄴ (2014-11-19 07:17)
공감0비공감0
Shapiro-Wilk normality test가 정답.
먼저 히스토그램을 그려서 감을 잡아 보시고, Shapiro-Wilk normality test로 확인을 해 보세요.
R에서 shapiro.test()를 하시면 됩니다.
ㄱㄴ (2014-11-19 07:20)
공감0비공감0
shapiro.test()를 해서 p 값이 낮다면 (<0.05), 정규분포가 아닐 확률이 높다는 거죠. 예를 들면 shapiro.test()를 해서 p 값이 0.05라면, 정규분포가 아닌 것이 틀릴 확률이 5%라는 거죠.