[DEBUG-WINDOW 처리영역 보기]
즐겨찾기  |  뉴스레터  |  오늘의 정보 회원가입   로그인
BRIC홈 커뮤니티
웅비 메디텍
배너광고안내
이전
다음
스폰서배너광고 안내  배너1 배너2 배너3 배너4
BioLab 박성순 교수
전체보기 소리마당PLUS 학회룸쉐어 Sci카페 SciON(설문조사)
standard deviation vs SE
회원작성글 파스텔
  (2014-11-23 14:48)
 공감1   조회33181  인쇄  주소복사  소셜네트워크로 공유하기
요즘 통계 이야기가 자주 나와서 간단한 이야기를 나누고자 합니다. 전 생화학/분자 생물학이라 통계를 사용하는일이 크게 필요 없지만, 공동연구를 하다보면 자주 만나는 문제가 공동연구자가 간단한 생화학/분자생물학 3-4 반복 실험을 하고 mean +/- SE 으로 데이타를 줍니다. 그럼 저는 mean +/- SD로 바꾸라하면 공동 연구자는 의아해하고 안 바꿉니다. 대부분은 SE가 value가 작으니까 더 선호 합니다. 그래서 제가 이런저런 설명을 하면, 공동 연구자는 좋은 저널에 mean +/- SE로 다들 발표하는데 왜 딴지냐고 하고 몇개 저널을 던져 줍니다. 그럼 전 뭐라고 딱히 할말이 없지요. 사실 많은 생물학 저널들이 SD 와 SE를 잘 구별 안합니다. 

보통 제 설명은 (저도 사실 통계를 쓸일이 없어서 잘 모르지만, 그리고 생화학 데이타를 통계를 써서 뭘 보여중일도 별로 없고요), SE란 사실 존재하지 않고 standard error of the means (SEM) 나 standard error of the proportion 등이 통계적으로 옳다. 그리고 SEM은 population 이 클때 sampling을 여러번하여서 그 각각 샘플링의 평균값의 variation (SD)을 설명하는것이다. 따라서 샘플링 한 데이타로 그 population의 성향을 예측하는데 쓸수 있고, 심리학이나 그런 큰 population 을 말할때 어떤 confidence interval을 가지고 이야기 할때 쓰는거다 (사실 confidence interval의 개념도 좀 헷갈리지만요). 우리 같이 통계 소시민인 생화학자는 개념적으로 이해가 쉬운 standard deviation을 쓰는것이 가장 좋다. SEM이 개념적으로 뭔지 나에게 쉽게 설명 할수 없다면 그냥 SD를 써라라고 합니다. 

전 줄기차게 SD를 고집 하지만, 세번 실험을 한후 mean +/- SE를 써서 발표 한 논문이 꽤 있습니다. 제가 생각하는 것이 틀린것인가요?
목록
통계전공  (2014-11-23 15:05)
공감0  비공감1   수정 삭제
어느 것이 더 올바른가 문제라기보다는 둘의 쓰임이 다르다고 봐야할 것 같습니다.

http://www-ist.massey.ac.nz/dstirlin/CAST/CAST/HseMean/seMean7.html

말씀하신 맥락으로는 sd 를 사용하는 게 옳을 것 같습니다만.
ㅎㅎ  (2014-11-23 16:20)
공감1  비공감0   수정 삭제
작아서 선호하는게 아니고요... 실험을 해서 데이타를 보여주는 목적이 데이타 값이 또는 평균이 얼마나 정확하냐를 보여주는 것이기 때문에 SEM을 쓰는 겁니다. 3-4번 실험해서 평균을 내지요? 이 평균이 얼마나 실제 평균에 근접하겠느냐, 정확하겠느냐를 보여주는 것이 SEM 입니다. 그러므로 SEM을 쓰는 것이 맞습니다. 그 반면 SD는 그 3-4번 반복한 실험이 얼마나 반복할 때마다 비슷한 결과를 보여주느냐를 나타낸다고 보면 되지요... 우리는 대부분의 경우에 실험이 반복할 때 마다 잘 되느냐 마느냐를 보여주는데 관심이 있는 것이 아니라 그 실험들로 구한 값이 얼마나 실제 값과 일치할 지에 관심이 있는 것입니다.
회원작성글 파스텔  (2014-11-23 16:56)
공감1  비공감0  
답글 감사 합니다. 당연히 작아서 선호하는것은 아니지요 (제가 그냥 단순 3반복 실험에서 SE이해 못하면서 SE를 고집하는 사람들이 그러지 않을까 하는 생각 입니다).

그런데 어떤 Population이 존재 하면 그 population의 실제 평균이 있기 때문에 그 population에서 n번 sampling을 해 각각 평균을 구한후 그 평균값의 variation으로 SEM을 구하는것으로 이해 합니다. 따라서 n 값이 늘어나면 더 실제 평균 값에 다가가기에 자연적으로 SE는 줄고요.

하지만 구체적으로, western blot이나 enzyme activity, qPCR등의 일반적 생화학 분자 생물학 데이타는 population 자체가 애초에 존재하지 않고 그 population의 실제 평균이 없는데 어떻게 SEM을 사용하지요? 그런 경우는 통계전공님이 링크한 사이트 처럼 그냥 spread of values를 SD를 써서 데이타를 보여주는것이 맞다고 보는데요. 그리고 직관적으로도 SEM (stabdard error of the means)는 mean이 여러개 있어야 계산이 가능한데, 3-4번 실험한 단일 데이타로 어떻게 SEM을 계산할수 있을까요? 그래서 전 제가 기술한것 같은 대부분의 생화학 분자 생물학 실험에서는 SEM를 쓸수 없다고 생각 합니다.
댓글리플
ㅎㅎ  (2014-11-23 17:11)
공감1  비공감1   수정
이해를 못하시는 분은 파스텔님 같습니다. 통계전공님의 링크가 맞다고 하시니 가서 보니 "Standard error of the mean (SE)" 라고 되어 있네요? SE를 어떻게 구하는 찾아서 잘 읽어보시고요... SD 를 이용해서 구합니다. 그리고 통계를 역시 전혀 이해를 못하시는 듯 합니다. 어떤 실험을 해서 결과가 나오면 그 결과는 표본치입니다. 실험을 통해서 샘플링을 한 것입니다. 그런 실험을 독립적으로 여러번 하면 SE를 구할 수 있는 반복실험이 됩니다. population이 없다니요? 통계가 무엇인지 전혀 모르니 이런 얘기가 가능한 것 같습니다만? 통계전공님은 결론을 다르게 내셨지만 제가 한 말이 그 말입니다. 구하고 못구하고 그런 문제가 아니고 쓰임이 다른 것입니다. 다만 쓰임이 다른데 실험하는 연구자들에게는 "대부분" 데이타로 제시된 값이 얼마나 정확하냐에 관심이 있지 실험이 얼마나 잘 되었느냐에 관심이 있는게 아니기 때문에 SE를 써야 한다는 겁니다. 반대로 그렇지 않은 경우도 있겠지요? 이 실험이 얼마나 잘 되었는지를 제시해야 하는 데이타도 당연히 있습니다. 그런 경우는 SD를 제시해야 합니다. 물론 SE를 제시하나 SD를 제시하나 어떻게 구하는지를 알면 별 문제없이 둘 다 파악할 수는 있지요?

http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2064100/pdf/jcb1770007.pdf

http://ezstat.snu.ac.kr/textbook_sources/chapter_17.pdf
댓글리플
catalan  (2015-07-28 11:27)
공감0  비공감0   수정
ㅎㅎ님, 실험을 통해 샘플링을 하는 거라고 가정하면, 실험결과 자체가 확률변수가 되어야 하는데요. 실험 결과는 표본평균과 달리 확률변수가 아닙니다. 님께서 통계를 제대로 이해하지 못하신 것 같네요. SE는 쓰이지 않는 것이 옳습니다 ^^;
댓글리플
catalan  (2015-07-28 11:29)
공감0  비공감0   수정 삭제
분포를 그린다는 것은 확률변수임을 가정하는 거에요.
하지만 실험 결과는 단순히 표본일 뿐 표본으로부터 구한 확률변수가 아니라는 뜻입니다.
쓰임새가 다르다는 부분까지는 맞으셨는데요,
SE는 그 쓰임새로 인해 실험논문에서 쓰면 안됩니다.

그리고 전혀 이해를 못한다는 듯한 말투를 쓰시는게 별로 보기 좋아보이지는 않습니다.
회원작성글 파스텔  (2014-11-23 18:04)
공감1  비공감0  
ㅎㅎ 님 전 위키등에서 글로 읽어 보았는데 대화로 확신을 갖고자 하는것 뿐 입니다. 그리고 통계는 잘 모르지만 ㅎㅎ님이 쓴글의 요지는 이해 합니다. 비꼬지 말고 제가 알고 싶은것을 가르쳐 주셨으면 좋겠고요.

SEM에서 Means가 아니라 mean인것은 제가 잘못 보았군요. 하지만 개념적으로는 한 population에서 여러번의 sampling을 통해 mean value가 여러개 있으면 그 mean value들로 SEM을 구하는것으로 알고 있습니다.

제가 구체적으로 알고 싶은것은 enzyme activity나 q-PCR 데이타를 반복 실험한 3개의 Numerical data로 SEM으로 구하는것이 바른 방법이냐 아니냐 입니다. 그럼 이런 실험에서 mean +/- SEM (n=3)로 발표하고 데이타 표현 목적이 데이타 평균이 얼마나 실제 평균에 근접하나에 있다라고 말하면 문제가 없다는 말씀이신가요?
회원작성글 파스텔  (2014-11-23 21:23)
공감2  비공감1  
제가 위글을 올리고 나서 ㅎㅎ님글을 보았군요. 제 질문 개의치 마세요. 이제 SEM이 statistical inference란 말이나 precision 뜻을 이해 하고, 쓰이는것이 다르다는것도 알겠습니다. SEM 계산법은 알고 있었는데, 저는 "SEM의 population에서 많은 sampling을 해 mean을 구해 sampling distribution을 보는 직관적 이해"가, 간단히 "3번 실험해 SEM을 계산해 statistical inference 의미를" 찾는 것 보다 훨씬 쉽게 알아들었습니다. 하지만 좀 알고 나서도 사실 위의 기술한 실험에서는 SEM은 misleading 이란 생각은 아직도 가지고 있습니다. 단순 3번 실험하면 그 데이타의 disperson을 SD로 보여주면 되지, 3 데이타로 정확성을 이야기한다고 (statistical inference를 쓰는) SEM을 쓰는것이 무슨 큰 의미가 있나 하는 생각 때문입니다. 물론 SEM를 쓰건 SD를 쓰건 쓴 방법만 명시하고 독자가 알아서 해석 하면 관계는 없다고 생각 합니다.

아래 링크를 보면 SEM이 "imaginary world of statistical inference" 라는 사람도 있더군요. 사실 이 글이 SEM를 이해하는데 많은 도움을 주었습니다.

http://www.med.mcgill.ca/epidemiology/hanley/tmp/Mean-Quantile/SD_or_SE.pdf
댓글리플
ㅎㅎ  (2014-11-24 08:49)
공감1  비공감0   수정
3번 실험등 n이 아주 작은 경우로 한정하면 님이 말씀하시는게 이제는 타당할 수 있습니다. 다만 아래 통계맨님 말씀대로 여전히 파스텔님이 통계를 제대로 이해하셨기를 바라고요... n이 작은 경우로 한정하면이란 말은 n이 큰 경우는 다르다라는 뜻으로도 아셨기를 바라고요... 작아보여서 쓰는 경우가 많다는 것은 남들은 바보라고 의심하는 경우이기 때문에 바람직하지 않고요.. 제가 붙여드린 화일이나 님도 말씀하셨지만 논문상에 그게 SD인지 SE인지 명시가 되어 있다면 읽은 파스텔님이 알아서 해석하면 되는 문제니까 공동연구자 분들에게 잘 알지도 못하면서 가르치려고 들 필요가 없다는 말도 드리고 싶네요.. 님은 대화를 통해서 모르는 것을 알려고 오신게 아니라 내가 맞고 남들이 바보라서 틀렸는데 왜 바보들은 그걸 모를까를 확인받고자 오신 거잖아요.. 그런게 느껴지면 대화를 하고 싶은 생각이 별로 없어지지요...

그리고 계속 여러 개의 mean이 있어야 하고 그 mean 들 간의 SD를 구하고 거기서 SEM를 구한다는 말씀을 하고 계신데요.. 그래서 실험값인 100, 90, 80, 87, 88, 99는 mean이 아니므로 SEM을 못구한다고 말하는거지요? population도 없고요? 그것도 개념 적용이 잘못된 것입니다. 잘 생각해 보세요..
댓글리플
ㅎㅎ  (2014-11-24 13:50)
공감1  비공감0   수정 삭제
님이 올려준 화일을 읽어보았습니다. 그건 그 쪽 분야에 한정된 얘기입니다. 그러니까 더더욱 통계를 제대로 이해하고 써야 된다는 겁니다. 제가 올려준 화일에서 룰4번인가요? 데이타가 3개면 그냥 데이타 포인트를 찍어서 그려라 라고 되어 있지요? 일단 SD를 쓴다는 건 그 데이타가 정규분포라는 가정에서 쓰는 겁니다(님이 올려준 화일에도 나와있는데 이해하셨나요? 정규분포가 아니라면 어떻게 나타내야 된다고도 나와있는데 그것도 이해하셨나요?) 님의 글투를 빌면 n이 3개 정도면 SD를 쓰나 SEM을 쓰나 그게 뭐 별 의미 없다는 겁니다. 다시 말하면 SD나 SEM이나 3개 데이타의 특성을 잘 보여주지 못한다는 겁니다. 데이타 세개 짜리에선 SD나 SEM이나 한쪽으로 치우칠 수 있으니까요.. 그래서 그냥 찍어서 보여주라는 겁니다.

이렇게 말해도 안 읽어 보실 분인 듯하여 직접 갖다 붙여드리지요..

Rule 4: because experimental biologists are usually trying to compare experimental results with controls, it is usually appropriate to show inferential error bars, such as SE or CI, rather than SD. However, if n is very small (for example n = 3), rather than showing error bars and statistics, it is better to simply plot the individual data points.
회원작성글 nitrom  (2014-11-23 23:54)
공감1  비공감2  
파스텔 님 의견에 동의합니다.
현실에서는 작아보여서 쓰는 경우가 실제로 많습니다. 바람직하지 않다고 보고 SD를 표현하는게 더 misleading을 줄인다는 의견에 동감합니다.
댓글리플
ㅎㅎ  (2014-11-24 13:11)
공감1  비공감0   수정 삭제
무슨 뜻인지는 압니다만 이게 무슨 정치도 아니고 큰 것을 작다고 하는 것이나 작은 것을 크다고 하는 것이나 잘못된 기술임에는 다를 바가 없습니다. 위에 설명한 대로 그 데이타를 통해서 무엇을 나타내고자 하느냐에 따라서 다른 것을 골라서 써야되는 것입니다. 바르게 알고 쓰자고 하셔야지요..
통계맨  (2014-11-24 00:55)
공감2  비공감1   수정 삭제
파스텔님, population이 존재하지 않는 경우는 없습니다. 추론하고자 하는 population이 없다면 통계가 필요 없습니다. 처음질문에서 갖고 계셨던 오개념을 이제 확실히 이해하셨는지 모르겠지만, SEM은 원래 애초에 직접 구하는 것이 아니라 SD를 sqrt(n)으로 나눠서 계산하는겁니다. 통계에서 평균값을 추론하는 무대는 특정 n(예를 들면 n=12)수의 샘플링을 한번이 아니라 여러번 반복한다고 했을때(당연히 가상의 상황입니다), 과연 현실세계에서 내가 얻은 한번의 샘플(n=12)의 평균은 얼마나 불확실한가??입니다. 실제로 할수 있는게 아니고 수학적 이론을 통해 이걸 추론합니다.그리고 SEM이 이걸 가능하게 해줍니다. 이론적으로 모집단(당연히 우리는 실제 알수 없습니다)의 SD를 sqrt(n)으로 나누면 SEM이 됩니다만 현실에선 모집단의 SD를 구할수 없으므로 표본의 SD를 이용합니다. 여기서 발생하는 오차때문에 n수가 많지 않은 두 그룹의 평균 비교에서 t-distribution을 가정하는 t-test를 하게 됩니다.


그런데 사실 n=3,4라면 애초에 이건 비모수검정을 하는게 맞습니다. 그런 측면에서 생각한다면 t 분포 혹은 표준정규분포를 가정하여 추론하는 값인 SEM을 이런 경우 쓰는게 이상할수도 있겠다 싶습니다.
글쎄요..  (2014-11-24 15:59)
공감1  비공감0   수정
ㅎㅎ님 말씀대로 저도 목적에 맞게끔 SD or SEM을 씁니다. 어차피 통계적 유의미성을 보이는데는 SD나 SEM이나 하등 관련이 없고 다만 error bar를 통해 무엇을 보여주느냐에 따라 달리씁니다. 가령 qRT-PCR을 했을 시 하나의 sample을 triplication으로 측정했을 시 나오는 3개의 data는 동일한 sample을 이용했으로므로 이론상 당연히 동일한 결과값이 나와야 합니다만 assay의 특성상 숫자가 완전히 동일하지는 않으므로 SD값이 0에 가까울 수록 assay quality가 좋은 것으로 생각해야 되며 이 경우 SEM을 쓰거나 통계적 유의미성을 찾으면 안된다고 생각합니다. 다만 그룹당 6마리의 독립된 개체로부터 출발했을 시에는 SEM을 씁니다. 실제로 독립된 개체간의 correlation이 있을지 없을지는 이론상으로도 추측을 할 수 없기에 unbiased로 생각을 해서 SEM을 해서 평균값이 실제로 어느 정도로 real값을 대변하는지로 나타냅니다. 따라서 in vitro test (purified protein, gene등등을 이용한 경우)일 때 이 assay가 얼마나 잘되었는지를 나타낼때는 SD, 독립된 sample로부터 평균값이 얼마나 real mean value를 대변 할 수있는 지를 나타낼때는 SEM을 씁니다.
댓글리플
ㅎㅎ  (2014-11-25 00:58)
공감0  비공감0   수정
제가 오래 전에 microarray후에 검증하려고 100여개가 넘는 유전자를 qRT-PCR 할 때 independent 한 3개의 sample을 준비해서 3 농도에서 각각 triplicate로 돌려서 나온 데이타 즉 3x3x3, 데이타를 가지고 통계처리 했습니다 (그 당시 참고한 논문은 저 정도면 된다고 하고 나중에 나온 논문은 5 point, 6 independent sample을 권장했고요..). 그렇게 실험을 하지 않는 분들이 문제고요.. qRT-PCR 한번 할 때 triplicate로 한 것은 말씀하신 대로 통계처리 자체가 안됩니다. 그렇게 실험하시면 안됩니다. n=1 이니까요.. 아니죠.. 하셔도 됩니다. n=1이라고 표시하시고 통계처리 안보여주시면 되지요.. 그렇게 실험하셨다면 통계는 아시지만 실험설계는 잘못하신 것이라 말씀드리고 싶네요.. 파스텔님은 원래 질문에서 실험을 세번 했다라고 했기 때문에 제가 했던 것처럼 independent 하게 실험을 세번 했다라고 이해했습니다. 다른 분들을 위해서 말씀드리자면 그에 대한 룰도 위에 제가 링크해드린 화일에 나와있습니다. 참고하시기 바랍니다.
댓글리플
글쎄요..  (2014-11-25 10:13)
공감0  비공감0   수정
흠 분명 같은 이야기의 반복인 것 같은데 어감이 묘하네요. n=1로 triplication해서 통계처리도 안하고 그렇게 실험 설계하지도 않습니다. n=1, measured by triplication으로 data presentation하는 경우를 보셨는지는 모르겠으나, ㅎㅎ님뿐 아니라 대부분의 사람들도 그런식으로 실험설계, 분석을 하지는 않습니다.
댓글리플
ㅎㅎ  (2014-11-25 12:24)
공감0  비공감0   수정 삭제
아..네 무슨 말씀인지 알겠습니다. 제가 오해를 했을 수 있군요.. 죄송합니다.
연구자  (2014-11-24 16:00)
공감0  비공감1   수정 삭제
각그룹에서 샘플의 분포도를 보여주는 SD를 사용하는 것이 옳다고 생각합니다.
많은 사람들이 SE를 사용하지만.
나도 초보  (2014-11-24 17:09)
공감1  비공감0   수정
생물학 하는 사람들이 흔하게 쓰는 오류 중 하나죠.
사실 n = 3 이런 류의 실험에서 모수 검정을 했다는 사실 조차 받아들여지는 곳이니까요.

문제는 SD가 맞냐 SEM이 맞냐가 아니라
SD를 써야 하는 상황인데 그냥 이바닥 통념상 SEM을 쓰는게 문제 아닐까 생각합니다.
그래프의 Visualization을 중요시하게 여기는 잘못된 생각에서 출발한 문제죠.
SD를 쓰던 SEM을 쓰던 동일 사후검정법을 쓰면 어차피 같은데도 불구하고 말이죠.
댓글리플
ㅎㅎ  (2014-11-25 01:25)
공감0  비공감0   수정 삭제
우리가 주로 하는 현대 생물학 실험에서 SD를 써야 되는 경우는 별로 없습니다. n=3으로 작아서 normality test 자체가 신뢰성이 없는 경우는 즉, 비모수 검정을 해야되는 경우는 mean, SD, SEM 같은 것을 쓰기 보다는 그냥 plotting 하기를 권장합니다. 다시 말하면 정규분포가 아닌 경우는 평균도 치우칠 수가 있어 평균 자체가 큰 의미 없죠.. 중간값을 쓰는게 낫고요.. SD도 계산은 가능하지만 정규분포에서 유추해 낼수 있는 그런 의미는 없지요.. 그래서 n=3 이면 그냥 점 세개 찍는 거지요... 당연히 SEM도 의미없고요.. n이 충분히 커 통계처리 할 수 있는 경우 대조군과 평균을 비교하기 위한 경우는 그냥 SD를 보여 주는 것보다는 SEM을 보여주어야 하고요.. 평균이 아닌 다른 통계치를 비교할 때는 그에 맞는 SE를 보여주어야 합니다. 네 유의성은 별도로 표시해야겠지요..

n이 작을 때는 t-test도 못하고 무조건 비모수 검정을 해야되느냐는 아래 논문을 참고하세요.. 아래 논문의 결론은 "n=3이라 하더라도 t-test 쓸 수 있다" 입니다. 아래 논문이 얼마나 훌륭한 논문인지는 저도 판단은 못하겠고요.. 참고하세요..

http://pareonline.net/getvn.asp?v=18&n=10
독립  (2014-11-25 08:25)
공감0  비공감0   수정
심오한 토론을 하시는데 엄하게 끼어들어 죄송합니다만 그럼 ELISA 실험을 예로 들때, 하나의 24웰 플레이트에 n=3개씩의 샘플을 측정했을 경우 통계처리가 불가능한 것인가요? 독립된 24웰 실험을 3번해서 각각 ELISA측정을 하고 3번 값을 얻어야 통계가 가능한 것인가요?
댓글리플
ㅎㅎ  (2014-11-25 12:40)
공감0  비공감0   수정 삭제
독립님께서 준비한 샘플이 상호 독립적인 샘플이라면 n=3이고요.. 준비한 샘플 1개를 3개 웰에 나누어 담고 측정을 했다면 n=1 입니다. 상호 독립된 샘플 3개를 동시에 준비할 수 있다면 같은 플레이트에 3x3 으로 해도 상관없고 이 경우는 n=3 이지요.. 생물학적으로 독립된 샘플 3개를 동시에 준비할 수 없다면 시차를 두고 독립적으로 시행한 실험 3개를 가지고 통계를 내면 됩니다. 제가 위에 올려드린 JCB 화일의 rule2를 참고하시면 됩니다.
질문!  (2014-11-25 14:33)
공감0  비공감0   수정
안녕하세요 지금 한창 공부중인 학생입니다!
통계에대해서 쉽게 이해가 안됬는데 이 글을 읽고 어느정도 감이잡힙니다.
그렇다면 질문하나면 올려도 될까요?
luciferase를 측정하는데 한번의 실험에 triplication으로 들어갑니다. 그럼 실험횟수는 n=1이고 3개의 data에서 mean을 구합니다.
그리고 같은방식으로 두번을 더 실험하여 총 n=3가 되고 각 n으로 부터 구해진 mean값을 SEM을 통하여 오차바를 그린다는게 올바르게 이해했는지 궁금합니다^^;
댓글리플
ㅎㅎ  (2014-11-25 14:57)
공감0  비공감0   수정
네.. 그게 제가 하고 싶은 말이 맞습니다...ㅎㅎ 쉬운 말을 너무 장황하게 했지요? 그리고 나서 t-test 하시면 됩니다만 위에 링크한 논문에 따르면 effect size D가 커야한다네요.. 쉽게는 비교하고자하는 평균값간의 차이가 충분히 큰 경우라고 생각하시면 되고 궁금하시면 effect size D를 어떻게 계산하는지 찾아보시고요...

결국 이렇게 쓰고 보니 흔히들 "생물학자들은 아무 것도 모르고 그냥 한다" 고 자조하고 무시하던 그 방식 그대로 하면 되는거네요...

"n=3으로 해서 sem으로 에러바 넣고 t-test한다"...ㅎㅎㅎ

그런데 위에 링크된 JCB 화일에서는 3 데이타 포인트를 그냥 그려서 냅두고 통계처리 없이 직관적으로 독자가 판단하는게 낫다라고 보고 그렇게 권장하는 것이거든요.. t-test 해도 된다는 simulation 논문이 훨씬 나중에 나온 것이니까 저 가이드라인을 작성하신 분께 메일을 한번 날려봐야겠어요... t-test 해도 된다는데 그냥 n=3으로 해서 sem이나 CI로 에러바 넣고 t-test 하면 되지 않겠냐고요...
댓글리플
질문!  (2014-11-25 15:27)
공감0  비공감0   수정 삭제
답변감사합니다^^;역시 통계는 심오(?)하다는걸 다시한번 느끼고갑니다^^
조성일  (2015-01-12 12:07)
공감0  비공감0   수정 삭제
통계란 것은 천편일률적으로 적용할 수 있는 것이 아닙니다. 아무리 훌륭한 통계학자라도 다른 학문영역의 것을 잘 알지 못합니다. 선생님의 연구영역에선 더 적겠지만 의학분야는 보통 10~30정도의 케이스가 보통입니다. 이런 케이스가 적은 실험은 SD를 사용하여야합니다. 하지만 의학분야의 임팩트있는 저널들을 보아도 SE를 쓰고 있는 경우가 많습니다. 이는 분명 잘못된 점입니다. 그리고 SE가 수치가 낮으므로 쓰고 있는 경우가 많습니다. 의학에 종사하는 분들이 통계를 잘 모르기때문에 그렇습니다. 우리가 실험할때 모집단에서 샘플링을 해서 실험하지 않습니까? 예를 들어 대한민국 인구전체를 대상으로 실험을 할 수 없기때문에 샘플링을 해서 합니다.(무작위추출이든 무엇이든) 실험에서 발생하는 수치가 표준편차(SD)라면 그것을 가지고 모집단(대한민국 국민전체)의 표준편차값을 구하는 것이 표준오차(SE)입니다. 그래서 케이스가 적은 의학연구들은 SD를 제시하는 것이 맞으나 투고의 유리 및 편의로 인하여 SE를 사용합니다. 그래서 JAMA나 몇몇 유수저널들이 SE를 사용하지 못하게 하고있습니다.

구. 소리마당
2014년 12월 31일 까지의 게시글이며, 그 이후는 새로운 소리마당 게시판을 이용 바랍니다.
구. 소리마당 게시판에서는 글등록과 댓글의 등록이 안됩니다. 단, 기 등록된 게시물의 수정 및 삭제는 가능합니다.
50
미국 포닥 갈때 비자는 어떻게 준비하나요? [2]
포닥
2014.11.25
9382
2
49
이번에 대학원 들어가려는 학생인데 교수님 마음을 모르겠습니다 [1]
회원작성글 yeegeenee
2014.11.25
7615
1
48
논문 작성시 괄호(abc) 작성법에 대하여 문의드립니다. [4]
회원작성글 붐붐파우
2014.11.24
14357
0
47
^^ [3]
2014.11.24
5928
0
46
글로벌 박사 펠로우십이란거... 받기 많이 어렵나요? [16]
학부생
2014.11.24
29564
1
45
GC나 LC 외부인이 교육받을수있는 곳이있나요? [2]
2014.11.24
7396
1
44
소금에 의한 단백질 분해효소 활성 억제 메커니즘 문의
얌얌
2014.11.24
8988
2
43
바이오폴리텍 [11]
생강
2014.11.23
9416
0
42
standard deviation vs SE [26]
회원작성글 파스텔
2014.11.23
33182
1
41
제가 논문을 낸 후 항상 젤로토포비아(Gelotophobia)를 앓는 것 같습니다. [3]
아마추어...
2014.11.23
16249
0
40
예비 대학생입니다. 유학에 대한 의견을 여쭙고 싶습니다. [11]
회원작성글 erosofpl..
2014.11.23
15618
0
39
어떻게 해야 좋을지 모르겠습니다. [13]
수료생
2014.11.22
14430
2
38
포닥은 오래 하면 안 좋나요? [11]
바통
2014.11.21
16536
2
37
엽록체의 DNA [3]
회원작성글 bio38
2014.11.21
17461
2
36
응급실에서 사망 판정후 바로 냉동실에 넣어면 안될 듯 하네요. [2]
ㅎㅎ
2014.11.21
14731
2
35
Scientific Report는 수준이 어느 정도 될까요? [5]
ȣ...
2014.11.21
16604
1
34
만약 폐암으로 암이 간으로 전이 됐다면, 이 전이 된 암은 간암인가요.. 폐암인가요? [5]
궁금궁금
2014.11.20
16048
2
33
- [2]
꼬꼬마
2014.11.19
12675
2
32
eLife, Nature communications, Cell reports [9]
오픈엑세스
2014.11.19
21587
3
31
(의학통계초보)kappa value 적용하는 법 질문드립니다. [1]
회원작성글 벳윤호
2014.11.19
14974
2
처음 이전 01 02 03 04 05 06 07 08 9 10 다음 끝
위로가기
커뮤니티 홈
 |  BRIC소개  |  이용안내  |  이용약관  |  개인정보처리방침  |  이메일무단수집거부
Copyright © BRIC. All rights reserved.  |  문의
트위터 트위터    페이스북 페이스북   유튜브 유튜브    RSS서비스 RSS
필코리아테크놀로지 광고