BRIC로고
인쇄 닫기
[BIT] GSEA-P: A desktop application for Gene Set Enrichment Analysis
[BIT] GSEA-P: A desktop application for Gene Set Enrichment Analysis 저자 이즈텍
등록일 2010.04.23
키워드: BIT

내용 요약:

GSEA-P GSEA (Gene Set Enrichment Analysis) 라는 계산 알고리즘을 Java 로 프로그래밍화 한 것이다. GSEA 는 사용자가 정의하거나 혹은 pathway, GO (Gene Ontology) 와 같이 생물학적인 특성을 공유하고 있는 다수의 유전자들이 두 가지 생물학적인 상태 (예를 들면 normal, cancer 와 같은) 에서 통계적으로 의미 있는 차이를 보이며 발현되는지, 발현되는 특성이 서로 비슷한지를 동시에 평가해주는 알고리즘이다. 정의된 유전자 군에서 통계적으로 상관성 있는 발현 양상을 보이는 유전자들은 서로 군집화 되며 그렇지 않은 유전자들은 멀리 떨어지게 되는데, GSEA 는 이렇게 군집화되어 해당 생물학적인 현상 (pathway, GO ) 을 가장 잘 대표할 수 있는 유전자들 (leading edge subset) 을 선별해주는 특징이 있다. GSEA-P 2.0 은 기존의 분석 모듈에 새로이 leading edge subset 분석 모듈을 추가하였으며, 통합된 MSigDB (Molecular Signature Database) 와 브라우저를 통해 유전자 군을 검색하거나 다양한 마이크로어레이 플랫폼에 매핑할 수 있다.


Gene Set Enrichment Analysis (GSEA) 분석 방법 및 특징

1.     모든 유전자들의 발현 패턴에 대해 순위(rank) 를 매겨서 정렬한 후 (: fold change 가 큰 순), 지정된 gene set 에 포함되어 있는 모든 유전자들이 특정 영역 (: fold change 가 높은 부분)에 몰려서 나타날 확률이 어느정도 인지를 Kolmogorov-Smirnov statistic 을 이용하여 계산함.

2.     이런 특성 때문에 GSEA 에서는 분석하고자 하는 gene set 내의 DEG 뿐 아니라 모든 유전자에 대해서 계산을 하게 됨 (score summation).

3.     계산된 score summation 값이 최대치를 보이는 부분(ES)을 확인하여 gene set 내의 유전자들 중 특히 중요한 유전자군 (leading edge subset) 을 추출할 수 있다는 특징이 있음.

4.     샘플의 phenotype permutation 을 통해 random 하게 섞은 후 1,000개의 permuted sample data 를 만든 후 각각에 대해서 ES 값을 계산하여 원래 데이터에서의 ES 값과 비교를 통해 p-value FDR 값 계산

GSEA 가 작동하는 방식을 도식화 하면 아래와 같다.

1. 유전자 발현 패턴을 순위를 매겨 정렬





2. 분석하고자 하는 Gene Set 정의 및 기존에 정렬되어 있는 모든 유전자 리스트에 매핑

 

S = {g3, g122, g5, g11, g67, g258} a pathway1 에 속한 gene set



3. 유전자의 각 fold change 값을 가중치 부여



4. Gene set 에 속한 유전자를 왼쪽에서 오른쪽으로 증가시켜 ES (Enrichment Score) 값 계산 및 Leading Edge 유전자 군 추정



§ ES 값은 weighted Kolmogorov-Smirnov statistic 을 이용하여 계산을 하게 되며, ES 값을 계산하는 자세한 방법은 본 논문을 참고할 것

 

§ Kolmogorov-Smirnov statistic 참고 싸이트:

http://en.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test


본문의 자료제공 : )이즈텍 http://www.istech21.com/


참고 논문 : http://bioinformatics.oxfordjournals.org/cgi/content/short/btm369v1
참고 URL : http://www.broadinstitute.org/gsea/

Category : Gene Expression
Tags : GSEA

 

작성 : 2010.04.23 이즈텍

Citing URL: https:/www.ibric.org/myboard/read.php?Board=report&id=1198
인쇄 닫기
Copyright@BRIC. All rights reserved.