[DEBUG-WINDOW 처리영역 보기]
즐겨찾기  |  뉴스레터  |  오늘의 정보  |  e브릭몰e브릭몰 회원가입   로그인
BRIC홈 동향
웨비나모집
스폰서배너광고 안내  배너1 배너2 배너3 배너4
전체보기 뉴스 Bio통신원 Bio통계 BRIC이만난사람들 웹진(BioWave)
BRIC View
최신자료 동향리포트 학회참관기 리뷰논문요약 BRIC리포트 외부보고서
인간의 전사 인자
인간의 전사 인자 저자 공정렬 (KAIST 바이오및뇌공학과)
등록일 2019.07.18
자료번호 BRIC VIEW 2019-R18
조회 1715  인쇄하기 주소복사 트위터 공유 페이스북 공유 
요약문
전사인자(TF, transcription factor)는 특정 DNA 서열을 인식하여 염색질(chromatin)과 전사를 제어하고 유전자의 발현을 유도하는 복잡한 시스템을 형성한다. 지금까지 TF가 유전자 발현을 제어하는 방법에 대한 많은 연구에도 불구하고, TF의 정확한 게놈 결합 부위가 어떻게 지정되고, TF의 결합이 궁극적으로 전사 조절에 어떻게 관련되는지 결정하는 것은 여전히 어려운 일이다. 본 총설 논문에서는 1,600개 이상의 인간 TF와 그 중 2/3에 대한 결합 모티프를 통해 TF를 식별하고 기능적으로 특징짓는 방법을 살펴본다. 인간 TF의 주요 그룹들은 진화 경로와 발현 패턴이 현저하게 다르며, 이는 별개의 기능성을 나타낸다. TF는 인간 생리학, 질병, 변이의 다양한 측면의 밑바탕을 이루고 있기에, TF 매개 유전자의 조절을 이해하기 위한 지속적인 노력이 필요하다.
키워드: motif, domain, repertoire, ontology, gene regulatory network
분야: Cell_Biology

본 자료는 The Human Transcription Factors. Cell, 2018, 172(4):650-665.의 논문을 한글로 번역, 요약한 자료입니다.

목차

1. 서론
2. TF의 목록
3. TF의 기능
4. TF와 질병
5. 결론


1. 서론

TF는 게놈을 직접 해석해 DNA 염기서열을 해독하는 첫 단계를 수행한다. 많은 수가 "마스터 조절자"와 "유전자 선택자"로 기능하며, 세포 유형과 발달 패턴을 지정하고 면역 반응과 같은 특정 신호전달경로를 제어한다. 실험실에서 TF를 통해 세포 분화를 조절할 수 있으며, 심지어 역분화(de-differentiation) 및 전환분화(trans-differentiation)도 가능하다. TF와 TF 결합 부위의 돌연변이는 많은 인간 질병의 근간이 된다. 이들의 단백질 순서, 조절 영역 및 생리적 역할은 동물계에서 깊이 보존되는 경우가 많기에, 총체적인 유전자 조절 네트워크(gene regulatory network, GRN)는 서로 비슷할 것이다. 그럼에도 불구하고 개별적인 조절 순서는 많은 차이를 나타내며, 오랜 시간 동안 TF는 중복 복제되고 분산된 것으로 보인다. 동일한 TF는 서로 다른 세포 유형에서 서로 다른 유전자를 조절할 수 있으며, 조절 네트워크가 동일한 생명체 내에서도 동적으로 변화할 수 있는 것임을 나타낸다. 결합 부위를 인식하고 전사를 제어하는 다양한 방법으로 TF를 조립하는 방법을 결정하는 것은, 그들의 생리적 역할을 이해하고 게놈의 특정한 기능적 특성을 해독하며 복잡한 유기체에서 얼마나 특정한 표현 프로그램이 조절되는지를 매핑하는 데 있어 가장 중요하다.

본 총설 논문은 TF가 개별적으로 그리고 총체적으로 어떻게 작동하는지 생각해 볼 수 있는 맥락을 제공하기 위해 TF와 TF의 총체적 기능에 대한 현재까지 연구 결과들을 검토한다. 우리는 또한 인간 TF의 목록과 각 TF에 대해 DNA 결합 모티프가 알려져 있는지에 대한 종합적인 평가를 살펴본다. 우리는 이를 사용하여 인간의 TF 기능, 발현, 진화를 조사하면서 TF 단백질과 TF 결합 부위 내의 변동 효과를 포함하여 인간 질병에서 TF가 수행하는 역할을 강조한다. 약 1,600개의 단백질에 대한 포괄적인 검토는 불가능하나, 대신에 우리는 기존 데이터의 단점과 떠오르는 새로운 기술들을 제안한다.

2. TF의 목록

인간 TF와 유전자 조절 관계에 대한 총체적 분석의 핵심적인 출발점은 신뢰도가 높은 인간 TF와 그에 대해 알려진 단순 지수들이다. 도메인 구조가 TF를 완벽하게 예측하지 못하며, 문헌이 매우 이질적이며, 전자 주석이 일치하지 않는 등, 이러한 목록의 생성을 자동화할 수 있는 모든 단일 솔루션이 없다. 우리가 알고 있는 바로는 인간 TF에 대한 최근의 포괄적인 총설 논문은 2009년에 Fulton에 의해, 그리고 뒤이어 Vaquerizas에 의해 발표되었다. 연구진은 총 535개의 TF를 식별하여 DNA 결합과 전사 규제 등 TF 활동의 증거를 토대로 인간 TF 목록을 작성했다. 알려진 TF에 대한 선택성 및 전사 참여 가능성에 기반한 신뢰도 수준으로 이를 포함하는 DBD (DNA-binding Domain) 및 단백질에 주석을 달았다. 이 목록은 총 1,391개의 인간 TF를 생성하기 위해 GO (Gene Ontology) 및 TRANSFAC TF 주석과 함께 추가되었다. 최근 몇 년간 이 분야는 시험관 내에서 생성된 수백 개의 모티프를 포함하여 데이터 수집에 있어 상당히 발전했다. 또한 유전자 자체의 주석에도 업데이트가 있었다. 따라서 우리는 인간 TF 수집의 수정 수작업으로 이 검토의 나머지 부분을 구성했다.

앞서 언급한 논문을 토대로 HMM (hidden Markov model) 및 CisBP의 매개변수를 활용한 도메인 검색, TRANSFAC과 연계된 데이터베이스인 TFClass, PDB (Protein Data Bank)에서 추출한 DNA와 복합체를 이루는 단백질들의 좌위(loci)와 결정구조 및 NMR 구조, 그리고 Interpro, GO 등의 데이터를 집대성하였다. 또한 모든 관련 정보와 외부 데이터베이스에 대한 링크가 포함된 각 단백질에 대한 웹 페이지를 만들었다. 그런 다음 두 큐레이터를 지정하여 단백질의 상태를 ‘알려진 모티프가 있는 TF’, ‘상동 단백질에서 추론한 모티프가 있는 TF’, ‘DBD 또는 문헌정보에서 유사한 TF’, ‘ssDNA/RNA 결합 단백질’, 또는 ‘TF의 가능성이 낮은 단백질’로 분류하였다. 또한 각 단백질의 DNA 결합 모드를 모노머(monomer), 헤테로머(heteromer) 호모멀티머(homomultimer) 등으로 분류하였다. 큐레이터들은 또한 그들의 평가를 뒷받침하는 메모와 인용 출처를 기록할 수 있었다. CisBP 및 기타 출처의 데이터를 사용하여 단백질-DNA 구조의 가용성과 함께 각 TF에 모티프가 알려져 있는지 여부를 기록하였다. 하위 집합이 DNA를 결합하는 패밀리 내에서 불충분한 특징의 단백질을 결정하기 위해 글로벌 서열 정렬과 알려진 DNA 결합 부위를 고려했다. 이 과제를 실현하기 위해 단백질 변형이나 구속력 있는 파트너와 같은 복잡성을 탐색하거나 기록하지 않았다. 그 이후 연구자들은 서로 간의 의견 불일치 사례를 해결했으며, 두 큐레이터 모두 DBD가 없는 단백질이 TF일 가능성이 있다는 데 동의한 모든 사례를 수작업으로 검토했다. HumanTFs 웹사이트(http://humantfs.ccbr.utoronto.ca/)는 각 TF별로 별도의 페이지와 더불어 DBD 유형별로 알려진 모든 모티프, 정보 및 서열 정렬을 표시한다. 이 사이트에는 사용자가 추가 정보를 제출할 수 있는 옵션도 있다.

 

upload_image
그림 1. 인간 TF 목록을 집대성하기 위한 탐색 방법

 

최종적으로 생성된 리스트에는 1,639개의 알려진 인간 TF가 포함되어 있다. 대부분은 두 가지 DBD 유형인 C2H2-ZF 및 Homeodomain 중 하나만을 포함한다. 나머지의 거의 절반이 추가적으로 bHLH, bZIP, Forkhead, 핵 호르몬 수용체, HMG/Sox, ETS 6개 중 하나로 분류된다. DNA-서열 특이성이 결여된 알려진 하위 분류를 고려하면 Myb/SANT 또는 HMG 도메인 TF는 이전에 추정된 것보다 훨씬 적다. 1,639개의 TF 중 대다수가 DNA를 모노머 또는 호모멀티머로 묶일 것으로 알려져 있다. 상당수는 동일한 DBD 유형의 사본을 여러 개 포함하고 있지만, 대부분은 DNA를 배열로 묶는 C2H2-ZF이다. 단백질 당 C2H2-ZF의 수는 부분적으로 이펙터 도메인에 따라 상당히 다르다. KRAB를 포함하는 하위 유형에서 많은 수의 C2H2-ZF는 개별 변환 가능한 요소를 대상으로 하는 데 필요한 특수성 때문일 수 있다. 오직 TF의 일부(47개, 약 3%)만이 하나 이상의 DBD 유형을 포함하고 있으며, POU:Homeodomain이 가장 널리 사용되고 있다. 대부분의 인간 TF는 또한 추가적인 단백질 영역을 가지고 있다. 총 391개의 다른 유형의 비 DNA 결합 도메인이 표시되며, TF 이펙터 기능의 다양하고 광범위한 네트워크 개념과 일치한다.

이 조사는 기존 목록에 포함되지 않은 348개의 TF를 포함한다. 눈에 띄는 새 TF로는 C2H2-ZF 134개, bHLH 22개, AT-hook 14개, Homeodomain 13개가 있으며, 최근에 기술된 THAP 핑거 단백질이 있다. 이전 목록의 개별 단백질은 거의 완전히 재확인된다. 출판되었던 1,391개 단백질 중 1,292개 단백질(93%)도 현재 목록에 있었고, 50개는 유전자 주석의 변화로 통합되었고, 49개는 위의 지침을 사용하여 제거되었다. 마찬가지로 Fulton의 연구진에 의해 수동 큐레이션으로 식별된 TF의 98%는 본 연구에서 TF로 간주된다.

3. TF의 기능

TF는 DNA 결합에 대한 전사에 영향을 미치는 방법에 있어 매우 다양하다. 일부 인간 TF는 RNA 중합효소를 직접 모집할 수 있고, 다른 TF는 특정 단계의 전사를 촉진하는 부속요소를 모집할 수 있다. 박테리아에서와 마찬가지로 인간 TF는 특정 이펙터 기능이 부족할 수 있으며, 대신 살균 메커니즘에 의해 작용하는데, 이는 다른 단백질이 동일한 부위로 결합되는 것을 차단하는 것처럼 간단할 수 있다. 그러나 대부분의 진핵생물의 TF는 계면활성제를 채용하여 활동한다고 생각된다. 초기에 TF 이펙터 활동의 매개자로 식별된 보조활성자(coactivator)와 보조억제자(corepressor)는 종종 여러 메커니즘을 통해 전사를 규제하는 다단위 단백질 복합체 또는 다중 도메인 단백질이다. 그들은 일반적으로 TF와 RNA 중합효소를 포함한 히스톤 또는 기타 단백질의 공유결합 변경, 그리고 염색질 결합, 뉴클레오솜 리모델링 등에 관련된 영역을 포함하고 있다. IFNβ 인핸서좀(enhanceosome)은 여러 개의 TF를 결합하여 GCN5/KAT2A와 CBP/p300 히스톤 아세틸기전이효소(acetyltransferase)를 모집하는 보조활성자의 전형적인 예다. 그 결과 국소 염색질 환경의 변화는 SWI/SNF 복합체와 같은 뉴클레오솜 리모델링 기능의 단백질들을 모집하여 RNA 중합효소가 결합하고 전사를 시작할 수 있는 공간을 만든다. 일부 보조활성자와 보조억제자는 특별히 더 널리 사용되는 것으로 보인다. p300은 종종 수십 개의 TF와 연관되어 인핸서(enhancer)의 표지로 사용된다. TF와 RNA 중합효소 II를 연결하는 매개복합체(Mediator Complex)는 수천 개의 좌위에 결합 가능하며 수십 개의 TF에 의해 모집된다.

전용 이펙터 도메인은 종종 TF의 특정 보조인자(cofactor)의 모집을 중재한다. 예를 들어 KRAB 도메인은 약 350개의 인간 C2H2-ZF 단백질에서 발견된다. 그것은 TRIM28/KAP1을 모집하고, 이것은 다시 HP1/CBX5와 SETDB1을 모집한다. 그리고 억제 H3K9me3 히스톤 표지를 촉매한다. 마찬가지로 핵 호르몬 수용체의 리간드 결합 도메인도 리간드 및 상황에 따라 활성자, 억제자, 다른 TF와의 상호작용 방식을 촉매하게 된다. 그러나 많은 TF는 잘 정의된 이펙터 도메인을 포함하고 있지 않다. 일부는 거의 전적으로 단일 DBD로 구성되며, 따라서 특히 BATF, CREBL2, MAFK와 같은 bZIP, 혹은 MAX, NHLH1, ATOH7와 같은 bHLH 그룹으로 여러 활성화 도메인이 포함될 가능성이 낮다. TP53, E2F, SP1과 같이 잘 연구된 단백질에 존재하는 고전적인 전사 활성자 서열은 흔히 짧은 선형 모티프라고 하는 작은 기능 영역을 가진 구조화되지 않은 저복잡성 서열이다. 예를 들어, LxxLL 모티프는 원래 핵 호르몬 수용기의 단백질-단백질 상호작용 인터페이스로 그들의 계통이 확인되었지만, Myb/SANT 및 STAT처럼 관련이 없는 TF 그룹에도 존재한다. 또한 가장 잘 특징지어지는 C2H2-ZF TF 중 다수는 구조화되지 않은 영역 또는 DBD를 이용하여 보조인자와 상호작용하는 것으로 알려져 있다.

TF는 전통적으로 활성자나 억제자로 분류되어 왔지만, 이러한 개념은 반복적으로 의문시되어 왔다. 많은 TF는 서열 순서와 진화 계통적인 가용성에 따라 정반대의 효과를 갖는 다수의 인자들을 모집할 수 있다. 예를 들어 MAX는 MNT 또는 MXD1와 함께 헤테로다이머로서 DNA에 결합할 때는 억제자 역할을 하고, MYC와 함께 이질감지기로 결합할 때 활성자로 기능한다. 최근의 한 연구는 다양한 맥락에서 다양한 TF 결합 부위의 상대적 위치가 미친 유전자 발현에 대한 영향을 조사하기 위해 400만 개 이상의 서열에 대한 복잡한 관계 분석을 사용했으며, 동일한 세포 유형에서 활성화와 억제가 모두 가능한 수많은 모티프를 밝혀냈다.

4. TF와 질병

TF는 모든 인간 유전자의 약 8%를 나타내며 다양한 질병 및 표현형과 연관되어 있다. TF 돌연변이는 종종 매우 유해하기 때문에, 게놈 좌위에서 TF를 인코딩하는 부분이 극도로 보존된 영역에 많이 분포하고 DBD 내의 공통적인 변형이 거의 없다고 생각된다. TF의 유전적 분석은 특정 조건에서만 표현형이 검출되거나 또는 특정 인구 그룹에서 유해한 효과가 높은 변형이 존재하지 않는다면 어려움을 겪게 된다. 또한 유전자 조절 네트워크에 내재된 기능적 중복을 통해 그 기능 자체가 복잡해질 수 있다. 그럼에도 불구하고 임상 표현형에서 인간 TF에 대한 세계적인 관점은 공통의 주제로 향한다. 인간 표현형 온톨로지(The Human Phenotype Ontology)가 편집한 바와 같이, 유전자 인코딩 TF 내 또는 그 주변에서 상당한 수의 변이를 수반하는 인간 질환 표현형이 밝혀지고 있다. 이러한 표현형에 관여하는 것으로 알려진 15개의 유전자는 선천성 성장호르몬 결핍과 관련하여 발생하는 전뇌하위축증과 관련된 유전자들 가운데 가장 풍부하게 분포되어 있음이 관찰되며, 12개는 Homeodomain 과 Sox 계열에 속하는 TF이다. 전반적으로 인간 TF의 19.1%에 대항하는 313개는 현재 최소한 하나의 표현형과 연관되어 있으며, 이는 모든 유전자를 고려할 때 관측된 수치인 16.2%보다 상당히 높은 비율이다. 인간 TF들이 주로 발생 또는 조직별 기능에 활용되기 때문에, 최근 인간 암세포주에서 이루어진 CRISPR를 이용한 스크리닝에서는 필수 유전자 세트에는 TF가 별로 포함되지 않았다. 그리고 인간의 TF가 유전적으로 쥐에서 대응되는 TF의 알려진 기능과 일치하는 표현형을 나타내는 경우가 많다. 예를 들어 10개의 Rel 계열 TF 중 6개는 B 세포의 증식 억제를 초래한다.

일부 다원질병(polygenic disease)에 대한 GWAS (Genome-wide connection study) 신호도 TF를 인코딩하고 있는 좌위에서 풍부하게 나타난다. 이러한 질병들 중 다수는 면역 의존성이 강한 요소를 가지고 있으며, 이는 많은 면역 반응 TF의 두드러진 역할을 시사한다. 또한 많은 개별 TF 좌위에는 다발성 질환에 대한 강력한 GWAS 신호가 있다. 예를 들어 적응형 면역 반응에서 중요한 역할을 하는 Ikaros 계열의 C2H2-ZF1 및 IKFZ3을 인코딩하는 좌위 내의 변이들은 10개의 다른 GWAS 연구에서도 유의미하게 나타났다. 이러한 연구의 대부분은 강한 B 세포 및 T 세포의 고유한 유전적 신호를 나타내는 자가면역질환(autoimmune diseases)을 포함하고 있다.

TF의 모듈식 구조는 돌연변이의 기계적 영향에 대한 식별을 용이하게 한다. DBD 변형은 서열 특이성을 변경할 수 있다. HOXD13의 변형은 사지 기형과 관련이 있다. 유전자 발현에 대한 영향은 DBD 외부에 위치한 돌연변이에 의해서도 발생할 수 있다. 예를 들어 TP53 단백질 내의 여러 변형은 단백질 상호작용을 변경함으로써 그 활동에 영향을 미친다. 암에서 염색체 이상은 RNA 결합 단백질 EWSR1과 결합하는 Ets 인자 ERG 및 FLI1과 같은 새로운 기능을 가진 융합된 단백질을 생성할 수 있다. 마찬가지로 유전자의 돌연변이는 TF의 표현을 제어하는 조절 영역 내에 속할 수 있으며, 결과적으로 TF 기능이 변형될 수 있다. 예를 들어 MYC 발현을 조절하는 인핸서 내에서 TCF7L2 (TCF-4) 결합 부위가 약화되면 대장 내 종양 발생 위험을 줄일 수 있다.

TF는 조절 DNA의 변이에 의해 결합 부위가 영향을 받는 단백질을 나타낸다는 점에서 여러 유전자 클래스들 가운데서도 독특하다. 그러한 수많은 사례들이 확립되어 광범위한 TF 그룹과 질병의 관계를 다루고 있다. 예를 들어 FTO 좌위는 인핸서의 기능을 조절하여 ARID5B의 결합을 변화시키고, IRX3 및 IRX5 발현량의 증가를 유도하고, 전체 미토콘드리아 열생성을 변화시키고, 지방세포(adipocyte)의 운명을 결정짓는다. TF가 어떻게 그들의 목표를 찾고 유전자 표현 패턴을 제어하는지에 대한 더 깊은 지식을 얻게 된다며, 유전자 조절에 영향을 미칠 가능성이 있는 수많은 질병 관련 유전자들의 변이에 의한 영향을 이해하는 데 크게 도움이 될 것이다.

5. 결론

2003년 Eric Lander는 단 7단어로 강연을 요약했다: “Genome: bought the book, hard to read”. (https://www.improbable.com/airchives/paperair/volume9/v9i6/nano/nano_6.html).

DNA 염기서열의 기계론적 해석의 어려움을 강조하면서, 게놈은 읽기 어려운 책에 비유한 것이다. 이후 15년이 지났지만, 비코딩 서열의 기능을 해석하는 작업은 여전히 도전적이다. 그리고 ‘유효성 정리(futility theorem)’는 여전히 유지되고 있다. 하나의 예로서 많은 TF가 열린 염색질 내에서 우선적으로 결합한다고 알려져 있지만, 열린 염색질 자체도 아마 TF에 의해 제어되고 있으며, 현재 서열을 통해 열린 염색질을 높은 민감도와 정밀도로 직접 예측하는 알고리즘은 없다. 최신 연구에서 개발된 모델은 20%~35% 정도의 민감도를 달성했으며 프로모터(promoter)를 효과적으로 찾았다.

현재 진행 중인 이 분야의 도전들은 알려진 TF에 대한 모티프가 일반적으로 부족하기 때문에 더 이상 진행되기 어렵다. 지금 해결해야 할 분명한 장애물은 결합 부위와 기타 서열상 특징들의 관련 조합을 어떻게 우리가 학습할 것이냐 하는 문제다. TF-TF 협력 작용과 TF-핵물질 상호 작용은 아직까지 대부분 매핑되지 않았지만, 둘 다 총체적으로 널리 퍼져 있을 가능성이 있다. 관련된 인자가 매우 많기 때문에, 기능적으로 상호작용하는 조합의 수는 천문학적일 수 있다. 인간의 게놈의 크기는 제한되어 있으므로, 통계적 검증력의 부족으로 인해 그러한 상위 단계의 상호작용을 체계적으로 탐지하는 데 어려움이 있을 것이다.

게놈의 기능적 DNA의 대부분은 TF가 인식과 활용에 중심적인 역할을 하는 조절자일 가능성이 높다. 많은 인간 질병에서 TF는 분명한 역할을 하고 있으며, TF 매개 유전자 조절 메커니즘을 이해하기 위한 지속적인 노력이 필요하다. 현재 연구가 필요한 다른 과제로는 동일 유전자를 조절하는 다수의 인자들 간의 시너지 및 중복성 해소, 인핸서-프로모터 결합 예측, 염색체의 3차원 구조 제어 기능과 그로 인한 대규모 배열 조절, 다양한 유형의 후생유전 기억 등이 있다. 이러한 주제들을 분석하기 위한 계산적 방법 역시 현재 개발 중인 연구의 주제로서, 이와 같은 현상을 중재하는 TF의 역할을 탐색하는 실험 기법 또한 계속 개발되고 있다. 이러한 발전은 인간 유전학 그 너머의 영역을 정복하는 데 중요한 역할을 할 것이다.

 

  추천 2
  
인쇄하기 주소복사 트위터 공유 페이스북 공유 
  
본 게시물의 무단 복제 및 배포를 금하며, 일부 내용 인용시 출처를 밝혀야 합니다.
Citation 복사
공정렬(2019). 인간의 전사 인자. BRIC View 2019-R18. Available from https://www.ibric.org/myboard/read.php?Board=report&id=3278 (Jul 18, 2019)
* 자료열람안내 본 내용은 BRIC에서 추가적인 검증과정을 거친 정보가 아님을 밝힙니다. 내용 중 잘못된 사실 전달 또는 오역 등이 있을 시 BRIC으로 연락(member@ibric.org) 바랍니다.
 
  댓글 1
회원작성글 하그리브스  (2019-07-24 16:47)
번역 및 요약 감사합니다.
등록
목록
어날리틱예나 코리아
위로가기
동향 홈  |  동향FAQ  |  동향 문의 및 제안
 |  BRIC소개  |  이용안내  |  이용약관  |  개인정보처리방침  |  이메일무단수집거부
Copyright © BRIC. All rights reserved.  |  문의 member@ibric.org
트위터 트위터    페이스북 페이스북   유튜브 유튜브    RSS서비스 RSS
에펜도르프코리아