목차
I. 서론 II. 유전학과 후성유전학 III. 후성유전체 최신 연구 방법 및 동향 1. 후성유전의 원리와 기작 2. 후성유전체 최근 연구 동향 2.1 입체적 메커니즘 규명 2.2 방대한 생물학 자료 데이터베이스 활용 3. 후성유전체 최신 연구 방법 3.1 특정 유전자좌에 대한 접근성 연구 3.2 크로마틴 구조 변형에 관한 연구 3.3 후성유전체와 전사 IV. 후성유전학 활용을 통한 암 진단 및 치료 기술 개발 동향 1. 후성유전학과 암 진단 및 치료 1.1 후성유전학과 암 1.2 후성유전학을 통한 진단 및 치료 방법 2. 암후성유전학 연구 방법 및 동향 2.1 DNA methylation 2.2 DNA hydroxy-methylation 2.3 Histone modifications 2.4 Cancer mutations in histone genes 2.5 Chromatin remodelers 2.6 Noncoding RNAs V. 결론 VI. 참고문헌
Ⅰ. 서론
인간 유전자 수가 3만~3만5000개에 불과하다는 사실이 ‘인간 유전체 프로젝트(Human Genome Project)‘에 의해 밝혀졌다. 생리활동을 조절하는 단백질 종류가 10만 개 정도 된다는 추정을 바탕으로 인간 유전자 개수가 10만개에 이를 것이란 예측과는 매우 상이한 결과이다. 특히 인간 유전체 프로젝트 이후 유전체의 기능적 구성 인자를 밝히기 위해 진행된 엔코드(ENCODE: Encyclopedia of DNA Elements) 프로젝트에 따르면 인간 유전자 수는2만여개로 줄어들게 된다[1]. 산술적으로 보자면 30억 개의 염기서열 중 단 1%만이 유전정보를 가지고 있으며 그 외의 대부분은 ‘암흑물질’ (dark matter)로 여겨져 왔다. 이 암흑물질은 ‘쓰레기 디엔에이(Junk DNA)’라 불려졌으며, 이 부분은 특정한 기능이 없으며 단백질을 만들어내지 않는 비암호화 RNA (non-coding RNA)들로 채워져 있다고 알려져 있었다.
그러나 유전체에서 실제로 전사(transcription)가 이루어 지는 부분은 앞서 언급한 1%의 유전정보를 지니고 있는 부분에 국한되지 않고 오히려80% 정도가 된다는 사실이 밝혀졌다. 또한, 최근 들어 비약적 발전을 거듭하고 있는 차세대염기서열분석 실험기법들 (Next Generation Sequencing)에 기반한 연구들을 통하여 부모로부터 물려받은 DNA에 담겨진 유전정보가 다양한 후천적 요인들에 의하여 다르게 발현될 수 있다는 것이 밝혀지고 있다. 이러한 현상들을 후성유전이라고 칭하며, 이를 연구하는 학문분야를 후성유전학이라 한다. 후성유전의 기작에 관련하여 아직도 활발한 연구가 진행되고 있으나, 보편적으로 알려진 주요 요인으로는 조직 특이적인 전사인자(Transcription Factor)의 작용, DNA 메틸화(Methylation), 히스톤 변형(Histone Modification), 비암호화 RNA의 작용, 세포 외부로부터의 신호 등이 있을 수 있다. 이러한 주요 요인들에 의한 후성유전적 변이가 암을 포함한 다양한 질병의 발생과 연관이 있다는 연구결과가 지속적으로 보고되고 있다.
그러므로 후성유전학에 대한 이해는 세포 내 생물학 과정과 유전자 조절에 대한 연구에 필수적이다. 후성유전적 기작의 주요 요인들의 구조와 기능에 대한 이해를 바탕으로 인간 질병의 치료에 대한 가능성을 넓혀갈 수 있을 것으로 기대되고 있다. 본 보고서에서는 근래에 와서 특히 큰 관심을 받고 있는 후생유전체학에 대하여 살펴보고, 후성유전적 기작들을 유전체 수준에서 실질적으로 연구하는 방법들 및 분석기법들 역시 설명하고자 한다. 아울러 후성유전체학 활용을 통한 암 진단 및 치료 기술 개발 동향에 관하여 소개하고자 한다.
II. 유전학과 후성유전학
수많은 생명체들 중 여타 종들과는 다른 하나의 특정한 종을 결정짓고 그 종의 특징을 세대를 이어가며 보전시켜주는 메커니즘이 존재한다는 사실을 종의 기원의 저자인 Charles Darwin이 발견하였다. 그러나 Darwin도 그 메커니즘이 무엇인지는 밝혀내지 못했다. 그런데 Darwin과 동시대 인물인 Gregor Mendel이 유전학의 기본이 되는 중요한 법칙을 발견하게 된다. 체코슬로바키아의 Brno에 위치한 수도원에서 수도승으로 있었던 Mendel은 1856년부터 수도원의 뜰에 완두콩을 심고 콩의 색, 모양, 줄기의 길이 등 일곱 가지 형질이 어떻게 유전되나를 체계적으로 조사하여 중요한 발견을 하여 지금까지도 흔들리지 않는 Mendel의 법칙을 완성하였다. 그러나 Mendel도 유전 인자가 어떤 물질인지, 또 그것이 어떻게 실제로 유전이 되는지는 몰랐다.
유전물질에 관한 발견은 1869년 스위스의 생화학자 Friedrich Miescher가 세포핵 속에서 어떤 산성을 띄는 물질을 추출하고 이를 핵산(nucleic acid)이라고 명명함으로써 이루어 졌다. 다만 이 물질이 무슨 기능을 가졌는지 모른 탓에 그 중요성을 인지 하지 못하고 지나쳐 버리게 되었다. 1900년대에 들어서 영국과 미국에서 세균과 박테리아에 대한 연구를 수행하던 과학자들이 단백질이나 다른 물질이 아닌 그 당시까지 알려지지 않은 물질이 유전정보를 다음 세대로 전달한다는 사실을 밝혀내었다. 결국 DNA가 구체적으로 어떤 물질인지는 20세기 중반에 와서야 알려졌다. 특히, 미국 컬럼비아 대학교의 Erwin Chargaff가 DNA염기서열 상 존재하는 4종류의 핵염기들의 구성비율에 관한 사실을 밝혔다. DNA의 핵염기들인 adenine(A)과 thymine(T)의 양이 같고, cytosine(C)과 guanine(G)의 양도 같다는 것이다. 이 발견으로 인하여 핵염기들이 일대일로 대응하는 DNA이중나선 구조 발견의 단초가 되었다. 1953년 James Watson과 Francis Crick이 DNA의 이중나선 구조를 밝혀냈다[2]. 이 발견은 분자생물학계에서 DNA 연구가 급발전 할 수 있는 기폭제가 되었다.
다음 과제는 DNA가 담고 있는 유전 정보가 생체 내에서 어떻게 전달되는지 분자 수준에서 밝히는 것이었다. 1958년 Crick은 ‘센트럴 도그마(central dogma)’라는 가설을 내놓았다. 센트럴 도그마 가설에 따르면 DNA의 유전정보는 RNA를 거쳐 단백질로 전달되며, 그 반대 방향으로는 전달되지 않는다. 2000년대 들어서서 센트럴 도그마의 예외 사항이 보고되기도 하였으나, 아직까지 분자생물학과 유전학의 중심 원리로 받아들여 지고 있다. 센트럴 도그마가 발표된 이래로 이 도그마의 주요 3단계인 복제(replication) - 전사(transcription) - 번역(translation)에 대한 기작들과 주요 요소들에 대한 연구가 유전학 분야에서 체계적으로 연구되어 왔다.
그런데 1980년대에 들어서면서 후성유전학이라는 새로운 개념의 연구분야가 등장하게 된다. 종전 유전학 분야의 중심 원리인 센트럴 도그마의 핵심인 DNA 염기서열의 변화가 없더라도 유전자가 다르게 발현될 수 있다는 현상이 발견되기 시작했기 때문이다. 특히 1983년 미국 존스홉킨스 대학의 Andrew Feinberg가 인간 암세포에서 정제해 얻은DNA에서 특정 유전자 집단의 메틸화가 정상 세포의 동일한 유전자 집단에 비하여 현저히 낮은 수치의 메틸화가 진행되어 있음을 발견하여, 후성유전학적 요인이 암을 비롯한 질병과 깊은 연관성이 있을 것이라는 보고를 하였다 [3]. 그 발견 이후로도 후성유전학과 암 질병간의 강한 연관성에 관한 발견이 지속되었다 [3-8]. 2000년대 들어서면서 몇몇 유전자가 아닌 유전체 전체를 시퀀싱 할 수 있는 실험기법들이 등장하게 된다. 특히 2000년대 후반에 들어 널리 보급되기 시작한 next generation sequencing 은 massive parallel sequencing 이라고도 불리며 유전체 전체에서 발생하는 현상들에 대한 고해상도의 정보를 제공해 줌으로써 분자생물학 분야에 새로운 지평을 열었다 [9, 10]. 후성유전학 분야에서도 이 기술력을 활용하여 후성유전 요인들을 유전체 수준에서 연구할 수 있게 되었다.
이렇듯 후성유전학은 기존의 유전학으로 답할 수 없었던 미제로 남아 있던 영역들을 연구하여 새로운 사실을 밝혀 줄 것이라는 기대감에 더하여 암을 포함한 주요 질병들과의 깊은 연관성이 있다는 사실이 알려지면서 과학계를 넘어 일반 미디어들에서도 소개되기도 하였다. 그 과정에서 지대한 관심을 받게 되면서 과학적으로 충분히 입증되지 않은 주장들이 과학계 안에서 조차 사실인 듯 받아들여 지고 있다. 후성유전학이 전통적인 유전학에 상반된 개념인 듯 소개된다 거나, 환경의 변화가 진화에 영향을 준다는 neo-Lamarckism 개념이 다윈진화론에 반대되는 개념이라는 주장은 사실과는 다르다고 할 수 있다. 실제로는 후성유전학이 기존에 받아들여져 온 지식들과 이분법적으로 나뉠 수는 없다. 오히려 후성유전적 기작들 역시 DNA 유전체 염기서열 상에서 동작하고 있다. 또한 후성유전적 요인들이 세대를 걸쳐 유전되기는 하지만 실제로 진화론적 견지에서 보자면 그 영향은 실제로는 매우 미비한 편이다. 즉, 후성유전적 기작들과 주요 요인들은 이미 체계적으로 널리 연구되어 온 유전학 분야의 지식들과 접목되어야만 실제 생명현상을 올바르고 종합적으로 이해 할 수 있을 것이다.
Ⅲ. 후성유전체 최신 연구 방법 및 동향
1. 후성유전의 원리와 기작
유전정보를 저장하고 있는 수십억 염기쌍이 들어있는 DNA는 “생명” 현상에 대한 모든 정보가 담겨있는 것으로 유명하다. 매우 복잡하고 정교한 전자장비들로 이루어진 시스템의 수 백 페이지짜리 두꺼운 사용설명서에 비할 수 있다. 이 시스템에 문제가 발생하면 사용자는 의례 사용설명서에서 문제해결을 위한 정보를 찾아 해결하려 한다. 그런데, DNA의 경우는 전자장비의 사용설명서 보다 한층 더 복잡한 단계를 거쳐야만 그 안에 있는 정보를 열람할 수 있다. 이러한 복잡성은 바로 DNA가 암호화 되어 있고, 전사인자와 같은 단일 제어자만 가지는 것이 아니라 동시에 다수의 제어자들이 공동으로 조절을 하여 암호화된 유전정보를 읽어 낼 수 있기 때문이다. 게다가 후성유전학적 제어자들의 역할이 최근 들어 밝혀짐에 따라 DNA라는 사용설명서에서 필요한 정보를 찾아서 읽어내는 과정 자체가 더욱 더 복잡해 졌다고 하겠다.
이러한 복잡한 과정의 일례로 메틸화를 들 수 있다. 실타레의 역할을 하는 히스톤 단백질에 실처럼 빼곡하게 감겨져 있는 DNA는 책장에 다른 책들 사이에 꽂혀져 첫 페이지를 열어 볼 수 조차 없는 상태의 사용설명서와 같다. 그러나 실타레인 이 히스톤 단백질과 실처럼 감겨있는 DNA의 복합체인 크로마틴의 특정 부분에 메틸화라고 하는 화학적 변화가 발생하면, 마치 빼곡히 꽂혀 있는 책장 속의 책들 중 사용설명서가 꺼내어져 필요한 페이지를 열람 할 수 있게 페이지가 열리는 것처럼 히스톤 단백질에 감겨 있던DNA가 물리적으로 풀리면서 DNA 에 저장되어 있는 유전정보가 읽혀져 발현 될 수 있게 된다 [11, 12].
이렇듯 종전까지 널리 알려진 유전학적 관점에서의 유전자 발현 기작에 더하여 후성유전학적 기작들이 밝혀짐으로써 보다 더 복잡하고 정교한 분자생물학 연구가 가능해 지고 있다. 1980년대에 처음으로 후성유전학이라는 개념이 등장하고, 근래 들어 분자생물학 실험기법들의 비약적 발전에 힘입어 후성유전학을 유전체 수준에서 연구하는 후성유전체학이 널리 연구되고 있다 [9, 13]. 이러한 연구들을 통하여 몇가지 주요한 후성유전학 기작들이 밝혀졌는데, 대표적인 것이 앞서 예를 들며 설명한 DNA 메틸화와 히스톤 변형이 되겠다. 이 두 가지 후성유전적 기작들을 포함하여 비암호화 RNA들을 통한 후성유전적 변화 및 암 질병 특이적 후성유전적 기작들에 대하여 4.2절에서 더 자세히 설명하고자 한다.
2. 후성유전체 최근 연구 동향
2.1 입체적 메커니즘 규명
후성유전학적 주요 기전으로 알려진 DNA 메틸화, 히스톤 변형 및 비암호와 RNA의 역할 등에 관하여 유전체 수준에서 많은 연구들이 진행되어 왔다. 이러한 연구들에 의하여 각 기작들의 메커니즘과 주요 요인들이 밝혀졌다. 그러나 대부분의 경우 개별 기작들에 국한되어 연구가 진행되어 정작 중요한 점이라 할 수 있는 다른 후성유전학적 기작들이나 더 나아가 일반 유전학적 기작들과의 연관성을 밝히지는 못하고 있다. 특히 후성유전적 변화는 외부 신호나 세포 내부의 환경에 따라 급변하는 특징을 갖고 있는 점을 고려한다면 종전에 이미 심층적으로 연구되어온 일반 유전학적 발견들과 연계하여야 한다. 지금까지의 후성유전학적 연구들의 결론들을 종합해 보자면 아직까지는 하나의 종합적 생명현상의 변화를 전체적인 관점에서 분석하기는 불가능에 가깝다. 개별 연구결과물에서 우리가 볼 수 있는 변화나 특이한 현상은 매우 복잡하고 정교한 거대한 메커니즘의 일부분을 시간흐름에 따라서도 아닌 매우 일시적인 시점에서만 관찰한 것일 뿐이다. 대부분의 후성유전학자들은 지금 현재 우리가 관찰하여 발견한 특징들과 요인들이 다음 시점에서는 어떻게 변화할지는 아직 알 수 없다고 한다 [14].
이러한 제한점들을 극복하기 위하여서는 유전학과의 연계는 물론 보다 다각적인 분석들을 통합하여 입체적인 메커니즘을 규명하는 것이 중요하다. 최근 들어 이러한 점에 입각한 연구들이 열띠게 진행되고 있다. 특히2000년대 후반부터 사용되기 시작한 next generation sequencing 기술은 기존까지 널리 사용되던 ChIP-seq이나 RNA-seq뿐만 아니라 후성유전학을 유전체 수준에서 관찰하고 연구할 수 있도록 다양한 후성유전체 연구에 활용되어 기폭제와 같은 역할을 하고 있다 [9, 13].
우선, 후성유전학적 기전으로 이미 밝혀진 비암호화 RNA의 역할에 대하여 보다 거시적이고 대대적인 연구가 진행되고 있다 [15-18]. 새로운 비암호화 RNA의 발견이 속속 이루어 지고 있고, 이에 따라 비암호화 RNA 들을 기능적 특성에 의거하여 분류하여 보다 특이적 기능들을 밝혀내려는 연구들이 진행되고 있다. 또한, 비암호화 RNA들이 결국 특정 단백질에 결합하여 후성유전적 기전에 영향을 줄 것으로 추측되어 이러한 단백질과의 결합부위를 검출하는 CLIP-seq (Cross-Linked ImmunoPrecipitation followed by next generation sequencing)과 같은 실험기법들 역시 개발되어 연구에 활용되고 있다 [10].
또한, 크로마틴 구조에 대한 연구 역시 후성유전학과 연계하여 활발히 이루어 지고 있다. 크로마틴 구조가 유전자 발현 및 조절에 중요한 역할을 할 것이라는 추측은 이미 있었다. 최근 개발된 3C (Chromatin Conformation Capture)기법에 기반한 다양한 실험기법들은 고해상도 크로마틴 구조 지도를 제공해 줌으로써 TADs (Topologically Associating Domains) 연구에 새로운 지평을 열었다 [10, 19-23]. 이와 연관하여 크로마틴 구조를 결정 짓는데 주요한 역할을 한다고 최근 밝혀지기 시작한 CTCF[21, 22] 또는 RAD21[24]과 같은 단백질들의 DNA 결합부위에 관한 연구도 활발히 진행되고 있다. 또한, 유전체 상의 크로마틴 접합부위를 검출할 수 있는 ChIA-PET (Chromatin Interaction Analysis by Paired-End Tag followed by next generation sequencing) 기법을 활용하여 유전체상의 특정 부위가 접합하는 상대 부위를 정확히 파악할 수 있다 [21, 25-28]. 3C 기법에 기반한 Hi-C와 같은 다양한 실험기법들과 ChIA-PET기법을 함께 활용하여 고해상도의 정밀한 크로마틴 구조를 밝혀낼 수 있게 되었다. 특히, TADs가 중요한 이유로는 유전자 발현 조절에 결정적 역할을 한다고 알려졌으나 아직까지 자세한 위치나 어떤 유전자를 조절하는지 조차 밝혀지지 않은 enhancer메커니즘을 밝혀 줄 수 있을 것으로 기대한다. 일반적으로 enhancer들은 해당 유전자로부터 상당히 먼 거리에 위치하고 있어 그 관계를 파악하기가 어려웠으나, 유전체상 TADs 들이 밝혀져 특정 유전자의 유전체 상의 영역을 파악할 수 있어 해당 enhancer 및 공동 전사인자들을 밝혀낼 것으로 기대되고 있다.
끝으로, 오랜 기간 진화의 과정에서 각기 다른 종들로 분화가 되는 과정 속에서도 변경 없이 지속적으로 보존되어 온 요인들에 대한 비교 분석을 통하여 필수적 기능을 할 것으로 예상되는 후성유전적 요인들을 밝혀내려는 연구들이 시도되고 있다. 특히, 생물학에서 가장 많이 연구되어온 생체모델인 쥐와 사람간의 비교 연구들의 결과들이 mouse ENCODE project를 통하여 활발히 진행 중이다 [29-36].
2.2 방대한 생물학 자료 데이터베이스 활용
ENCODE와 modENOCDE 는 후성유전체 연구에도 큰 기폭제가 되고 있다. 단지 방대한 분량의 자료를 제공하는 것을 넘어서서 이제는 전세계 연구자들이 실험실에서 행하는 실험들에 대한 프로토콜에서부터 얻어내는 생물자료들의 질적 수준과 규격까지 표준화하고 있다. 아울러 이러한 생물자료들을 처리하여 분석하는 생물정보학적 과정까지 함께 표준화하고 있다. 이러한 표준화를 통하여 세계 각지에서 보고되는 자료들은 별다른 처리 없이 즉시 다른 자료들과 비교 분석이 가능하다 [1, 37, 38]. ENCODE와 modENOCDE 데이터베이스에는 다양한 종과 세포에서 얻어진 자료들이 있어 비교후성유전체학(comparative epigenomics)이 가능하다 [29-36, 39]. 비교후성유전체학은 이미 널리 연구되고 있는 비교유전체학(comparative genomics)과 같은 개념으로, 특정한 기작을 이해 할 수 있는 주요 유전자나 제어자의 기능을 밝히는데 가장 좋은 접근법이라 할 수 있어 보다 적극적인 연구가 진행되어야 한다.
이러한 비교후성유전체학을 통한 유전자와 제어자들의 기능을 분석하기 위해서는 대용량의 방대한 자료들을 처리하고 분석해야 하기 때문에, 필연적으로 대용량 컴퓨테이션이 요구된다. 이에 따라, 다른 분자생물학 분야와 마찬가지로 후성유전체학에서 생물정보학의 중요성 부각되고 있다. 이러한 요청들로 인하여 이미 후성유전체학 분석을 제공하는 웹서비스들이 가동되고 있다. 가령, Regulome-DB의 경우는 인간 유전체의 비암호화 영역을 직접 들여다 볼 수 있는 기능을 제공한다 (regulome.stanford.edu). 그리고 Haplo-Reg의 경우는 비암호화된 변형적 패턴들이 영향을 미칠만한 임상 조건(질병)들을 검색할 수 있다 (http://www. broadinstitute .org/mammals/haploreg).
3. 후성유전체 최신 연구 방법
후성유전체는 유전체 상에 여러 겹으로 중첩되어 쌓여있는 복잡한 층들로 되어 있는 구조로써 유전자 발현을 조절하는 정보를 담고 있다. 이러한 복잡한 층들에는 nucleosome들의 결합[40], 위치[40], 구성[41], 변형[42] 및 동적[43]인 정보들이 존재한다. 또한 DNA 메틸화[44] 역시 나타난다. 이러한 후성유전적 현상들은 전사인자들(transcription factors)[45], ATP의존적 크로마틴 리모델러(chromatin remodellers)[46], 비암호화 RNA들[47]의 작용에 의해 형성된다.
후성유전적 기작들이 기본적인 세포발달 과정과 인간 질병에 깊은 연관성이 있다는 사실이 알려진 이래로 상세한 후성유전체 지도를 만들어 내는데 큰 관심이 있어왔다. Encyclopedia of DNA Elements (ENCODE)[48]와 Epigenomics Roadmap[49] 콘소시움 등이 이러한 후성유전체 지도를 만들어 내기 위한 대규모 연구를 주도 하고 있다. 이러한 노력으로 후성유전학은 생물학 연구의 많은 분야에서 일반적에서 연구되고 있으며, 이는 Sequence Read Archive (SRA) 데이터베이스에 24,000개 이상의 ChIP–seq (chromatin immunoprecipitation followed by high-throughput sequencing) 자료가 저장되어 있음이 증명하고 있다.
대규모 병렬 시퀀싱 (Massively parallel sequencing)은 혁신적 유전체 연구 기법이지만 Sanger 시퀀싱에 비하면 염기서열을 읽어내는 길이가 상대적으로 짧고 정확도가 보다 낮은 편이다. 이러한 단점은 다형성과 돌연변이를 정확히 판독해 내지 못하는 한계를 가져온다[50]. 그러나 일반적으로 짧은 길이로 염기서열을 검출한다고 여겨지는 대규모 병렬 시퀀싱의 25-75bp의 길이는 후성유전체 시퀀싱에 적합하며, 검출된 염기서열이 참조 유전체(reference genome)의 어느 부위에서 읽혀진 것인지 밝혀내는 매핑(mapping) 과정에서 충분한 정확도를 가질 수 있어 큰 문제가 되지 않는다. 이렇듯 후성유전적 현상이 발생하는 정확한 부위를 유전체 상에서 찾아 줄 수 있는 대규모 병렬 시퀀싱은 하나의 염기와 바로 다음에 위치한 염기를 구분할 수 있을 정도의 고해상도를 제공함으로써 후성유전적 현상을 매우 정확히 관찰하게 해줄 수 있다. 특히, 2007년 처음으로 대규모 병렬 시퀀싱을 이용한 연구 결과가 발표될 당시의 시퀀싱 비용은 megabase 당 대략 $800USD 이었으나, 2014년부터는 megabase 당 $0.1USD 미만으로 현저히 저렴해 졌다. 근래에 들어 이렇게 매우 저렴해진 시퀀싱 비용으로 인하여 대규모 병렬 시퀀싱은 분자생물학 분야에서 이미 가장 강력하고 보편적인 실험기법으로 자리매김한 것과 같이 후성유전체 분야에서도 널리 사용되고 있다 [13]. 대규모 병렬 시퀀싱 기법을 활용하여 최근에 개발 된 후성유전체 연구방법들을 소개하고자 한다.
3.1 특정 유전자좌에 대한 접근성 연구
대규모 병렬 시퀀싱을 활용하여 관찰하고 있는 후성유전체 현상 중 하나는 바로 크로마틴 구조의 변형을 통한 특정 유전자좌(loci)의 접근이 특정한 환경하에서 더 용이해 지는 기작에 관한 것이다. 비특이적 핵산가수분해효소(nucleases)에 의한 분열에 대한 민감도에 의하여 검출되는데, micrococcal nuclease (MNase)[51]와 deoxyribonuclease I (DNase I)[52]가 가장 보편적으로 사용되고 있다. 또한, FAIRE (formaldehyde-assisted isolation of regulatory elements)[53]와 Sono-seq (sonication of crosslinked chromatin sequencing)[54]이 크로마틴 개방 상태(nucleosome-depleted)와 크로마틴 폐쇄 상태(nucleosome-occupied)를 관찰하기 위해 각각 개발 되었다. 그러나, 후성유전학 연구 초기에는 이러한 기법들이 microarray 플랏폼에 적용되어 상대적으로 저해상도에서 관찰이 이루어진다는 제한적 요인이 있었다. 근래 들어 대규모 병렬 시퀀싱에 접목시켜 연구가 활발히 진행되고 있다.
MNase-seq (MNase digestion followed by sequencing)은 nucleosomes의 위치뿐만 아니라 RNA 중합효소 II (RNA polymerase II)의 유전체 상의 위치까지 매핑 할 수 있다 [55]. 또한, paired-end 시퀀싱을 한다면 nucleosomes의 위치와 함께 염기서열 특이적 전사 인자의 결합 위치까지 검출 할 수 있다 [56]. 동원체(centromeres)의 특성을 연구하는 데에도 MNase-seq이 활용되기도 하였다 [57]. DNase-seq (DNase I hypersensitive sites sequencing)은FAIRE-seq 이나 Sono-seq와 같이 DNA 분해효소I (DNase I)에 의하여 절단된 단편들을 검출할 수 있어 크로마틴의 개방부위를 밝혀줄 수 있다 [58]. ATAC-seq (Assay for Transposase-Accessible Chromatin using sequencing)은 유전체 곳곳을 뛰어 다니며 이동하는 유전자군으로 알려진transposon들을 이용하여 앞서 언급한 다른 방법들과 같이 크로마틴의 개방부위를 찾아줄 수 있다 [59]. 다른 방법들에 비하여 상대적으로 적은 용량의 생체샘플만 있어도 실험이 가능하여 희귀한 세포주나 환자들의 경우에도 적용이 가능하다는 장점이 있다. 그 외에, 특정 화학분열 기작들을 이용하는 방법들이 개발되고 있다 [60, 61]. 이 방법들은 기존과 달리 실험에 사용되는 시약에 따라 결과가 달라지지 않는다는 장점이 있다.
한편, DNA 메틸화를 측정하는 방법이 대안으로 부각되고 있다. 기존의 방법들의 경우는 어떻게는 DNA 자체에 영향을 주게 되어 불필요한 크로마틴 구조의 변형이 발생할 수 밖에 없는 단점이 있다. 그러나 DNA 메틸화 측정의 경우는 이러한 한계를 극복할 수 있다는 장점이 있다. DamID (DNA adenine methyltransferase IDentification) [62, 63]와NOMe-seq (Nucleosome Occupancy and Methylation sequencing)가 이러한 방법에 속한다.
이 외에도 유전체 관련 연구에 가장 보편적으로 사용되고 있는 방법으로는ChIP (Chromatin ImmunoPrecipitation)기법과tiled microarray 기법이 접목된ChIP–chip또는 massively parallel short-read sequencing 이 접목된 ChIP–seq이 있다. 지난 10여년간 분자생물학 실험의 중심으로 자리매김 하여 중요한 많은 연구들이 이루어져 왔으나, 실험과정에서 크로마틴을 초음파로 분쇄하여200-400 염기쌍 정도의 길이로 절단하여 시퀀싱을 하기 때문에 검출되는 DNA 단편들이 짧을 수 밖에 없게 된다. 이러한 제한적 요인은 결국 실험 결과물의 해상도에도 제한을 주게 되는 단점으로 작용하게 된다. 이 한계점을 극복하기 위하여 초음파 절단을 대신하여 효소들을 이용한 크로마틴 절단을 하여 실험하는 방법들이 최근에 개발되고 있다. 예를 들자면 핵산말단분해효소 (exonuclease)를 이용한 ChIP-exo (ChIP and exonuclease digestion)[64]과 특정 크로마틴 단백질을 용해시켜 절단을 하는 방식인 고해상도X-ChIP–seq (High-resolution X-ChIP–seq)[65]과 native ChIP을 사용함으로써 다른 방식들에서 주로 사용되는formaldehyde crosslinking의 부작용을 극복할 수 있는 장점이 있는 ORGANIC (Occupied Regions of Genomes from Affinity-purified Naturally Isolated Chromatin)[66, 67]방법 등이 있다.
3.2 크로마틴 구조 변형에 관한 연구
후성유전체는 본질적으로 매우 역동적인 특성을 지니고 있다. 히스톤 프로틴들에 감겨진 DNA로 이루어진nucleosome들은 크로마틴을 구성하는 하나의 작은 개체로써 유전체 상에서 초단위로 움직이며 잠시 비활성화 되기도 하고 때로는 다른nucleosome으로 교체되기도 한다. 게다가 전사인자나 히스톤 단백질 외의 일반 단백질들과 역동적으로 결합을 끊임없이 반복한다. 이러한 동적인 특성을 ChIP 기법에 기반한 실험들로는 연구할 수가 없다.
최근 들어 후성유전체의 역동적인 변형들을 포착할 수 있는 실험기법들이 개발되어 이 분야의 연구가 활발히 진행되고 있다. 첫 시도는 H3.3이라 불리는 히스톤 변형에 초점을 맞추어 이루어 졌는데, 이 변형의 경우는 DNA복제와 관련이 없기 때문에 히스톤 단백질이 유전체 상에서 움직이는 위치를 포착해 줄 수 있다 [68, 69]. 항원결정기(epitope)를 관찰하고자 하는 단백질에 달아서 발현시킴으로 해서 크로마틴의 일시적 접합부위를 고해상도로 찾아주는 방법도 개발되었다 [70, 71]. 단백질이 아닌 대사체를 레이블링 하여nucleosome의 움직임을 포착하는 방법인 CATCH-IT (Covalent Attachment of Tags to Capture Histones and Identify Turnover)도 개발되었다 [72]. 실제 살아있는 세포를 직접 촬영하여 세포 내의 동적인 현상들을 자세히 관찰할 수 있는 live-cell imaging기술에 ChIP기반 실험기법을 접목하여 연구하려는 시도 또한 있다 [73]. Live-cell imaging 의 경우 동적인 현상을 관찰은 할 수 있지만 해상도가 낮다는 단점이 있어서 동적이진 않지만 고해상도를 갖는 ChIP기반 방법을 접목하여 이러한 단점을 극복하려는 것이다. 지금까지 언급한 실험 기법들로 인하여 크로마틴의 일시적 접합부위나nucleosome의 움직임의 변화들을 관찰할 수 있게 되었으나 아직까지는 후성유전체의 동적인 특성을 시간대별로 자세히 이해하기에는 제한적인 요인이 많다고 할 수 있다.
3.3 후성유전체와 전사
유전자 발현의 과정인 전사단계의 모든 기작들은 결국 크로마틴이 취하는 특정 순간의 특정한 구조 안에서 이루어 진다. Nucleosome이 전사인자들의 접근을 통제하는 물리적인 장벽의 역할을 한다는 사실이 밝혀지고 있다 [11, 12]. 그러므로 후성유전체가 유전자 발현에 어떠한 방식으로 영향을 주는지를 이해하는 것이 매우 중요한 과제로 부각되고 있다. 이미 in vitro 상에서는nucleosome이 전사체와 어떤 상호작용을 하는지에 관한 연구가 진행되어 왔다. 그러나 in vivo 상에서는 크로마틴에 영향을 주는 단백질군들이 많아서 특정nucleosome을 연구하기에는 매우 복잡한 환경이다.
최근 들어 in vivo 상에서 전사체와 후성유전체 간의 연관관계를 관찰할 수 있는 방법들이 개발되었다. Nascent RNA-seq은 유전자 발현의 결과물인 cDNA들의 총 질량을 유전체 수준에서 검출해 주는 RNA-seq 으로 최종 발현량을 측정한 후에, 초기(nascent) RNA의 수준을 다시 측정하여 크로마틴 구조의 변화가 전사과정에 미치는 효과를 추정하는 방법이다 [74, 75]. NET-seq (native elongating transcript sequencing)은 초기 RNA를RNA 중합효소 II (RNA polymerase II)와 함께 정제함으로써RNA 중합효소 II에 의하여 추가된 마지막 염기서열들을 읽어낼 수 있다 [76]. 전통적 실험기법인 nascent chain isolation을 NET-seq과 접목시켜 3’ 말단 쪽의 염기서열을 읽을 수 있는3′NT (3′ Nascent Transcript)라는 방법도 있다 [77]. 또한 RNA 중합효소 II가 어느 위치에서 뉴클레오타이드를 RNA 사슬에 더하는 과정인 신장(elongation)을 하는지와 어느 위치에서 멈춘 후 원래 자리로 되돌아 오는지를 모두 관찰할 수 있다. Nuclear run-on 기법에 기반한GRO-seq (ge-nome-wide scale as Global Run-On sequencing)을 개선한PRO-seq (Precision nuclear Run-On and sequencing)이란 방법도 RNA 에 추가된 마지막 뉴클리오타이드를 관찰 할 수 있으나RNA 중합효소 II의 정체와 회귀를 관찰할 수는 없다 [78].
Ⅳ. 후성유전학 활용을 통한 암 진단 및 치료 기술 개발 동향
유전체에서 일어나는 일시적이고 빠르게 변화하는 후성유전적 작용들은 DNA 유전정보의 해석을 더 복잡하게 하지만, 오히려 이러한 요인들은 연구자들에게 신약 및 치료기법 개발에 보다 더 많은 기회를 제공 할 것이라 여겨지고 있다. 언제, 어떻게 이러한 후성유전학적 변화가 정상 세포의 발달에 변화를 줌으로써 암 및 기타 질병을 유발시키는 기작이 작동하는지를 총체적으로 이해하는 것이 매우 중요한 부분이 되었다.
1. 후성유전학과 암 진단 및 치료
1.1 후성유전학과 암
후성유전학이 암과 관련이 있다고 밝혀진 것은DNA 메틸화가 유전자 발현에 미치는 영향에 관한 연구들을 통해서이다 [3, 5-8]. 초기에는 DNA메틸화가 암 발병의 기작에 주요 역할을 할 것이라는 추측이 다수의 연구보고서에서 제시 되었다. 이러한 초기 관찰에 근거한 추측들은 근래 들어 진행된International Cancer Genome Consortium (ICGC)[79]의 연구 결과들에 의하여 정확하게 추측하였음이 입증되었다. ICGC에서 여러 종류의 암 유전체들의 염기서열을 분석한 결과 다수의 후성유전적 조절자들에서 체세포 돌연변이가 존재함이 발견되었다. 암 유전체를 분석한 주요 목적은 암을 유발하는 돌연변이 여부를 확인하는 것 이었다. 돌연변이의 주요 특징으로는 다양한 종류의 암에서 자주 발견되며, 특정 유형의 암에서 높은 발견율을 보인다는 것이다. 특히, 특정 암에서 크로마틴 조절자의 유전적 손상과 그로 인한 후성유전적 변형의 발견은 단백질의 기능 규명과 치료를 위한 타깃으로서의 가능성을 제공한다. 이미 크로마틴 조절자들에 대한 다양한 억제 약물들이 개발되었고, 다양한 단계의 임상실험이 진행되고 있다(그림 1)[80].
1.2 후성유전학을 통한 진단 및 치료 방법
진단
후성유전학은 예방의학(preventive medicine)에 활용될 수 있다. 가령 후성유전체를 스캔함으로 암 의심 요인들을 암 발병 이전 또는 초기에 조기 진단함으로써 미리 암 발병을 억제하거나 암을 초기에 발견하여 치료 함으로써 완치에 이를 수 있다. 신생아의 발뒤꿈치에서 체취한 혈액을 통한 검사가 이미 시작되고 있다. 많은 국가에서 이 혈액은 신생아가 출생한 해당 병원과 당국의 의료관리 시스템에 의하여 응고 혈액의 형태로 DNA 보관이 가능한 Guthrie cards 방식으로 안전한 장소에 영구보관 되고 있다. 이러한 자료들은 이미 연구에 활용되고 있는데, 가령 런던대학교 Queen Mary 컬리지의 과학자들은 신생아들의 DNA 메틸화 패턴을 비교분석하고 있으며, 더 나아가 동일 신생아의 메틸화 패턴을 출생 직후와 3년이 경과한 시점에 얼마나 변화하였는지를 연구하고 있다 [81]. 후성유전학적 요인들의 시간 경과에 따른 변화는 곧 건강에 문제가 생기는 경우 중요한 단서가 될 것이다.

그림 1. 암 치료에 활용되는 후성유전적 제어자들 [80] KAT, histone lysine acetyltransferase; KMT, histone lysine methyltransferase; RMT, histone arginine methyltrans-ferase; and PARP, poly ADP ribose polymerase. 근래에 들어 급격히 발전하는 시퀀싱 기술의 발전에 따라 시퀀싱 가격이 빠르게 낮아지고 있는 점과 앞서 언급한 후성유전체 시퀀싱을 통한 후성유전학적 요인들의 변화를 분석하는 것이 질병 조기진단에 주요 단서로 활용될 수 있다는 점을 함께 고려한다면 머지 않은 미래에 후성유전체 시퀀싱을 이용한 예방의학적 접근은 정기 건강검진의 필수 사항으로 자리매김 할 것으로 보인다. 후성유전체의 변화를 정기적으로 판독하여 업데이트하고 이전 판독과 비교하여 변화된 점들을 검사하는 것은 유전체 서열에서 개개인 별로 질병관련 특정 유전자를 가지고 있는 지를 파악하는 것과 함께 중요한 검사로 자리매김 할 것이다.
치료 방법
후성유전적 기작들이 일정한 상태를 유지하지 않고 상황에 따라 변화하는 특성은 신약개발에 매진하고 있는 과학자들에게 효과가 좋은 신약을 개발 할 수 있다는 큰 기대를 갖게 해 준다. 환경이나 필요에 따라 변화하는 특성은 질병을 치유할 수 있는 약물의 가장 중요한 필수요소들 중 하나인 적응성이란 측면에 부합하기 때문이다. 또한, 후성유전적 기작들을 이용하는 것이 신약 개발에 보다 더 적합 수 있는 이유는, 다양한 단백질들 간의 결합이 후성유전적 기작들에서 주요 역할을 하기 때문이다. 전통적 신약개발의 경우에는 효소(enzyme)에 결합하는 약물을 개발해 왔었다. 그러나 후성유전학 기작에 기반한 약물을 개발한다면 효소가 아닌 작은 분자를 이용한 단백질들간 결합에 직접 영향을 줄 수 있는 약물 개발이 가능하다. 다시 말하자면, 특정한 후성유전적 기작을 직접 조절 할 수 있는 특정한 분자를 인지하여 제어할 수 있는 약물 개발이 가능하다는 것이다. 예를 들면, 치료가 어렵다고 알려진 급성 백혈병(acute myelogenous leukemia)의 발병에 깊은 연관이 있는 BET (bromodomain and extraterminal) 단백질을 억제할 수 있는 특정한 분자가 발견되었다 [82]. 이 분자를 억제하는 신약이 제약회사 GlaxoSmithKline를 포함한 신약개발관련 회사들에 의하여 개발되어 임상실험이 진행되어 왔으며, 2014년 임상 1상이 성공적으로 통과되었다.
1980년대 처음 후성유전적 기작에 관한 연구가 진행된 이래로 많은 과학자들이 연구에 매진하여 암 관련 후성유전적 기작들을 제어할 수 있는 다수의 억제자들(Epigenetic Inhibitors)이 보고 되었고, 이를 기반으로 후성유전학적 신약들이 개발되고 있다 (그림 1). 신약 개발의 과정은 일반적으로 4단계로 나누어진다. 우선, 후보군으로 선정된 작은 분자들은 악성세포주에서 특이 표현형에 대한 검사를 받게 된다. 이 검사에서는 일차적으로 증식 억제 여부, 세포괴멸 발생 여부, 세포주기 정지 여부 등을 점검한다. 이러한 표현형 분석은 종종 유전체 및 단백질체 분석기법과 접목되어 일차 검사에서 관찰된 반응에 대해 분자 수준에서의 잠재적 메커니즘의 존재 여부를 검사 받게 된다. 다음 단계로, 이렇게 가능성을 확인 받은 억제제는 이제 in vitro 검사를 마치고 in vivo 검사를 받게 된다. 암 질병 동물 모델을 사용하여 해당 억제제가 실질적으로 생존율 측면에서 치료 효과가 있는지 여부를 검사 받게 된다. 동물 모델 검사는 약물의 독성 및 약물 동태학적 특성에 관한 검사 결과 또한 제공한다. 이러한 사전 임상 연구에 기반하여 선별된 후보 억제제는 실제 임상 실험 단계에서 검사 받게 된다. 마지막 단계로서, 엄격히 실시된 임상 실험들에서 실질적 효능을 검증 받게 되면 FDA와 같은 규제 당국으로부터 일상적인 임상 사용 승인을 받게 된다.
2. 암후성유전학 연구 방법 및 동향
2.1 DNA methylation
CpG dinucleotides에서 cytosine의 5-carbon의 메틸화(5mC)는최초로 입증된 DNA 변형에 대한 첫 발견이자 크로마틴 변형에 관한 연구 중에서 지금까지 가장 많이 진행된 분야일 것 이다. 비록 유전체 상에서 저메틸화 현상은 악성종양 세포에서 흔히 관찰되지만, 암에서 가장 잘 연구된 후성유전적 변형은 포유류의 모든 promoter들 중 70% 정도에서 발견되는 CpG islands에서 일어나는 메틸화 변화이다. CpG island 부분에 발생한 메틸화는 유전자 발현을 조절하는 전사과정에서 중요한 역할을 하며, 악성종양으로의 변형 중에 빈번히 발생한다 [83, 84]. 또한 pro-moter에서 CpG 과메틸화 현상은 유전자 발현뿐만 아니라 악성종양으로 변형하는 과정에 중요한 역할을 하는 비암호화 RNA들의 발현에도 영향을 준다 [83].
DNMT (DNa MethylTransferases)들은 DNA 메틸화 기작에서 중요한 역할을 하는 요인들로 밝혀졌다. 진핵생물에 세 가지의 활성 DNMT들이 존재하며 각기 다른 기능을 하는 것으로 알려졌다 [85, 86]. 한편, DNA 메틸화는 여러 MBD (Methyl-Binding Protein)들의 결합을 유도한다. DNMT들과 MBD단백질들의 돌연변이가 비정상적인 발생에 영향을 준다는 것이 밝혀진 것은 이미 오래 전 일이지만, 이 돌연변이들이 인간의 악성종양에 영향을 주는 것은 최근에 들어서야 밝혀졌다. 급성 골수성 백혈병(AML; Acute Myeloid Leukemia) 환자의 25%가 DNMT3A 돌연변이를 가지고 있음이 최근에 발견되었다 [79].
2.2 DNA hydroxy-methylation
DNA 메틸화는 다른 후성유전적 요인들에 비하여 상대적으로 안정적인 크로마틴 변형이라고 오래 전부터 여겨져왔다. 그러나, 최근 대규모 병렬 시퀀싱 등의 고해상도 유전체 분석법에 의해 만능 세포와 분화된 세포에서 역동적인 DNA 메틸화가 발생하는 현상이 관찰되었다. 이러한 관찰 결과들을 종합해 보면 크로마틴의 변형 기작을 삭제 또는 변경시킬 수 있는 효소적 활성이 세포 안에 존재하는 것으로 추측된다 [83]. 특히, 5hmC (5-hydroxymethylcytosine)가 5mC의 대사체 기작에 영향을 미친다는 것이 2009년 처음으로 보고되었다. TET (ten-eleven translocation) 1-3 단백질들이 5mC를 5hmC로 전환하는 DNA hydroxylases이다. 가령, 발암 과정에서 TET2 단백질의 돌연변이를 가진 환자의 종양세포에 5hmC의 양은 감소하고 5mC의 양은 증가해 있음이 발견되었다 [87]. TET 단백질들에 의한 5hmC의 반복적인 산화는 5fC(5-formylcytosine) 및 5caC(5-carboxylcytosine)와 같은 여러 가지 산화 파생물들을 만들어낸다. 이 파생물들의 생물학적 역할은 아직 밝혀지지 않았지만, 유전자 발현 조절에 중요한 역할을 할 것이라고 추정된다 [88]. 특히, 5hmC는 유전자 발현 조절에 중요한 역할을 하는 enhancer 또는 insulator element 에서도 발견되었다.
표1. 크로마틴 변형과 기능 [80]
 Modifications: me1, monomethylation; me2, dimethylation; me3, trimethylation; me2s, symmetrical dimethylation; me2a, asymmetrical dimethylation; and Cit, citrulline. Reader domains: MBD, methyl-CpG-binding domain; PHD, plant homeodomain; MBT, malignant brain tumor domain; PWWP, proline-tryptophan-tryptophan-proline domain; BRCT, BRCA1 C terminus domain; UIM, ubiquitin interaction motif; IUIM, inverted ubiquitin interaction motif; SIM, sumo interaction motif; and PBZ, poly ADP-ribose binding zinc finger. a These are established binding modules for the posttranslational modification; however, binding to modified histones has not been firmly established.
2.3 Histone modifications
상당히 다양한 종류의 히스톤 변형들은 매우 복잡한 메커니즘들이 가능하게 하며, 이로 인하여 히스톤 변형들에 관한 연구는 비교적 더디게 진행되어 오고 있다. 히스톤 변형은 유전자 발현을 조절하는 전사과정의 활성과 억제 모두에 관련이 있다고 알려져 있다 (표1). 그러나 히스톤 변형들은 정적이지 않고 주변 환경과 시간이 변화함에 따라 역동적으로 변한다. 그리고 전사과정에 대한 활성과 억제는 항상 상호 배타적인 것은 아닌 것으로 보인다. 또한, 하나 혹은 하나 이상의 히스톤 변형의 조합들은 히스톤들 간에 상호조율을 통하여 이루어 지며, 이러한 상호조율 과정은 생물학적으로 중요한 의미를 지닌다 [12, 89]. 히스톤 변형을 유도거나 이미 변형된 돌연변이와 결합하는 단백질들이 잘 못 발현되어 있는 현상이 암 환자들에게서 발견되었다. 이러한 종양발생에 연관이 있으며 새로운 치료법에 활용이 가능한 히스톤 변형들과 최근 들어 발견되고 있는 특성들은 다음과 같다.
Histone Acetylation
• Lysine 잔기의 Nε-아세틸화는 전사, 크로마틴 구조, DNA repair에 관여하는 주요 히스톤을 변형 함 • Lysine 의 양전하를 중성화하여 히스톤과 음전하를 가진 DNA의 결합을 약하게 하여 크로마틴 구조 개방 시킴 • 두 가지 효소들 KATs (histone lysine acetyltransferases)와 HDACs (histone deacetylases)에 의해 조절 됨 • KATs는 두 종류: (1) 핵 안에 존재하고 GNAT, MYST, CBP/p300으로 분류되는 type-A, (2) 핵 밖에 존재하고 비히스톤을 조절하는 type-B • 다양한 KATs의 돌연변이 및 염색체 전좌들(MLL-CBP, MOZ-TIF2)이 혈액암에서 발견 됨 • Histone acetyltranferases가 악성 종양에 기여하는 분자적 기전은 히스톤과 비히스톤 단백질의 아세틸화 패턴 분석을 통해 진행되고 있음
Histone Deacetylation
• HDACs은 아세틸화 된 lysine 잔기를 아세틸화 전 상태로 되돌며, 총 18가지 종류의 효소가 확인 됨 • 서열 유사성에 따라 4가지 class I 부터 IV로 분류 됨 • 이종 융합 단백질들인 PML-RARα, PLZF-RARα, AML1-ETO들은 HDACs을 유도하여 비정상적인 유전자를 발현시켜 백혈병을 유발 시킴 • HDAC-I(inhibitors of histone deacetylases)는 비정상적인 유전자 억제를 해제하여 악성 세포의 증식 억제 및 사멸을 유도 함 • T 세포 림프종 치료를 목적으로 하는 두 가지의 HDAC 억제제들(Vorinostat와 Romidepsin)이 최근에 미국 FDA의 승인을 받음 • HDACs의 발현 정도는 그 외의 다양한 종양에서 관찰되고 있어서 보다 특이적으로 작용하는 HDAC 억제제 개발이 진행되고 있음
Histone Acetylation Readers
• 아세틸화의 일차적인 reader는 bromodomain이라는 결합 부위를 가진 40개 이상의 단백질들 임 • 이들 단백질은 chromatin-reading 부위의 변형을 인식하는 PHD fingers를 가지고 있음 • Bromodomain을 가진 BET 계 단백질들(BRD2, BRD3, BRD4, BRDt)은 전사와 세포 주기를 조절 함 • BRD3와 BRD4의 전위가 NUT-midline carcinoma와 관련 있음이 발견 됨 • BET 억제제는 MYC 전사를 억제함으로써 암의 치료에 효과가 있음
Histone Methylation
• 메틸화는 arginine, lysine, histidine 잔기에서 발생 함 • 아세틸화와 인산화와는 달리 메틸화는 전하를 바꾸지는 않음 • 가장 잘 알려진 것은 lysine 잔기의 메틸화로 H3K4, H3K36, H3K79는 euchromatin부분, H3K9, H3K27, H4K20은 heterochromatin 부분과 관련이 있음 • Lysine 메틸화는 methyltransferase 활성을 가진 SET domain을 통해 일어 남 • KATs와 달리, histone lysine methyltransferases(KMT)는 특정한 lysine 잔기를 표적으로 함 • 다양한 암에서 KMT(MMSET, EZH2, MLL)의 전위와 돌연변이가 발견 됨 • 특히 인간의 암에서 EZH2는 이중적 역할을 가지고 있어 주목을 받고 있음 • EZH2는 PRC2 복합체에서 촉매역할을 하는데, H3K27의 메틸화에 관여 함 • 초기 연구들에서는 EZH2의 과발현은 전립선 암과 유방암 진행을 유도하여 발암유전자로 여겨졌으나, 최근 혈액암에서 EZH2의 돌연변이가 발견되어 암 억제 역할도 가지고 있음이 밝혀짐
Histone Demethylation
• 두 종류의 lysine demethylase(LSD1과 Jumonji demethylase)가 발견되면서 역동적인 변형임이 밝혀짐 • 이는 Histone lysine의 메틸화는 매우 안정하다고 알려진 것과 상반되는 발견임 • LSD1(KDM1A)은 FAD(flavin adenine dinucleotide)와의 amine oxidation reaction을 통해 mono-, dimethyllysine을 탈메틸화 함 • Jumonji는 free electron pair을 필요로 하지 않기 때문에 mono-, di-, trimethyllysine 모두를 탈메틸화 할 수 있음 • 여러 종류의 암에서 KDM5A(JARID1A), KDM5C(JARID1C), KDM6A(UTX)의 돌연변이가 발견되었으며, 특히 UTX 돌연변이는 혈액암에서 많이 발견 됨
Histone Metylation Readers
• 다양한 상태의 lysine 메틸화는 물리화학적으로 lysine의 다양성을 초래 함 • 이러한 메틸화의 상태를 인지할 수 있는 motif를 가지고 있는 단백질들에 의해 어떤 상태인지 판별 됨 • 백혈병은 JARID1A 또는 PHF23의 일부분을 포함하고 있는 PHD finger와 NUP98의 결합에 의해 발병됨으로 PHD finger의 H3K4me3 결합을 억제하면 치료될 수 있음 • 재조합 단백질(fusion protein)은 크로마틴에 결합함으로써 H3K27me3의 비활성화를 억제하여 혈액암 유전자(HoxA9, Meis1, Pbx1)의 발현을 유도 함
Histone Phosphorylation
• Serine, threonine, tyrosine의 인산화는 대부분의 히스톤에서 발생 함 • 이 인산화는 단백질의 전하를 변화시켜 구조와 기능에 영향을 주게 됨 • 인산화 위치는 전사 조절과 크로마틴 응축에 영향을 준다는 것이 발견 됨 • 악성혈액종양에서 증가되거나 돌연변이로 변형되는 JAK2는 H3Y41을 특이적으로 인산화시켜 크로마틴 억제자인 HP1α의 결합을 방해함으로써 Lmo2같은 혈액암유전자를 발현 시킴
2.4 Cancer Mutations in Histone Genes
소아 교아종 (pediatric glioblastomas) 환자들 중 1/3에서 복제에 의존적이지 않은 히스톤 단백질 들인 H3F3A(histone H3 variant H3.3) 와 HIST1H3B(canonical histone H3.1)을 발현시키는 유전자들에서 체세포 돌연변이가 지속적으로 일어나는 현상이 최근에 보고되었다 [90, 91]. 이 돌연변이들은 특정 유전자좌에 대하여 두 상동염색체가 이종의 유전자로 배합된 상태 (heterozygous)를 항상 유지하고 있으며 서로 근접하게 위치하여 집합체를 형성하고 있다. 이렇게 함으로써 아미노산 서열을 교체하는 결과를 초래하며, 이는 결국 히스톤 H3의 말단에 위치한 매우 중요한 돌연변이(K27M, G34R/G34V)를 생성해 내게 되는데 큰 영향을 미친다. 이렇게 변형이 된 히스톤들은 크로마틴 구조와 유전자 발현 조절의 전사단계에 중대한 영향을 가져올 가능성이 매우 높다. K27M은 메틸화와 에틸화에 모두 영향을 줄 수 있고, G34R/G34V 돌연변이들과 더불어 암 유전자 발현이 다른 경우와는 현저히 다른 양상을 띄게 한다. 특히, G34V돌연변이를 가지고 있는 종영세포는 H3K36me3가 전반적으로 증가되어 있다 [90].
이러한 발견들은 후성유전체 기작에 관하여 몇 가지 흥미로운 의문점을 유발한다: 가령, 변형된 돌연변이 히스톤 단백질들이 왜 nucleosome의 일부로 남아 있는가? 어떻게 이러한 돌연변이 히스톤 단백질들이 샤페론(histone chaperone) 이라고 불리는 특별한 단백질들의 기능 및 nucleo-some 형성, 안정성, 이동성에 영향을 주는가? 이러한 질문들에 대한 연구들이 진행 중이며, 몇 가지 근거들이 발견되고 있다. 가령, H3.3 히스톤 단백질을 비활성화시켜 기능을 멈추게 할 수 있는 ATRX/DAXX 크로마틴 리모델링 복합체들에 돌연변이가 발생된 것이 소아 다형교모세포종 (pediatric glioblastoma multiforme)에서 발견되었다. 이러한 돌연변이를H3F3A/ATRX/DAXX 상에 가지고 있는 종양의 경우는telomere의 길이 변화와 유전체 안정성 전반에 변화가 있을 가능성이 높아진다 [90]. 이러한 최근 진행된 연구들에서 발견된 근거들에 의하여, 크로마틴 리모델링 복합체에 발생하는 돌연변이들이 악성종양의 일반적 특징으로 받아들여 지고 있다.
2.5 Chromatin Remodelers
화학적 관점에서 보자면, nucleosome상에서 원자가 전자를 공유하는 화학적 변형들이 무수히 발생하여 역동적인 ATP 의존적 크로마틴 리모델링이 가능한 여건을 마련해 준다. 크로마틴 리모델링의 생화학적 활동과 그들의 내부적 구성 상태에 따라서 크게 네 가지 부류로 나뉠 수 있다. (1) switching defective/sucrose nonfermenting(SWI/SNF) family; (2) imitation SWI(ISWI) family; (3) nucleosome remodeling and deacetylation(NuRD)/Mi-2/chromodomain helicase DNA binding(CHD) family; (4) inositol requiring 80(INO80) family. 이 효소들은 진화의 과정 속에서 모두 잘 보존되어 왔으며, 그들이 움직일 수 있고 히스톤 단백질을 교체하는 등의 활동에 필요한 에너지의 공급원으로 ATP를 이용한다. 또한, 이들은 각기 특징적인 domain 구조를 가지고 있고, 가지고 있는 다양한 chromatin reader motif의 종류(SANT domain, bromodomain, chromodomain)에 따라 분류된다. 이 다양한 motif 들은 크로마틴 리모델링의 활동이 특정한 지역에서 특정한 환경하에서만 작동할 수 있게 해준다.
SNF5, BRG1, MTA1와 같은 크로마틴 리모델링 관련 몇몇 단백질들이 악성종양에서 변형된다고 밝혀졌고, 이들이 종양 억제제의 역할을 할 것이라는 가능성이 제기되고 있다. 이러한 추측들은 최근 들어 암유전체를 시퀀싱하는 연구들이 진행되면서 보다 더 신빙성이 높아지고 있다. 예를 들어, 다양한 종류의 혈액암 [92, 93] 및 고형암 [94-98]에서 앞서 언급한 네 가지 효소들 중 하나인 SWI/SNF 복합체가 매우 빈번히 변형되어 돌연변이를 만들어 내어 이 복합체들이 암의 발달과 유지에 중요한 역할을 하는 것을 보여준다.
2.6 Noncoding RNAs
대규모 병렬 시퀀싱은 유전체 전체에서 일어나는 유전자 발현을 검출 할 수 있게 개발되었으나, 실제로는 유전자로 발현되는 부분은 전체 유전체의 2%정도라고 알려져 있다. 유전자로 발현이 되지 않은 유전체의 나머지 부분들은 ncRNAs (noncoding RNA)을 만들어 낸다. 비암호화 RNA들은 200 nucleotides미만의 짧은 것과 긴 것(lncRNA)으로 나눌 수 있으며, 정상 세포의 발달은 물론 암과 같은 질병의 발생에 중요한 역할을 한다고 밝혀지고 있다. 짧은 비암호화RNA의 종류로는 small nucleolar RNAs(snoRNAs), PIWI-interating RNAs(piRNAs), small interfering RNAs(siRNAs), microRNAs(miRNAs)가 있으며, 각 종류들의 서열이 다양한 종들 간에 잘 보존되어 있다. 이러한 서열을 이용하여 DNA상의 특정 대상과 염기쌍을 이루어 유전자 발현이 일어나지 않도록 하는 기작으로 전사단계 및 후전사 단계에서 영향을 미친다. 반면 길이가 긴 RNA(lncRNA)들은 종들 간에 서열 유사성이 상대적으로 적고, 유전자 발현에 보다 다양한 기작을 통하여 영향을 미친다고 알려져 있다. 특히 크로마틴 상에서 활동하는 크로마틴 조절자들의 결합을 유도하거나 돕는 매우 중요한 역할을 한다고 보고되고 있다 [99].
비암호화 RNA에 관하여 가장 잘 연구들 중 하나를 예로 들면, HOXC cluster와 연관이 있는 lncRNA인 HOTAIR이다. HOTAIR는 PRC2 complex와 LSD1-containing CoREST/REST complex의 작용을 돕는 역할을 하고[99], 말기 유방암과 대장암에서 과도하게 발현되어 있음이 발견되었다 [99, 100]. 또한 악성종양 세포에서 HOTAIR의 발현 정도를 조정할 경우 PRC2가 크로마틴 상에 결합하는 기작에 영향을 미침으로써 암의 전이가 발생하지 않게 하는 효과가 있다 [99]. 한편, HOTAIR와 같은 길이가 긴 비암호화 RNA의 다른 예로는 HOTTIP가 있다. HOTTIP는 HOXA cluster에서 발현이 된다고 알려져 있으며 5’HOXA 유전자의 전사 활성을 촉진 시킨다[99]. HOTTIP는 크로마틴이 구부러져 원거리에 있는 부분과 접합되는 과정에서 5’HOXA 유전자에 접근하게 되어 MLL1 complex를 유도하여 H3K4me3에 결합하게 함으로써 전사가 잘 이루어지게 하는 결과를 가져온다. 5’HOXA cluster 가 백혈병의 발생과 진행에 매우 중요한 역할을 하기 때문에 이러한 발견들은 HOTTIP가 이 질병의 비정상적 유전자 발현 현상에 큰 영향을 줄 수 있다는 가능성이 제기되고 있다.
V. 결론
후성유전적 현상들은 여러 질환들의 발병과 진행에서 중요한 역할을 한다고 알려져 왔으며 유전학으로는 설명 할 수 없었던 현상들에 대한 답변을 제공함으로써 과학자들은 물론 많은 일반인들의 관심을 받게 되었다. 1980년대 등장한 후성유전학은 2000년 중후반 이후 개발된 차세대 염기 서열분석 또는 대규모 병렬 시퀀싱이라 불리는 기법을 활용하며 후성유전학을 유전체 전체에 걸쳐 연구할 수 있는 후성유전체학이라는 새로운 분야로 거듭나게 되었다. 본 보고서에서 살펴 본 바와 같이 다양한 후성유전적 기작들이 체계적으로 연구되고 있으며 이미 암을 포함한 여러 질병들의 발병과 진행에 주요한 역할을 하는 것이 확인되고 있다. 이러한 발견들을 통하여 축적된 지식들은 곧 해당 질병에 대한 진단 및 치료 방법의 개발로 이어지고 있다.
다만 현재 후성유전체학 분야에서 사용할 수 있는 기술들은 특정 위치에서 일어나는 특정한 현상에 대한 생화학적 정보만을 우리에게 제공해 줄 뿐이다. 후성유전학적 변화들을 포함한 분자생물학을 넘어 일개의 생명체 전반에 걸쳐 일어나는 생물학적 변화와 그에 따른 결과들에 대한 전반적이고 총체적인 메커니즘에 관한 이해를 하기에는 아직 가야 할 길이 매우 멀다고 하겠다. 이러한 후성유전에 관한 연구들이 현재에 지니는 한계점들을 극복하기 위해서 기존의 실험방법들 보다 개선된 기술들을 개발하기 위한 시도들이 최근 들어 이어지고 있다.
가령, 가장 많이 사용되는 대규모 병렬 시퀀싱에 기반하지 않고 질량분석 기법을 활용한 ChAP-MS (chromatin affinity purification with mass spectrometry)이라 불리는 방법이 개발되었다 [101, 102]. 기존에는 관찰하고자 하는 특정 히스톤 단백질 등을 미리 정한 후 그에 단백질을 추출해 줄 수 있는 특정 antibody를 사용했어야 하지만, 이 새로운 방법을 사용하면 특정 단백질 만이 아닌 크로마틴 상에서 일어나는 모든 후성유전적 현상들을 관찰 할 수 있다. 다만 아직까지는 유전체 상의 일정 부분만을 한번의 실험에서 관찰 할 수 있다는 한계가 있다. 다른 방법으로는, nano-fluidic장치에 기반하여 silica wafer를 사용함으로써 시퀀싱에서 형광물질(fluorescent)을 사용하지 않을 수 있어 종전 시퀀싱 방식보다 훨씬 개선된 해상도를 제공해 주는 방법도 개발되었다 [103]. 특히 이 방법은 Odyssey Molecular 라는 회사를 설립하여 다른 연구자들이 사용할 수 있도록 상용화하고 있다. 한편, DNA 메틸화 측정의 경우에는 기존까지 널리 사용되어온 bisulphite시퀀싱을 대신하여 nanopores (DNA를 매우 미세한 틈사이로 흘려보내어 측정하는 방식)를 사용 하여 측정하는 방법이 개발되었다 [104-106]. 이 방법 역시 시퀀싱 전문 업체인 Pacific Biosciences에서 상용화 단계에 들어가 있다고 한다. 그런가 하면, 연구의 대상으로 삼고자 하는 특정한 세포만을 정확히 추출해 줄 수 있는 방법이 개발되었다. 이 방법은 laser를 사용하며LCM-RRBS (laser capture microdissection–reduced representation bisulphite sequencing)라고 불린다 [107]. 특히 이 방법은 신경세포와 같이 매우 복잡한 조직에서 특정한 세포를 추출하여 실험하고자 하는 경우에 매우 유용할 것으로 기대된다.
이러한 최신 기법들은 기존의 기법들이 발견해 주지 못한 새로운 정보들을 제공해 주리라 기대된다. 다만 아직까지는 이러한 기법들이 대부분 프로토타입 수준에 머물러 있어서 전세계 곳곳에서 후성유전체 연구에 매진하는 연구자들이 그들의 실험실에서 직접 사용하기에는 짧게는 몇 개월에서 길게는 수년의 시간이 소요될 것으로 보인다. 그러나 앞서 언급한 바와 같이 학계에서 개발된 기법들을 상용화시키고자 하는 노력들이 이미 진행되고 있다. 이렇듯 최근 들어 시도되고 있는 다양한 신규 실험기법들의 개발과 종전에 이미 체계적으로 시행되어 온 후성유전체 연구방법들이 접목될 향후 2-3년 이후에는 후성유전에 관한 새로운 발견들이 이루어져 생명활동 전반에 대한 우리의 이해 수준이 한 단계 향상되리라 기대한다. 1958년 Crick이 발표한 ‘센트럴 도그마(central dogma)’가 한 세기가 지나기 전에 새로운 버전으로 탈바꿈하게 될 수 있기를 희망한다.
VI. 참고문헌
=> PDF 참고 |