[DEBUG-WINDOW 처리영역 보기]
BRIC을 시작페이지로 회원가입    로그인
BRIC동향
   
통합검색
배너1 배너2 스폰서배너광고 안내
오늘의 BRIC정보
모바일 BRIC RSS
트위터 페이스북
검색 뉴스레터 안내
좋은 연구문화 만들기
Bio일정
Bio일정
 
Bio일정 프리미엄(유료) 등록이란?
2017년 5월달 Bio일정을 확인하세요.
실험
실험
바이오 형광사진
실험의 달인들
동향리포트
평가단 모집
Bio마켓
Bio마켓
BioJob
BioJob
Biojob 프리미엄(유료) 등록이란?
커뮤니티
커뮤니티
전체메뉴
대메뉴안내: 동향
뉴스 Bio통신원 Bio통계 BRIC View BRIC이만난사람들 웹진
BRIC View
최신자료 동향리포트 학회참관기 리뷰논문요약 BRIC리포트 외부보고서
CRISPR 시스템 생물학 및 응용: 게놈 공학을 위한 자연의 도구 상자
CRISPR 시스템 생물학 및 응용: 게놈 공학을 위한 자연의 도구 상자 저자 양진아 (서울대학교)
등록일 2017.03.09
자료번호 BRIC VIEW 2017-R08
조회 2858  인쇄하기 주소복사 트위터 공유 페이스북 공유 
요약문
박테리아와 고세균은 플라스미드와 바이러스 감염을 막기 위한 다양한 방어기작을 가지고 있다. 그 중에서도 특이한 것은 외래 핵산에 대한 적응 면역을 제공하는 CRISPR-Cas (clustered regulatory interspaced short palindromic repeats-CRISPR associated) 시스템이다. CRISPR 시스템은 재감염 시 왕성한 간섭(interference)을 촉진하기 위해 침입자의 유전정보를 수집한다. 본 리뷰논문 요약에서는 Cas 단백질이 외래 핵산에 반응하는 다양한 기작에 대해 이해하고 이들 시스템이 다양한 생명체에서 정확한 게놈 조작을 위해 어떻게 활용되었는지 살펴보고자 한다.
키워드: CRISPR, Cas protein, genome editing, toolbox
분야: Biotechnology, Genomics
본 자료는 Biology and Applications of CRISPR Systems: Harnessing Nature’s Toolbox for Genome Engineering. Cell. 2016; 164: 29-44의 논문을 한글로 번역, 요약한 자료입니다.

목차

1. 전문
2. 본문
  · 획득(acquisition): 과거 감염에 대한 유전적 기록 만들기
  · Type I 획득(acquisition)
  · Self- versus Non-Self-Recognition
  · Protospacer 이식(integration) 메커니즘
  · Type II 획득(Type II acquisition)
  · Type II 획득 장치(machinery)
  · Type-II Protospacer 이식(integration)
  · 게놈 수정 도구로서의 CRISPR 인테그라제(integrase)
  · crRNP Biogenesis: 세포를 위한 분자 보초병(sentinel) 만들기
  · Cas6 Endoribonucleases에 의한 가공
  · Type II 시스템에서의 가공(processing)
  · 생명 공학 도구로서의 Cas6
  · 간섭(interference): 정확하고 프로그램 가능한 DNA 결합 및 절단
  · Type I 간섭(interference)
  · Type II 간섭(interference)
  · Type III 간섭(interference)
  · Type V 간섭(interference)
  · 게놈 편집 도구로서의 간섭(interference) 복합체


1. 전문

CRISPR-Cas는 파지 감염에 대한 원핵 개체군의 방어시스템으로서 외래 DNA를 선택적으로 절단하여 감염을 막고 일부를 흡수하는 기능을 하며, 약 50%의 세균과 90%의 고세균에서 발견된다. 침입자에 대해 일반화된 방어를 제공하는 다른 세포 방어 메커니즘과는 달리, CRISPR 시스템은 이전 감염의 기록을 생성하여 재감염 시 신속하고 확실한 대응을 유도함으로써 척추동물의 적응 면역과 유사하게 기능한다. CRISPR-Cas 시스템은 20-50bp 길이의 염기서열이 반복되는 가운데 비슷한 길이지만 독특한 서열인 spacer가 끼워져 있고, AT가 풍부한 선행서열을 가지는 CRISPR 배열을 특징으로 한다. E. coli에서 CRISPR 유전자가 처음 발견된 지 거의 20년이 지난 후, spacer가 이전 감염에 대한 기록으로서 바이러스 게놈과 접합플라스미드로부터 유래되었다는 것이 밝혀졌다. Spacer와 일치하는 외래 DNA 서열을 ‘protospacer’라 하는데, 2007년에는 파지 게놈과 일치하는 spacer가 상응하는 파지에 대해 숙주 미생물이 면역을 갖도록 하며 새로운 파지 감염이 CRISPR 배열에 새로운 spacer를 첨가하여 확장을 유도한다는 것이 밝혀졌다.

CRISPR 면역은 spacer 획득, CRISPR RNA (crRNA) 생합성 및 간섭(interference)의 3단계로 나뉘어진다(그림 1). 적응(adaptation)이라고도 불리는 spacer 획득 과정에서 외래 DNA 식별, 처리되어 CRISPR 자리에 새로운 spacer로 이식(integration)된다. crRNA 생합성은 종종 하나의 pre-crRNA로써 CRISPR 자리의 전사된 후 각각 단일 space를 보유한 crRNA로 성숙되는 과정을 거친다. 간섭(interference) 단계에서, 기능성 복합체(effector complex)는 crRNA를 사용하여 spacer 서열에 상보적인 서열을 가지는 임의의 파지 또는 플라스미드를 식별하고 파괴한다.

이러한 단계는 주로 CRISPR 배열 측면의 cas 유전자에 의해 암호화 되는 Cas 단백질들에 의해 수행된다. CRISPR-Cas 시스템은 "특징 유전(signature gene)"에 따라 6가지 type으로 분류될 수 있으며 이들은 추가적으로 두 그룹으로 나뉘어지는데, Type I-III는 가장 잘 연구된 반면 Type IV-VI는 최근에 확인되었다. Type I 시스템의 특징 단백질은 Cas3이며, 이 단백질은 외래 DNA를 분해하기 위한 다중 단백질-crRNA 복합체 Cascade (CRISPR-associated complex for antiviral defense)가 인식하는 DNA를 절단하는 뉴클레아제 및 헬리카제 도메인을 가지고 있다. Type II 시스템의 특징 cas9 유전자는 간섭(interference)에 필요한 유일 단백질을 암호화한다.

upload image
그림 1. CRISPR 시스템의 기능.
침입한 유전자는 CRISPR 배열로 획득되고, pre-crRNA로 전사된 후 crRNA로 가공된다.
가공된 crRNA와 Cas 단백질이 결합하여 표적이 되는 핵산 서열을 절단한다.



Type III 시스템의 특징 단백질은 Cas10이며 Cascade 복합체에 조립되어 대상을 탐색하고 파괴한다. Type IV 시스템의 Csf1은 CRISPR 배열이 아닌 독립된 형태로 발견되지만 Cascade-like 복합체의 일부를 형성할 것으로 제안되고 있다. Type V 시스템 또한 Cas9과 비슷한 단일 뉴클레아제를 포함하며 서브 type에 따라 Cpf1, C2c1 또는 C2c3를 포함한다. Type VI 시스템은 2개의 HEPN (higher eukaryotes and prokaryotes nucleotide-binding) RNase 도메인으로 예상되는 도메인이 있는 C2c2를 가지고 있다. Type I, III 및 IV 시스템 다중 서브유닛 기능 복합체를 기반으로 하는 Class 1으로, 단일 서브유닛으로 기능하는 Type II, V 및 VI 시스템은 Class 2로 나뉜다(그림 2)(표 1).

표 1. CRISPR type 및 특징 단백질에 관한 요약
upload image


upload image
그림 2. CRISPR 시스템은 구성 유닛에 따라 크게 6가지 type으로 나뉜다.
각 type의 오페론을 나타내었으며, 특정한 아형에서만 존재하는 유전자는 점선으로 표현하였다.
간섭과 연관된 유전자는 파랑색, crRNA의 가공에 연관된 유전자는 노랑색, 획득과 관련된 유전자는 녹색으로 나타내었다.



2. 본문

· 획득(acquisition): 과거 감염에 대한 유전적 기록 만들기

CRISPR 면역은 외래 DNA가 숙주 세포의 염색체로 식별 및 이식(integration)되는 것으로 시작된다. 획득이 처음 실험적으로 감지된 Streptococcus thermophilus Type II-A 시스템에서는 박테리오파지 DNA로부터 새로운 spacer가 CRISPR 자리의 선행 서열 끝부분에 삽입되고, 첫 번째 반복 서열이 복제되어 반복-spacer 구조를 유지한다. E. coli I-E 시스템을 이용한 후속 연구는 Cas1과 Cas2가 spacer 획득을 매개한다는 것을 입증했다. 대부분의 시스템에서 새로운 protospacer 서열은 무작위적으로 선택되는 것이 아닌 protospacer 서열 옆에 있는 2-5 염기 protospacer adjacent motif (PAM)의 존재 여부에 달려있다. 대부분의 시스템에서 crRNA 유도 간섭(interference)은 외래 DNA 식별 및 파괴에 대해 PAM 서열에 의존하기 때문에 PAM 서열이 없는 CRISPR 자리가 표적이 되는 것을 방지할 수 있다. CRISPR를 가지고 있는 생명체의 거의 20%에 숙주 게놈에서 유래된 spacer가 존재하는 것은 유전자 조절 및 게놈 진화 등 CRISPR-Cas 시스템의 다른 역할을 암시한다. Spacer 획득 단계는 Type I-III에 걸쳐 다양한 시스템에서 실험적으로 관찰되었다. 다음으로는 가장 포괄적 인 연구가 수행된 Type I-E 및 Type II-A 시스템에서의 최근 연구에 관해 기술하겠다.

· Type I 획득(acquisition)

E. coli에서의 획득은 두 가지 기작을 통해 발생한다. 나이브(naive) 획득은 이전에 수집되지 않은 DNA에 의한 감염 시 시작되며 Cas1-Cas2 integrase 복합체를 이용하여 외래 DNA로부터 새로운 spacer를 인식하고 획득한다. 다른 Cas 단백질 없이 Cas1과 Cas2의 과발현으로 CRISPR 배열의 선행 서열의 말단에 33bp spacer가 취득된다. E. coli CRISPR-Cas 시스템의 PAM은 5’-AWG-3’으로, 이식(integration)된 spacer의 첫 번째 뉴클레오티드는 G이다. PAM 외에도 protospacer의 30번째 끝에 있는 두 개 염기서열 모티프, AA도 상당수의 spacer에 존재하는 것이 밝혀졌다. 최근, 가공되지 않은 protospacer에 결합된 Cas1-Cas2 복합체의 결정 구조를 통해 PAM 상보 가닥의 5’-CTT-3’ 서열과 서열 특이적으로 접촉하므로, Cas1이 잠재적 protospacer의 PAM 부위를 인식할 것으로 제안되었다. 새로운 침입자로부터 취득한 spacer를 포함한 crRNA는 Cas 단백질과 결합하여 spacer 서열과 일치하는 PAM 인접 DNA 서열을 타겟팅할 수 있는 Cascade를 형성한다. 표적 결합 시, Cas3(헬리카제/ 뉴클레아제)이 유도되어 외래 DNA를 분해한다. 프라임 획득은 Cascade가 Cas3 분해를 막는 돌연변이 PAM 또는 protospacer를 만날 때, 표적화된 플라스미드 또는 게놈으로부터 과활성 spacer를 획득하는 과정이다. 프라이밍(priming)은 숙주의 기능적 spacer 레퍼토리를 증가시켜 돌연변이에 의해 CRISPR-Cas 시스템에 걸리지 않는 침입에 대해 숙주가 대응할 수 있도록 한다. Cascade는 돌연변이 표적 부위에 결합할 수 있다. 최근의 단일 분자 연구는 Cas1과 Cas2이 표적 부위에 Cas3을 동원하는 것을 보여주었는데, 본래의 표적에서 단방향 전위만 일어나는 것과 달리, 동원된 Cas3은 표적 DNA를 분해하지 않으면서 어느 방향으로나 전위할 수 있으며, 이때 활성화된 Cas1과 Cas2는 표적 사이트의 양측에서 취득이 활발하게 일어나게 한다.

프라임 획득은 나이브 획득이 실험적으로 관찰되지 않은 Haloarcula hispanica Type I-B 시스템뿐만 아니라 P. atrosepticum Type I-F시스템에서도 Cas2와 Cas3 fusion을 수반하는 실험을 통해 확인되었다. H. hispanica에서의 획득은 또한 Type II 아형뿐만 아니라 Type II-B 및 Type V 시스템에서 발견되는 5’->3’ exonuclease인 Cas4를 필요로 하며, protospacer가 이식(integration)되기 전에 3’ 돌출부(overhang)를 생성하는데 관여할 수 있다. 일부 시스템에서는 Cas1과 Cas2가 spacer를 획득하는 데 필요한 최소 단백질이지만, Type-I 시스템에서 Cas1, Cas2와 간섭(interference) 장치와의 연계는 호스트의 적응 면역의 촉진을 조장한다.

· Self- versus Non-Self-Recognition

나이브(naive) 획득 중에 관찰되는 protospacer 선택에서 외래 DNA에 대한 선호 메커니즘은 최근까지 이해되지 못했다. E. coli에서의 spacer 획득은 DNA 복제에 크게 의존하는 것으로 나타났으며, 외부에서 유래한 spacer는 자체 spacer보다 약 100-1000배 이상 선호되는데, 자체 spacer의 출처에 대한 분석을 통해 protospacer가 복제 분기점의 정지와 dsDNA의 절단을 빈번하게 생성하는 것으로 예측되는 자리로부터 획득되었음을 증명하였다. 이러한 해로운 dsDNA 절단은 RecBCD(헬리카제/뉴클레아제) 복합체에 의해 복구되는데, 끊어진 끝은 Chi-site에 도달할 때까지 분해된 뒤 5’ 말단만이 추가적으로 분해된다. 외래 DNA에서 Chi 부위의 빈도가 낮기 때문에 RecBCD는 플라스미드와 바이러스 DNA를 우선적으로 분해하여 Cas1과 Cas2에 대한 후보 protospacer 기질을 생성하며, 이때 하나의 가닥에서는 수십에서 수백 개의 뉴클레오타이드 길이의, 다른 가닥으로부터는 길게는 킬로베이스 길이의 단일 가닥 단편을 생성한다. 현재 protospacer-Cas1-Cas2 복합체가 생성되는 기작은 불분명하지만, protospacer가 결합된 Cas1-Cas2의 최근 결정 구조는 복합체가 특정 기작을 통해 protospacer의 이중가닥 영역의 길이를 정의하고 3’ 말단의 돌출부를 최종 길이로 절단할 수 있음을 보였다. RecBCD는 주로 그람 음성 박테리아에서 보존되는 반면, 그람 양성 박테리아 및 고세균은 유사한 역할을 위해 각각 AddAB 및 HerA-NurA에 의존한다. 이러한 생물체의 CRISPR-Cas 시스템이 진화론적으로 구별되는 이들 부속품들과 협력하기 위해 진화했는지 여부는 아직 테스트 중이다.

· Protospacer 이식(integration) 메커니즘

Cas1과 Cas2는 복합체가 되어 새로운 spacer를 획득하기 위한 중심적인 역할을 하는데, protospacer의 유무에 따른 Cas1과 Cas2의 결정 구조는 중간의 Cas2 dimer에 의해 두 개의 Cas1 dimer가 연결되었음을 제시하였다. Cas1은 촉매 작용을 하며 Cas2는 주로 구조적 역할을 하는데, Cas1과 Cas2를 과발현하는 E. coli의 CRISPR 자리의 Southern blot을 통해 protospacer의 각 가닥이 leader proximal repeat의 반대편에 이식(integration)되는 것을 관찰하였다. 이러한 integrase 유사 모델은 정제한 Cas1-Cas2 복합체를 사용하여 CRISPR 자리를 가진 플라스미드로의 이식(integration)을 재구성한 in vitro 실험을 통해 더욱 뒷받침되었다. In vitro 이식(integration) 결과물에 대한 deep sequencing으로 Cas1-Cas2가 CRISPR 자리를 직접 인식한다는 것이 확인되었으며, 특히 첫 번째 반복 서열에 인접한 곳에 protospacer 이식(integration)이 주로 일어나기는 하지만 모든 반복 서열의 경계에서도 다양한 수준으로 발생한다는 것을 보였다. 이것은 E. coli 생체 내에서는 첫 번째 반복에서만 발생하는 것과 대조적이다. Cas1-Cas2 복합체가 선행-반복 서열에 대한 서열 특이성을 갖는지를 결정하기 위한 최근의 연구로 protospcaer 이식(integration)이 Cas1에 의한 서열 특이적 인식을 통해 선행-반복 서열의 경계에서 시작되며 반복 서열 말단의 두 번째 친핵성(nucleophilic) 공격으로 이어진다고 알려졌다. 이것은 생체 내에서 관찰된 바와 같이, 숙주 단백질에 의한 DNA 수리 후 첫 번째 반복 서열의 정확한 복제를 보장한다. AAG PAM에 상응하는 이식(integration) 기작을 통해 획득된 거의 모든 spcaer가 선행 서열의 5’-G로 배향되어 있다는 점에서, Cascade 및 Cas3에 의한 crRNA-의존적 표적화를 유도한다는 점에서 매우 특이 적이라 할 수 있다. 그러나 spacer에 PAM의 일부를 포함하는 것은 E. coli에서만 관찰되어 다른 시스템의 Cas1-Cas2 기반 이식(integration) 반응의 지향성에 대해서는 여전히 의문이 남아있다.

· Type II 획득(Type II acquisition)

Type II 시스템은 결함이 있는 파지에 의한 감염에 대해 상관성이 있다. CRISPR 면역에 중요한 문제는 외래 DNA가 확인되고 CRISPR 자리에 이식(integration)되고, 전사되고, 처리되고, 적절한 표적에 대한 탐색을 시작해야 하는 간섭(interference) 복합체로 조립되는데 필요한 시간이다. 용해성 파지는 20분 이내에 세포를 죽일 수 있기 때문에, 이 다단계 과정에 충분한 시간을 제공하지 못한다는 의문이 제기되었다. Hynes와 그의 동료들은 활성화된 파지를 UV- 조사된 파지 또는 제한 변형 시스템에 민감한 파지를 추가하여 감염시킬 경우 활성 파지 단독으로 감염시킨 것과 비교하여 spacer 획득이 촉진되는 것을 관찰하였다. 저자들은 손상된 파지로부터의 획득이 야생 집단에서 지배적인 획득 양식일 수 있으며, 이러한 방법은 급속히 번식하는 파지를 능가할 필요 없이 면역을 획득하도록 한다고 언급하였다.

· Type II 획득 장치(machinery)

Type II 시스템은 cas1, cas2 및 cas9의 이외의 추가적인 cas 유전자의 유무에 따라 II-A, II-B 및 II-C로 세분된다. Type II-A 시스템은 csn2를 포함하며 가장 드물게 발견되는 Type II-B 시스템은 cas4를 포함한다. Ttype II-C 시스템은 3개의 유전자(cas1, cas2, cas9)만으로 구성된다. Csn2는 여러 Type II-A 시스템의 획득 단계에 필수적인데 기능은 밝혀지지 않았지만 유리 DNA 말단을 따라 결합하고 미끄러지는 사량체의 도넛형 구조를 형성한다. Cas4는 Type II-B 시스템에서의 획득에 관여 할 가능성이 크며, 확인된 Type II 시스템의 대다수를 구성하는 Type II-C 시스템은 일부 예외에도 불구하고 보조적인 획득 인자가 요구되지 않을 가능성이 있다. 최근 Cas1, Cas2 및 Csn2 외에도 Cas9가 Type II 시스템에서 새로운 spacer를 획득하는 데 필요한 역할을 한다는 것이 입증되었는데, S. thermophilus의 CRISPR1 Type II-A 시스템, Streptococcus pyogenes의 Type II-A 시스템 및 S. thermophilus의 CRISPR3 시스템(type II-A도 포함)으로 작업한 두 그룹 모두 야생형 또는 비활성 Cas9 (dCas9)는 spacer 획득이 일어나는 반면, Cas9 결실 균주에서는 spacer 획득이 일어나지 않음을 보였다. 또한 PAM과 상호작용하는 부위에 대한 돌연변이 Cas9의 경우 새로운 spacer에 대한 PAM 특이성이 상실되는 것을 검증하면서, Cas9이 잠재적인 protospacer에서 PAM 사이트를 인식하고 표지함으로써 Cas1과 Cas2에 의한 인지를 보조하는 것을 밝혔다. 이것은 Cas1-Cas2가 PAM 서열을 독립적으로 인식하는 E. coli Type I-E 시스템과 대조적이며, dCas9의 발현이 주로 자체 표적 spacer의 획득을 가져 오는 것으로 보아 다수의 획득이 자체 표적화 및 자살로 이어진다는 것을 시사한다. 대안적으로서, S. thermophilus는 CRISPR 단백질을 과발현하는 균주에서는 가려진 self-non-self 구분 기작을 가지고 있을 수 있다.

야생형 S. thermophilus에 대한 파지 도전 실험은 다수의 실험들을 통틀어 특정한 spacer가 불균형적으로 획득되었음을 보였으며, Type II 획득 장치가 Cas9 의존적 PAM 선택능 외에도 유전자의 위치 혹은 protospacer 서열에 기반한 밝혀지지 않은 기작이 있을 것으로 제시한다. 또한, S. pyogenes CRISPR 시스템(Cas1, Cas2, Csn2 및 Cas9)의 4개 단백질이 복합체를 형성하고, Cas9에 의해 획득 복합체가 잠재적 표적으로 유도된다는 것이 증명되었다. 또한 획득 단계에서 trans-activating crRNA (tracrRNA)는 필수이지만 해당 crRNA가 필요한지 여부는 분명하지 않다. 추후 Cas9이 매개하는 spacer 획득과 Type I 시스템에서의 프라임 획득 사이의 유사점에 대해 밝히기 위한 메커니즘 연구가 필요할 것이다.

· Type-II Protospacer 이식(integration)

Type II-A 시스템에서의 protospacer 이식(integration)에 대한 서열 요구 조건은 최근 S. thermophilus에서 입증되었는데, E. coli와 마찬가지로 선행 서열과 단일 반복 서열로도 이식(integration)이 매개되며 추가로 E. coli의 경우 선행 서열 말단 최소 60 nt가 필요한 것과 달리 10 nt으로도 충분하다. 반복 서열에 제한된 돌연변이를 일으킨 연구를 통해 처음 2개 뉴클레오티드의 서열은 획득에 필수적이지만 말단 뉴클레오티드 2개 서열에 대한 변이는 결과에 차이가 없었다. 즉, 선행-반복 서열 접합부에서의 Cas1-Cas2 촉매 결합은 서열 특이적인 반면 반복-spacer 접합부에서의 작용은 다른 메커니즘에 의해 결정된다. 종합하면 이러한 발견은 Type I과 II CRISPR-Cas 시스템 사이에서 protospacer 선택의 다양한 메커니즘에도 불구하고 Cas1-Cas2 인테그라제 복합체의 기능이 보전됨을 뒷받침한다.

· 게놈 수정 도구로서의 CRISPR 인테그라제(integrase)

다수의 인테그라제, transposase와 유사한 반응을 촉매함에도 불구하고 Cas1-Cas2 복합체의 몇 가지 근본적인 차이는 Cas1-Cas2 복합체를 게놈 조작에 활용될 수 있음을 보여준다. (1) Cas1-Cas2 복합체는 이식(integration)될 DNA 기질에 대한 서열 특이성이 없다. 이 특성은 게놈을 바코드로 만드는데 이상적인 시스템이 될 수 있다. 게놈 바코드는 개별 세포에서 비롯된 계통 추적을 가능하게 하여 인구 변화, 암, 발달 및 감염에 대한 연구를 용이하게 한다. 전체 플라스미드를 이식(integration)하는 재조합 효소 기반의 현재 기술과 달리 (2) 짧은 DNA 서열을 이식(integration)하기 때문에 잠재적인 피트니스 하락 및 음성 선택이 필요하지 않다. In vitro 실험을 통해 DNA 기질이 플라스미드의 CRISPR 자리가 아닌 위치에 이식(integration)된 사례는 Cas1-Cas2를 다양한 표적 서열 이식(integration)에 사용할 수 있음을 시사한다.

· crRNP Biogenesis: 세포를 위한 분자 보초병(sentinel) 만들기

CRISPR 면역 시스템은 RNA 프로그램 단백질을 사용하여 세포를 순찰하여 crRNA에 상보적인 서열을 갖는 DNA 분자를 찾는다. 이러한 분자 sentinel의 조립은 CRISPR 자리의 전사로 시작하여 긴 전구체 CRISPR RNA (pre-crRNAs)를 생성한 다음 가공을 거쳐 짧은 crRNA 가이드가 된다. 프로모터는 반복-spacer 배열의 상류에서 AT가 풍부한 선행 서열 내에, 또는 반복 서열 내에서 존재한다. 본지에서는 Type I 및 III 시스템에서 Cas6 endoribonuclease family가 촉매하는 pre-crRNA의 처리 과정과 내재성 RNase III, Cas9 및 tracrRNA가 포함된 Type II 시스템의 독특한 처리 경로에 대해 소개하겠다.

· Cas6 Endoribonucleases에 의한 가공

Type I 및 Type III 시스템은 Cas6 endoribonuclease를 사용하여 각 반복 내에서 특이적으로 pre-crRNA 서열을 절단한다. Cas6 상동체의 서열은 다양하지만 보전된 DNA 제한 기작을 통해 반복 서열의 5’ 및 3’ 말단 일부를 포함하는 spacer를 crRNA 가이드로 만든다. 완전한 crRNA 가이드는 반복 서열에서 유래한 8 nt 길이의 5’ 핸들과 길이가 다양한 3’ 핸들로 구성되며, Type III 시스템의 경우 3’ 핸들은 아직 알려지지 않은 기작을 통해 추가적으로 다듬어진다. 예외적으로 Type 11-C 시스템에서는 crRNA 처리를 위해 Cas5 단백질을 사용하며 5’ 핸들에서 11 nt, 3’ 말단에서 21-26 nt가 남는다. 다른 Type I 시스템에서 Cas5 서브유닛은 Cascade 복합체에서 crRNA의 5’ 말단을 캡핑하는 비촉매적 역할을 한다. Type I-C, I-D, I-E 및 I-F 시스템에서, 반복 서열은 안정한 hairpin(헤어핀) 구조를 형성한 뒤 구조 및 서열 특이적으로 Cas6에 의해 쪼개지며 이후 헤어핀은 crRNA의 3’ 핸들이 된다. E. coliT. thermophilus (Cas6e) 및 Pseudomonas aeruginosa (Cas6f)의 Cas6 단백질은 3’ 핸들에 안정적으로 결합하여 결국 Cascade 복합체의 일부가 된다. Type I-A, I-B, III-A 및 III-B 반복 서열은 회분식 구조가 아니기 때문에 구조를 형성하지 않을 것으로 예측되며, 따라서 각 Cas6 결합의 특이성은 구조보다 서열에 의존할 것으로 생각된다. 비회분식 구조의 반복 서열을 인식하는 다른 Cas6 단백질들이 RNA 안정화에 비슷한 작용을 하는지는 알려져 있지 않다. 간섭(interference)에 관련된 Cas 단백질은 crRNA의 가공과 함께 최종 기능적 복합체를 구성하여 crRNA에 대한 상보적 서열을 가지는 표적을 인식하고 파괴하는 기능을 한다. Type III 시스템에서 복합체의 길이에 따라 달라지는 서브유닛의 수는 가변적이며 보호되지 않은 다른 crRNA는 분해된다.

· Type II 시스템에서의 가공(processing)

Type II 시스템은 pre-crRNA를 가공하는 다른 기작이 있는데, Type II-A 및 II-B에서 pre-crRNA 절단 특이성은 CRISPR 반복 서열에 대한 서열 상보성을 갖는 tracrRNA에 의해 보조된다. tracrRNA를 코딩하는 유전자는 전형적으로 CRISPR-cas 자리 근처 또는 내부에 위치한다. Cas9에 의해 안정화된 crRNA:tracrRNA 염기쌍을 통해 pre-crRNA의 반복 서열이 RNase III에 의해 쪼개진다. 내재성 RNase III에 대한 의존성은 Type II 시스템이 왜 박테리아에만 존재하고 고세균에서는 발견되지 않는지 설명한다. 알려지지 않은 뉴클레아제가 crRNA의 5’ 말단을 추가적으로 자르는데, S. pyogenes에서, 30 nt spacer는 20 nt로 정돈된다. Neisseria meningitidisC. jejuni Type II-C 시스템에서 각 반복 서열은 프로모터를 암호화하고 있으며 전사 시작 부위에 따라 다양한 pre-crRNA 길이를 갖는다. 여전히 RNase III에 의해 pre-crRNA 가공이 일어날 수 있지만 필수적이지 않으며, Cas9은 추가적 가공 없이 pre-crRNA 및 tracrRNA와 복합체를 형성해 표적에 대한 간섭(interference)을 일으킬 수 있다.

· 생명 공학 도구로서의 Cas6

Type I-F 시스템의 Cas6 상동체인 Cas6f (Csy4라고도 함)는 새로운 용도로 활용된 최초의 Cas 단백질이다. Cas6f는 결합 및 절단의 서열 특이성이 입증된 후 세포로부터의 태그 RNA 전사체를 정제하기 위해 사용되었으며, 후속 연구에서는 Cas6f이 표식 mRNA의 번역 효율 및 안정성을 변경하기 때문에 단백질 발현을 조절할 수 있다는 것을 보여주었다. 또한, Cas6f과 Cas9을 같이 사용하여 하나의 전사체로부터 다중의 가이드 RNA를 가공함으로써 멀티플렉스 편집을 성공한 사례가 있다.

· 간섭(interference): 정확하고 프로그램 가능한 DNA 결합 및 절단

면역력을 제공하기 위한 CRISPR 시스템이 수행되는 것은 RNA에 안내 받는 인지와 DNA 분자의 정밀 절단으로 특징지어지며 유전체 공학 및 유전자 발현 조절에 유용한 도구로 사용될 수 있게 한다. 서로 다른 CRISPR type은 다양한 crRNP (crRNA Cas 단백질) 복합체로 타겟을 인지한다. Type I과 III은 다중 단백질 복합체를 사용하는 반면, Type II과 V는 단일 단백질로 작용할 수 있다. 여러 연구를 통해 주요한 3가지 type에서 복합체 기작과 구조가 설명되었으며, crRNA 염기쌍에 의한 결합이라는 공통점과 장치, 표적 절단 기작 등에서의 차이점이 드러났다.

· Type I 간섭(interference)

Type I 시스템에서 표적 DNA를 인지하고 절단하는 역할은 별도의 구성원들로 이루어지는데, crRNA 유도 Cascade 복합체가 DNA 표적 서열에 결합하고 DNA를 풀어준 뒤 표적을 절단하는 Cas3(HD 뉴클레아제/헬리카제)를 리크루팅한다. Type I의 각 하위 type (I - A에서 I - F까지)에는 Cascade 구성 요소들과 경우에 따라 cas3 유전자에도 뚜렷한 차이가 있다. 모델 시스템인 E. coli Cascade 복합체는 32 nt spacer를 지닌 중앙 61 nt crRNA 외에 5종의 단백질(Cse1, Cse2, Cas5, Cas7, Cas6)이 상이한 화학량으로 구성된다. Cas7 서브유닛은 crRNA를 따라 중합하여 등줄기(backbone)를 형성하고, Cas6 (Type I-E 시스템의 Cas6e)는 CRISPR 성숙 후 3’ 말단 헤어핀에 결합되며, Cas5는 5’ 핸들에 결합한다. 'small subunit' (Type I-E의 Cse2)은 구조의 배 위치에서 이합체로 발견되며 crRNA 및 표적 DNA를 안정화 시킨다. 'large subunit' (Type I-E의 Cse1, 대부분의 다른 아형의 Cas8)은 crRNA의 5’ 말단에 결합하여 PAM 서열을 인식하고 표적으로 Cas3을 리크루팅한다. 이러한 구조는 일반적으로 보전된다.

Cascade는 spacer 서열을 6개의 5 염기로 이루어진 구획들이 A 형태와 비슷하게 배열된 형태가 되며, 이때 6번째 염기들은 돌출되어 Cas7 subunit들과 결합한다. 간섭(interference)의 시작하는 것으로서 먼저 Cascade의 Cse1이 외래 DNA에서 trinucleotide PAM을 인식한다. Case1 결합에 의해 표적 DNA의 protospacer PAM 쪽 말단에서부터 풀리면서 R 루프 구조가 형성되고, crRNA의 노출된 염기들이 불연속적으로 표적 DNA에 결합하여 안정적이지만 고도로 왜곡된 crRNA: 표적 가닥 이중 나선이 형성된다. Cse1의 구조변화에 의해 리크루팅된 Cas3은 HD 뉴크레아제 도메인을 이용하여 절단을 일으키며, 헬리카제 도메인이 활성화되어 금속과 ATP 의존적으로 3’에서 5’쪽으로 이동하면서 비표적 가닥을 분해시킨다. PAM 외에 spacer의 3’ 말단 또한 간섭(interference)에 영향을 끼치며 E. coli Cascade 복합체의 시드 영역 내(spacer의 1 내지 5 및 7 내지 8번 위치) 단일 서열 변이에도 결합 및 간섭(interference)이 감소된다. Type I 아형 사이에서 cas3 유전자 차이는 다양하게 나타나는데, Type I-A 시스템에서는 Cas3의 각 도메인이 별도로 복합체와 결합하며 Type I-F 시스템에서는 Cas3이 Cas2와 융합되어 있다. 일부 Type I-E에서는 링커로 Cse1과 융합되어 있는데, 이러한 융합과 도메인 분리가 Type I-E 시스템에서의 분해에 어떻게 영향을 미치는지에 대해서는 추가적인 연구가 필요하다.

· Type II 간섭(interference)

Type I 및 Type III 시스템(Type V 시스템의 Cpf1과는 유사)의 다중 서브유닛 기능 복합체와는 다르게 Type II 특징 단백질인 Cas9는 개별적으로 crRNA 및 tracrRNA와 함께 표적을 탐색하여 양 가닥을 모두 절단한다. 광범위한 연구를 통해 S. pyogenes Cas9의 기질과 결합 상태의 다양한 구조 범위뿐만 아니라 여러 종에서의 구조가 파악되었다. Cas9의 구조에서 뉴클레아제엽과 a-나선형 또는 REC 엽이 나타나는데, 뉴클레아제엽은 표적 가닥을 절단하는 HNH 뉴클레아제, 비표적 가닥을 절단하는 RuvC와 유사한 뉴클레아제 도메인으로 구성되며, 이는 다시 a- 나선형엽, HNH 도메인 및 C-말단 PAM 상호작용 도메인으로 나눌 수 있다. Cas9의 표적은 PAM 뒤 10-12 nt의 시드 영역으로부터 PAM에서 멀어지는 방향으로 풀리는데, 표적과 일치할 때 표적의 DNA 가닥이 절단되며 이때 시드 영역 밖의 서열에서는 미스매치가 어느 정도 용인된다. 표적 부위로부터 멀리 떨어진 미스 매치가 절단 효율을 떨어뜨리는 기작은 HNH 도메인의 구조적 유연성에 의존하는 것으로 보이나 아직 결정구조가 밝혀지지 않았다. FRET 분석으로 HNH 도메인이 DNA 기질에 결합할 때 촉매 가능한 위치로 스윙하는 것이 밝혀졌으며, Cas9이 일으키는 DNA 절단을 제어하기 위한 여러 단계의 구조적 변화가 일어나는 것을 시사하였다. RuvC 도메인은 HNH 도메인이 활성 위치로 이동할 경우 비표적 가닥을 절단한다.

S. pyogenes Cas9-sgRNA 복합체와 표적과 결합시킨 Staphylococcus aureus Cas9의 결정 구조에 대한 연구를 통해 (1) sgRNA의 결합이 apo 형태에서 관찰된 자동 억제 상태의 Cas9을 표적 탐색이 가능한 구조로 변환시키는 것이 밝혀졌으며 또한, sgRNA가 결합하여 PAM과 상호작용하는 알기닌 잔기가 표적을 스캐닝하도록 위치하는데, 이러한 구조변화로 PAM 의존적 spacer 획득에서 tracrRNA가 필수적인 이유를 설명할 수 있다. 놀랍게도, tracrRNA의 3’ 헤어핀이 Cas9에 대한 결합에너지와 특이성을 제공하지만, sgRNA의 시드 영역과 함께 repeat-anti-repeat 영역 또한 구조적 재배열에 필요함을 보였다. 또한, sgRNA의 시드 서열이 진핵세포 Argonaute 구조 및 Type I 및 Type III 기능 복합체에서 관찰된 것과 같이 A- 형태 나선으로 사전 배열된다는 것이 밝혀졌으며 이러한 사전 배열 표적 DNA가 풀어질 때 gRNA의 결합을 촉진시킨다. (2) S. aureus의 Type II-C CRISPR 시스템의 Cas9는 sgRNA 및 단일 가닥 DNA 표적 서열과 복합체로 결정화되어 더 먼 Cas9의 구조 변화에 대한 정보를 준다. S. aureus Cas9는 S. pyogenes의 Cas9(아미노산 1,368개 vs 1,053개)보다 현저히 작으며 gRNA 및 PAM 부위도 다르다. S. aureus Cas9는 중간의 도메인과 PAM 측 부위가 결여된 더 작은 a-나선형 엽을 가진 반면 뉴클레아제엽은 보존되어있다. S. aureus Cas9에서 쐐기 도메인이 새롭게 제시되었으며 두 단백질에서 상당한 차이를 보이는 쐐기 도메인에 의해 gRNA의 상동성이 결정된다고 제안하였다. 또 다른 작은 Cas9인 Actinomyces naeslundi의 Cas9은 apo 형태로 결정화되었지만 기질 결합 형태가 없고, 구조적인 무질서함 때문에 더 이상의 연구가 진행되지 않았다. N. meningitidisCorynebacterium diphtheriae의 Type II-C Cas9 단백질에 대한 최근의 연구 결과에 따르면 이들 효소는 S. pyogenes Cas9와 비교하여 dsDNA를 풀 수 있는 능력이 낮으며 PAM 비의존적으로(어떤 경우에는 tracrRNA와 독립적으로) ssDNA를 절단한다는 것이 밝혀졌다.

· Type III 간섭(interference)

Type III 시스템은 기능 복합체(Type III-C 및 III-D도 확인되었지만 아직 특징 지어지지 않았음)에 기초하여 Csm을 포함하는 Type III-A와 Cmr을 포함하는 Type III-B로 분류된다. 계통 발생 연구에서 Csm 및 Cmr 복합체 사이에서의 구조적 보존이 밝혀졌다. Csm3 (III-A 시스템) 또는 Cmr4 (III-B)는 Cas7과 유사하게 crRNA를 따라 나선형 backbone으로 중합하며, Csm2 또는 Cmr5는 작은 서브유닛으로 Cse2의 역할을 한다. crRNA는 Cascade와 유사하게 6개 뉴클레오티드마다 꼬임(kinks)과 결합하도록 미리 배열되어 있다. 이제까지 밝혀진 Type III의 표적은 RNA이며 기존의 나선형 핵산들과 다르게, 매우 비틀어진 모양으로 결합된다. Cmr3과 Csm4는 crRNA 5’ 핸들과 결합하며 Cas10 (Csm1과 Cmr2라고도 함)은 큰 서브유닛의 역할을 한다. Csm5, Cmr6 및 Cmr1은 Cas7과 상동성이 있으며 crRNA의 3’ 말단에서 나선형 backbone을 캡핑한다. Type III-B 시스템에서 6개 뉴클레오티드가 차이 나는 두 주요한 crRNA 유형이 관찰된다. 저온 전자 현미경을 통해 각 Cmr 복합체에 대해 구성하는 서브유닛(Cmr4 및 Cmr5)의 수가 다른 것이 관찰되었으며, 이러한 차이가 crRNA의 길이 차이 때문이거나 반대의 결과로 나타난 것일 수 있다.

구조적 유사성에도 불구하고, Type III 간섭(interference) 복합체는 Cascade와 확연히 구분된다. Csm과 Cmr 복합체의 기질 특이성에 대한 연구를 통해 Csm 복합체는 활발히 전사되는 DNA의 비-주형 가닥에 대해 RNA 절단과 DNA 절단을 모두 나타내는 것으로 나타났으며 Cmr 복합체의 in vitro 연구에서는 RNA에 대해서만 결합 및 절단 활성을 보이는 것으로 나타났다.

DNA와 RNA 간섭(interference)은 Type III 복합체에서 서로 다른 서브유닛에 의해 수행된다. RNA 간섭(interference)은 backbone 서브유닛 Csm3 (type III-B 시스템에서는 Cmr4)에 의해 매개되는데, 서브유닛들의 활성부위에서 매 6개 뉴클레오티드마다 ribose 2’ OH의 친핵성 공격이 일어나면서 절단된다. DNA 간섭(interference)은 Cas10이 연관되며, 전사 버블에 의해 노출된 DNA 가닥을 손바닥형 중합효소 도메인의 단일 촉매 사이트를 사용하여 절단한다. Cmr에 의한 DNA 표적화는 확인되지 않았으나 Cas10 서열의 보존과 전사 의존성 플라스미드 클리어링이 근거가 된다.

Type I과 Type II 시스템이 protospacer를 보유한 모든 외래 DNA를 표적 삼는 것과 달리, Type III 시스템은 세포에 위협이 되는 전사가 시작될 때까지 외래 DNA를 무시하며, 이러한 과정을 통해 숙주가 항생제 내성 유전자와 같은 prophage에 포함된 유리한 유전자를 획득하는 이점을 가진다. 그러나 RNA와 전사 의존성 DNA 표적 모두의 가닥 특이적 성질은 획득 단계에서 spacer가 이식(integration)될 때 생산적인 방향성에 대한 제약을 주며, 이러한 한계를 극복하는 방법은 아직 밝혀지지 않았다. Type III 시스템은 Type I 시스템과 공존하는 경우가 빈번하게 발견되는데 이 경우 구분되는 표적 특이성으로 인해 Cascade에 의한 인지되지 않은 표적을 처리할 수 있다. Type III 시스템은 PAM이 결여된 것이 특징인데, CRISPR 자리에서의 자가 면역을 피하기 위해 Csm과 Cmr 복합체는 crRNA의 반복 유래 서열과 표적간의 상보성을 확인하여 완전 일치하는 경우에는 절단하지 않는다.

· Type V 간섭(interference)

최근에 분류된 Type V 시스템은 획득을 위한 장치 및 하나의 추가 단백질만으로 구성된다는 점에서 Type II 시스템과 유사하다. Type V 시스템의 3가지 아형 Type V-A, V-B 및 V-C는 각각 Cpf1, C2c1 및 C2c3 단백질로 특징지어진다. 세 단백질 모두 Cas9와 같은 트랜스포존 관련 TpnB 단백질의 계열에서 진화되었으며 C-말단에 RuvC 도메인과 아르기닌이 풍부한 나선형 구조를 가진다. 그러나 단백질끼리는 거의 유사하지 않으며, Type 1 및 Type III cas1 유전자의 다양한 가지의 cas1 유전자들의 계통 발생학적인 그룹화(phylogenetic grouping)는 아형들이 CRISPR 시스템과 tpnB 유전자 사이의 별개의 재조합 사건에서 기인하였음을 시사한다. 일부 Type V-B 시스템에서는 활성에 필요한 tracrRNA가 확인되었지만 Type V-A 및 V-C 시스템에는 tracrRNA와 Cas6 또는 Cas5 등의 유사 엔도뉴클레아제가 존재하지 않아 crRNA가 처리되는 방식을 알 수 없다. Type V-A 시스템의 crRNA는 보존된 스템-루프(stem-loop)를 가지며 E. coli에서 전사될 때 Cpf1가 있는 경우 기능을 가지는 형태로 가공될 수 있지만, Cpf1이 가공에 필수적인지, 가공에 관련된 숙주 인자가 있는지 여부는 알려지지 않았다. Francisella novicida의 Cpf1이 형질 전환된 플라스미드를 성공적으로 간섭(interference)하였으며, Type I 시스템의 PAM 위치와 유사한 protospacer 서열의 5’ 말단에서 5’-TTN-3’ PAM을 인지한다. 절단이 일어나면 잘린 이중 나선에서 PAM에서 떨어진 부위에 5개 뉴클레오티드로 되어있는 5’ 돌출부가 생긴다. RuvC 활성 부위 잔기에 변이가 생기면 두 가닥 모두에서 절단이 일어나지 않는데, 한 연구진은 Cpf1이 각각의 단량체가 RuvC 활성부위를 제공하지만 한쪽만이 표적을 인지하는 성질의 이량체로 작용한다고 제시하였다. crRNA와의 결합 기작 및 추가적인 활성 부위의 여부는 아직 불분명하다. 단일 뉴클레아제 도메인만이 확인된 또 다른 C2c1 또한 5’-TTN-3’ PAM을 인식하며 tracrRNA가 필요하다. 새롭게 발굴된 Type V와 Type VI 시스템의 작용 기작들은 향후 추가적인 연구를 통해 파악될 것이다.

· 게놈 편집 도구로서의 간섭(interference) 복합체

Cas 단백질 기반의 대부분의 도구 개발은 프로그램 가능한 서열 특이적 DNA 인식능력을 이용하는데 집중되어 있으며 특히 S. pyogenes 유래의 Cas9은 게놈 공학에서 유용성이 입증되었다. crRNA와 tracrRNA를 하나의 가이드 RNA (sgRNA)에 융합시킴으로써 Cas9를 2개의 구성성분으로 만들었으며, 게놈 편집, 전사 조절, RNA 표적화 및 이미징에 편의를 제공하였다. Cas9는 생쥐와 원숭이부터 일차적 인간 T 세포와 줄기 세포, 식물, 박테리아, 진균에 이르기까지 다양한 세포 유형과 미생물에 사용되었으며, 최근의 연구는 더 큰 시공간 조절이 가능하도록 화학적, 광학적으로 유도 가능한 Cas9 및 아데노연관 바이러스 벡터에 패키징이 용이하도록 더욱 작은 크기와 다른 PAM 서열을 가지는 Cas9 상동체에 대한 연구에 집중되어있다.

다른 간섭(interference) 복합체들도 이미 사용되었거나 게놈 편집에 잠재성이 있다. Cascade 의 다중 서브유닛 구성은 Cas9에 비해 다루기가 쉽지 않지만 큰 크기와 안정한 결합이 E. coli에서 전사를 조절하는데 사용되었다. Csm 또는 Cmr 복합체의 적용을 보여준 발표된 연구는 없지만, 세포에서 다양한 RNA 조절 용도로 사용될 수 있을 것이며, 시험된 16개 중 2개의 Cpf1 상동체는 인간 세포에서 게놈 편집을 촉진하는 것으로 나타났다. Cpf1의 다른 PAM 특이성은 Cas9에 적합한 PAM이 없는 표적에 유용할 수 있으나, 아직 Cpf1의 효율 및 오프-타겟 편집에 대한 철저한 조사가 필요할 것이다.

이미 연구 환경에서 광범위하게 Cas9이 사용되고 있지만, 치료를 위한 적용을 위해서는 여전히 도전이 남아있다. 프로그래밍된 절단을 만드는 것은 쉬운 일이지만 상동성을 이용한 수리를 이용하도록 편향시키는 것은 여전히 어려운 과제이며, 전체 유기체의 특정 조직에 Cas9 시스템(RNP, 플라스미드, 바이러스 벡터 등)을 전달하는 것은 임상 적용을 위해 반드시 해결해야 하는 과제이다.

이 분야가 계속해서 급속도로 발전함에 따라, 임상 시험은 수십 년 이내에 이뤄질 수 있으며, 치료법은 아마도 10년 이내에 개발될 것이다. Cas9과 작물의 엔지니어링은 이미 진행 중인데, 결손(knockout) 식물은 유전자 변형 생물체로 규제 받지 않으며 다른 형태의 조작에 대한 규제는 현재 고려되는 중이다.
  추천 0
  
  인쇄하기 주소복사 트위터 공유 페이스북 공유 
  
Citation 복사
양진아(2017). CRISPR 시스템 생물학 및 응용: 게놈 공학을 위한 자연의 도구 상자. BRIC View 2017-R08. Available from http://www.ibric.org/myboard/read.php?Board=report&id=2695 (Mar 09, 2017)
* 자료열람안내 본 내용은 BRIC에서 추가적인 검증과정을 거친 정보가 아님을 밝힙니다. 내용 중 잘못된 사실 전달 또는 오역 등이 있을 시 BRIC으로 연락(member@ibric.org) 바랍니다.
 
의견올리기
작성자
목록
마텍무역
마텍무역 스폰서배너광고 안내
이전페이지로 돌아가기 맨위로 가기
 

BRIC 홈    BRIC 소개    회원    검색    문의/FAQ    광고    후원
Copyright © BRIC. All rights reserved. Contact member@ibric.org