[DEBUG-WINDOW 처리영역 보기]
BRIC을 시작페이지로 회원가입    로그인
BRIC동향
   
통합검색
BRIC 광고안내
오늘의 BRIC정보
모바일 BRIC RSS
트위터 페이스북
검색 뉴스레터 안내
좋은 연구문화 만들기
Bio일정
Bio일정
 
Bio일정 프리미엄(유료) 등록이란?
웨비나 모집
세미나 VOD
실험
실험
바이오 형광사진
실험의 달인들
동향리포트
동향리포트
웨비나 모집
Bio마켓
Bio마켓
BioJob
BioJob
Biojob 프리미엄(유료) 등록이란?
커뮤니티
커뮤니티
전체메뉴
대메뉴안내: 동향
뉴스 Bio통신원 Bio통계 BRIC View BRIC이만난사람들 웹진
BRIC View
최신자료 동향리포트 학회참관기 리뷰논문요약 BRIC리포트 외부보고서
단백질체 기반의 상호작용체학 동향
단백질체 기반의 상호작용체학 동향 저자 강두석 (한국과학기술원)
등록일 2017.03.14
자료번호 BRIC VIEW 2017-T06
조회 920  인쇄하기 주소복사 트위터 공유 페이스북 공유 
요약문
단백질-단백질 사이의 결합들은 근본적으로 모든 생물학적 과정을 매개한다. 유전자 염기서열 지도화 작업(mapping)이 끝난 지난 십여 년간 과학자들은 세포 내에서 일어나는 현상들을 설명하기 위해 유전체 발현(Transcriptome)에서 단백체(Proteome), 그리고 그 단백질들의 결합체(Interactome)에 이르기까지 다양한 방법으로 연구 영역을 넓혀왔고 그 분야에서 노력을 경주해왔다. 그 결과, 오늘에 이르러서 높은 수준의 재현성을 가진 단백질 발현-결합-기능과 관련된 데이터베이스를 구축하기에 이르렀고, 이러한 데이터들은 매우 가치있는 형태로 연구 현장에서 활용되고 있다. 이 리포트에서는 유전체 연구 이후로 이루어지는 omics 중 단백질체학에 초점을 맞추고 어떻게 단밸질과 단백질의 결합들이 연구되고 그 데이터들이 모아지고 질적으로 평가가 되는지에 대해 살펴본다.
키워드: Interactome, Proteomics, Protein-Protein interaction, , Human Proteome Project
분야: Proteomics
목차

1. 서론
2. 본론
  2.1 친화도 정제 - 질량 분광법 기반의 PPI 매핑방법
  2.2 근접 표지방법을 이용한 질량분석법
  2.3 단백질 간 결합 매핑을 위한 대안적 접근
  2.4 Y2H 시스템을 활용한 대량의 단백질 결합 스크리닝
3. 결론
4. 참고문헌


1. 서론

인간 게놈 프로젝트(Human Genome Project)는 유전자 염기서열 mapping을 통해 질병의 유전적 뿌리를 찾고 치료법을 개발하는 것이 목표였다[1]. 1990년 미국 국립 보건원에 의해 30억 달러 규모를 가지고 13년에 걸쳐 진행된 이 프로젝트는 2003년에 이르러 완성되었고, 인간 유전체의 95%에 달하는 Euchromatic 영역의 전체 염색체 서열이 2006년 Nature에 발표되었다. 이 정보를 통해 치료를 위한 바이러스의 유전자형 결정이라든가, 암과 관련된 돌연변이의 동정과 같은 질병과 관련된 유전자 연구에 많은 진전이 이루어졌다[4][5][16]. 그뿐만 아니라, 유전자 염기서열 정보는 법의학 분석, 진단 의학과 같은 응용 분야에서도 상당부분 기여를 해왔다[2][13]. 하지만, 인간 게놈 프로젝트의 궁극적 목표였던 병인학적 연구나 치료방법 개발 및 예후 예측에서는 좀처럼 큰 진전을 이루어내지 못하였다. 일련의 nucleotide 순서를 아는 것만으로는 생명현상을 충분히 설명할 수 없었기 때문이다.

기본적으로 유전체는 특정 상황과 시점에서 단백질의 발현을 이루어내는 역할을 한다. 이렇게 발현된 단백질들은 단백질-단백질 상호 결합을 통해 기능적 복합체를 형성하기도 하고, 대사체를 만들어냄으로써 세포 및 주변 조직의 항상성을 유지한다[8]. 같은 유전체를 가질지라도 세포 주변의 상황과 자극은 저마다 다른 형태의 단백질 발현, 상호작용, 조절의 조건을 만들어내기 때문에 세포 내에서 이루어지는 생리학적 현상들을 유전체 정보만으로 이해하는 데는 한계가 있다. 따라서 유전체의 정보만으로 쉽게 읽어낼 수 없는 그 현상들을 파악하기 위해서는 단백질 간 결합으로 이루어지는 네트워크의 함수형 데이터(functional-data)가 필요하다[6][8].

따라서 생명과학자들은 프로테오믹스에 대한 높은 기대감을 가지고 있다. 그들은 어떤 단백질이 유기체, 조직, 세포 또는 세포 기관에 의해 어떤 양으로 형성되며 조합을 이루는지 알고 싶어한다. 과학자들은 인간 프로테옴 프로젝트가 인간 게놈 프로젝트와 마찬가지로 세포 기능의 연구에 있어서 새로운 방향을 제시할 것으로 기대한다[22]. 또한, 건강한 세포와 질병 세포의 프로테옴 비교를 통해 질병 원인에 대한 단서를 발견할 수 있을 것이며, 이러한 종류의 단백질들을 목록화하여, 구체적인 분자기전 연구를 뒷받침하게 할 것이다. 그러나 이런 종류의 단백질 목록을 만드는 것만으로는 충분하지 않다. 과학자들은 이러한 신호를 다른 분자로 전달하는 단백질 분자의 번역 후 변형(post-translational modification)에 대해서도 고려해야 한다. 단백질은 인산화, 메틸화 또는 아세틸화되는 부위에 따라 특정 신호 전달 경로를 활성화시킬 수 있고, 이것은 다양한 대사 경로에 영향을 줄 수 있다. 따라서, 번역 후 변형이 이루어진 단백질까지 포함해서 목록을 작성할 필요가 있다. 여기에 더 추가되어야 할 것은 상호작용하는 단백질에 대한 정보이다. 일부 단백질은 쌍으로 모여 그 과정에서 신호를 교환한다. 인간 세포의 상호작용은 약 130,000쌍의 상호작용을 포함하는 것으로 추정된다[3]. 이러한 상호작용들을 독립적으로 판단하는 것은 불가능하다. 상호작용의 교차점을 이루는 그룹도 다른 그룹의 상호작용에 영향을 미치기 때문이다. 따라서 단백질 결합체 지도작성 및 해석의 필요가 생겼고, 그러기 위해서는 PPI (Protein-Protein Interactome) 데이터 수집이 충분한 신뢰도와 재현성을 가지고 이루어져야 한다는데 의견이 모아졌다. 현재 진행되고 있는 Human Proteome Project에서는 단백질 구조를 통한 기능 예측, 그리고 Text mining (연구논문에서 정보 추출)을 통해 interactome을 구축해 나가고 있다(표 1). 그뿐만 아니라 최근에는 충분한 신뢰성을 갖춘 High throughput experimental PPI mapping 방법을 통해 공개적으로 사용 가능한 데이터베이스를 구축해 나가고 있다(표 2). 현재 단백질-단백질 결합체의 DB를 만들기 위해 다양한 실험방법들이 제시되고 있으며, 그 실험 방법의 한계를 극복하기 위해 지금도 기술적 진화가 이루어 지고 있다.

1. 본론

2.1 친화도 정제 - 질량 분광법 기반의 PPI 매핑방법

현재 작용체 mapping에서 가장 빈번하게 사용하고 있는 방법은 AP-MS (Affinity Purification - Mass Spectrometry)이다(그림 1A). 이것은 세포 내에 표지와 융합된 단백질의 발현을 유도하여 resin에 붙이고 함께 침전시킴으로써 결합되어 나온 단백질들을 액상 크로마토그래피와 이어진 질량분석기를 통해 동정해내는 방법이다. 최근 인간의 단백질을 가지고 시행한 연구에서 20,000개의 단백질 간 결합을 동정해낸 예가 있다. BioPlex (biophysical interactions of ORFeome-derived complexes)라고 하는 방법을 통하여 FLAG-HA 표지자를 c-말단에 붙인 600개 가량의 ORF들을 HEK 293T 세포들에 일시적으로 transfection하여 AP-MS 방법으로 동정한 경우다[11]. 클론의 준비에서 품질관리, 정량화 알고리즘의 개발을 기반으로 양, 감지 빈도, 그리고 재현성들이 추가되어 신뢰성을 높이는 데이터셋을 갖추고 있다. 이것은 BioGRID PPI database에서 찾을 수 있다. 또 다른 연구에서는 염색체 분리 또는 모터 단백질의 기능과 관련된 유전자를 타겟으로 하였다. 1,125개의 HeLa 세포주 라이브러리를 스크리닝하는 방법으로 N-, C-말단 각각에 표지자 처리된 쥐 또는 인간의 유전자를 도입한 박테리아 인공 염색체를 가지고 AP-MS를 수행하여 28,000개의 단백질 결합들을 동정해냈다[12]. 여기서 단백질 간 상호작용 외에도 정량적인 측정을 통해 약한 결합반응이 우세함을 밝혀내었다. 이 사실은 복합체의 형태가 안정적인 구조를 유지하기보다 일시적인 그리고 유동적인 형태로 존재함을 시사한다.

이렇게 만들어진 상호작용 데이터 세트는 IntAct 데이터베이스와 IMEx 컨소시엄에 각각 등록되었다. 특히, 양쪽 모두의 연구는 2,800여개가 넘는 단백질체를 직접 검증을 통해 입력하며 유지하고 있는 CORUM (Comprehensive Resource of Mammalian protein complexes) database에서도 의미있게 중첩된다. 현재 CORUM은 PPI database들 중에서 가장 적합한 표준으로 여겨진다. 이것은 실험적으로 검증된 상호작용에만 전적으로 의존하며 대규모 데이터 세트의 등록을 허용하지 않는다(표 1). Proteome 적용 범위는 HPP, MaxQuant Database (MaxQB), Human Proteome Map 및 최근의 대규모 프로테옴 매핑 계획에서 생성 및 공유된 데이터 세트와 비교-평가를 통해 이루어졌다.

AP-MS 방법에서 표준화된 전처리과정을 적용하더라도, 과발현이나, 표식으로 인해 유발되는 오류들이 존재한다. 하지만, Large-scale 연구에서 이러한 오류들은 대조군의 적절한 사용을 통해 해결할 수 있다. 음성 대조군은 대체로 미끼로 사용한 단백질의 선택적 친화도에 의존하지 않기 때문에 공통적으로 나타나는 오염 물질들은 관련성이 없는 데이터 세트에서도 나타난다. 이러한 이유로 음성대조군들을 식별-배제할 수 있다. 하지만, 이러한 문제들마저도 CRISPR/Cas9 유전자 편집 도구를 사용함으로써 내인성 단백질의 직접적인 친화도 표지(tagging)를 통해 극복될 수 있다[12]. 그뿐만 아니라 내인성 단백질의 검출한도 개선과 실험에 사용할 항체의 품질개선 및 유의성 분석이 가능한 소프트웨어의 개발 등과 같이 다양한 방법을 통해 AP-MS의 기술적 한계를 극복하려는 시도가 계속해서 이어지고 있다.

표 1. 단백질-단백질 결합정보 데이터베이스
upload image
upload image

2.2 근접 표지방법을 이용한 질량분석법

AP-MS가 가장 일반적으로 사용되고 있지만, PPI를 매핑할 때 취약점은 복합체를 추출하기 위해 세포를 파괴해야만 한다는 것이다. 세포를 파괴하면 단백질의 추출 환경에 따라 원래의 단백질-단백질 상호작용에 영향을 끼치기도 하고, 약한 결합 또는 일시적인 결합의 형태가 와해되어 동정되지 못할 수도 있다. 이러한 영향들을 최소화하기 위해 보완된 방법으로 공간적으로 제한된 접근법을 사용하는 근접 표지 방법이 구상되었다[9]. 이웃 단백질을 바이오틴화 하는 효소를 통해 근처의 단백질들을 생체 내에서 공유 결합으로 표지함으로써, 일시적이거나 가변적인 단백질-단백질 상호작용까지도 잡아낼 수 있게 된다(그림 1B). 추가로 biotin에 대한 streptavidin을 사용하여 biotinylated protein의 효율적인 회수작업이 가능해진다[9]. 최근에는 BioID 그리고 APEX 기법을 이용하여 다중 단백질 복합체의 분석 및 특정 세포 구획의 단백질 조성 동정을 위한 근접 표지 기술로 채용하여 데이터를 모은다[15].

BioID 데이터들은 주로 관심 있는 단백질과 바이오틴 연결효소 융합을 통해 근접 단백질을 바이오티닐화 시킴으로써 동정해낸 단백질의 발현과 관련되어 있다[12]. E. coli에서 얻어진 BirA biotin ligase는 기질특이적으로 특정 시퀀스에 바이오티닐화를 유도하는데, BirA mutant (Arg118Gly)를 사용하게 되면 10nm 반경의 단백질들을 무작위로 바이오틴화하도록 할 수 있다[7][14]. AP-MS 분석법과 마찬가지로 BioID에서 얻어진 데이터가 직접적인 물리적 단백질-단백질 상호작용을 의미하지는 않는다.

BioID는 AP-MS의 기술적 한계로 인해 기존에는 찾기 힘들었던 중요한 기능성 복합체에서의 단백질 동정을 가능케 하였다. 예를 들어, AP-MS를 이용하여 Centrosome-associated proteins (중심체와 관련된 단백질들)을 밝혀내기는 어려웠다. 중심체는 세포 주기별로 만들어지고 성숙되며 분리되어 spindle microtubule을 형성하는 등 상당히 역동적이고 거대한 구조체다. 세포 주기를 진행하는 세포에서 중심체 구조에 관여하는 단백질들은 대부분 일시적인 상호작용을 하는데다 부분적으로 약한 결합들로 구성되기 때문이다. 그러나 BioID 접근법은 기존의 AP-MS로는 어려웠던 새로운 단백질 복합체의 형태를 동정해낼 수 있게 하였다.

APEX는 완두콩 또는 대두로부터 유래된 단일 형태의 아스코르빈산 과산화제 리포터로, 이것은 과산화수소가 있는 조건에서 산화촉매반응을 통해 Biotin-Phenol를 Biotin-phenoxyl화 함으로써 결과적으로 주변의 단백질을 바이오틴화한다(그림 1C). 따라서 BirA-촉매화된 바이오틴화는 Lys 잔기로 제한되고, 바이오틴 페녹실 라디칼은 전자가 풍부한 Tyr, Trp, His 및 Cys와 같은 아미노산과 공유 결합으로 반응할 수 있다. 이것은 또한 짧은 시간(< 5ms) 존재하며, 막 불투과성이며, 작은 반경(< 20nm)을 표지한다. 또한 APEX는 diaminobenzidine 침전을 촉매하기 때문에 세포 내에서 음영을 형성한다[15]. 이것을 Osmium tetroxide (OsO4)로 고정하게 되면 전자현미경을 통해 나노미터 해상 범위로 그 위치까지도 확인이 가능하다[15].

2세대 APEX2 mutant (Ala134Pro)는 무작위적으로 표지하던 기존의 그것보다 더 향상된 효율을 보여준다[12]. BioID와 마찬가지로, 한번 근접 단백질들이 표지 되면, 바이오틴화된 단백질들은 엄격한 streptavidin 정제와 질량분석법을 통해 동정될 수 있다. BioID를 넘어서는 APEX의 장점은 시간 단위가 아닌 분 단위로 표지가 이루어지는 보다 높은 시간적 해상도 이다.

APEX 리포터는 Drosophila 근육의 미토콘드리아 matrix 단백질체 매핑에 이어 인간의 미토콘드리아막 사이의 공간과 막으로 둘러싸인 미토콘드리아 matrix의 프로테옴지도 작성에도 사용되었다. 막과 결합하는 세포 기관의 단백질 연결체의 매핑은 아직 동정되지 못했지만, 그것마저도 앞으로 사용하는 효소 및 그 기질의 최적화를 이루어낸다면 충분히 효용성을 연장할 수 있을 것으로 전망된다.

upload image

그림 1. 단백질 간 결합 분석을 위한 실험적 방법
A. 표지자 단백질의 인위적 발현유도 또는 항체에 붙인 내인성 단백질과 결합하는 단백질들을 함께 침전시켜 질량분석법으로 동정한다. B-C. 관심있는 단백질과 공간적으로 근접한 부위에 위치한 단백질들에 무작위적으로 바이오티닐화를 함으로써 streptavidin으로 pull-down하여 질량분석법으로 동정한다.



2.3 단백질간 결합 매핑을 위한 대안적 접근

교차 결합된 펩타이드를 동정하여 어떠한 단백질의 펩타이드 구조가 인접 단백질의 특정 구조에 결합하는지를 알아내는 XL-MS와 같은 전략을 사용하는 방법도 있다(그림 2A). 이 방법은 단백질 복합체의 구조 정보를 제공한다. XL-MS의 경우, 초기에 데이터를 수집하거나 분석을 하는데 있어 상당한 복잡성을 가지고 있기 때문에 상대적으로 진행속도가 느린 단점이 있다[9]. 각 펩타이드로부터 교차 결합된 일련의 펩타이드 단편들을 MS/MS 스펙트럼을 통해 밝혀내고 이것들을 목록으로 만들어 특정 구조에 배치함으로써 단백질 결합체의 형태를 재구성해낸다[9]. 이 분야에서 높은 수율 확보를 위한 기술에 많은 진전이 있었음에도, 검출한계를 넘어서는 단백질 결합체의 수율 확보는 여전히 쉽지 않은 문제다. 이 문제를 해결하기 위해 기계 감도 범위에 올라서는 복합체 펩타이드 양의 충분한 확보를 위해 추가적인 사전 분획 과정을 거치거나, 친화적 표지자를 교차 결합시킬 수 있는 시약 또는 그에 상응하는 화합물의 개발이 필요하다. 추가로, 동정된 데이터를 가지고 단백질 결합체의 구조를 재구성해낼 수 있는 소프트웨어의 기술개발도 진행 중이다.

마찬가지로, PCP-MS 연구 또한 적용 범위 및 특이성 향상이 이루어지고 있는 분야다. 이 접근법은 친화적 정제과정들을 피하고 그 대신 density gradient, size exclusion, ion exclusion, 그리고 hydrophobicity와 같은 크로마토 칼럼 특징을 이용하여 단백질 복합체를 분리한다(그림 2B). 사용 가능한 분리 옵션의 범위가 주어지면 PCP-MS도 미래의 발전을 위한 중요한 범위를 제공할 것이다.

upload image

그림 2. 단백질간 결합 분석에서 시도 되는 다른 접근방법
A. 결합력이 약하거나 일시적인 단백질의 결합 형태를 알기 위해서 세포 내에서 결합한 단백질 복합체를 고정하여 동정하는 방법이 채택되고 있다. 고정을 위해서 일반적으로 homobifunctional N-hydroxy succinimide (NHS) ester들이 사용되고 있으며, 펩타이드 시퀀싱을 통해 결합하는 구조를 알아낼 수 있다. B. 단백질이 가지고 있는 특성별(분자량, 전하, 친수/비친수성, 친화력)로 분리하여 동정함으로써 상관관계에 있는 단백질들을 분석하고 목록을 작성한다.



2.4 단백질 간 직접적인 상호작용 분석

XL-MS를 제외하고, 위에서 설명한 다른 방법들(AP-MS, proximity labeling, 그리고 PCP-MS)의 경우는 여러 단백질의 복합체 속에 존재한다는 사실만 확인할 수 있다. 이것을 보완하여 직/간접 단백질 상호작용임을 확인하는 방법으로는 20여년이 넘도록 사용해온 Y2H (Yeast two-hybrid)분석이 있다. 상호작용하는 단백질은 전사 인자의 DNA 결합 도메인과 활성 도메인에 분리되어 표지되고, 직접적인 결합이 형성되면 이것이 재구성됨으로써 이어서 리포터 유전자를 활성화하는 방식이다. 비록 yeast 내에서 일어나는 분자적 현상이 mammalian cell에서 일어나는 생리학적 조건을 완벽하게 재현하지 못하고, 그 결과 단백질의 결합에 영향을 줄 수 있는 번역 후 일어나는 변형의 과정을 고려하기 어렵기 때문에 false positive 또는 false negative 데이터가 얻어질 가능성이 있지만, 대량으로 단백질-단백질 결합을 스크리닝해낼 수 있는 강력한 툴이라는 점에서 상당한 이점이 있다. 다나파버 암 연구소(Farber Cancer Institute)에서는 Y2H 시스템을 통해 인간, 바이러스-숙주, 식물 및 이스트에서 대량으로 단백질-단백질 결합을 스크리닝해내고 있으며, 최근에는 광범위한 인간 ORF를 수집하여 14,000개의 binary 단백질-단백질 상호작용 매핑을 해냈다[10]. 이 그룹은 궁극적으로 인간 바이너리 PPI 전체를 매핑하는 것을 목표로 하고 있으며, 현재까지 매핑된 PPI 총 합계는 대략 1만 7000개에 달한다.

표 2. 현재 추진중인 단백질 상호 작용체 계획
upload image

3. 결론

생명 정보학 및 질량분석 기술의 진보는 proteome에 존재하는 수많은 단백질들의 상호작용을 밝혀내는데 도움을 주었다. 지난 십여 년간 단백질체 DB를 만드는데 있어 데이터의 정확성과 재현성을 끌어올림으로써 표준화하기 위한 다양한 시도들이 있었고, 실험을 통해 드러난 각종 데이터들을 기반으로 분자 상호작용에 관한 자세한 정보를 담고 있는 자원들은 이제 실체화에 가까워졌다. Tandem Affinity Purification (TAP) 방법을 비롯하여, XL-MS, Spatially restricted enzymatic labeling technique, 및 Y2H에 의한 PPI 스크리닝 방법들은 생물정보학 분석을 뒷받침하며, 단백질 간 상호작용을 통한 단백질 복합체와 관련된 정보를 제공함으로써 단백질 상호작용체 연구와 구조 생물학 사이를 연결해 주었다. 현재 질량분석법은 단백질 복합체의 구조에 대한 중요한 정보를 제공할 수 있는 수준에 와 있다. 앞서 소개한 다양한 방법을 채택한 단백질체의 정보는 시스템 생물학의 도움을 통해 막대한 양의 상호작용 데이터를 해석하고 검증할 수 있다. 이것은 궁극적으로 연구실에서 진행하는 실험의 방향을 제시해 줄 것이며, 세포에서 만들어진 단백질의 변이와 그를 통해 변화된 단백질 복합체의 조합 및 생리학적 기능 연구 영역으로까지 확장될 것으로 전망한다.

4. 참고문헌

==> PDF 참조

본 자료는 BRIC-KOBIC "유전체 연구동향" 정보제공자 모집으로 작성되었습니다.
  추천 0
  
  인쇄하기 주소복사 트위터 공유 페이스북 공유 
  
Citation 복사
강두석(2017). 단백질체 기반의 상호작용체학 동향. BRIC View 2017-T06. Available from http://www.ibric.org/myboard/read.php?Board=report&id=2702 (Mar 14, 2017)
* 자료열람안내 본 내용은 BRIC에서 추가적인 검증과정을 거친 정보가 아님을 밝힙니다. 내용 중 잘못된 사실 전달 또는 오역 등이 있을 시 BRIC으로 연락(member@ibric.org) 바랍니다.
 
의견올리기
작성자
목록
바이오코리아
바이오코리아 스폰서배너광고 안내
이전페이지로 돌아가기 맨위로 가기
 

BRIC 홈    BRIC 소개    회원    검색    문의/FAQ    광고    후원
Copyright © BRIC. All rights reserved. Contact member@ibric.org

 
도서이벤트