본래 전공은 생물정보학과 무관한 학부생입니다. 이번에 유전자들의 데이터를 다루어야 할 일이 생겨서 질문드립니다.
제목 그대로, ENSP id(Ensembl protein id. 예: 9606.ENSP00000293362)와 gene symbol(예: BRCA1)을 대응시켜 놓은 파일(txt, csv, xlsx 등)을 어디서 찾을 수 없을까 하여 고민하고 있습니다. ENSP로 되어 있는 자료를 모두 Gene symbol로 변환해야 할 일이 생겼기 때문입니다.
웹사이트에서 '검색'의 형식으로 id 하나하나를 검색해서 변환시켜 주는 서비스는 찾을 수 있었는데요, 제가 처리하고자 하는 데이터 속의 단백질 id 개수가 1200만 개 정도 되다보니 그런 서비스를 이용하는 것은 무리라고 생각이 들었습니다.
이에, 파일로 되어 있는 대응관계 자료만 있다면 R이나 c언어 등을 이용해서 프로세싱을 할 수 있고, 이것이 사실상 유일한 방법일 것 같아서 이렇게 글 남겨 봅니다. 혹시 이런 대응관계 자료를 제공하는 웹사이트를 아시는 분이 계시다면 귀띔해주시면 정말 감사하겠습니다 ㅠㅠ