실험Q&A를 통해 여러분의 지식을 나누어 주세요. 답변을 등록하시려면 로그인 해주세요.
본 정보는 네티즌에 의해 작성된 정보로, 내용 중 중요하다고 생각되는 부분은 추가적인 사실 확인을 반드시 하시길 바랍니다.
RepeatMasker 옵션 중에 -nolow 등 low complexity region 이나 simple repeats 를 masking 할 것인지 정해주는 것들이 있던 걸로 기억합니다. 이 옵션들이 설정이 되어 있는지, 또는 예제 결과를 만드는 데 쓰였던 버젼과 지금 버젼 사이에 어떤 차이가 있을런지도?
혹시 이 다음 step 이 gene model prediction 이라면 simple repeat/low complexity 는 masking 하지 않는 것이 좋습니다. Protein-coding ORF가 simple repeat 등에 걸쳐 있는 경우가 흔하니까요. 제 note 를 보니 항상 -nolow -no_is (이건 무슨 옵션이었는지 기억이 -_-;; ) 옵션들을 켜 놓고 RepeatMasker 를 수행했었네요.
...
사족: 다음 스텝이 gene model prediction 이라면, 특히 유전체가 작고 compact 한 편인 경우 protein-coding tandem duplicated 유전자들이 LTR 로 masking 이 되어버리는 경우도 많이 있었습니다. RepeatMasker 로 masking 이 된 서열 중에서도 expression 이 일어나는 유전자가 있을 수 있어서, 얘네들을 따로 구출하곤 했던 걸로 기억합니다.