안녕하세요?
Evolutionary/systematic biology 를 정식으로 전공하신 분이 답을 해주셨으면 좋겠지만, 부족하나마 제가 알거나 생각해보거나 찾아본 것을 써보겠습니다.
Alignment gap 은 missing data 일 수도 있고 indel, structural variation (SV) 에 의해 생길 수 있습니다. Missing data 라면 잘라내고 무시하면 되겠지만, indel/SV 일 경우 이것이 진화 도중 얼마나 자주 일어나는 현상인지 모델링하기 어렵고 MEGA 등에서 주로 다루는 sequence substitution 과는 완전히 다른 현상이기 때문에, 어려운 문제입니다.
MEGA 에서는 alignment gap이 있을 경우 pairwise 또는 compelete deletion (MP analysis 의 경우 partial deletion 추가) 이라는 옵션들이 있는데, 모두 gap/indel 을 계통수에 반영하려는 노력이 아니라, 어떻게 얼마나 버릴까 하는 옵션들입니다.
https://www.megasoftware.net/web_help_11/index.htm#t=Gaps_In_Distance_Estimation.htm
https://www.megasoftware.net/web_help_11/index.htm#t=Alignment_Gaps_and_Sites_with_Missing_Information.htm
즉 말씀하신 것처럼 indel 이 계통수에 크게 영향을 미치는 경우 MEGA 로는 indel data 를 반영한 계통수를 그릴 수 없고 좀 더 복잡한 도구를 쓰셔야 하겠습니다.
...
예를 들어 MRBAYES 같은 도구는 nucelotide / amino acid 서열 뿐 아니라 restriction sites 의 binary 유/무 여부, 심지어 morphology 구분까지 계통수 분석을 위한 input data 에 포함시킬 수 있습니다:
http://mrbayes.sourceforge.net/wiki/index.php?title=Evolutionary_Models_Implemented_in_MrBayes_3
https://www.aubot.dk/FastGap_home.htm
여기서 indel 의 여부를 bindary data 로 nucloetide / amino acid 서열과 함께 MRBAYES 와 같은 도구의 input 으로 사용하는 방법을 (검색해보면) 많이들 추천 하고 있지만, 제가 직접 시도해본 적은 없습니다.
이밖에도 indel + phylogenetic tree 로 검색하시면 비슷한 고민을 한 많은 논문들을 보실 수 있습니다. 예를 들어:
https://academic.oup.com/sysbio/article/66/5/698/2999315
의외로 깜짝 놀랄 정도로 이런 것을 잘 다루는 도구가 있을 지도 모르겠습니다. 실제 이 분야 세부 전공하신 분이 말씀을 해주시면 좋겠네요.
어쨌든 MEGA 에는 말씀하신 기능이 없다고 생각합니다.