안녕하세요.
말씀하신 Sol genomics network 의 FTP site 에 가보시면 이 유전체 assembly 의 여러 버젼들을 볼 수 있습니다.
https://solgenomics.net/ftp/tomato_genome/Heinz1706/assembly/
살펴보니 "Version 2.10 (2010-06-25)" 부터 염색체 "pseudomolecule" (contig, scaffold 들을 genetic, physical, optical mapping 등을 통해 염색체에 존재할 것으로 여겨지는 순서대로 늘어놓은 것) 을 만들기 시작한 듯 합니다.
https://solgenomics.net/ftp/tomato_genome/Heinz1706/assembly/build_2.10/ReleaseNotes.txt
Version 2.10 release note (위 링크) 를 보시면:
All scaffolds that could not be placed on either of the 12 tomato chromosomes by either the genetic or physical maps were placed on an artificial "chromosome 0". The scaffolds on this chromosome are ordered from large to small and unoriented.
라고 하네요. 즉 12 개 염색체를 만들고 남은 조각들을 모두 "chromosome 0" 에 무작위 순서로 넣은 모양입니다. 보통 이렇게 안 하고 "unplaced" 조각들 (scaffold / contig) 은 각각 따로 유전체 assembly 에 포함시키는데 조금 특이합니다.
이 "0번 염색체" 에 존재하는 유전자들은 그 자체와 주변 서열은 밝혀졌지만, 유전체내 위치 정보는 정해지지 않은 상태입니다. Version 4 (2019년) 까지 가면서 일부 "0번 염색체" 서열들이 제 위치를 찾아들어가지만 아직 남아있는 조각들이 있네요.
RNA-seq 에는 문제가 없겠지만, 유전체끼리 synteny 등을 비교하실 때는 "0번 염색체" 는 제외하고 분석하시면 되겠습니다.