실험Q&A를 통해 여러분의 지식을 나누어 주세요. 답변을 등록하시려면 로그인 해주세요.
본 정보는 네티즌에 의해 작성된 정보로, 내용 중 중요하다고 생각되는 부분은 추가적인 사실 확인을 반드시 하시길 바랍니다.
-
Mad Scientist
(비회원)
-
06.07.02 11:15
물론 Perl 이나 Python 같은 스크립트로 간단한 프로그램을 짜서 계산할 수도 있겠지만, 그게 가능하신 분이라면 이런 것을 물어보지도 않으셨겠죠. 쩝.
http://www.mbio.ncsu.edu/BioEdit/bioedit.html
시퀀스가 한두개라면 위와 같은 프로그램을 받아서 시퀀스 붙여넣으시고, 시퀀스 옆에 나오는 bp 눈금를 이용해서 계산하는 게 쉽지 않을까요.. -.-;;
코돈은 Coding Region 만 잘라내서 위 프로그램에서 Translation 한 다음 아미노산 갯수 세봐도 될 것 같고.
단순히 Nucleotide 갯수를 알고싶으신걸로 이해해도 될듯싶네요...
여러 웹사이트가 있지만, 그중에 한군데를 소개해드리죠...
여기가서 빈박스안에 > 표시 (쉬프트키 + 마침표) 하시고 엔터친다음 염기서열 붙여넣기하시고, ReadSeq 에 체크된거 확인하시고, submit 클릭! 하시면 몇 bp 인지 나옵니다. 기타 상보서열, 역상보서열, 아미노산 서열로 번역도 됩니다. 유용하게 사용하세요...
http://searchlauncher.bcm.tmc.edu/seq-util/seq-util.html
이런걸 뭐 프로그램까지 찾을 필요있나요?
메모장(notepad)에 메뉴바에서 상태표시줄을 활성화한 다음
시퀀스를 한줄로 나열한 후에 커서를 시퀀스 제일 마지막에 위치하도록 한다음
메모창 제일 아래에 보면 Ln1,Col123 이렇게 써있는 것을 찾을 수 있습니다.
이 의미는 첫번째 line에 123번째 column이라는 것을 의미하며 커서가 제일 마지막에서 깜박인다면 123-1=122개의 염기서열이 있다는 것을 뜻합니다.
아래아한글에서는 문자수를 세어주는 기능이 있습니다.
워드에서도 그런 기능이 있구요.
엑셀에서도 hcount 함수를 사용하면 쉽게 알아낼 수 있습니다.
저도 이런 프로그램이 필요합니다. 특정 서열 (15-25개 정도)을 갖는 sequence read 가 몇개나 되는지, 또 한 두개의 에러 (in-del까지 포함되면 더욱 좋고요)도 감안해서 세어주면 너무나 큰 도움이 되겠습니다. 이거 오래 전에 포스트 된건데 아직도 보는 분들이 있으면 하는 바램입니다
grep 이나 agrep 을 써서 하고 있지요.agrep -0 -c NNNNNNNNNNNN test_file.fastq-0 는 0 mismatch, -c는 카운트한 숫자만 표시하라는 옵션, 안하면 염기 서열과 빨간 타겟 염기가 표시되어 스크린에 나옵니다. 길---게.....근데 여러개의 서열을 한번에 할 수 있는 방법을 만들었는데 혹시 필요한 분이 있을까 해서 간단히 올려봅니다.리눅스 환경에서 우선 Snakemake 를 설치하시고 한 디렉토리에 데이터를 모두 모아 놓고 찾고자 하는 염기 서열을 파일형식으로 만들어야 합니다. 파일은 비어 있어도 됩니다. 파일 이름이 인풋 염기 서열이 된니까 extension 없이... 그리고는 snakefile을 아래와 같이 만듭니다. <p class="Standarduser"><span lang="EN-GB" style="font-family: " courier="" new";="" color:="" rgb(51,="" 51,="" 51);="" font-size:="" 10px;"="">SAMPLE=["CAAATTAAACCACCA","CTACAGTGAAATCTC","CTACAGAGAAATCTC"]<o:p></o:p></span><span style="font-size: 10px;">
</span><p class="Standarduser"><span style="color: rgb(51, 51, 51); font-family: " courier="" new";="" font-size:="" 10px;"="">rule all:</span><span style="font-size: 10px;">
</span><p class="Standarduser"><span lang="EN-GB" style="font-family: " courier="" new";="" color:="" rgb(51,="" 51,="" 51);="" font-size:="" 10px;"=""> input: expand
("{smp}.count", smp=SAMPLE)<o:p></o:p></span><span style="font-size: 10px;">
</span><p class="Standarduser"><span style="color: rgb(51, 51, 51); font-family: " courier="" new";="" font-size:="" 10px;"="">rule agrep1:</span><span style="font-size: 10px;">
</span><p class="Standarduser"><span lang="EN-GB" style="font-family: " courier="" new";="" color:="" rgb(51,="" 51,="" 51);="" font-size:="" 10px;"=""> input: s1="{smp}"<o:p></o:p></span><span style="font-size: 10px;">
</span><p class="Standarduser"><span lang="EN-GB" style="font-family: " courier="" new";="" color:="" rgb(51,="" 51,="" 51);="" font-size:="" 10px;"=""> output:
s1="{smp}.count"<o:p></o:p></span><span style="font-size: 10px;">
</span><p class="Standarduser"><span lang="EN-GB" style="font-family:" courier="" new";="" color:#333333"=""><span style="font-size: 10px;"> </span><span style="font-size: 10px;">shell:
""" agrep -0 -c {input.s1} test.fastq >
{output.s1} || true """</span><b style="font-family: Dotum, AppleGothic, sans-serif;"><span lang="EN-GB" style="font-family:" courier="" new""="">생성된 여러 *.count 파일을 하나로 합치려면 따로 푤더를 만들어 *.count파일만을 모아놓고</span></b><o:p></o:p></span>
<p class="Standarduser"><span style="font-family: " courier="" new";"="">find .
-type f -print -exec cat {} 역/; > file_name.txt파일로 생성 시키려면 오른쪽 꺽쇄 (<span style="font-size: 10px;"> > </span>; 이 특수문자가 여기서 잘 안보임) 하고 파일 이름.. 어렵게 얻은 겁니다. 잘 쓰세요. </span>