일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 스캘핑
- 관심종목
- 리눅스
- 주식투자
- 세균
- 기본적분석
- mummer
- W패턴
- 생물정보학
- 지지저항선
- 증권사레포트
- 매매기법
- 상한가
- 추천종목
- bioinformatics
- 분봉차트
- 기술적분석
- 목표주가
- 생명정보학
- 지지저항
- 비교유전체
- 돌파매매
- 이동평균선
- 유전체
- 초단타
- 쌍바닥패턴
- 매매일지
- 주식매매
- 차트분석
- 우분투
- Today
- Total
A Fine-Tuned Universe
standalone BLAST (계속 수정 중) 본문
내가 관심있는 유전자가 어떤 기능인지 또는 기능을 알고 있는 유전자를 이용해 내가 가진 유전정보에서 해당 기능을 가진 유전자를 찾고 싶을 때 시퀀스의 유사도를 기반으로 가까운 유전자를 찾아주는 BLAST를 흔히 사용한다
몇 개의 유전자만을 찾아보려면 NCBI BLAST 페이지에서 웹 기반으로 할 수 있지만 대량의 유전자를 찾아보아야 한다면 웹에서는 할 수 없다
(시간이 나거나 생각이 날 때마다 수정해서 이 포스트를 조금씩 보완해갈 예정이다.)
1. BLAST database 만들기
BLAST database는 makeblastdb 명령어를 이용하여 만들 수 있다
nucleotide 또는 protein fasta 파일을 먼저 준비한다
이 포스트에서는 Pseudomonas mendocina strain MAE1-K 를 예제로 설명해보겠다
NCBI Nucleotide CP023641.1로 이동한다
https://www.ncbi.nlm.nih.gov/nuccore/CP023641.1
화면 오른쪽 위에 있는 Send to를 누르고 Coding sequences를 선택하면 FASTA nucleotide 또는 protein를 고르 수 있는데 이번 예제에서는 nucleotide FASTA를 다운받아보겠다
makeblastdb -in 0426-cyano.faa -dbtype prot -out NIES298
makeblastdb -in MAE1K_nuc.txt -dbtype nucl -out MAE1K_nucl
blastp -db NIES298 -query Query_LuxR.fasta -out Hit_NIES298_LuxR -outfmt 7 -evalue 0.00001 -max_target_seqs 1
BLAST의 결과는 여러 형태로 나타낼 수 있는데
-outfmt 뒤에 숫자를 붙여서 선택하면 된다.
blastp -db NIES298 -query query_epd.fasta -out Hit_NIES298_epd -outfmt 6 -evalue 0.00001 -max_target_seqs 1
-outfmt 6은 header에 qseqid sseqid pident length mismatch gapopen qstart qend sstart send evalue bitscore가 순서대로 표시되고 tab-delmited value로 저장된다
각 줄임말의 의미는 아래와 같다
qseqid: query (e.g., unknown gene) sequence id
sseqid: subject (e.g., reference genome) sequence id
pident: percentage of identical matches
length: alignment length (sequence overlap)
mismatch: number of mismatches
gapopen: number of gap openings
qstart: start of alignment in query
qend: end of alignment in query
sstart: start of alignment in subject
send: end of alignment in subject
evalue: expect value
bitscore: bit score
'Bioinformatics' 카테고리의 다른 글
Artemis (Genome analysis, visualization, a circular map) (0) | 2020.08.05 |
---|---|
Pan-genome 분석 나름대로 순서 정리 (0) | 2020.03.12 |
GNUPlot (0) | 2019.08.07 |
show-coords 로 delta 파일 활용 (0) | 2019.08.07 |
postnuc returned non-zero, nucmer error message (0) | 2019.08.07 |