A Fine-Tuned Universe

Prokka - 세균 유전체 annotation 본문

Bioinformatics

Prokka - 세균 유전체 annotation

정재준 2022. 1. 18. 10:50
728x90

세균 유전체 annotation을 위해 가장 많이 사용하는 방법은 NCBI의 prokaryotic genome annotation pipeline (PGAP, https://www.ncbi.nlm.nih.gov/genome/annotation_prok/) 일 것이다. FASTA 파일을 업로드하면서 PGAP를 이용해 annotation을 하겠다는 옵션에 체크만 해주면 신경쓸 필요없이 쉽게 annotation을 할 수 있고 여기서 부여된 locus tag, accession number 등은 전세계 공통으로 사용할 수 있어서 편리하다

 

하지만 별로도 유전체 annotation을 할 일도 생기는 데 (유전체 정보를 미리 공개하고 싶지 않은 경우 등) 이 때 Prokka를 사용할 수 있다. Prokka는 세균 유전체를 annotation 해주는 프로그램이며 리눅스 운영체제에서 command-line 기반으로 사용할 수 있는 프로그램이다. 속도도 빨라서 몇 분만에 annotation 결과를 얻을 수 있다.

 

Prokka는 Prodigal (CDS 탐색), RNAmmer (rRNA 탐색), Aragorn (tRNA 탐색), SignalP (signal peptide 탐색), Infernal (non-coding RNA 탐색) 를 이용해서 유전체의 각 요소들을 찾아낸다.

 

Prodigal은 먼저 coding sequence를 찾아낸다. 그리고 기능을 추측하기 위해 일반적으로 사용되는 방법 - 가장 유사한 단백질의 기능을 annotation 하는 것 - 을 사용한다. 좀 더 자세한 것은 논문을 참조하기 바란다. 

 

Input file

 

de novo assemble 등을 통해 얻은 fasta 파일 하나면 된다. complete genome 이든 contig 든 상관없다.

 

Output file

 

fna, faa, ffn, fsa, tbl, sqn, gbk, gff 파일들이 output으로 나오며 log 파일과 annotation summary를 담은 txt 파일도 나온다

 

Command-line 기반 사용 방법

 

설치는 다 되어있다고 가정하고 사용하기는 정말 쉽다

prokka --outdir [dirname] --locustag [locustag] testfile.fasta

 

이 정도만 써줘도 된다. prokka라고 명령어만 치면 도움말이 나오니 추가로 더 필요한 것이 있다면 공부해보시길

 

리눅스 사용 어려울 때 가장 간편한 사용 방법

 

리눅스를 쓰지 않는 사람들의 경우 내가 생각하기에 가장 간편한 사용방법은 갤럭시를 이용하는 것이다

 

1. usegalaxy.org 에 접속하여 로그인한다.

2. upload data를 눌러서 자신의 fasta 파일을 업로드 한다. upload 창에 fasta 파일을 드래그 앤 드롭하거나 불러오기로 넣으면 된다.

 

start를 누른다.

 

업로드가 완료된 것이 보인다.

 

 

 

히스토리에도 내가 올린 파일이 등록된 것을 볼 수 있다.

 

 

왼쪽 위 검색 창에 prokka를 입력하면 그 밑에 prokka 가 검색된다. 클릭하면 가운데 화면에 prokka를 실행시킬 준비가 된 것이 보인다. "contigs to annotate"에 분석하고자 하는 파일을 선택하면 된다. 여러가지 parameter를 설정할 수 있는데 내용은 아는 것이 아니라면 특별히 건드리지 않아도 된다. 화면 아래쪽으로 내려서 run tool을 클릭한다

 

그러면 output을 나올 파일을 안내해주면서 오른쪽 히스토리에 파일 목록이 생긴다. 기다리면 된다.

 

 

잠시 기다리면 파일 목록이 같이 초록색으로 바뀌는데 그러면 다 된것이다 제목을 누르고 디스크 모양을 클릭하면 파일을 download 받을 수 있다.

요즘 세대들을 위하여 저 디스크 모양은 좀 바꾸는게 어떨까.

(floppy disk 실물을 본 적 없는 사람 많을듯... 5.25 인치, 3.5 인치 floppy disk 모르시쥬?)

 

 

 

 

논문링크

https://academic.oup.com/bioinformatics/article/30/14/2068/2390517

 

 

LIST