A Fine-Tuned Universe

General procedures for comparative genomic analysis 본문

Bioinformatics

General procedures for comparative genomic analysis

정재준 2021. 4. 1. 15:16
728x90
  1. ANI
    • EzBiocloud - ANI calculator: 매번 FASTA 파일을 업로드 해야한다는 단점
    • EzBiocloud - OAT: 한 번에 분석할 수 있는 genome 수가 적고 분석 속도가 느림
    • KBase - FastANI 가 적절한 대안으로 생각됨
      • KBase 접속 - New narrative
      • Data 에서 + 클릭 - Import 클릭 - 빈 칸에 gbff 파일을 드래그 해서 업로드 한다
      • 주의할 점: 중간중간 화면 오른쪽 위에 있는 Save를 눌러줘야 한다iocloud - ANI calculator: 매번 FASTA 파일을 업로드 해야한다는 단점
      • EzBiocloud - OAT: 한 번에 분석할 수 있는 genome 수가 적고 분석 속도가 느림
      • KBase - FastANI 가 적절한 대안으로 생각됨
      • KBase 접속 - New narrative - APPS에서 fastANI 검색 후 클릭하면 narrative에 FastANI가 추가됨
      • Data 에서 + 클릭 - Import 클릭 - 빈 칸에 gbff 파일을 드래그 해서 업로드 한다
      • 주의할 점: 중간중간 화면 오른쪽 위에 있는 Save를 눌러줘야 한다
      • Staging area - Import As 에서 assembly 또는 genbank genome을 선택하고 위로 된 화살표 모양 클릭하면 narrative에 추가됨, narrative에서 run 누르면 왼쪽 data에 등록됨
      • APPS에서 fastANI 검색 후 클릭하면 narrative에 FastANI가 추가됨 + 눌러서 분석하고자 하는 genome을 모두 추가한 뒤 Run 클릭, 분석이 완료되면 result에서 결과를 볼 수 있다, 하단의 report.html을 다운로드 받을 수 있다
  2. DDH
    • https://ggdc.dsmz.de 접속
    • GGDC 클릭
    • query accession에 genome accession number 입력
    • reference accession에도 genome accession number를 입력하는데 한 줄에 하나씩 입력할 수 있다. 비교하고자 하는 모든 genome의 accession number를 적으면 된다. (최대 75개)
    • 결과를 받아볼 이메일을 적고 submit 클릭
    • 결과 이메일에서는 recommended 라고 된 부분의 값을 사용하면 된다.
  3. Roary
    • FNA 파일이 포함된 GFF 파일로 편집
    • usegalaxy.org에 gff 파일을 모두 업로드 (화면 왼쪽에 upload data 클릭 후 드래그앤드랍, start 클릭)
    • usegalaxy.org에서 roary 찾아서 클릭 후 분석하고자 하는 genome을 모두 선택
    • minimum percentage identity를 50으로 수정
    • Additional outputs에서 select all 선택
    • execute 클릭
LIST