일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 매매일지
- 돌파매매
- 목표주가
- 세균
- 리눅스
- 분봉차트
- W패턴
- 이동평균선
- 생물정보학
- 유전체
- 지지저항
- 기본적분석
- 우분투
- 추천종목
- 주식매매
- 상한가
- 비교유전체
- 기술적분석
- 지지저항선
- mummer
- 생명정보학
- 초단타
- bioinformatics
- 주식투자
- 스캘핑
- 매매기법
- 관심종목
- 차트분석
- 증권사레포트
- 쌍바닥패턴
- Today
- Total
목록생물정보학 (11)
A Fine-Tuned Universe
세균 genome sequencing을 위해 nanopore 시퀀싱 하였으나 pseudogene이 너무 많아 제대로 분석을 할 수가 없었다. (20%정도...) 실제로 유전체에 pseudogene이 많은게 아니라 시퀀싱 에러일 것으로 생각했기 때문에 illumina 로 한 번 더 시퀀싱 하였고 두 결과를 hybrid assembly 하고자 하였다 Unicycler는 short read를 먼저 assemble하여 contig를 만들고 long-read로 그 contig들을 scaffold 해주는 방식이다. 개발자는 이것을 short-read-first assembly 라고 부른다. 과거에는 nanopore와 같은 long-read sequencing의 depth가 낮고 정확도가 떨어지기 때문에 short-..
각각의 genome은 시퀀스뿐만 아니라 여러가지 정보를 포함하고 있다. 예를 들면, strain 이름, size, contig 수, GC%, accession number, ftp 링크 등등의 항목이 있다. 한 두 개의 genome이 아니라 매우 많은 수의 genome의 이런 정보들을 얻고 싶은데 일일이 링크를 타고 들어가서 복붙할 수는 없는 노릇이다 https://ftp.ncbi.nlm.nih.gov/genomes/GENOME_REPORTS Index of /genomes/GENOME_REPORTS ftp.ncbi.nlm.nih.gov 여기에 들어가보니 뭔가 report들을 모아놓은 느낌이 든다 README를 읽어보자 This directory contains summary reports conveyi..

세균 유전체 annotation을 위해 가장 많이 사용하는 방법은 NCBI의 prokaryotic genome annotation pipeline (PGAP, https://www.ncbi.nlm.nih.gov/genome/annotation_prok/) 일 것이다. FASTA 파일을 업로드하면서 PGAP를 이용해 annotation을 하겠다는 옵션에 체크만 해주면 신경쓸 필요없이 쉽게 annotation을 할 수 있고 여기서 부여된 locus tag, accession number 등은 전세계 공통으로 사용할 수 있어서 편리하다 하지만 별로도 유전체 annotation을 할 일도 생기는 데 (유전체 정보를 미리 공개하고 싶지 않은 경우 등) 이 때 Prokka를 사용할 수 있다. Prokka는 세균 유..