일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 주식투자
- 돌파매매
- 분봉차트
- 초단타
- mummer
- 추천종목
- 유전체
- 스캘핑
- 지지저항
- 주식매매
- 기본적분석
- 생명정보학
- W패턴
- 매매기법
- 차트분석
- 목표주가
- 지지저항선
- 기술적분석
- 관심종목
- 쌍바닥패턴
- 리눅스
- 매매일지
- bioinformatics
- 비교유전체
- 상한가
- 우분투
- 생물정보학
- 이동평균선
- 증권사레포트
- 세균
- Today
- Total
목록전체 글 (135)
A Fine-Tuned Universe
세균 genome sequencing을 위해 nanopore 시퀀싱 하였으나 pseudogene이 너무 많아 제대로 분석을 할 수가 없었다. (20%정도...) 실제로 유전체에 pseudogene이 많은게 아니라 시퀀싱 에러일 것으로 생각했기 때문에 illumina 로 한 번 더 시퀀싱 하였고 두 결과를 hybrid assembly 하고자 하였다 Unicycler는 short read를 먼저 assemble하여 contig를 만들고 long-read로 그 contig들을 scaffold 해주는 방식이다. 개발자는 이것을 short-read-first assembly 라고 부른다. 과거에는 nanopore와 같은 long-read sequencing의 depth가 낮고 정확도가 떨어지기 때문에 short-..
각각의 genome은 시퀀스뿐만 아니라 여러가지 정보를 포함하고 있다. 예를 들면, strain 이름, size, contig 수, GC%, accession number, ftp 링크 등등의 항목이 있다. 한 두 개의 genome이 아니라 매우 많은 수의 genome의 이런 정보들을 얻고 싶은데 일일이 링크를 타고 들어가서 복붙할 수는 없는 노릇이다 https://ftp.ncbi.nlm.nih.gov/genomes/GENOME_REPORTS Index of /genomes/GENOME_REPORTS ftp.ncbi.nlm.nih.gov 여기에 들어가보니 뭔가 report들을 모아놓은 느낌이 든다 README를 읽어보자 This directory contains summary reports conveyi..
https://software.broadinstitute.org/morpheus/ Morpheus software.broadinstitute.org Tool-Hierarchical clustering 클릭 Metric - One minus pearson correlation 등 선택 Linkage method - Average Cluster - Rows and columns View-Option Relative color scheme 체크 해제 Minimum, Maximum 값 입력 색깔 정하고 색깔 별 값 입력
NCBI Assembly에서 다운로드 받은 파일이름 바꾸기 참고용으로 남겨두고 더 자세한 내용은 http://blog.genoglobe.com/2019/02/bash-cut.html [BASH] cut 명령을 이용하여 파일 이름을 간략하게 정리하기 cut - remove sections from each line of files (print selected parts of lines from each file to standard out) 커맨드 라인에서 man cut이라고 치면 나오는 설명... blog.genoglobe.com $ ls | while read f > do > cp $f $(echo $f | cut -d'_' -f 1,2).fna > done

세균 유전체 annotation을 위해 가장 많이 사용하는 방법은 NCBI의 prokaryotic genome annotation pipeline (PGAP, https://www.ncbi.nlm.nih.gov/genome/annotation_prok/) 일 것이다. FASTA 파일을 업로드하면서 PGAP를 이용해 annotation을 하겠다는 옵션에 체크만 해주면 신경쓸 필요없이 쉽게 annotation을 할 수 있고 여기서 부여된 locus tag, accession number 등은 전세계 공통으로 사용할 수 있어서 편리하다 하지만 별로도 유전체 annotation을 할 일도 생기는 데 (유전체 정보를 미리 공개하고 싶지 않은 경우 등) 이 때 Prokka를 사용할 수 있다. Prokka는 세균 유..
KEGG pathway mapper는 내가 분석하고자 하는 유전체 또는 유전자 세트가 KEGG pathway 상에서 어디에 해당하는지 색깔로 표시해주는 도구이다 https://www.genome.jp/kegg/mapper/ 1. amino acid fasta 준비 GenBank FTP에 들어가서 faa 파일을 다운로드 받는다 2. BlastKOALA에 faa를 업로드하고 이메일로 전송되는 결과를 다운로드 받는다 3. KEGG pathwaty mapper - reconstruct 에서 BlastKOALA의 결과파일을 붙여넣고 exec을 클릭한다