일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- W패턴
- 유전체
- 증권사레포트
- 매매일지
- 생명정보학
- 기본적분석
- 매매기법
- 지지저항선
- 리눅스
- 분봉차트
- 기술적분석
- 세균
- 생물정보학
- 비교유전체
- 쌍바닥패턴
- 차트분석
- 관심종목
- 상한가
- 주식투자
- 스캘핑
- 추천종목
- mummer
- 목표주가
- 주식매매
- 우분투
- 지지저항
- 이동평균선
- bioinformatics
- 돌파매매
- 초단타
- Today
- Total
목록유전체 (11)
A Fine-Tuned Universe
유전체 정보의 편리한 다운로드를 위해 NCBI에서 만든 command line tool로 "datasets"있다 https://www.ncbi.nlm.nih.gov/datasets/docs/v2/download-and-install/ 리눅스, 맥, 윈도 모두 설치가능하다 리눅스에서 conda를 이용해 설치했다 conda create -n ncbi_datasets conda activate ncbi_datasets conda install -c conda-forge ncbi-datasets-cli 웹페이지에는 간단한 예제 명령어만 나와있는 것 같다. datasets --help로 필요한 걸 찾아보면 된다. 한 번에 모든 명령어에 대한 도움말이 나오지는 않고 datasets download --help 이렇..
세균 유전체를 연구하기 전에 이용하고자 하는 유전체의 질을 따져보는 것이 중요하다. 유전체 본래의 크기가 모두 시퀀싱이 되었는지 또는 배양이나 시퀀싱 과정에서 오염이 발생하지 않았는지, 크게 이 두 가지 요인을 확인하여 전체적인 genome quality를 유추해볼 수 있다. CheckM은 유전체의 completenes와 contamination rate을 추정하여 genome quality를 계산해주는 유용한 프로그램인데 2022년 11월에 bioRxiv에 CheckM2가 소개되었다. https://www.biorxiv.org/content/10.1101/2022.07.11.499243v1.abstract CheckM1은 lineage-specific marker gene의 존재 유무와 copy num..
22-09-15 추가 checkM은 prokaryotic genome이나 metagenome assembled genome의 quality를 체크해주는 프로그램이다 최근에는 checkM2가 새로 나왔다 분류단계 별 single gene set가 미리 준비되어 있고 assembled genome에서 single gene set의 존재 유무를 통해 분석한 genome의 completeness, contamination 을 추정해준다. 모든 분류단계의 single gene set이 있는 것은 아니다 어떤 genus는 list에 없다. 그럴 경우 상위 분류단계 (family, order 등) 를 기준으로 분석해야 하는데 상위 분류단계로 갈 수록 공통적으로 가지고 있는 single gene이 줄어든다. 따라서 c..
세균 genome sequencing을 위해 nanopore 시퀀싱 하였으나 pseudogene이 너무 많아 제대로 분석을 할 수가 없었다. (20%정도...) 실제로 유전체에 pseudogene이 많은게 아니라 시퀀싱 에러일 것으로 생각했기 때문에 illumina 로 한 번 더 시퀀싱 하였고 두 결과를 hybrid assembly 하고자 하였다 Unicycler는 short read를 먼저 assemble하여 contig를 만들고 long-read로 그 contig들을 scaffold 해주는 방식이다. 개발자는 이것을 short-read-first assembly 라고 부른다. 과거에는 nanopore와 같은 long-read sequencing의 depth가 낮고 정확도가 떨어지기 때문에 short-..