일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 리눅스
- 돌파매매
- 주식투자
- 관심종목
- mummer
- 매매기법
- 주식매매
- 이동평균선
- 생물정보학
- 추천종목
- 세균
- 지지저항
- 목표주가
- 기술적분석
- 쌍바닥패턴
- 매매일지
- 우분투
- 기본적분석
- 지지저항선
- 스캘핑
- 증권사레포트
- bioinformatics
- 차트분석
- 유전체
- 초단타
- 비교유전체
- 상한가
- 생명정보학
- 분봉차트
- W패턴
- Today
- Total
목록Bioinformatics (44)
A Fine-Tuned Universe
파워포인트만으로 만들기 어려운 그림 자료를 만들기 위해 SVG 코드를 직접 작성해보았다. 검색해보면 보통 일러스트레이터나 Inkscape 같은 프로그램에서 그린 그림을 SVG로 export하는 방법이 안내되어 있는데 나는 반대로 SVG 코드를 직접 작성하고 그것을 그림으로 만들고자 하였다 CRISPR의 spacer 시퀀스의 배열을 여러 strain에서 비교하려고 하다보니 반복되는 도형으로 spacer임을 나타내고 그 중 특성 spacer를 다른 색으로 표시하고 싶었다. 그래서 파워보인트나 그림을 그려주는 프로그램에서 표현하려면 몇 번째 spacer 인지 눈으로 세어가면서 표시해야 하기 때문에 코딩 수 그림파일로 변환하기로 하였다. 원래 html 이 뭔지는 대충 알고 있었지만 SVG나 CSS에 대해서는 전..
논문은 아래 링크 참조 https://link.springer.com/article/10.1007/s12275-018-8014-6 원리 Prokaryotic genome의 universal single gene 92개의 amino acid sequence로 maximum-likelihood tree 작성 설치 sudo apt-get install UBCG genome file NCBI assembly FTP 디렉토리에서 fna.gz 파일을 다운로드 bcg 파일을 저장할 directory 만들기 mkdir [name_directory] 분석 java -jar UBCG.jar extract -i [filename.fasta] -bcg_dir [output directory] -label [name] java..
22-09-15 추가 checkM은 prokaryotic genome이나 metagenome assembled genome의 quality를 체크해주는 프로그램이다 최근에는 checkM2가 새로 나왔다 분류단계 별 single gene set가 미리 준비되어 있고 assembled genome에서 single gene set의 존재 유무를 통해 분석한 genome의 completeness, contamination 을 추정해준다. 모든 분류단계의 single gene set이 있는 것은 아니다 어떤 genus는 list에 없다. 그럴 경우 상위 분류단계 (family, order 등) 를 기준으로 분석해야 하는데 상위 분류단계로 갈 수록 공통적으로 가지고 있는 single gene이 줄어든다. 따라서 c..
세균 genome sequencing을 위해 nanopore 시퀀싱 하였으나 pseudogene이 너무 많아 제대로 분석을 할 수가 없었다. (20%정도...) 실제로 유전체에 pseudogene이 많은게 아니라 시퀀싱 에러일 것으로 생각했기 때문에 illumina 로 한 번 더 시퀀싱 하였고 두 결과를 hybrid assembly 하고자 하였다 Unicycler는 short read를 먼저 assemble하여 contig를 만들고 long-read로 그 contig들을 scaffold 해주는 방식이다. 개발자는 이것을 short-read-first assembly 라고 부른다. 과거에는 nanopore와 같은 long-read sequencing의 depth가 낮고 정확도가 떨어지기 때문에 short-..