일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 생물정보학
- 유전체
- 매매기법
- 매매일지
- 우분투
- 세균
- 돌파매매
- 목표주가
- 차트분석
- 증권사레포트
- 주식투자
- W패턴
- 비교유전체
- 분봉차트
- 리눅스
- 쌍바닥패턴
- 기술적분석
- 기본적분석
- mummer
- 스캘핑
- 이동평균선
- 지지저항
- 초단타
- bioinformatics
- 지지저항선
- 추천종목
- 관심종목
- 상한가
- 주식매매
- 생명정보학
- Today
- Total
목록Bioinformatics/그 외 (3)
A Fine-Tuned Universe
세균 유전체를 연구하기 전에 이용하고자 하는 유전체의 질을 따져보는 것이 중요하다. 유전체 본래의 크기가 모두 시퀀싱이 되었는지 또는 배양이나 시퀀싱 과정에서 오염이 발생하지 않았는지, 크게 이 두 가지 요인을 확인하여 전체적인 genome quality를 유추해볼 수 있다. CheckM은 유전체의 completenes와 contamination rate을 추정하여 genome quality를 계산해주는 유용한 프로그램인데 2022년 11월에 bioRxiv에 CheckM2가 소개되었다. https://www.biorxiv.org/content/10.1101/2022.07.11.499243v1.abstract CheckM1은 lineage-specific marker gene의 존재 유무와 copy num..
Polysaccharide utilization loci (PUL)은 세균 유전체 상에서 다당류 물질을 이용하기 위해 필요한 유전자가 모여있는 부분을 말한다. 대부분 Bacteroidetes phylum의 세균에서 주로 발견된다. Pseudomonadota (전에는 Proteobacteria 였는데 이름이 바뀌었다. 적응이 안된다.) 세균들은 다당류를 이용하더라도 PUL 형태의 gene cluster가 거의 없는 것 같다. PUL에는 다당류 분해에 필요한 glycoside hydrolase, polysaccharide lyase 와 같은 carbohydrate-active enzymes (CAZy) 뿐만 아니라 transcriptional regulator, transporter 등 유전자가 함께 존재하..
34개의 유전체를 roary로 분석하였다. amino acid identity 50% 기준이다 roary --f ./ -e -n -i 50 -p 64 *.gff 분석한 모든 유전체의 core gene을 query_pan_genome 스크립트로 구하였다 그 전에 분석에 사용한 모든 roary gff 파일과 query_pan_genome -a intersection *.gff 결과 파일은 확장자도 없이 'pan_genome_results' 라는 파일로 나왔다. 엑셀에서 열어보면 아래와 같다 자세히 살펴보면 gene name (gene name이 있는 경우에만, 없을 땐 protein id)가 맨 앞에 있고 그 다음에 콜론(:)이 공백(space)로 구분되어 있고 그 뒤로는 탭으로 구분된 protein id가..