일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 우분투
- 상한가
- 관심종목
- W패턴
- 목표주가
- 돌파매매
- 초단타
- mummer
- 세균
- 매매일지
- 리눅스
- 기본적분석
- 이동평균선
- bioinformatics
- 쌍바닥패턴
- 스캘핑
- 비교유전체
- 매매기법
- 추천종목
- 차트분석
- 생물정보학
- 기술적분석
- 주식매매
- 분봉차트
- 지지저항
- 증권사레포트
- 주식투자
- 지지저항선
- 생명정보학
- 유전체
- Today
- Total
목록Bioinformatics (44)
A Fine-Tuned Universe
#!/bin/bash search_string="16S" for file in ./*.fna; do while IFS= read -r line; do if [[ "$line" == *"$search_string"* ]]; then echo "$line" >> "$file.filtered" while IFS= read -r inner_line; do if [[ "$inner_line" == ">"* ]]; then break else echo "$inner_line" >> "$file.filtered" fi done fi done < "$file" done awk, sed 같은 걸 써야할 것 같았는데... 엄청 간단했다
FastANI 결과를 보면 아래와 같이 나온다 즉 genome1 genome2 ANI값 이런 식으로 나온다 하지만 보통은 matrix 형태로 정리된 아래 형태에 익숙할 것이다. 아니면 아래와 같은 형식으로 바꿔서 결과를 정리해야 할 때가 있다 그런데 비교하려는 유전체가 많아질 수록 결과를 정리하기가 힘들다. 그래서 주말에 아래와 같이 쉘스크립트를 써서 결과를 정리하였다 먼저 유전체 목록을 아래와 같이 파일로 만들었다. 사실 둘 다 같은 내용인데 가로 세로를 구분해서 생각하려고 따로 만들었다 ls *.gz > query_list ls *.gz > reference_list 그리고 아래와 같이 스크립트를 짜서 실행시켰다. #!/bin/bash while read query do awk -v genome=$q..
세균 유전체를 연구하기 전에 이용하고자 하는 유전체의 질을 따져보는 것이 중요하다. 유전체 본래의 크기가 모두 시퀀싱이 되었는지 또는 배양이나 시퀀싱 과정에서 오염이 발생하지 않았는지, 크게 이 두 가지 요인을 확인하여 전체적인 genome quality를 유추해볼 수 있다. CheckM은 유전체의 completenes와 contamination rate을 추정하여 genome quality를 계산해주는 유용한 프로그램인데 2022년 11월에 bioRxiv에 CheckM2가 소개되었다. https://www.biorxiv.org/content/10.1101/2022.07.11.499243v1.abstract CheckM1은 lineage-specific marker gene의 존재 유무와 copy num..
Polysaccharide utilization loci (PUL)은 세균 유전체 상에서 다당류 물질을 이용하기 위해 필요한 유전자가 모여있는 부분을 말한다. 대부분 Bacteroidetes phylum의 세균에서 주로 발견된다. Pseudomonadota (전에는 Proteobacteria 였는데 이름이 바뀌었다. 적응이 안된다.) 세균들은 다당류를 이용하더라도 PUL 형태의 gene cluster가 거의 없는 것 같다. PUL에는 다당류 분해에 필요한 glycoside hydrolase, polysaccharide lyase 와 같은 carbohydrate-active enzymes (CAZy) 뿐만 아니라 transcriptional regulator, transporter 등 유전자가 함께 존재하..