일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 분봉차트
- 돌파매매
- 쌍바닥패턴
- 비교유전체
- 리눅스
- mummer
- 차트분석
- 추천종목
- 기술적분석
- 초단타
- 관심종목
- 생물정보학
- 기본적분석
- bioinformatics
- W패턴
- 생명정보학
- 매매기법
- 상한가
- 스캘핑
- 증권사레포트
- 매매일지
- 유전체
- 지지저항
- 목표주가
- 우분투
- 지지저항선
- 주식매매
- 세균
- 주식투자
- 이동평균선
- Today
- Total
목록bioinformatics (19)
A Fine-Tuned Universe
서로 유사하지 않은 유전체를 많은 수 분석하다보니 아래와 같은 오류가 생긴다 "number of clusters(51652) exceeds limit 5000 Multifastas not created. please check the spread for cintamination from differert species of increase the --group_limit parameter." --group_lilmit parameter로 cluster limit을 늘려주라는 말이다 논문을 찾아보니 아래 논문에서도 이 옵션을 사용한 경우가 있다 "Furthermore, we conducted pan-genome analyses using the Roary pipeline with the “-i 70 –gr..
FastANI 결과를 보면 아래와 같이 나온다 즉 genome1 genome2 ANI값 이런 식으로 나온다 하지만 보통은 matrix 형태로 정리된 아래 형태에 익숙할 것이다. 아니면 아래와 같은 형식으로 바꿔서 결과를 정리해야 할 때가 있다 그런데 비교하려는 유전체가 많아질 수록 결과를 정리하기가 힘들다. 그래서 주말에 아래와 같이 쉘스크립트를 써서 결과를 정리하였다 먼저 유전체 목록을 아래와 같이 파일로 만들었다. 사실 둘 다 같은 내용인데 가로 세로를 구분해서 생각하려고 따로 만들었다 ls *.gz > query_list ls *.gz > reference_list 그리고 아래와 같이 스크립트를 짜서 실행시켰다. #!/bin/bash while read query do awk -v genome=$q..
Polysaccharide utilization loci (PUL)은 세균 유전체 상에서 다당류 물질을 이용하기 위해 필요한 유전자가 모여있는 부분을 말한다. 대부분 Bacteroidetes phylum의 세균에서 주로 발견된다. Pseudomonadota (전에는 Proteobacteria 였는데 이름이 바뀌었다. 적응이 안된다.) 세균들은 다당류를 이용하더라도 PUL 형태의 gene cluster가 거의 없는 것 같다. PUL에는 다당류 분해에 필요한 glycoside hydrolase, polysaccharide lyase 와 같은 carbohydrate-active enzymes (CAZy) 뿐만 아니라 transcriptional regulator, transporter 등 유전자가 함께 존재하..
NCBI GenBank에서 유전체 정보를 보면 자주 참고하는 자료가 있고 계속 반복되어 나오지만 실제로는 보지 않는 자료가 있다 gbk 형식은 아래와 같이 생겼는데 gene complement(1616..1951) /locus_tag="MAE_00030" CDS complement(1616..1951) /locus_tag="MAE_00030" /codon_start=1 /transl_table=11 /product="ferredoxin" /protein_id="BAF99824.1" /translation="MPRITVYGQTITCDRGENLRRILLKHDISLYNGASKLINCRGIG SCGTCAVAIVGEVSAINWQEKARLSLPPHNPDNNRRLACQVKVFGDIEVTKYDGFWGQ GDSVISDQ..