'Cut' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

목록Cut (2)

A Fine-Tuned Universe

gff 파일에서 locus tag과 product만 추출하기

NCBI GenBank에서 유전체 정보를 보면 자주 참고하는 자료가 있고 계속 반복되어 나오지만 실제로는 보지 않는 자료가 있다 gbk 형식은 아래와 같이 생겼는데 gene complement(1616..1951) /locus_tag="MAE_00030" CDS complement(1616..1951) /locus_tag="MAE_00030" /codon_start=1 /transl_table=11 /product="ferredoxin" /protein_id="BAF99824.1" /translation="MPRITVYGQTITCDRGENLRRILLKHDISLYNGASKLINCRGIG SCGTCAVAIVGEVSAINWQEKARLSLPPHNPDNNRRLACQVKVFGDIEVTKYDGFWGQ GDSVISDQ..

Bioinformatics/Linux 2023. 1. 27. 11:00

[roary] query_pan_genome 스크립트로 roary 결과 다루기 (1) core gene의 protein id만 구하기

34개의 유전체를 roary로 분석하였다. amino acid identity 50% 기준이다 roary --f ./ -e -n -i 50 -p 64 *.gff 분석한 모든 유전체의 core gene을 query_pan_genome 스크립트로 구하였다 그 전에 분석에 사용한 모든 roary gff 파일과 query_pan_genome -a intersection *.gff 결과 파일은 확장자도 없이 'pan_genome_results' 라는 파일로 나왔다. 엑셀에서 열어보면 아래와 같다 자세히 살펴보면 gene name (gene name이 있는 경우에만, 없을 땐 protein id)가 맨 앞에 있고 그 다음에 콜론(:)이 공백(space)로 구분되어 있고 그 뒤로는 탭으로 구분된 protein id가..

Bioinformatics/그 외 2023. 1. 5. 16:09

이전 Prev 1 Next 다음

목록Cut (2)

A Fine-Tuned Universe

티스토리툴바