반응형
안녕하세요
한주현입니다
생물정보학 코딩 연습과 파일 형식을 익히기 위한 포스팅 네 번째 시간입니다
오늘은 DNA서열을 분석하는 생물정보학 문제를 포스팅하겠습니다
염기서열 이란?
염기서열은 DNA의 기본단위인 뉴클레오티드(nucleotide)의 구성성분 중 하나인 염기(base)들을 나열한 것 입니다.
DNA에서 염기가 3개 모이면 하나의 트리플렛 코드(triplet code)를 구성하며 하나의 아미노산(Amino acid)를 지시하게 됩니다.
인간의 단백질을 구성하는 아미노산의 개수는 총 20개로 되어있습니다.
문항) 염기서열 개수 세기
염기서열은 총 4개의 염기인 A(아데닌), C(시토신), G(구아닌) 그리고 T(티민) 으로 이루어져있습니다.
아래의 DNA서열에서 A, C, G, T 의 개수를 세어보도록 합시다.
아래의 링크 또는 DNA 서열을 사용하세요.
https://raw.githubusercontent.com/KennethJHan/Bioinformatics_smalltalk_Python50/master/sampleDNA.txt
GATCGaTAGggcCTATATaggaTCGAAAATCGC
주의 할 점으로 서열 사이사이 소문자들이 들어가있습니다.
이 소문자들을 모두 대문자로 변환하며 염기서열의 숫자를 세겠습니다.
정답)
A 11
C 6
G 9
T 7
문항에 의문사항이 있으시면 댓글로 말씀 부탁드리겠습니다.
그럼 다음 문항에서 만나요~
반응형
'생물정보학 > 생물정보학_연습문제' 카테고리의 다른 글
[VCF] 03. VCF 파일에서 Variant 개수 count 하기 (1) | 2017.04.06 |
---|---|
[VCF] 02. VCF 파일에서 SNP, InDel Count 하기 (1) | 2017.04.04 |
[VCF] 01. VCF 파일에서 PASS filter 하기 (3) | 2017.04.03 |
[공지] 생물정보학 연습문제 카테고리를 시작하며 (2) | 2017.04.03 |
댓글