본문 바로가기
반응형

정렬4

[생물정보학] vcf 파일 chromosome, position 별로 정렬 sorting 하기 안녕하세요 한주현입니다. 오늘은 vcf 파일을 chromosome 별로 position 별로 정렬 sorting 하는 방법에 대해 알아보겠습니다. 들어가며 가끔 vcf 파일이 다음과 같이 sorting 되어있지 않는 경우가 있는데요, 이렇게 정렬이 되어있지 않으면 어떤 툴들에서는 정렬이 안되었다고 오류가 띡! 뜹니다 ... 정렬이 안된 vcf 파일을 다음과 같이 정렬하고 싶은거죠. 참고로 vcf 파일은 임의로 생성하였고 편의상 chromosome, position, ref, alt 만 값을 넣었고 나머지는 점(.) 으로 채웠습니다. VCF 정렬하기 vcf를 정렬하는 방법에는 여러가지가 있습니다만, 프로그램 쓰지 않고 간단히 정렬하는 방법을 찾으시는 분들께, 다음의 리눅스 기본 명령어로 간단히 vcf 파일.. 2020. 3. 8.
[맥] 파일 사이즈를 특정 크기 이상으로 찾고 정렬하는 방법 안녕하세요 한주현입니다. 오늘은 맥북의 파일을 특정 파일 크기 이상 가진 파일을 찾는 방법에 대해 알아보겠습니다. 파일의 특정 크기 이상 파일들 찾기 1) 새로운 파인더를 하나 켭니다. 가장 최근 액세스한 파일들이 나오네요. 구질구질 많습니다 ㅎㅎ; 2) command + shift + H 키를 눌러서 홈으로 이동합니다. 3) Kind를 File Size로 바꾸고 Any를 is greater than 으로 바꾸고 원하시는 파일 사이즈를 입력합니다. 저는 2GB 이상인 파일들을 정렬해보려고 합니다. 이렇게 입력해 주면 바로 짠! 하고 큰 파일들이 나옵니다 ㅎㅎ 생물정보학 파일들과 안드로이드 가상머신 파일이 나오네요 ^^;; 쟤네들 때문에 용량이 없네요 ㅜㅜ 아이고.. 오늘은 맥에서 파일 크기대로 써보았습니.. 2018. 12. 8.
[python] 파이썬 사전 딕셔너리 값 value 로 정렬하는 방법 - lambda 식 응용 - 파이썬으로 단어 수 세기, 텍스트에서 가장 많이 출현한 단어 세기 안녕하세요 한주현입니다. 오늘은 python에서 딕셔너리의 값으로 정렬하는 방법에 대해 알아보겠습니다. 들어가며 python 의 사전형은 순서가 없는 자료형입니다. 그런데 가끔 우리는 사전의 값 순서대로 정렬하고 싶을 때가 있지요..ㅋㅋ 예를 들어, 텍스트에서 단어 수를 사전형으로 세어 본 다음 어떠한 단어가 가장 많이 나왔는지 알고 싶을 때 값으로 정렬하게 된다면 가장 많이 출현한 단어를 알 수 있을 겁니다. Dictionary 값 value 로 정렬하기 사전의 value 값으로 정렬하는 방법은 sorted 함수를 사용합니다. sorted 함수는 key 를 받을 수 있는데, 여기서 lambda 식을 사용하여 튜플에서 1 번째 index를 기준으로 정렬하는 것 이지요 12345678910111213141.. 2018. 7. 5.
[pandas] 파이썬 판다스를 활용한 컬럼 정렬 안녕하세요 한주현입니다 오늘은 파이썬 판다스를 활용하여 컬럼간 정렬하는 방법에 대해 알아보겠습니다 준비물 1) 파이썬 판다스https://pandas.pydata.org/ 2) 헤더가 있고 행과 열로 구성된 데이터 *) 모든 소스코드와 샘플 데이터는 다음 링크에서 받으실 수 있습니다https://github.com/KennethJHan/PandasColumnSorter 기본 원리 판다스에서는 행과 열로 구성된 데이터를 엑셀 테이블 처럼 다룰 수 있는 DataFrame이라는 객체에 담을 수 있습니다 0) pandas를 import 합니다 1import pandas as pdcs 1) data 파일을 읽습니다. panadas의 method 중 read_csv 라는 메서드를 사용합니다. 여기서는 구분자가 co.. 2018. 2. 5.
반응형