본문 바로가기

반응형

전체 글

(69)
[통계] Likelihood, Likelihood ratio test (우도, 우도비검정) 생물체의 진화를 연구하는데에는 다양한 접근방식과 방법론이 있을텐데, 생물정보학에서 가능한 진화 연구 중에는 정도로 불리는 분석 방법이 있다. 생물체의 진화 과정을 생각하면 계통수 (phylogenetic tree)를 먼저 떠올릴 수 있을 것 같다. 여러 개의 종에 대해 얻어진 계통수 상의 특정한 branch 상에서 해당 branch에 특이적으로 positive selection이 된 변이들을 포함하는 유전자를 찾는 분석이 이다. 이 분석에 대해서 자세히 다루기 전에, 여기서 selection을 판단하는 데 활용하는 검정방법인 Likelihood ratio test (우도비검정)을 먼저 살펴보려고 한다. 1. Likelihood (vs Probability) 우리말로 번역하면 가능도, 우도.. 정도로 쓸 ..
데이터베이스 입문 1.1 데이터베이스 시스템의 응용 데이터베이스의 다양한 활용 예 판매: 고객, 상품, 구매 정보 관리 은행업무: 고객정보, 계좌, 예적금 등의 정보 및 은행업무 수행을 위한 트랜잭션 대학: 학생정보, 수강신청, 학점 정보 등의 학사관리 1.2 데이터베이스 시스템의 목적 초기 데이터베이스의 형태: 파일 시스템 대학 예시 교수, 학생, 학과, 수업에 대한 정보 보관 예시 다음과 같은 응용프로그램의 필요 새로운 학생, 교수, 수업 추가 수업에 학생을 등록하고 수업 명단 생성 학생에게 학점 부여, 평점 계산, 성적 증명서 생성 새로운 기능이 필요할 때마다 새로운 응용프로그램이 필요 파일 시스템에 정보를 저장했을 때의 단점 데이터 중복과 비일관성 데이터 중복 → 저장공간의 낭비 ex: 여러 과목을 듣는 학생의 인..
[Format] Hi, Sam!_v1 SAM 파일 포맷은 read data를 reference sequence에 mapping한 결과로 얻게 되는 sequence alignment 를 표현합니다. 많은 컬럼을 담는 만큼 많은 정보를 담고 있는 파일이라 1부, 2부로 분류해서 본 포스트에서는 이 포맷을 이해하는 의의, 이해 과정에 필요한 추가적인 개념과 sam format의 전반적인 형태, 담고있는 정보 일반을 전달하고 추후에 작성 될 2부에서는 sam format 내에 "flag", "CIGAR string"을 조금 더 자세히 다루고, mapping 프로그램에 따라 결과물을 살펴볼 때 주의해야 할 점 정도를 추가로 서술하게 될 것 같습니다. [요약] SAM FORMAT이 컬럼 별 담고있는 정보는 아래와 같습니다. SAM format - 생물..

반응형