본문 바로가기

Bioinformatics Databases

DGV: Database of Genomic Variants

DGV 개요

  • comprehensive summary of structural variation in the human genome
  • SV = 50bp 이상 이라고 정의함
  • healthy control sample 로부터 얻어진 variant 만 수집함
  • control data의 useful catalog 로 표현형과 변이 사이의 상관관계 연구에 활용할 수 있는 Genomic variant database
  • 지속적인 업데이트 수행

DGV 에서의 variant 처리 과정

  • 샘플 레벨로 세출되는 변이에 대해서 유사한 boundary 를 가지는 경우 merge 수행 (동일한 type 인 경우, 동일한 platform-approach 통해서 만들어진 경우에만)
  • merge 수행 시 overlap thershold: reciprocal manner 로 70% 이상이 겹칠 때

Gold standard variant track

  • Curated 된 변이 제공
  • High resolution and High quality study 에 대한 평가 수행, 정확도 및 민감도 평가에 따라 Gold standard 로 편입될 지 여부 결정: “strict quality filters” 를 통과해야 한다고 언급
  • 샘플 간 변이 overlap 기준은 DGV 전체의 처리 과정을 동일하게 따름
  • 여러 Study로부터 support 가 존재하는 경우 포함하게 됨
  • The initial criteria
    • a variant is found in at least 2 different studies: 두 개 이상의 연구로부터 report 된 변이일 것
    • found in at least two different samples: 두 개 이상의 샘플로부터 report 된 변이일 것

Submission 안내

  • 현재는 이 데이터베이스 단독으로 데이터를 수집하지 않고 EBI, NCBI 와 연계 (이 쪽 디비를 통해 제출하면 연결됨)
  • 세 개의 database 가 synchronized됨

추가 정보

Database 구조 (er diagram)

 

참고 문헌

DGV

http://dgv.tcag.ca/v107/app/home?ref= 

 

Database of Genomic Variants [*** v107 ***]

 

dgv.tcag.ca

DGV: FAQ

http://dgv.tcag.ca/v107/app/faq

 

Database of Genomic Variants [*** v107 ***]

Frequently Asked Question How are the boundaries of CNVs identified and reported? How is a gain or loss defined, and how can I get the variant frequency? How do I compare the data in DGV to my patient cohort? What types of filters are applied to the data b

dgv.tcag.ca

https://pubmed.ncbi.nlm.nih.gov/24174537/

 

The Database of Genomic Variants: a curated collection of structural variation in the human genome - PubMed

Over the past decade, the Database of Genomic Variants (DGV; http://dgv.tcag.ca/) has provided a publicly accessible, comprehensive curated catalogue of structural variation (SV) found in the genomes of control individuals from worldwide populations. Here,

pubmed.ncbi.nlm.nih.gov

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3169170/?tool=pubmed 

 

Public data archives for genomic structural variation

Public data archives for genomic structural variation ,1 ,2 ,1 ,2 ,2 ,1 ,1 ,1 ,1 ,1 ,3 ,4 and 2 Deanna M. Church 1National Center for Biotechnology Information, Bethesda, MD, USA Ilkka Lappalainen 2European Bioinformatics Institute, Hinxton, Cambridge, UK

www.ncbi.nlm.nih.gov

 

반응형

'Bioinformatics Databases' 카테고리의 다른 글

AlphaFold Protein Structure Database 오픈!  (0) 2022.07.29