DGV 개요
- comprehensive summary of structural variation in the human genome
- SV = 50bp 이상 이라고 정의함
- healthy control sample 로부터 얻어진 variant 만 수집함
- control data의 useful catalog 로 표현형과 변이 사이의 상관관계 연구에 활용할 수 있는 Genomic variant database
- 지속적인 업데이트 수행
DGV 에서의 variant 처리 과정
- 샘플 레벨로 세출되는 변이에 대해서 유사한 boundary 를 가지는 경우 merge 수행 (동일한 type 인 경우, 동일한 platform-approach 통해서 만들어진 경우에만)
- merge 수행 시 overlap thershold: reciprocal manner 로 70% 이상이 겹칠 때
Gold standard variant track
- Curated 된 변이 제공
- High resolution and High quality study 에 대한 평가 수행, 정확도 및 민감도 평가에 따라 Gold standard 로 편입될 지 여부 결정: “strict quality filters” 를 통과해야 한다고 언급
- 샘플 간 변이 overlap 기준은 DGV 전체의 처리 과정을 동일하게 따름
- 여러 Study로부터 support 가 존재하는 경우 포함하게 됨
- The initial criteria
- a variant is found in at least 2 different studies: 두 개 이상의 연구로부터 report 된 변이일 것
- found in at least two different samples: 두 개 이상의 샘플로부터 report 된 변이일 것
Submission 안내
- 현재는 이 데이터베이스 단독으로 데이터를 수집하지 않고 EBI, NCBI 와 연계 (이 쪽 디비를 통해 제출하면 연결됨)
- 세 개의 database 가 synchronized됨
추가 정보
Database 구조 (er diagram)
참고 문헌
DGV
http://dgv.tcag.ca/v107/app/home?ref=
Database of Genomic Variants [*** v107 ***]
dgv.tcag.ca
DGV: FAQ
http://dgv.tcag.ca/v107/app/faq
Database of Genomic Variants [*** v107 ***]
Frequently Asked Question How are the boundaries of CNVs identified and reported? How is a gain or loss defined, and how can I get the variant frequency? How do I compare the data in DGV to my patient cohort? What types of filters are applied to the data b
dgv.tcag.ca
https://pubmed.ncbi.nlm.nih.gov/24174537/
The Database of Genomic Variants: a curated collection of structural variation in the human genome - PubMed
Over the past decade, the Database of Genomic Variants (DGV; http://dgv.tcag.ca/) has provided a publicly accessible, comprehensive curated catalogue of structural variation (SV) found in the genomes of control individuals from worldwide populations. Here,
pubmed.ncbi.nlm.nih.gov
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3169170/?tool=pubmed
Public data archives for genomic structural variation
Public data archives for genomic structural variation ,1 ,2 ,1 ,2 ,2 ,1 ,1 ,1 ,1 ,1 ,3 ,4 and 2 Deanna M. Church 1National Center for Biotechnology Information, Bethesda, MD, USA Ilkka Lappalainen 2European Bioinformatics Institute, Hinxton, Cambridge, UK
www.ncbi.nlm.nih.gov
'Bioinformatics Databases' 카테고리의 다른 글
AlphaFold Protein Structure Database 오픈! (0) | 2022.07.29 |
---|