1.简介
网址https://www.ncbi.nlm.nih.gov/clinvar
ClinVar是NCBI主办的与疾病相关的人类基因组变异数据库。它的强大在于整合了dbSNP、dbVar、Pubmed、OMIM等多个数据库在遗传变异和临床表型方面的数据信息,形成一个标准的、可信的遗传变异-临床相关的数据库。ClinVar同时支持在线和下载到本地两种形式。
网站主页
clinvar是一个开放的数据库,每个研究机构都可以向其提交数据,对于提交的信息,会有专家团队进行审核评级。对于数据库中的位点,根据注释信息的可靠性,分成了1到4个不同的星级,星级越高,可信度越高。截至到2018年11月12日,数据库中所有记录统计如下:
clinvar主要整合以下四块信息:
ClinVar 采用的是星标系统(star-based system),可以评估某个特定突变在疾病中的本来或者注释作用。四星级是最高级,指这个突变的功能已经经过了多位专家的测评。这样详细审查过程的好处在于用户能信任三、四星突变的功能注释,但是在ClinVar 数据库中只有少量此类数据(3800个)。更多时候是只有一星的突变,这通常只基于单个提出注释功能的研究成果,还有没有星的,也就是提交者没有提供解释标准和支持证据。ClinVar 工具的一个问题在于其数据库中大多数临床上重要的突变(83%)都是某个家庭中独一无二的,或者非常罕见的。
2.在线搜索
搜索方式可以分为简单搜索和高级搜索。在该数据库中,提供了以下7种检索方式
gene symbols
HGVS expressions
protein change
rs number
disease
submitters
location on a chromosome
以PTEN
这个gene symbol为例,检索出的部分记录如下:
从结果中,我们可以获知这个基因多种信息,其中有:
1.总体信息:在左侧栏目找到这个关键词的总体统计信息,同时这些信息也可以作为筛选条件而使用。
2.变异和位置信息:可以发现基因的变异位置、变异类型(C>T还是其他)、所在染色体信息等。
3.与其相关的疾病。
4.变异频率:这个minor变异类型在不同数据库中的出现频率,如GO-ESP:0.00054(T)表示在ESP数据中含有“T”的等位基因频率为0.00054。
5.临床意义:可以简单理解为这个突变对临床疾病的重要性。分为pathogenic(致病),likely benign(可能有害)等多个等级。
6.审核状态:因为这些临床意义是提交者自己定义并且提交的,因此有可能会对数据有一定误导作用,通过对数据的审核,有助于加强数据的可靠性。但不是每个数据都会有审核。
2.1 Interpretation
这部分会给出突变位点的临床意义Clinical significance, 和相关数据库的链接,这些数据库通常包含MedGen, OMIM, dbSNP, PubMed等。
2.2 Allele
这部分会给出allel的详细信息,包括变异类型,HGVS表达式等信息。
2.3 Assertion and evidence details
这部分会给出详细临床信息
3.FTP下载
下载地址:[ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/](ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/)
image
下载代码
## ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/mkdir -p ~/annotation/variation/human/clinvarcd ~/annotation/variation/human/clinvarwget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/disease_names mkdir vcf_GRCh37 && cd vcf_GRCh37 wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh37/clinvar_20170130.vcf.gz wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh37/common_and_clinical_20170130.vcf.gz wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh37/common_no_known_medical_impact_20170130.vcf.gzwget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh37/clinvar_20170228.vcf.gz wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh37/clinvar_20170228.vcf.gz.tbi
4.本地注释
~/biosoft/ANNOVAR/annovar/annotate_variation.pl -downdb -webfrom annovar -build hg19 -downdb clinvar_20170130 ~/biosoft/ANNOVAR/annovar/humandb/ ~/biosoft/ANNOVAR/annovar/annotate_variation.pl --filter -buildver hg19 -out clinvar_20170130_anno -dbtype clinvar_20170130 jmzeng.annovar_input ~/biosoft/ANNOVAR/annovar/humandb/
wget https://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh38/clinvar_20180429.vcf.gz wget https://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh38/clinvar_20180429.vcf.gz.tbi java -jar ~/biosoft/SnpEff/snpEff/SnpSift.jar annotate clinvar_20180429.vcf.gz merge_
作者:oddxix
链接:https://www.jianshu.com/p/0ff9d1c091f4
共同学习,写下你的评论
评论加载中...
作者其他优质文章