【佳學(xué)基因檢測(cè)】基因檢測(cè)全面性正確性的一個(gè)技術(shù)細(xì)節(jié):dbNSFP
dbnfsp 是一個(gè)綜合性的數(shù)據(jù)庫(kù),收錄了SIFT, Polyphen2, LRT, MutationTaster等多種算法預(yù)測(cè)的基因組變異對(duì)功能的影響。通過(guò)snpsfit的dbnsfp命令,可以用這個(gè)數(shù)據(jù)庫(kù)對(duì)變異位點(diǎn)進(jìn)行注釋。
dbNSFP 是一個(gè)數(shù)據(jù)庫(kù),用于對(duì)人類(lèi)基因組中所有潛在的非同義單核苷酸變異 (nsSNV) 進(jìn)行功能預(yù)測(cè)和注釋。其當(dāng)前版本以29版 Gencode和94版 Ensembl為基礎(chǔ),涵蓋了 84,013,490 個(gè) nsSNV 和 ssSNV(拼接點(diǎn) SNV)。它收集了 37 種算法(SIFT、SIFT4G、Polyphen2-HDIV、Polyphen2-HVAR、LRT、MutationTaster2、MutationAssessor、FATHMM、MetaSVM、MetaLR、CADD、CADD_hg19、VEST4、PROVEAN、FATHMM-MKL 編碼、FATHMM-XF 編碼的預(yù)測(cè)分?jǐn)?shù), fitCons x 4, LINSIGHT, DANN, GenoCanyon, Eigen, Eigen-PC, M-CAP, REVEL, MutPred, MVP, MPC, PrimateAI, GEOGEN2, BayesDel_addAF, BayesDel_noAF, ClinPred, LIST-S2, ALoFT), 9 個(gè)保守分值 ( PhyloP x 3、phastCons x 3、GERP++、SiPhy 和 bStatistic)和其他相關(guān)信息,包括在 1000 Genomes Project 第 3 階段數(shù)據(jù)、UK10K 隊(duì)列數(shù)據(jù)、ExAC 聯(lián)盟數(shù)據(jù)、gnomAD 數(shù)據(jù)和 NHLBI Exome Sequencing Project ESP6500 數(shù)據(jù)中觀察到的等位基因頻率,來(lái)自不同數(shù)據(jù)庫(kù)的各種基因ID,基因的功能描述,基因表達(dá)和基因相互作用信息等。