【佳學基因檢測】癌癥序列變異解釋與報告標準指南:如何高效腫瘤基因檢測的正確性?
ASCO和CAP聯(lián)合推薦
肺癌基因檢測單位選擇標準簡介
肺癌是中國先進大發(fā)病率癌癥,佳學基因投入大量人力物力專注于良性、惡性腫瘤的產(chǎn)生原因、阻抑方式、靶向藥物及免疫藥物的選擇和使用方法。提出基因解碼是腫瘤早期預測、個性化治好的信息依據(jù),并指出基因解碼解密基因序列變異與腫瘤診斷與治療的關系要優(yōu)先于基于數(shù)據(jù)庫比對的基因檢測。關于癌癥序列變異解釋與報告標準指導是將整個行業(yè)推向正確方向的先進步。
1. 引言
基于二代測序技術的腫瘤檢測已越來越多的應用于臨床實驗室中,但目前在不同實驗室間存在檢測方法、報告內容等方面的差異,這對遺傳檢測的解讀以及普及應用造成了一定的影響。因此,在不同實驗室間建立統(tǒng)一的分子檢測結果的解讀和報告標準,及建立行業(yè)標準,顯得尤為迫切。
在2015年春天,在美國專門成立了一個以臨床實驗室為核心的工作組,其組成包含了分子病理協(xié)會(AMP)、美國醫(yī)學遺傳學與基因組學協(xié)會(ACMG)、美國臨床腫瘤學會(ASCO)與美國病理學家協(xié)會(CAP)的一線專家,該工作組的主要工作為對腫瘤及疑似腫瘤相關的序列變異檢測建立檢測標準并在行業(yè)達成共識。
該工作組首先對北美地區(qū)超過40家的臨床檢測實驗室進行了問卷調查,結果顯示不同實驗室在檢測組織類型、檢測基因數(shù)量、是否檢測腫瘤組織全外顯子組或全基因組、以及其他細節(jié)方面都存在較大差別,此外在不同單位的檢測報告的報告內容方面也存在較多差異。該工作組認為,為醫(yī)療機構提供分類的遺傳變異報告對病人及整個醫(yī)療行業(yè)都極為重要,包括:提供正確的腫瘤對靶向治療反應性信息;建立先進別的醫(yī)療指南;以及與臨床試驗合作,對建立不同實驗室間的通用標準提供支持?;谝陨线@些考量,工作組專家們根據(jù)已有數(shù)據(jù)、文獻報道和專業(yè)知識,給出以下指南建議。
圖注:
A: MAF閾值;B: 變異分類數(shù)目;C:報告中是否包含治療性建議;D: 報告中是否包含潛在的生殖細胞突變;
E: 報告是否包含變異等位頻率Variant allele frequency (VAF);F: 報告是否包含基因組坐標;
G: 報告是否包含轉錄本ID(Transcript accession);H: 報告是否包含不符合質控的基因/區(qū)間。
2. 術語
dbSNP, The Database of Short Genetic Variation;
ExAC, Exome Aggregation Consortium;
IARC, International Agency for Research on Cancer;
NCBI, National Center for Biotechnology Information;
SNV, single-nucleotide variant;
UCSC, University of California, Santa Cruz;
WHO, World Health Organization;
FDA, Food and Drug Administration;
CNV, copy number variation;
COSMIC, Catalog of Somatic Mutations in Cancer;
HGMD, Human Gene Mutation Database;
indel, insertion and deletion;
LOF, loss of function;
MAF, minor allele frequency;
PG, professional guideline;
TCGA, The Cancer Genome Atlas;
VAF, variant allele frequency.
3. 數(shù)據(jù)庫
3.1 基因組數(shù)據(jù)庫
3.1.1 大型腫瘤基因組數(shù)據(jù)庫
1. The National Cancer Institute’s Genome Data Commons:
- The Cancer Genome Atlas(TCGA)
- Therapeutically Applicable Research to Generate Effective Therapies(TARGET)
- the Cancer Genome Characterization Initiative
2. Catalog of Somatic Mutations in Cancer
3.1.2 體細胞序列變異解釋相關數(shù)據(jù)庫
表1 體細胞序列變異解釋相關數(shù)據(jù)庫
Utility/function | Database | Location (web address) |
Population databases to exclude polymorphisms | √1000 Genomes Project16√ | http://browser.1000genomes.org |
Exome Variant Server | http://evs.gs.washington.edu/EVS | |
√dbSNP17√ | http://www.ncbi.nlm.nih.gov/snp | |
dbVar18√ | http://www.ncbi.nlm.nih.gov/dbvar | |
ExAC√ | http://exac.broadinstitute.org | |
Cancer-specific variant databases | √Catalog of Somatic Mutations in Cancer19√ | http://cancer.sanger.ac.uk/cosmic |
My Cancer Genome | http://www.mycancergenome.org | |
Personalized cancer therapy, MD Anderson Cancer Center | https://pct.mdanderson.org | |
cBioPortal, Memorial Sloan Kettering Cancer Center20 | http://www.cbioportal.org | |
Intogen21 | https://www.intogen.org/search | |
ClinicalTrials.gov | https://clinicaltrials.gov | |
IARC (WHO) TP53 mutation database22 | http://p53.iarc.fr | |
Pediatric Cancer Genome Project (St. Jude Children’s Research Hospital–Washington University) | http://explorepcgp.org | |
International Cancer Genome Consortium23√ | https://dcc.icgc.org | |
Sequence repositories and data hosts | NCBI Genome | http://www.ncbi.nlm.nih.gov/genome |
RefSeqGene24 | http://www.ncbi.nlm.nih.gov/refseq/rsg | |
Locus Reference Genomic25 | http://www.lrg-sequence.org | |
UCSC table browser26 | https://genome.ucsc.edu/cgi-bin/hgTables | |
Ensemble BioMart27√ | http://useast.ensembl.org/biomart/martview | |
Other disease/mutation databases useful in the context of variant interpretation for cancer genomics | √ClinVar28√ | http://www.ncbi.nlm.nih.gov/clinvar |
√Human Gene Mutation Database29√ | http://www.hgmd.org | |
Leiden Open Variation Database30 | http://www.lovd.nl | |
dbNSFP (compiled database of precomputed in silico prediction scores for nonsynonymous SNVs)31√ | https://sites.google.com/site/jpopgen/dbNSFP | |
Ensemble Variant Effect Predictor15 | http://www.ensembl.org/info/docs/tools/vep/index.html |
表注:
表格為不有效統(tǒng)計,賊后更新日期2016年6月7日。
3.1.3 臨床實驗室在應用公共數(shù)據(jù)庫時一般的注意事項
1. 了解數(shù)據(jù)庫內容及數(shù)據(jù)組織形式;
2. 特別注意數(shù)據(jù)庫的限制,避免檢測結果過度解讀;
3. 注意基因組與轉錄組的組裝版本,應與Human Genome Variation Society (HGVS)注釋一致;
4. 根據(jù)已有資源評估基因組測序質量;
5. 確認用于病理診斷的數(shù)據(jù)質量。
3.2 參考序列數(shù)據(jù)庫
常見參考序列數(shù)據(jù)庫用于人類基因組組裝及相關信息,包括基因組坐標,轉錄本編號與版本,外顯子邊界等等。常見的有:
- √RefSeq (National Center for Biotechnology Information Reference Sequence Database,https://www.ncbi.nlm.nih.gov/refseq, last accessed January 2, 2016),
- √Ensembl (http://www.ensembl.org/index.html, last accessed January 2, 2016),
- Locus Reference Genomic (https://www.lrg-sequence.org,last accessed February 2, 2016)
3.3 人群數(shù)據(jù)庫
人群數(shù)據(jù)庫提供基因多態(tài)性、人群等位基因頻率等信息,用于區(qū)分測序結果中的多態(tài)性與突變,常見的有:
- The Database of Short Genetic Variation (the National Center for Biotechnology Information database of genetic variation)
- Exome Variant Server
- √Exome Aggregation Consortium
3.4 腫瘤特異性數(shù)據(jù)庫
腫瘤特異性數(shù)據(jù)庫提供匯總之后的不同腫瘤類型及亞型間的序列變異發(fā)生率,還包括發(fā)表的文獻、臨床試驗、成果數(shù)據(jù)等數(shù)據(jù),見表1 Cancer-specific variant databases。
3.5 原發(fā)性變異數(shù)據(jù)庫
原發(fā)性變異數(shù)據(jù)庫(Constitutional Variant Databases)主要用于區(qū)分生殖系變異與體細胞變異,常用的有:
- √Human Gene Mutation Database
- √ClinVar (http://www.ncbi.nlm.nih.gov/clinvar)
3.6 內部數(shù)據(jù)庫(實驗室產(chǎn)生)
臨床實驗室根據(jù)內部資源獨立建立的數(shù)據(jù)庫,可用于變異注釋,指南鼓勵將這些體細胞變異的注釋數(shù)據(jù)逐步整合到公共數(shù)據(jù)庫資源中去促進體細胞變異的解釋。
4. 生物信息學預測算法
生物信息學預測算法常用于預測基因中核苷酸的變化是否會影響基因的結構和蛋白質的功能,總體上看,目前的生物信息學算法還無法高效足夠高的特異性(大約60%-80%),因此建議不要將預測結果作為臨床分類與臨床決策的證據(jù)。
表2 預測序列突變對基因結構和蛋白質功能影響的算法
Utilsity/function | Algorithm/software | Location (web address) |
Missense SNV | √PolyPhen237√ | http://genetics.bwh.harvard.edu/pph2 |
√SIFT38√ | http://sift.jcvi.org | |
MutationAssessor39√ | http://mutationassessor.org | |
MutationTaster41√ | http://www.mutationtaster.org | |
PROVEAN45 | http://provean.jcvi.org/index.php | |
Condel46 | http://bg.upf.edu/blog/2012/12/condel-for-prioritization-of-variants-involved-in-hereditary-diseases-and-transfic-for-cancer | |
CoVEC40 | https://sourceforge.net/projects/covec/files | |
CADD47√ | http://cadd.gs.washington.edu | |
GERP++48√ | http://mendel.stanford.edu/sidowlab/downloads/gerp/index.html | |
PhyloP and PhastCons49√ | http://compgen.bscb.cornell.edu/phast | |
Splice site prediction | Human Splicing Finder42 | http://www.umd.be/HSF3 |
MaxEntScan43 | http://genes.mit.edu/burgelab/maxent/Xmaxentscan_scoreseq.html | |
NetGene244 | http://www.cbs.dtu.dk/services/NetGene2 | |
NNSplice50 | http://www.fruitfly.org/seq_tools/splice.html | |
GeneSplicer51 | http://www.cbcb.umd.edu/software/GeneSplicer/gene_spl.shtml |
表注:
表格為不有效統(tǒng)計,賊后更新日期2016年6月7日。
5. 變異鑒定與注釋
通常由軟件來鑒定和注釋變異,比如點突變、插入缺失、結構變異和拷貝數(shù)變異。臨床實驗室需注意軟件工具的局限性。測序深度、等位基因頻率等信息需加以考慮,在腫瘤異質性評估中等位基因頻率對體細胞突變的解讀尤為重要,特別是在缺乏配對正常樣本的時候。目前較為通行的注釋文件格式為VCF格式,可從中分析相關信息。常見軟件有:
表3 突變注釋軟件
Software | Location (URL) |
Annovar√ | http://annovar.openbioinformatics.org/en/latest/ |
snpEff | http://snpeff.sourceforge.net/ |
SeattleSeq | http://snp.gs.washington.edu/SeattleSeqAnnotation138/ |
AnnTools | http://anntools.sourceforge.net/ |
NGS-SNP | https://www.ualberta.ca/~stothard/downloads/NGS-SNP/ |
VEP (Variant Effect Predictor) | http://useast.ensembl.org/info/docs/tools/vep/index.html |
表注:
表格為不有效統(tǒng)計,賊后更新日期2016年6月7日。
表4 突變解析軟件
Variant caller | Location (URL) |
MuTect v1.1.555 | https://www.broadinstitute.org/cancer/cga/mutect |
GATK – MuTect v2 | https://www.broadinstitute.org/gatk/guide/tooldocs/org_broadinstitute_gatk_tools_walkers_cancer_m2_MuTect2.php |
VarScan 256 | http://dkoboldt.github.io/varscan/ |
VarDict57 | https://github.com/AstraZeneca-NGS/VarDict |
Sterlka58 | https://sites.google.com/site/strelkasomaticvariantcaller/ |
FreeBayes59 | https://github.com/ekg/freebayes |
Scalpel60 | http://scalpel.sourceforge.net/ |
Pindel61 | http://gmt.genome.wustl.edu/packages/pindel/ |
SAMtools62 | http://samtools.sourceforge.net/ |
Torrent Suite Variant Caller | https://github.com/iontorrent/TS |
SomaticSniper63 | http://gmt.genome.wustl.edu/packages/somatic-sniper/ |
表注:
表格為不有效統(tǒng)計,賊后更新日期2016年6月7日。
6. 基于證據(jù)的體細胞變異分類的指導意見
基于循證醫(yī)學的體細胞變異分類的指導意見(Proposed Guideline for Evidence-Based Categorization of Somatic Variants),根據(jù)文獻報道及工作組專家共識,提議將基因檢測相關臨床及實驗證據(jù)分為4級:
表5 臨床及實驗證據(jù)分類
Category | Therapeutic | Diagnosis | Prognosis |
Level A | Biomarkers that predict response or resistance to FDA-approved therapies for a specific type of tumor | Biomarkers included in professional guidelines as diagnostic for a specific type of tumor | Biomarkers included in professional guidelines as prognostic for a specific type of tumor |
Biomarkers included in professional guidelines that predict response or resistance to therapies for a specific type of tumor | |||
Level B | Biomarkers that predict response or resistance to therapies for a specific type of tumor based on well-powered studies with consensus from experts in the field | Biomarkers of diagnostic significance for a specific type of tumor based on well-powered studies with consensus from experts in the field | Biomarkers of prognostic significance for a specific type of tumor based on well-powered studies with consensus from experts in the field |
Level C | Biomarkers that predict response or resistance to therapies approved by the FDA or professional societies for a different type of tumor | Biomarkers of diagnostic significance based on the results of multiple small studies | Biomarkers of prognostic significance based on the results of multiple small studies |
Biomarkers that serve as inclusion criteria for clinical trials | |||
Level D | Biomarkers of prognostic significance based on the results of multiple small studies | Biomarkers that may assist disease diagnosis themselves or along with other biomarkers based on small studies or a few case reports | Biomarkers that may assist disease prognosis themselves or along with other biomarkers based on small studies or a few case reports |
表注:
A級:可作為FDA批準治療某種特異性腫瘤的生物標志物(biomarker),或被收錄于某些特殊類型腫瘤的診斷、治療、預后評價的權威指南;
B級:可作為基于強力臨床試驗證據(jù)和專家共識的治療某種特異性腫瘤的生物標志物,或用于診斷、預后評估;
C級:可用于指導FDA批準的標注外用藥,或基于多個小規(guī)模研究的證據(jù)的診斷/預后評估;
D級:結果不確定的臨床前研究,可作為輔助標志物,基于小規(guī)模研究且未達成共識。
圖2 基于證據(jù)體細胞變異分類(臨床影響力)
圖注:
I級:具有強臨床意義的變異(A級和B級證據(jù));
II級:具有潛在臨床意義的變異(C級或D級證據(jù));
III級:變異的臨床意義不確定;
IV級:與良性或疑似良性相關的變異。
7. 檢測結果報告與解讀
- 所有檢測到的變異都需要根據(jù)臨床影響力4級分級系統(tǒng)進行分級標識;
- 所有檢測到的變異都需要按照HUGO基因命名委員會規(guī)則注釋與報告,報告中也應包含其他必要信息;
- 生殖系變異在報告中可不加以區(qū)分,若報告生殖系變異需符合當?shù)胤膳c政策(患者需簽署知情同意書等);
- 報告檢測到變異的臨床意義;
- 報告可隨相關醫(yī)學知識的更新而發(fā)生變化,當有特殊需求時可考慮更新報告;
- 實驗方法應隨檢測結果一同報告;
- 可將檢測報告與電子病歷系統(tǒng)整合。
注:
1. NGS分析無法區(qū)分體系變異與生殖系變異;
2. 生殖系變異的報告需要依據(jù)ACMG/AMP指南。
8. 結論
在癌癥基因組譜中越來越多地使用NGS技術,給臨床實驗室?guī)砹诵碌奶魬?zhàn)。分子專業(yè)人員的關鍵任務之一是,基因測序檢測到的癌癥相關序列變體的解釋和報告的標準化。擬議的“癌癥序列變異解釋與報告標準指南”代表了工作組成員的專家一致意見及他們代表的利益相關者的意見。該建議描述了一個基于證據(jù)的變量分類系統(tǒng),以及變量注釋,分類和報告的過程。該報告還列出了常用于NGS數(shù)據(jù)分析的有用的生物信息學工具和數(shù)據(jù)庫。這些建議應作為臨床實驗室專業(yè)人員和腫瘤學家的教育資源,以輔助變體解釋和臨床決策。我們希望本文提供的指南將在癌癥基因組學領域得到廣泛應用,并推動癌癥患者的基因組檢測和正確治療實踐。
9. 免責聲明
分子病理學協(xié)會(AMP)臨床實踐指南和報告的開發(fā),旨在為實踐和特定領域的實踐提供指導和建議,幫助實驗室和其他衛(wèi)生保健專業(yè)人員。指南或報告不應被視為包括所有正確的方式或方法,或排除其他方式或方法。指南或報告不能高效任何具體結果,也不能建立一種護理標準。指南或報告不是要指定對特定患者的治療。治療決定必須基于健康護理提供者和每個患者的個體情況的獨立判斷。 AMP對本指南或報告不作任何明示或暗示的高效,特別不包括任何對特定用途或目的適銷性或適用性的高效。 AMP對與使用本文所含信息相關的直接,間接,特殊,偶然或繼發(fā)性損失概不負責。
10. 參考資料
http://jmd.amjpathol.org/article/S1525-1578(16)30223-9/fulltext#appsec1
(責任編輯:佳學基因)