【佳學(xué)基因檢測】腫瘤分層分治的臨床依據(jù)
腫瘤分層分治的臨床依據(jù)基因檢測:
腫瘤分層在癌癥診斷和個(gè)體化治療中起著重要作用。高通量測序技術(shù)的發(fā)展產(chǎn)生了大量的多組學(xué)數(shù)據(jù),使得利用多個(gè)分子數(shù)據(jù)集對癌癥類型進(jìn)行分層成為可能。腫瘤正確治療基因解碼引入了一種通過整合多組學(xué)數(shù)據(jù)進(jìn)行腫瘤分層的網(wǎng)絡(luò)嵌入方法。該網(wǎng)絡(luò)嵌入方法通過預(yù)分組樣本、整合與每個(gè)分組內(nèi)癌癥類型相對應(yīng)的基因特征和體細(xì)胞突變來構(gòu)建患者特征,然后整合所有分組以獲取全面的患者信息。基因特征包含網(wǎng)絡(luò)拓?fù)湫畔?,因?yàn)樗ㄟ^網(wǎng)絡(luò)嵌入方法整合了脫氧核糖核酸甲基化、信使核糖核酸表達(dá)數(shù)據(jù)和蛋白質(zhì)相互作用。一方面,基因解碼基因檢測使用監(jiān)督學(xué)習(xí)方法輕梯度提升機(jī)(Light Gradient Boosting Machine)基于患者特征進(jìn)行癌癥類型分類。與其他三種方法相比,網(wǎng)絡(luò)嵌入方法在大多數(shù)癌癥類型中具有賊高的AUC。對于分層癌癥類型的平均AUC為0.91,表明通過網(wǎng)絡(luò)嵌入方法提取的患者特征對于腫瘤分層是有效的。另一方面,利用無監(jiān)督聚類算法密度聚類算法(Density-Based Spatial Clustering of Applications with Noise)將單一癌癥亞型進(jìn)行劃分。通過網(wǎng)絡(luò)嵌入方法分層的絕大多數(shù)亞型與患者的生存顯著相關(guān)。
本文關(guān)鍵詞
腫瘤分層分治,臨床依據(jù)
腫瘤分層診斷研究進(jìn)展
腫瘤與癌癥發(fā)生的基因解碼表明:癌癥通常是由體細(xì)胞變異發(fā)生的多種因素導(dǎo)致的,這可以導(dǎo)致細(xì)胞異常調(diào)控和異常病變的形成。腫瘤組織與正常組織在細(xì)胞形態(tài)和組織結(jié)構(gòu)上存在差異。良性腫瘤通常具有相對較低的異型性,與其起源的正常組織相似,而惡性腫瘤則具有相對較高的異型性。近年來,下一代測序技術(shù)的發(fā)展和多個(gè)多中心癌癥外顯子/基因組項(xiàng)目的發(fā)展,如癌癥基因組圖譜(TCGA)和國際癌癥基因組聯(lián)盟,提供了大量的組學(xué)數(shù)據(jù),如基因表達(dá)數(shù)據(jù)、拷貝數(shù)變異、突變和脫氧核糖核酸(DNA)甲基化數(shù)據(jù)。因此,多組學(xué)腫瘤數(shù)據(jù)的快速積累為從多層面研究系統(tǒng)生物學(xué)帶來了新的機(jī)遇和挑戰(zhàn)。 將腫瘤分層為臨床和生物亞型有利于正確腫瘤學(xué)。例如,基于熵的一致性聚類(ECC)方法將多個(gè)基本分區(qū)融合為一個(gè)一致性模型,使用基于熵的效用函數(shù)。重要的是,已經(jīng)提出了許多基于多樣化臨床數(shù)據(jù)的癌癥分類的數(shù)據(jù)驅(qū)動(dòng)方法,如基于基因表達(dá)譜的乳腺癌預(yù)后多基因分類器,基于神經(jīng)網(wǎng)絡(luò)的結(jié)合臨床信息(包括腫瘤大小和腋窩淋巴結(jié)狀態(tài))進(jìn)行不同乳腺癌亞型生存預(yù)測,以及基于成像數(shù)據(jù)使用深度神經(jīng)網(wǎng)絡(luò)算法進(jìn)行皮膚癌分類。 整合基因表達(dá)數(shù)據(jù)、miRNA表達(dá)數(shù)據(jù)和DNA甲基化數(shù)據(jù)等多平臺分子數(shù)據(jù)可以有效地識別癌癥亞型,已被證明比單一數(shù)據(jù)類型更強(qiáng)大。已提出多種策略用于整合多組數(shù)據(jù)。一種策略是在整合多組數(shù)據(jù)之前單獨(dú)分析每種數(shù)據(jù)類型,但這種策略無法捕捉同源數(shù)據(jù)之間的關(guān)系。聯(lián)合和個(gè)體變異解釋可以同時(shí)捕捉多個(gè)數(shù)據(jù)之間和數(shù)據(jù)內(nèi)部的關(guān)聯(lián)信息,但對特征選擇敏感。為了有效地提取隱藏在各種生物數(shù)據(jù)類型中的共享和互補(bǔ)信息,需要更系統(tǒng)和集成的方法。然而,生物分子網(wǎng)絡(luò)在生物系統(tǒng)中具有許多不同層次和不同組織形式,已廣泛應(yīng)用于癌癥研究。因此,基于網(wǎng)絡(luò)的策略是分析和整合多組學(xué)數(shù)據(jù)的有效方法。 癌癥體細(xì)胞突變譜可以整合到生物分子網(wǎng)絡(luò)中。癌癥進(jìn)化可能受到癌癥驅(qū)動(dòng)基因中的體細(xì)胞突變的影響,這些突變會(huì)導(dǎo)致其他基因的改變。腫瘤基因解碼提出了一種基于網(wǎng)絡(luò)傳播的網(wǎng)絡(luò)分層(NBS)方法,通過聚集具有相似網(wǎng)絡(luò)突變的患者來發(fā)現(xiàn)癌癥亞型。假設(shè)是,如果2個(gè)腫瘤的突變基因位于相似的網(wǎng)絡(luò)區(qū)域,則它們可能非常相似。腫瘤基因解碼基因檢測提出了一種基于網(wǎng)絡(luò)嵌入的分層(NES)方法,用于從大量患者的體細(xì)胞突變譜中識別臨床相關(guān)的患者類別。因此,腫瘤基因解碼基因檢測可以根據(jù)每個(gè)患者的體細(xì)胞突變譜和患者之間的相似性對腫瘤進(jìn)行分層。
怎樣進(jìn)行腫瘤分層才能診斷正確?
癌癥是由遺傳和非遺傳因素共同引起的多方面疾病。隨著基因解碼與人工智能技術(shù)的發(fā)展,多組學(xué)數(shù)據(jù)近年來已廣泛應(yīng)用于各種癌癥類型。在基因解碼基因檢測的技術(shù)發(fā)展過程中,NESM通過整合與癌癥類型相應(yīng)的基因特征和體細(xì)胞突變譜構(gòu)建患者特征。由于網(wǎng)絡(luò)拓?fù)湫畔⑹峭ㄟ^網(wǎng)絡(luò)嵌入方法整合DNA甲基化、mRNA表達(dá)數(shù)據(jù)和蛋白質(zhì)相互作用而提取的,它被包含在基因特征中。腫瘤正確治療基因解碼應(yīng)用監(jiān)督分類算法對泛癌和個(gè)體癌癥階段進(jìn)行分類。實(shí)驗(yàn)結(jié)果表明,NESM方法提取的患者特征對于腫瘤分層是有效的。在細(xì)分癌癥亞型時(shí),NESM方法識別的絕大多數(shù)亞型與患者的生存顯著相關(guān)。NESM主要從網(wǎng)絡(luò)拓?fù)渲刑崛√卣?,這是大多數(shù)方法所不考慮的。
與其他方法相比,它可以更好地將癌癥分類和細(xì)分為亞型,但仍存在一些局限性。例如,PPI網(wǎng)絡(luò)的選擇或構(gòu)建可能對NESM模型產(chǎn)生影響。此外,體細(xì)胞突變的速率在不同腫瘤類型之間差異很大。某些腫瘤類型(如胃腺癌(STAD)、子宮內(nèi)膜癌(UCEC)等)具有較高的突變率,而其他腫瘤類型(如直腸腺癌(READ)和乳腺癌(BRCA))具有較低的突變率。在當(dāng)前的NESM框架中,腫瘤基因解碼只整合與體細(xì)胞突變譜、DNA甲基化和mRNA表達(dá)數(shù)據(jù)相匹配的正常腫瘤樣本。整合其他類型的組學(xué)數(shù)據(jù),包括RNA測序、個(gè)體患者蛋白質(zhì)組學(xué)和全基因組測序,可能進(jìn)一步改善NESM模型。其次,該方法的框架是基于從特定數(shù)據(jù)集中提取的患者特征對患者進(jìn)行聚類。該框架可以用于使用各種附加算法解決腫瘤分層問題。例如,我們可以使用圖卷積神經(jīng)網(wǎng)絡(luò)提高預(yù)測正確性,并使用其他聚類算法,包括層次聚類和高斯混合模型聚類。在未來的工作中,這將為正確腫瘤學(xué)和臨床應(yīng)用提供一些線索。
腫瘤分子分層的科學(xué)依據(jù):
(責(zé)任編輯:佳學(xué)基因)