來自美國、德國、意大利等100多個實驗室的近150位科學(xué)家通力合作,聯(lián)合在頂級期刊《自然》發(fā)表了這篇文章,他們開發(fā)了一個超級AI系統(tǒng),該系統(tǒng)基于腫瘤組織DNA的甲基化數(shù)據(jù),可以準確區(qū)分近100種不同的中樞神經(jīng)系統(tǒng)腫瘤。更厲害的是,這個AI系統(tǒng)還能自學(xué)成才,發(fā)現(xiàn)一些臨床指南里面沒有的新分類。
為了更廣泛的可訪問性,團隊設(shè)計了一個免費的在線分類工具,不需要任何額外的現(xiàn)場數(shù)據(jù)處理。團隊稱,研究結(jié)果為跨越其他癌癥實體生成基于機器學(xué)習(xí)的腫瘤分類器提供了藍圖,并具有從根本上改變腫瘤病理的應(yīng)用前景。
大約一個月之前,張康教授那篇《重磅!中國科學(xué)家最新醫(yī)學(xué)AI成果榮登《細胞》雜志》在朋友圈刷屏,也充分體現(xiàn)了公眾對于AI技術(shù)在醫(yī)療領(lǐng)域的不斷突破給予了極大的熱情。
準確的診斷對于適當(dāng)?shù)募膊≈委熤陵P(guān)重要。目前,臨床上中樞神經(jīng)系統(tǒng)腫瘤的診斷核心技術(shù)還是基于顯微鏡的組織學(xué)診斷。然而,這需要對細微的細胞改變進行評估。在某些情況下,可能導(dǎo)致不同個體對特定樣本進行不同的分類。如今,技術(shù)的發(fā)展使大量的分子數(shù)據(jù)能夠被獲取和評估,這種主觀判斷的誤差也在不斷縮小。
1926年,一篇由神經(jīng)外科醫(yī)生Percival Bailey和Harvey Cushing發(fā)表的題為“神經(jīng)膠質(zhì)瘤組的腫瘤分類與預(yù)后相關(guān)的研究”,為公眾提供了對中樞神經(jīng)系統(tǒng)(CNS)癌癥類型的發(fā)展、細胞特征和臨床后果的早期認識。
這本書的標題充滿了預(yù)見性,因為他們所倡導(dǎo)的基于顯微鏡的診斷方法并不普遍。作者的想法早于他們的時間。例如,書名中的“histo-genetic”一詞指出了細胞變化與遺傳學(xué)之間的聯(lián)系。Bailey 和Cushing對細節(jié)的強烈關(guān)注使得他們能夠發(fā)現(xiàn)與臨床結(jié)果相關(guān)的宏觀和微觀腫瘤特征,并提出了14種腫瘤的分類。
今天,許多腦腫瘤通過組織學(xué)和分子特征的分析來鑒定。世界衛(wèi)生組織在2016年更新其對某些腦腫瘤的診斷指南,以推薦一種結(jié)合組織學(xué)和分子信息的綜合診斷方法。然而,不同的中樞神經(jīng)系統(tǒng)腫瘤的臨床表現(xiàn)和生物學(xué)特性有高度特異性,很難確診。很多在顯微鏡下表現(xiàn)相似的腫瘤,實際上有不同的基因變異特點,這些幾乎是很難觀察到的,這就給精準診斷帶來了極大的困難。
組織學(xué)分析的一個重要發(fā)展是計算工具的拓展,讓機器學(xué)習(xí)過程分析組織學(xué)數(shù)據(jù)。在這種方法中,使用由醫(yī)生分類的腫瘤樣本圖像的數(shù)據(jù)集對“計算機”進行“訓(xùn)練”。計算機使用分類信息來開發(fā)自己的模式識別標準,用以識別腫瘤類型。然而,如果缺乏對某些腫瘤明確定義的診斷標準,或者如果不同類型的腫瘤在組織學(xué)上難以區(qū)分,機器就會遇到挑戰(zhàn)。
研究團隊決定專注于分類信息,其分類不需要復(fù)雜的視覺評估。他們采用機器學(xué)習(xí)方法根據(jù)DNA甲基化的變化(將甲基添加到DNA中)進行腫瘤分類,并將這些診斷與病理學(xué)家使用組織學(xué)分析所做的診斷相比較。
DNA甲基化是最早發(fā)現(xiàn)的基因表觀修飾方式之一。這類改變不會改變DNA序列,但可影響基因表達或細胞命運。異常DNA甲基化和癌癥其他后生變化的作用正日益明顯。在許多癌癥中,表觀遺傳變化的基因組范圍模式(稱為表觀基因組)可能發(fā)生顯著改變。例如,神經(jīng)膠質(zhì)瘤中基因IDH1或IDH2的突變引起DNA甲基化模式的全基因組失調(diào),這可能與特定的臨床結(jié)果相關(guān)。
之前的研究已經(jīng)強調(diào)了在某些類型的腦腫瘤中,分析DNA甲基化的診斷優(yōu)勢:甲基化特征一方面能夠標記相應(yīng)的細胞變化,一方面還能夠用于追蹤細胞來源,例如用來診斷那些病灶不明的癌癥。然而,常規(guī)的全基因組范圍甲基化分析對于臨床診斷仍然不常見,原因有幾個:成本;樣品要求;缺少必要的數(shù)據(jù)分析專家以及這些發(fā)現(xiàn)是否會對臨床治療產(chǎn)生影響。
但是,相關(guān)研究正在取得一些進展?,F(xiàn)在科學(xué)家已經(jīng)可以很容易地從經(jīng)福爾馬林固定后石蠟包埋的少量組織(FFPE)中提取DNA。
作者向計算機提供了由世界衛(wèi)生組織分類的幾乎所有CNS腫瘤類型樣本的全基因組甲基化數(shù)據(jù)。此外,為了區(qū)分中樞神經(jīng)系統(tǒng)腫瘤與其他腫瘤和正常腦組織之間的差異,研究團隊還分析了部分間充質(zhì)腫瘤、黑色素瘤、彌漫性大B細胞淋巴瘤、漿細胞瘤以及6種垂體腺瘤,以及健康腦組織的DNA甲基化情況。
根據(jù)世衛(wèi)組織的分類以及樣本的診斷結(jié)果,在有監(jiān)督的機器學(xué)習(xí)算法下,分析世衛(wèi)組織定義的每類腫瘤的甲基化特征;然后又用無監(jiān)督的機器學(xué)習(xí)算法再分析一遍,讓AI系統(tǒng)總結(jié)出自己對中樞神經(jīng)系統(tǒng)腫瘤甲基化的認知。
經(jīng)過訓(xùn)練,計算機可以根據(jù)特定的甲基化特征將腫瘤分為82個不同的類別。其中有29個符合世衛(wèi)組織定義的特定腫瘤類型,第二類也有29個,它們能與WHO分類中的某種腫瘤下面的亞類型匹配。剩下的就是只能部分匹配,或者完全不能匹配。
研究人員認為,這些發(fā)現(xiàn)可以幫助研究人員更深入地理解中樞神經(jīng)系統(tǒng)腫瘤,并有助于治療方案的選擇或診斷工具的發(fā)展。
圖1:使用機器學(xué)習(xí)方法的腫瘤分類。Capper 等人使用機器學(xué)習(xí)方法根據(jù)稱為甲基化的DNA改變類型的全基因組模式對腦腫瘤進行分類。使用基于標準顯微鏡分析或選定病理學(xué)家診斷的腫瘤樣品的甲基化數(shù)據(jù)來訓(xùn)練計算機。訓(xùn)練結(jié)束后,電腦獲得1104個測試用例
作者比較了計算機和病理學(xué)家所做的診斷。在60.4%的樣本上,AI系統(tǒng)和病理學(xué)家診斷是一致的。15.5%的樣本AI系統(tǒng)和病理學(xué)家的也是一致的,只不過AI系統(tǒng)認為,它們應(yīng)該屬于一個更小的亞型。還有12.6%的病例,AI系統(tǒng)和病理學(xué)家診斷的結(jié)果不一致。經(jīng)過更加深入的分析(例如基因測序)之后,92.8%的樣本是AI系統(tǒng)正確。
考慮到每種樣本的低成本與標準癌癥診斷相比的優(yōu)勢,研究團隊的方法是否代表了腫瘤診斷的未來可能標準?
針對這個問題,研究者也提出,
獲得腫瘤標本的全面分子圖譜當(dāng)然是有用的(尤其是當(dāng)與顯微鏡檢查相結(jié)合時),并且可能會隨著醫(yī)學(xué)治療變得更加個性化以適應(yīng)個體腫瘤特征的前進方向。
組織學(xué)仍然是疾病分類中不可或缺的部分,因為顯微鏡標本保存和檢查的標準方法為世界各地臨床實驗室使用的常規(guī)診斷工作流程提供了最容易獲取和標準化的切入點。疾病可以在分子和細胞變化中表現(xiàn)出來; 因此,整合分子分析和視覺檢查的方法可以加強診斷能力。
常規(guī)和廣泛使用由研究人員開發(fā)的平臺,對于目前許多實驗室來說可能并不實用。所以這種技術(shù)最可能的直接應(yīng)用是評估具有不明確組織學(xué)特征的病例。然而,這一新的方法對傳統(tǒng)方式來說是一個有益的補充。
來源|互聯(lián)網(wǎng)整合資源編輯