口述/雲象科技創辦人暨執行長葉肇元 整理/賴宛靖
雲象科技創辦人暨執行長葉肇元
病理診斷可謂是治療的基礎,在醫療過程中至關重要,儘管數位化技術發展迅速,但病理科醫師仍以傳統形態學、憑藉個人經驗或透過顯微鏡逐片判讀病因,面對人才短缺、病灶刁鑽與巨大工作壓力等困境,AI病理診斷系統已成為協助醫護人員精準診察、幫助病人恢復健康的重要利器。
病理科醫師的工作極其繁重,要在組織切片中尋找微小病灶,猶如大海撈針,當病理科醫師太過疲累或是有判讀的時間壓力時,難免會出現疏漏、誤判。在AI功能愈來愈強大的現今,訓練一套可幫助病理科醫師提高影像辨識及診斷準確性和效率的系統,甚為重要,尤其是病理學的判斷往往取決於經驗、甚至是直覺,若能透過更科技的方式將組織細胞比例、各類腫瘤的樣態等加以量化,將能大幅減輕病理科醫師的負擔。
AI並非最近才有的新技術,這個詞彙首次出現在1956年的Dartmouth AI Workshop中,由一群電腦科學家所創造。AI技術一路演進,從早期的專家系統使用程式語言將人類知識轉化為電腦可理解的形式,到機器學習透過演算法從資料中找出規則,再進入深度學習,利用深度神經網路進行表徵學習,不再需要專家進行資料前處理,AI就能判斷出答案。在病理科所需的應用中,深度學習可以幫助辨識細胞,例如觀察淋巴球和中性球,傳統方法須依賴專家觀察並設定分類閾值,而深度學習則透過大量經過專家標註的影像讓AI自動學習辨識特徵,提高準確性和效率,使病理診斷邁向新高度。
利用AI奠定病理診斷新里程碑
自2018年起,雲象科技就開始嘗試將AI應用於病理影像分析,然而當時臺灣的病理AI研究並不多,更談不上產品化。為了進行研究,雲象科技選擇一個從現在標準看來相對簡單的題目:「教AI辨識癌症」,並與林口長庚醫院解剖病理部攜手,研究過程中提供726個玻片,由雲象科技負責訓練卷積神經網路(Convolutional Neural Network;CNN)模型,訓練AI辨認鼻咽癌細胞以提升醫生的閱片準確率和效率,該項研究成果也於2020年在權威期刊《Cancer》上發表。
這項研究採用兩階段訓練模型,然而,全玻片影像的解析度動輒達到200億畫素,GPU記憶體不足是一大挑戰。為了解決問題,我們將全玻片影像切割成小的影像區塊,訓練「區塊級模型」(Patch-Level Model),識別出像是背景(不含組織)、良性組織或惡性組織,接著再處理全玻片影像,將每個影像區塊分類為3種可能的類別後,再將結果彙整並訓練第二個模型,即「切片級模型」(Slide-Level Model),以判斷組織是良性還是惡性。
訓練AI時需要將影像分割成小區塊。如果未經過醫師標註,就無法確定其是否包含癌症組織。因此,林口長庚團隊協助以紅色圈出含癌症組織、綠色圈出良性組織,這些標註的影像小區塊再用於訓練深度神經網路,該計畫完成23,430個區域標註、歷經數百小時的繁重工作,最終訓練出來的AI模型比對ROC/AUC曲線,看看AI預測準確率是否可信賴,結果我們訓練出的Slide-Level Model,其AUC達到0.99,顯示出非常高的準確率。
再將AI模型與病理科醫生的判讀進行比較發現,雲象的病理AI模型應用於100個AI從未見過的測試案例,結果顯示病理科醫師的判讀多數優於AI, AI的表現幾乎跟人類專家一致,其AUC曲線達0.98(完美演算法的AUC為1)。
當醫師的第二雙眼睛
既然AI沒有比人強,那為何要訓練AI病理系統?我認為AI不是用來取代病理科醫師,而是能當醫師的第二雙眼睛就好。臨床上陽性案例較易判讀,一旦看到病灶就可停手,陰性則要確定整張玻片都沒有腫瘤才行。醫師要在檢體中找到埋藏的腫瘤談何容易,若可針對AI初步篩選並標出重點區域再進行判斷,就可減少大海撈針的時間,提高準確度。
研究團隊比較「純人工診斷」、AI提示可疑區域再由醫師檢查的「AI Heatmap模式」,以及醫師只看AI選出的10個高倍率視野的「極端模式」,比較3種閱片模式後發現,辨別良性病例時,純人工診斷平均需95秒,AI Heatmap模式縮短至62秒,極端模式則縮短至46秒,大幅節省診斷時間;此外,病理科醫師常需提供「腫瘤純度Tumor Purity」報告,是指腫瘤組織中腫瘤細胞所占的比例,過去醫師往往只能用直覺去概估,因此我們希望這套AI病理系統能協助提供更精確的定量資訊。
除了在組織切片中找到腫瘤細胞,面對更棘手的淋巴結腫瘤轉移診斷,AI能否簡化這項更繁瑣的工作,畢竟遠端轉移的病灶往往很小,增加辨識困難,也會對病理科醫師產生巨大的工作壓力。
雲象團隊在2017年研究了淋巴結乳癌轉移診斷的敏感度,結果顯示純人力診斷的平均敏感度為62.8%;較大轉移病灶的敏感度為92.9%,較小轉移病灶的敏感度僅38.3%,顯示出面對微小病灶的轉移,病理科醫師的確需要科技的幫助,方可提升敏感度。
有鑑於過去AI訓練需依賴大量標註數據,我們嘗試開發一種不需要細節標註的方法,使用高解析度影像訓練AI偵測淋巴結轉移癌症,採用零細節標註零分割方法,得以將未經切割的病理全玻片影像,直接用於訓練AI模型,該技術也已在權威期刊《Nature Communications》上發表。我們跳脫傳統細節標註的限制,訓練AI識別癌症的可能樣態,並使用自然影像訓練的分類器將這些影像分類。
團隊設計2個AI模型,第一個模型負責檢測全玻片影像中的淋巴結並將影像分割出來,第二個模型則針對單個淋巴結進行良性與惡性二元分類,判斷其是否受到了癌症的轉移侵襲。研究中使用了5,907顆淋巴結影像來訓練AI,並提升GPU的計算能力,使其能處理高達50億畫素的影像解析度。團隊進行臨床實驗驗證結果,發現大型轉移病灶的純人力診斷敏感度為99.3%,有AI輔助則提高至100%;面對微小轉移病灶的判讀,AI的輔助使診斷敏感度從81.94%提升到95.83%;最難判讀的游離腫瘤細胞(Isolated Tumor Cell;ITC),敏感度從68%提升到96%;至於在閱片時間上,不論是哪種型態,AI都能幫助將閱片時間縮短25%到30%左右。
量化難以名狀的癌細胞
此外,AI還能實現人類無法做到的事情。舉例來說,T細胞淋巴瘤是罕見疾病,全仰賴病理科醫師對腫瘤組織切片的形態分析,才能做出精確診斷與治療。T細胞淋巴瘤在形態上有2種難以區分的主要類型:單形性上皮腸T細胞淋巴瘤(MEITL)和腸道T細胞淋巴瘤(ITCL-NOS),病理科醫師必須依賴細胞核的大小、變異度、形態分布和免疫表現型做出準確的區分,這對尚在累積經驗的病理科醫師而言,挑戰甚鉅,尤其是模稜兩可的案例更難下診斷。
團隊運用數千顆細胞核的標註資料,訓練出的AI模型能對淋巴瘤的細胞核精確偵測及描繪輪廓,並計算癌細胞的長短軸比例、圓度、邊緣扭曲程度等量化特徵,預測水準可達AUC 0.966(完美演算法的AUC為1),讓醫師不再需要對T細胞淋巴瘤的形態進行粗糙的二元分類,能對該疾病的分類與治療更有幫助。
隨著AI病理診斷應用發展技術的日新月異,能快速且精確地分析大量的病理圖像資料並提供可靠的初步診斷,大大降低病理科醫師的診斷時間與壓力,提升診斷的準確性和一致性。病理診斷是醫學基礎,唯有以最有效率的方式掌握病程發展,才能提升醫療品質,使病人盡早獲得最佳治療,這也是團隊致力推動臨床上應用AI病理系統的使命。