過去常說「科技日新月異」,在我過去五十多年的歲月裡,直到去年年底才出現這種感受。2022 年 11 月 30 日 OpenAI 發表 ChatGPT,不到一週突破百萬用戶,支援多國語言與友善的人機介面,即使在有網路嚴密控管的中國,也翻牆出來體驗 ChatGPT 的神奇之處

李育杰國立陽明交通大學應用數學系教授

「生成式 AI」和「分辨式 AI」有哪裡不一樣? 112/03/30

圖一:ChatGPT 只是生成式 AI 的一種形式,這種生成人工智慧可以創造出原本不存在的音樂、圖像、語言和其他形式的數據。


過去常說「科技日新月異」,在我過去五十多年的歲月裡,直到去年年底才出現這種感受。2022 年 11 月 30 日 OpenAI 發表 ChatGPT,不到一週突破百萬用戶,支援多國語言與友善的人機介面,即使在有網路嚴密控管的中國,也翻牆出來體驗 ChatGPT 的神奇之處,迅速積累破億用戶。今年 3 月 14 日公布更強大的 GPT4 的大型語言模型(LLM, Large Language Model),GPT3 有 1750 億的參數,ChatGPT 使用 GPT3.5 約 2000億。GPT4 應大過 GPT3.5 數倍,但 OpenAI 刻意不揭露。

而 ChatGPT 只是生成式 AI 的一種形式,這種生成人工智慧可以創造出原本不存在的音樂、圖像、語言和其他形式的數據。包括: OpenAI 的 DALL-E 2、Midjourney v4,讓你可以用簡易的線條或簡單的文字描述、風格設定,快速生成影像。而各項不同的應用也如雨後春筍般的湧現。


Q1:「生成式 AI」因為 ChatGPT 來到爆發奇異點,「生成式 AI」和「分辨式 AI」有哪裡不一樣?

生成式人工智慧(Generative AI)和分辨式人工智慧(Discriminative AI)是人工智慧中兩個重要的概念。

首先理解一下分辨式人工智慧(Discriminative AI),顧名思義,這是需要有標注標籤資料以供「分辨」,我們常以(X, y)來表示有標注標籤的資料,X 代表資料本身,y 表示其標籤。從分辨區隔手中的標注資料,進而「訓練」篩選出一個好的分類器 (Classifier),用於對那些沒有「標注」僅有 X 的資料,預測其標籤 y。具體來說,分辨式模型依據有限的資料分佈與其對應的標籤找出一映射的函數 F(X),用此函數值當成X 所對應的標籤 y。分辨式 AI 模型的代表性算法包括支持向量機(SVM)、決策樹(Decision Tree)、羅吉斯迴歸(Logistic Regression)等。從這樣的學習模式,不難想像,需要倚賴大量高品質具有標籤的標注資料,當然也提高了模型訓練成本,限縮大型複雜分辨式 AI 模型的發展。

而生成式 AI 模型與分辨式模型就根本的差異,在於生成式 AI 模型巧妙運用大量沒有標注標籤的資料 X,試圖自我產生資料與隱藏於資料中的訊息。而移除標注資料的限制後,讓大型的複雜模型的訓練,藉助於強大 GPU 的算力與大量的資料,得以實現。生成式 AI,雖無必要使用有標注標籤的資料,但若仍有標注標籤的資料合併使用,訓練過程中再引入強化學習(Reinforcement learning)機制,可協助引導模型快速朝向「正確」合用的方向收斂。而這樣的模式,也讓通用性的人工智慧漸露曙光。這種人工智慧可以創造生成出自然語言、音樂、圖像和其他形式的資料。


Q2:「生成式AI」有哪些潛力?

很自然的在各種形式的內容產生,生成式 AI 能夠生成自然語言、圖像、音訊等多種類型的內容。創造出新內容,如文章、故事、詩歌、音樂等。這樣的創造力可以在許多領域中得到應用,例如文學、音樂、設計等。事實上,已有多本書籍是由生成式 AI 「創作撰寫」於亞馬遜網路書局販售。這些數位內容產生快速且低成本,直接應用在遊戲產業與虛擬擴增實境之上,帶動這些內容產業的發展。ChatGPT 讓大家體驗人機流暢的對答模式,這樣的人機互動,將形成風潮,導入在各式聊天機器人,可以是伴隨機器人、擬真人的客服系統、自然語言搜索等。而由於生成式 AI 背後的隨機性,可以自動生成設計各類藝術創作,刺激創作靈感,人類可以不再腸枯思竭。

從去年 11 月 30 日 ChatGPT 發布,過去四個月來,非常多生成式 AI 的應用已紛紛湧現,這些技術正快速地擴散,不久將會全面改變我們的工作方式。


Q3:「生成式設計」會對製造業產生什麼樣的衝擊?

有了生成式 AI 的理解,無論是從文字生成影像、影像生成影像,利用過去積累的大量資料,以引導式的訓練生成方式,將其運用於設計製造,讓系統自動創建生成新的產品設計,從而提高設計效率和創造力。

這樣新型態的設計作業流程,對於製造業來說,可以直接提高產品設計效率,從而減少人工設計的時間和成本,迅速生成多項設計方案,供設計工作人員可以選擇,並進行引導式的修正生成。例如可以快速生成 3D 模型,可視覺化對產品修改,從而更好地展示和驗證設計方案。必要時,也可以很快速得到市場與消費者的反饋,使其所設計的產品更符合市場的期待與終端消費者需求。而生成式設計本身也含有隨機性,從而創造出從未存在過的新設計。當然,在這樣的流程中,也須謹慎小心,避免使用生成式 AI 服務的過程中,洩露公司的生產計畫與機敏的資料。

了解新興科技潛在風險,才能有效駕馭科技帶來的美好

生成式 AI 的橫空出世,確實又將人工智慧的發展推向一個嶄新的紀元。整個機器學習的模式也有革命性突破,可以巧妙運用巨量的無標注資料,降低資料標注成本。然而,資料品質的好壞,仍主導著生成式 AI 模型的品質。存在著資料偏頗的風險。當然,也有著資訊安全與隱私上的疑慮,因此,筆者一直提醒大家,機敏的問題不要問 ChatGPT,重要的內部文件,千萬不要讓 ChatGPT 幫忙翻譯。同時,生成式 AI 產出結果的正確性,也是需要使用者用心思考,獨立判斷。深入了解新興科技潛在的風險,才能有效駕馭科技帶來的美好。


原文標題為:「生成式 AI」和「分辨式 AI」有哪裡不一樣?


相關課程