::: 工研院產業學習網

全球及國內生成式AI　現況與發展機會

2024/01/10 #智慧資通訊 #人工智慧 #AI #生成式

全球及國內生成式AI　現況與發展機會

撰文／工研院產業科技國際策略發展所分析師　石立康

自去年底ChatGPT問世之後，讓不同國籍的普羅民眾，也開始能輕易使用AI在其生活或工作環境中。ChatGPT於開放註冊後，在5天內就達到百萬個使用者，用戶成長速度比Instagram快15倍，比Spotify快30倍，最終僅兩個月就讓總用戶人數突破1億，每天約1,300萬個活躍用戶，且付費升級版的ChatGPT Plus服務還因為需求太大，發生暫時停售的現象。

知名新創研究機構CB Insights在今年2月初發布今年的11大科技趨勢時，就已經提過生成式AI會是今年的重大主題。但羅馬實非一天造成的，自2017年起全球對生成式AI創投不論是案件數跟金額皆呈現上升趨勢，在去年達到最高。視覺媒體、生成介面、文字、語音、程式撰寫，更是其中五大熱門領域。

在2022年8月也有重要的轉捩點，新創Stability AI對大眾發布Stable Diffusion（Text-to-Image工具），吸引數百萬使用者並讓該工具成為網路熱門話題，對Google、Meta及OpenAI等造成壓力，OpenAI在9月開放Dall-E 2，於11月開放ChatGPT給公眾，不過Google跟進在今年2月推出Bard聊天機器人時，因回答問題失誤率高，導致股價暴跌近8%。同時間很多新創也在開發自己的生成式AI工具，包括C3.ai、BigBear.ai和SoundHound AI等股價也受市場追捧。中國搜尋引擎龍頭百度也跟進在3月推出「文心一言」（Ernie Bot）聊天機器人，也造就了目前大家觀察到的爆發潮。

國內生成式AI現況及潛在應用

目前國內程式撰寫、文案生成、靈感啟發、藝術教學、動畫創作相關產業公司，已直接受益在工作中導入ChatGPT進行人機協作，生成式AI因在對話問答具優異表現，使金融、電信、客服等也率先導入。如玉山金以ChatGPT取代原客服對話機器人，也用其進行企業確認客戶身份的程序（Know Your Customer），讓顧客開戶時間大幅縮短；另有電信業者正與華碩旗下的台智雲合作，使用自有資料再透過開源模型，建置自用的客服對話機器人；還有部分企業希望直接掌握優化過的大型模型，避免未來被外商壟斷，如聯發科、中研院、國教院三者合作使用開源BLOOM模型進行繁體語料再訓練與優化（訓練資料為原先1,000倍），該模型已公開讓外界下載，未來可用於問答系統、文字編修、廣告文案生成、華語教學、客服系統等。

雖然臺灣缺乏基礎模型開發所需的資料量、算力、財力等，在此方面難與國際大廠競爭，但不論是在「基礎模型」或「客製模型」兩方面，國內廠商也還至少各有方案可選擇適合者使用。

臺廠可直接連接國際大廠Microsoft或Google的API，此時導入生成式AI成本低且立即可用，但不易客製且僅能透過雲端使用，未來資訊會留在雲端，也將面對未來服務可能斷鏈的風險。臺廠也可用國際大廠雲端訓練工具，自行上傳資料來調整大型模型，可符合特定領域需求，但同樣有服務斷鏈風險。臺廠亦可用開源模型結合自有資料，微調模型後建置應用，能提供最安全、正確的服務，但有賴多次訓練且算力需求不低，優點是可掌握核心技術，若不想將資訊留雲端，也可將模型佈署在企業內部，避免洩密與資安問題。但此時需要一家本土企業擔任「AI代工廠」角色提供不同規模基礎模型、合理算力價格及訓練顧問服務。

除前述所提的金融、電信、客服外，從生成式AI特性來看，國內尚有多種其他應用，如醫療、照護、心理諮詢、法律服務、補教機構、製造場域、IC設計與資訊軟體、電商、3D設計與動畫、音樂創作、新藥物及新材料開發、政府服務等亦適合在未來導入，提升生產力。

國內後進者的發展機會所在

對通用型生成式AI，前面提過模型參數規模大、所需資料量多、所需算力、財力高，身為國內後進者的確難與國際大廠競爭，但這也並非代表國內後進者沒有機會。據研究文獻、實務經驗、算力、標記資料量等因素來觀察，若是用在特定領域的生成式AI，模型參數約落在1B至20B之間即有相當競爭力，此為國內後進者可考慮積極發展的一個可行技術區間。

以BioMedLM為例，該模型為史丹福大學基礎模型研究中心（CRFM）和MosaicML兩者聯合開發，可用於醫學任務問答。例如可生成簡明相關的問題來總結患者的需求，該模型是基於GPT-2的小型模型，以美國國立衛生研究院線上生物醫學數據庫論文摘要和全文訓練而成，該模型在美國醫學院學生成為醫生須通過的醫學執照考試中取得最佳的50.3分，表現勝過多種大型模型，但BioMedLM參數2.7B，僅通用型生成式AI的數十分之一。

此現象說明在特定領域資料上重新訓練小型模型，可表現得跟大型者一樣好或更好；但所需資料量、算力、成本相對少很多。其他如程式撰寫的CodeGen、圖像生成的DALL-E及Diffusion Model等表現突出的生成式AI模型，也都落在此區間中。而部分臺灣特定產業如高科技設計或製造業，基於保護商業機密、資安等考量，不想將機敏資訊留在雲端，必不會考慮使用國際大廠的雲端方案，這也創造出特定領域生成式AI的本土需求，可交由本土廠商解決。

文章轉載來源網址
工業技術研究院工業技術與資訊月刊

工研院產業學習網

熱門文章

相關文章