ChatGPT推出後席捲全球,也點燃一場AI科技競賽,除了Google、微軟外,中國百度也將跟進推出類似的工具,不僅如此,台灣國科會在2月新春記者會上重磅宣布,將推出「台版ChatGPT」,盼能在今年年底前推出,國科會主委吳政忠日前也回應,台灣要打造的是「可信賴的生成式對話引擎」,並非OpenAI那種對話式引擎,預計年底時會有共用模型,至於目前進度如何、將投入多少資金與資源等相關訊息皆未公布,引發各界好奇,「台版ChatGPT」究竟會做到什麼程度?

我是廣告 請繼續往下閱讀
AI科技賽開打!中國搶先推簡體中文版ChatGPT

美國科技公司OpenAI於2022年11月推出聊天機器人「ChatGPT」,全球不僅掀起一股AI熱潮,甚至點燃了一場AI科技競賽,不只Google宣布推出AI聊天機器人「Bard」,中國百度也將跟進推出簡體中文版的類似工具,產品名字確定為「文心一言」,英文名則取作「ERNIE Bot」,並宣布在3月完成內測後開放。

根據百度官方的邀請函提到,「文心一言」是百度研發的大語言模型,能夠與人對話互動、回答問題,甚至協助創作,高效便捷幫助人們獲取資訊、知識以及靈感,透過大語言模型,能以自然語言處理技術來改善生活和工作效率,進而推動人工智能領域發展,帶來更多可能性。

憂中國聊天機器人有「偏見」 國科會要推「台版ChatGPT」

以防中國聊天機器人恐有偏見論述為由,國科會在2月新春記者會上重磅宣布,將推出「台版ChatGPT」,盼能在今年年底前推出,目前正積極佈局,據悉,國科會也將在近幾月發布相關資訊,公開進度。主委吳政忠當時表示,類似ChatGPT的軟體技術未來也將進入中小企業以及使用者的生活當中,然而,人工智慧有「教它什麼,就學什麼」的特性,很可能產生偏見,強調「台灣必須要有自己的版本」。

然而,ChatGPT技術背後有大型語言模型支撐,其訓練基礎是全球頂標等級,各界難免憂心,台灣不見得有如此龐大的資源及財力,能訓練出同等級的語言模型。對此,吳政忠坦言,台灣的科技預算難與Google、微軟或美國相比,但台灣靠得是努力與腦力,台灣若能善用「繁體中文」及「民主政體」優勢,可望成為行銷國際的切入點。國科會的前身科技部先前已補助 4 所國內大學成立 AI 創新研究中心(Taiwan AICoE),未來AICoE也會以國家高度,與國際對應交流。

立法院教育及文化委員會於15日邀請吳政忠報告業務概況,多位立委關切「台版ChatGPT」進度,他強調,AI不會取代人類,而是「不會用AI的人類會被用AI的人類取代 」,確實應善用所有可信賴資料,但要小心使用ChatGPT的同時,資料會被蒐集起來,若台灣政府有些金控、機密資料要詢問,就必須要有自己的可信賴軟體,站在台灣有科技實力、保護資安的立場上,有必要打造「台版ChatGPT」。

吳政忠提到,台灣資源不如美國,不可能發展全面性、像ChatGPT那樣的軟體,而是要對焦在台灣特色,如政府金控、機密資料需要AI幫忙,不適合用國外軟體亂問,有洩漏機密疑慮,因此台灣必須建置「可信賴的生成式對話引擎」,第一步會在年底前把共用模型的基礎設施建立起來,讓政府單位、大型機構等不同部門來試用。

「台版ChatGPT」做得出來嗎?優勢在哪?唐鳳這麼說

數位發展部長唐鳳接受《NOWnews今日新聞》專訪時曾表示,若只是要讓聊天機器人具備「換句話說」的能力,相對容易,他透露,國科會國網中心已經有這樣的運算能力,但困難點在於要照顧20種國家語言的需求,以及讓多元語言相互對接,好比使用者現在以台語、客語、原住民語跟ChatGPT聊天,會發現它很常亂講,因為其語料大部分都是英文,「這就是訓練時語言材料不充足所致,而這也是全世界研發相關技術都會碰到的問題。」

他認為,台灣的優勢在於「軟硬體整合能力」,國科會負責研究、研發,數發部協助尋找台版聊天機器人的應用場域,以及引進隱私強化技術,並研發出強化隱私的運算方式,讓大家合在一起訓練,卻不會看到彼此的個資,透過聯邦學習,大幅降低資安風險。

立委關切經費、預算來源 吳政忠:還在盤點中

此次國科會發出想要在年底推出台版ChatGPT的訊號,引各黨派立委好奇經費預算來源,吳政忠坦言,OpenAI獲得微軟投資100億美元,但我國科技預算今年僅1327億元,能運用的錢相差極大,預計利用跨部會署科發基金,針對緊急事件的預算,需要申請多少經費還在盤點中,目前是先把專家、業界「志工」找到,內部整合後再跟國際介接。 

資策會資深產業分析師朱師右說,ChatGPT服務千萬等級的用戶,它需要極大規模的伺服器,台灣若要做到類似應用,就得投入大量的運算與資源,而所需的研發與營運資源、商業模式與生態系建構能力等,究竟是否是我國政府與產業所能負擔的?他認為要觀察台版ChatGPT想要切入的方向為何。

盼公私協力打造「台版ChatGPT」 目前聚焦讓政府運用

另外,有學界的人提出「台版ChatGPT」究竟會做到什麼程度的疑問?資策會產業顧問張家維表示,目前仍在密切觀察中,但據他所知,現在許多語料庫的開發或者是蒐集整理是由學研界來投入,國科會有幾個團隊目前也在跟學校老師合作,進行語料庫的開發與蒐集,初步運用以及後續的訓練過程,原則上應該還是以國網中心的「台灣衫」為主,作為主要的算力來源,畢竟他在國內在科研領域中,資料與資源最為豐厚,因此台版ChatGPT與跟國網中心合作的比例是相當高的。

日前針對我國是否真有能力打造「台版ChatGPT」?吳政忠也給出回覆談到,有將國網中心的「台灣杉二號」(Taiwania 2)AI超級電腦主機,放進計劃運作。另外,台灣2018年就有培養AI人才,只是缺大量語言輸入跟編輯,因此已經找了國內人工智慧領域的教授、業界人員投入計畫,盼公私協力,目前台版聚焦讓政府運用,因此資料庫來自中央、地方政府資料,包括中研院,都會去協調授權。

至於可能牽涉到個資的議題,吳政忠表示,國發會正在修正個資法,盼建立獨立的監理機制,都會納入配套,將與數位部、國發會一起思考,怎麼把個資隱私規範納入。