唯星科技 | DeepSeek是什麼？為什麼多國政府擬禁用？

2025-02-25

DeepSeek是什麼？為什麼多國政府擬禁用？

Deep Seek是一款由
中國新創以開源策略開發的低成本大語言模型（Deep Seek-R1），
在技術方面表現亮眼，
更超越ChatGPT在多國的App Store免費下載榜上奪冠。
而為什麼Deep Seek能從多種大語言模型中脫穎而出？
最核心的優勢便是對於成本的控制，
根據報導，
其模型的訓練方式為蒸餾技術：
該方法為透過現有的模型來訓練該模型，
其成本僅為557萬美元，
大約是OpenAI GPT-4的5%。
這樣的突破不但降低成本讓更多用戶受益，
也打破了過去幾年AI競賽的門檻給人的高資本印象，
顯示出小模型經過訓練，
也能夠挑戰大模型的地位。

但也有不少單位擔心機密資料被藉此機會被中共滲透，
已先行宣布單位設備禁用該模型：
美國德州州長已在1/31先行宣布，
表示州政府設備禁止使用Deep Seek與小紅書（RedNote），
強調德州不允許中國共產黨用蒐集AI與社群媒體上的數據，
來滲透關鍵基礎設施，

但部分科技公司對此持不同意見，
蘋果執行長庫克近日在電話會議上被問及此事時表示：
Innovation that drives efficiency.
稱此舉是一種推動效率的創新，
蘋果在AI基礎上的投入，
主要集中於裝置端運行AI模型，
而非雲端運算，
競爭力與對手相比稍嫌不足，
而模型體積較小的Deep Seek出現，
恰巧與蘋果在AI方面的策略不謀而合。

宏碁(Acer)總經理簡慧祥分析，
Deep Seek的出現，
也開始讓開源的概念在AI領域有了發展的機會，
讓更多小型的語言模型、邊緣AI更有機會被看見。
宏碁泛亞營運總部總經理侯知遠也表示，
Deep Seek象徵著算力成本下降，
讓中小型國家可以開發自己的語言模型，
藉此提高國家競爭力。

參考來源：
參考一
參考二
參考三
參考四
參考五
參考六
參考七
參考八
參考九