Welcome to WEISHIN TECHNOLOGY company website

DeepSeek是什麼?為什麼多國政府擬禁用?

Deep Seek是一款由
中國新創以開源策略開發的低成本大語言模型(Deep Seek-R1),

在技術方面表現亮眼,
更超越ChatGPT在多國的App Store免費下載榜上奪冠。
而為什麼Deep Seek能從多種大語言模型中脫穎而出?
最核心的優勢便是對於成本的控制,
根據報導,
其模型的訓練方式為蒸餾技術:
該方法為透過現有的模型來訓練該模型,
其成本僅為557萬美元,
大約是OpenAI GPT-4的5%。
這樣的突破不但降低成本讓更多用戶受益,
也打破了過去幾年AI競賽的門檻給人的高資本印象,
顯示出小模型經過訓練,
也能夠挑戰大模型的地位。

但也有不少單位擔心機密資料被藉此機會被中共滲透,
已先行宣布單位設備禁用該模型:
美國德州州長已在1/31先行宣布,
表示州政府設備禁止使用Deep Seek與小紅書(RedNote),
強調德州不允許中國共產黨用蒐集AI與社群媒體上的數據,
來滲透關鍵基礎設施,

但部分科技公司對此持不同意見,
蘋果執行長庫克近日在電話會議上被問及此事時表示:
Innovation that drives efficiency.
稱此舉是一種推動效率的創新,
蘋果在AI基礎上的投入,
主要集中於裝置端運行AI模型,
而非雲端運算,
競爭力與對手相比稍嫌不足,
而模型體積較小的Deep Seek出現,
恰巧與蘋果在AI方面的策略不謀而合。

宏碁(Acer)總經理簡慧祥分析,
Deep Seek的出現,
也開始讓開源的概念在AI領域有了發展的機會,
讓更多小型的語言模型、邊緣AI更有機會被看見。
宏碁泛亞營運總部總經理侯知遠也表示,
Deep Seek象徵著算力成本下降,
讓中小型國家可以開發自己的語言模型,
藉此提高國家競爭力。

參考來源:
參考一
參考二
參考三
參考四
參考五
參考六
參考七
參考八
參考九