DeepSeek是什麼,害輝達股價暴跌?中國AI實測優劣
DeepSeek-R1是深度求索(DeepSeek)於2025年1月20日發布的人工智慧大型語言模型,專門適用於數學、編碼和邏輯等任務,性能對標OpenAI o1。
- 開發
DeepSeek-R1的論文中沒有公布其訓練成本等細節。不過此前的論文中,DeepSeek透露其訓練使用的是英偉達因為美國出口管制而針對中國市場特供的低配版GPU H800,訓練成本為557.6萬美元,遠低於類似西方公司的閉源模型。外界預估R1的訓練成本也不會比DeepSeek-V3高多少,或在600萬美元上下。
- 使用
DeepSeek-R1使用MIT協議開源,意味著任何人都可以自由使用該模型,包括商業用途。用戶可以在DeepSeek官方網站和App使用官方提供的服務。
DeepSeek-R1上線時提供的API服務定價為每百萬輸入tokens 1元人民幣(緩存命中)/4元(緩存未命中),每百萬輸出tokens 16元,輸出API價格僅僅只有OpenAI o1的3%。
- 外界反應
1月27日,DeepSeek超越ChatGPT,登頂蘋果App Store美國區免費APP下載排行榜。
DeepSeek-R1爆火,引發全球投資者大量拋售人工智慧相關股票。1月27日,英偉達美股股價下跌近17%,單日市值蒸發5890億美元,為美國股市歷史上最大。
DeepSeek-R1發布後不久,Meta執行長馬克·扎克伯格就宣布,Meta計劃在2025年投入超600億美元,加大對人工智慧的投入。據媒體1月27日報道,Meta成立了四個研究小組,專門研究DeepSeek的模型。其中兩個小組研究其開發者如何降低訓練和運行DeepSeek的成本,第三個小組研究訓練模型可能使用了哪些數據,第四個小組研究基於DeepSeek模型屬性重構其LLaMA模型的新技術。
OpenAI表示,其有證據表明DeepSeek使用OpenAI的專有模型來訓練自己的開源模型,這違反了OpenAI的服務條款。
中國AI公司DeepSeek日前發布最新模型DeepSeek V3,被認為是目前最強大的開源AI模型之一。
※郭宇璇報導