DeepSeek是什麼，害輝達股價暴跌？中國AI實測優劣－岳林品質大觀園

DeepSeek是什麼，害輝達股價暴跌？中國AI實測優劣

DeepSeek-R1是深度求索（DeepSeek）於2025年1月20日發布的人工智慧大型語言模型，專門適用於數學、編碼和邏輯等任務，性能對標OpenAI o1。

開發

DeepSeek-R1的論文中沒有公布其訓練成本等細節。不過此前的論文中，DeepSeek透露其訓練使用的是英偉達因為美國出口管制而針對中國市場特供的低配版GPU H800，訓練成本為557.6萬美元，遠低於類似西方公司的閉源模型。外界預估R1的訓練成本也不會比DeepSeek-V3高多少，或在600萬美元上下。

使用

DeepSeek-R1使用MIT協議開源，意味著任何人都可以自由使用該模型，包括商業用途。用戶可以在DeepSeek官方網站和App使用官方提供的服務。

DeepSeek-R1上線時提供的API服務定價為每百萬輸入tokens 1元人民幣（緩存命中）/4元（緩存未命中），每百萬輸出tokens 16元，輸出API價格僅僅只有OpenAI o1的3%。

外界反應

1月27日，DeepSeek超越ChatGPT，登頂蘋果App Store美國區免費APP下載排行榜。

DeepSeek-R1爆火，引發全球投資者大量拋售人工智慧相關股票。1月27日，英偉達美股股價下跌近17%，單日市值蒸發5890億美元，為美國股市歷史上最大。

DeepSeek-R1發布後不久，Meta執行長馬克·扎克伯格就宣布，Meta計劃在2025年投入超600億美元，加大對人工智慧的投入。據媒體1月27日報道，Meta成立了四個研究小組，專門研究DeepSeek的模型。其中兩個小組研究其開發者如何降低訓練和運行DeepSeek的成本，第三個小組研究訓練模型可能使用了哪些數據，第四個小組研究基於DeepSeek模型屬性重構其LLaMA模型的新技術。

OpenAI表示，其有證據表明DeepSeek使用OpenAI的專有模型來訓練自己的開源模型，這違反了OpenAI的服務條款。

中國AI公司DeepSeek日前發布最新模型DeepSeek V3，被認為是目前最強大的開源AI模型之一。

※郭宇璇報導

文學館

林公孚

岳林品質大觀園

林公孚發表在痞客邦留言(0) 人氣()

岳林品質大觀園

以分享品質管理相關知識為主

DeepSeek是什麼，害輝達股價暴跌？中國AI實測優劣

歷史上的今天

留言列表

站方公告

活動快報

天海旅...

我的好友

熱門文章

文章分類

最新文章

最新留言

動態訂閱

文章精選

文章搜尋

新聞交換(RSS)

誰來我家

參觀人氣

QR Code

POWERED BY