DeepSeek 吹得很猛 結果美股今天就直接把前天虧的部分拉回來了



代表沒有H100 還是不行

講難聽點就是資本故意炒作 然後自己下場做空 割韭菜而已 你還以為美國真的不行了嗎

昨天恐慌性拋售的散戶都成了韭菜
顯然樓主的數學不是很好,或者把「拉回來」的定義放的很鬆。


不過,相較於昨天多少見獵心喜、集體性的歇斯底里在01上手舞足蹈發文起乩…還是好許多。

一整個唱衰太極殿與西方國家AI大廠…
中國甚麼都行
最行的就是大外宣
只要他們開始宣傳
就表示這東西沒有效果
你完全不懂股市,現在撿便宜回檔很正常 漲完後就會一路跌了

nv就是大外宣炒作騙騙騙股價部分才拉回來

人家DS也不是用H100
ROG_ally
美股廖添丁 你被NV騙了那個五萬片是禁令前別人買的,DeepSeek才用2千多個晶片而且已經轉去AMD GPU上。
smallbeetw
美國華人只是為了掩飾自己的無能,不然沒辦法跟金主交代…
ap7869858 wrote:
代表沒有H1...(恕刪)






抄底的都賺到了⋯
有些行情會這樣

利空來襲先重挫
然後反彈回去觀望
再看後續
利空是否真實會影響營收

所以
目前只是技術面的震盪
真實的市況還再發展中
Sinfield wrote:
ap7869...(恕刪)


轉貼~
最近國產AI大模型Deepseek的爆火給芯片產業帶來不小的震動,英偉達一夜市值蒸發3500億,其低成本的算法讓人們懷疑英偉達未來發展前景,通過最近對Deepseek的了解發現有一個論點比較好接受,那就是其算力成本低的原因是數據蒸餾,也就是搭便車,已經有了一個訓練好的大模型A,和準備訓練的小模型B,假設輸入是X,需要讓BX儘可能接近AX的結果,就像是提前知道了某道題的答案,根據這個答案去解題,這樣就簡單多了,不需要做繁瑣的試錯流程,以前的大模型訓練像是題海戰術,而蒸餾就像是在題海戰術裏面經過磨練的優秀大模型去充當新模型的老師,老師篩選出有效的題目再讓新的大模型去訓練,前一個模型是教師模型,後一個大模型叫學生模型,山姆奧特曼說:複製你知道的有效東西,相對來講是容易做的,而新的有風險的和困難的事情是當你不知道他是否可行的時候,這個是極其困難的,這也是世界上最酷的事。學生能否超過老師並創新發展,我們拭目以待。
但是,在英偉達暴跌之時,我們也看到大量個人散戶抄底英偉達的資金大約是5.6億美元,說明現在的個人投資者很多都不盲目追高了,左側交易很有市場,越跌越買,美股暴跌之時就是倒車接人,抓住機會上車,暴跌之後的反彈往往又快又高,昨天的暴漲使得本帳戶收益距離最高點只差6萬多美元,恐慌之時拋掉籌碼的投機者永遠在追趕,而不像投資者平和地坐收漁翁之利。
Sinfield wrote:
Sinfie...(恕刪)


阿里出來打臉DeepSeek了人家是拼實力贏V3
轉貼~中國新創AI公司開發的DeepSeek語言模型,以高效能、低成本震驚各國。接著29日,中國阿里巴巴旗下的「阿里雲」凌晨宣布,推出超大規模MoE模型「通義千問Qwen 2.5-Max」,號稱在多項權威基準測試中展現出優異的表現,甚至略勝DeepSeek V3,消息一出也帶動阿里巴巴股價上揚。綜合陸、港媒體報導,阿里巴巴旗下的「通義千問」團隊研發的Qwen2.5-Max在訓練過程中使用超過20兆token的預訓練數據,並採用精心設計的後訓練方案。團隊聲稱,與業界領先的閉源或開源模型對比,Qwen2.5-Max在各個評測系統如LiveCodeBench、LiveBench、Arena-Hard等評估中的表現都超越了DeepSeek V3,在MMLU-Pro等其他測試中也展現極具競爭力的成績。
ap7869858 wrote:
代表沒有H100 ...(恕刪)


又掉下去了…
Sinfield wrote:
,通過最近對Deepseek的了解發現有一個論點比較好接受,那就是其算力成本低的原因是數據蒸餾,也就是搭便車,已經有了一個訓練好的大模型A,和準備訓練的小模型B,假設輸入是X,需要讓BX儘可能接近AX的結果,就像是提前知道了某道題的答案,根據這個答案去解題,這樣就簡單多了


我有用過OpenAI和Gemini,對比這次的Deepseek,在使用上的體感上好很多。

尤其是ds的思考鏈的演繹真的深得我心

我個人認為只用上述的解法。不能解釋太多的問題。


再說如果真的那麼簡單,那為什麼美股連發電、冷卻類股都跌翻了。


DS日前最大的成績是,讓AI的發展往更多的可能來走下去。而不是只強調暴力式的加強算力而已。

展望未來,能平衡的發展算力和算法的才是穩健的道路
關閉廣告
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!