老司机午夜免费精品视频_欧美综合图区_少妇性BBB搡BBB爽爽爽视頻_91精选在线观看_亚洲色大成网站WWW永久男同_久久精品国产99国产毛片

gg
gg

當前位置:首頁 >  熱點資訊 > 內容

AI圈暗流涌動:Llama4來了,DeepSeekR2和GPT-5也不遠

時間:2025-04-08 06:32    來源:投資界   閱讀量:13832   

Meta發布Llama 4系列,強調多模態和超長上下文窗口,部分模型將開源。OpenAI確認O3和O4-mini即將上線,GPT-5推遲發布但將免費。DeepSeek與清華發布新論文,提出SPCT方法和元獎勵模型,顯著提升推理擴展性能。

本周全球被關稅議題占據頭條,但科技界的目光卻聚焦在AI領域的密集動作上。

周末,Meta深夜突襲發布Llama 4系列,號稱“原生多模態+千萬級上下文窗口”,并首次披露單卡H100可運行的輕量化版本。此前OpenAI則宣布O3和O4-mini模型即將在幾周內上線,同時確認GPT-5因技術整合和算力部署問題推遲數月。

DeepSeek則與清華大學的研究團隊本周聯合發布了一篇關于推理時Scaling的新論文,提出了一種名為自我原則點評調優的學習方法,并構建了DeepSeek-GRM系列模型。結合元獎勵模型實現推理時擴展,性能接近671B大模型,暗示DeepSeek R2臨近。

Meta強勢推出Llama 4

多模態與超長上下文成亮點

周六,Meta正式發布了Llama 4系列模型,Llama 4全系采用混合專家架構,并實現了原生多模態訓練,徹底告別了Llama 3純文本模型的時代。此次發布的模型包括:

Llama 4 Scout;

Llama 4 Maverick;

以及強大的 Llama 4 Behemoth 預覽。

此次公布的Llama 4 Maverick 和 Llama 4 Scout 將是開源軟件。然而,Llama 4 的新許可證對使用有一定限制,例如月活用戶超 7 億的公司需申請特殊許可,且使用時需遵守多項品牌和歸屬要求。

前kaggle總裁,fast AI 創始人Jeremy Howard表示,雖然感謝開源,但Llama 4 Scout 和 Maverick 都是大型 MoE 模型,即使量化后也無法在消費級 GPU 上運行,這對開源社區的可及性來說是個不小的損失

Meta強調,Llama 4 Scout 和 Llama 4 Maverick 是其“迄今為止最 先進的型號”,也是“同類產品中多模態性最 好的版本”。

Scout亮點

:速度極快,原生支持多模態,擁有業界領 先的 1000 萬+ Token 多模態上下文窗口,并且能在單張 H100 GPU 上運行(Int4 量化后)

Maverick性能

:在多個主流基準測試中擊敗了 GPT-4o 和 Gemini 2.0 Flash,推理和編碼能力與新發布的 DeepSeek v3 相當,但激活參數量不到后者一半

X網友也對Scout模型的性能感到震驚,尤其是其在單GPU上運行并支持超長上下文窗口的能力。

最令人矚目的是Llama 4 Behemoth。目前Behemoth仍處訓練中,不過Meta將其定位為“世界上最智能的 LLM 之一”。這個擁有288B激活參數和2萬億總參數量的“巨獸”,在32000塊GPU上訓練了30萬億多模態Token,展現了Meta在AI領域的雄厚實力。

有X網友指出了Behemoth訓練的性能潛力,強調了它在階段就已經表現出超越多個最 高 級模型的能力,例如Claude 3.7 和Gemini 2.0 Pro。

還有X網友調侃了 Meta 的“燒錢”策略,同時對 Llama 4 的參數規模表示驚訝。

此前《The Information》周五報道稱,在投資者向大型科技公司施壓,要求其展示投資回報的情況下,Meta 計劃今年投入高達650 億美元來擴展其 AI 基礎設施。

Open AI確認O3和O4-mini即將上線

GPT-5免費策略引轟動

在Llama 4發布的同時,OpenAI首席執行官Sam Altman則在社交媒體上確認,O3和O4-mini將在未來幾周內發布,而GPT-5則將在未來幾個月與公眾見面。

盡管沒有更多關于o3和o4mini的細節內容,但是Altman表示,OpenAI在很多方面真正改進了o3模型,一定會讓用戶大為滿意。

實際上GPT-5的功能和發布時間才是市場關注的重點。據Altman透露,GPT-5將整合語音、Canvas、搜索、Deep Research等多項功能,成為OpenAI統一模型戰略的核心。

這意味著GPT-5將不再是一個單一的模型,而是一個集成了多種工具和功能的綜合系統。通過這種整合,GPT-5將能夠自主使用工具,判斷何時需要深入思考、何時可以快速響應,從而勝任各類復雜任務。OpenAI的這一舉措旨在簡化內部模型和產品體系,讓AI真正實現隨開隨用的便捷性。

更令人興奮的是,GPT-5將對免費用戶開放無限使用權限,而付費用戶則能體驗到更高智力水平的版本。此前,奧特曼在和硅谷知名分析師Ben Thompson的深度對談中,表示因為DeepSeek 的影響, GPT-5將考慮讓用戶免費使用。

不過對于GPT-5的發布時間反復推遲,有網友做出了下面這個時間表來調侃。

DeepSeek攜手清華發布新論文

DeepSeek與清華大學的研究團隊本周聯合發布了一篇關于推理時Scaling的新論文,提出了一種名為自我原則點評調優的學習方法,并構建了DeepSeek-GRM系列模型。這一方法通過在線強化學習(RL)動態生成評判原則和點評內容,顯著提升了通用獎勵建模(RM)在推理階段的可擴展性,并引入元獎勵模型(meta RM)進一步優化擴展性能。

SPCT方法的核心在于將“原則”從傳統的理解過程轉變為獎勵生成的一部分,使模型能夠根據輸入問題及其回答內容動態生成高質量的原則和點評。這種方法包括兩個階段:

拒絕式微調作為冷啟動階段,幫助模型適應不同輸入類型;

基于規則的在線強化學習則進一步優化生成內容,提升獎勵質量和推理擴展性。

為了優化投票過程,研究團隊引入了元獎勵模型。該模型通過判斷生成原則和評論的正確性,過濾掉低質量樣本,從而提升最終輸出的準確性和可靠性。

實驗結果顯示,DeepSeek-GRM-27B在多個RM基準測試中顯著優于現有方法和模型,尤其是在推理時擴展性方面表現出色。通過增加推理計算資源,DeepSeek-GRM-27B展現了強大的性能提升潛力,證明了推理階段擴展策略的優勢。

這一成果不僅推動了通用獎勵建模的發展,也為AI模型在復雜任務中的應用提供了新的技術路徑,甚至可能在DeepSeek R2上能看到該成果的展示。

有海外論壇網友調侃道,DeepSeek一貫是“論文后發模型”的節奏,競爭對手Llama-4可能因此受壓。

聲明:免責聲明:此文內容為本網站轉載企業宣傳資訊,僅代表作者個人觀點,與本網無關。僅供讀者參考,并請自行核實相關內容。

gg

推薦圖片

  • 比技術賽技能,承岐黃
    比技術賽技能,承岐黃傳薪火!福建省舉辦中醫藥針灸推拿適宜技術技能大賽10月26日-27日,2023年福建省中醫藥針灸推拿適宜技術技能大賽在福
  • 馬齒莧又名“五行菜”
    馬齒莧又名“長壽菜”“五行菜”,為馬齒莧科一年生草本植物。肥厚多汁,無毛,生于田野路邊及庭園廢墟等向陽處。其葉子為青色、梗為赤色、花為黃色、
  • 陳郎中為格格治病“不
    “望、聞、問、切”系古時醫家為患者診病的常用之法,是指通過觀氣色、聽聲音、問病狀、按脈搏的方式確定患者病因、癥狀,在此基礎上開方治病。因古時
gg
gg
主站蜘蛛池模板: 国产88精品久久久久久 | 国产精品无人区一区二区三区 | av天堂永久资源网av天堂 | 无码精品AV久久久奶水小说 | 欧美一级大片免费观看 | 爱色天堂 | 国产乱老熟视频网 | 中文字幕精品视频 | 性欧美另类 | 亚洲另类精品无码专区 | 久久久久免费看 | 亚洲国产一区二区av | 天天做天天爱夜夜爽少妇 | 人妻精品动漫H无码专区 | 免费无码成人AV在线播放 | 欧美人与动牲交A欧美 | 久青草国产在视频在线观看 | 日本国产精品无码字幕在线观看 | 日韩久久久精品首页一本在线免费视频 | 四虎成人免费视频在线播放 | 亚洲精品一区三区三区在线观看 | 日本大尺度无删减在线观看 | 黄色免费在线观看网站 | 欧美一级做性受免费大片免费 | 亚洲精品无码你懂的网站 | 厕拍在线观看 | 99久久自偷自偷国产精品不卡 | 久久毛片少妇高潮免费看 | 一区不卡av| 日日干夜夜欢 | 永久免费AV无码网站性色AV | 亚洲中文字幕av每天更新 | 欧美日韩免费在线观看视频 | 国产欧美日韩A片免费软件 国产一级淫片免费放大片 国产亚洲视频系列 | 中文字幕在线播放一区 | 亚洲一区二区三区精品在线 | 国产成人剧情AV麻豆果冻 | 欧美交换配乱吟粗大 | 日本特级毛片 | 综合久久91 | 中文字幕亚洲码在线 |