久久久久久久久久久久久av_成人欧美一区二区三区在线观看_国产一区二区三区站长工具_天天摸在线视频_六十路精品视频_久久综合色天天久久综合图片_婷婷视频在线_伊人久久五月天_久久大胆人体视频

登錄
首頁 > 奧迪 > 又是王冠:27M小模型超越o3-mini!拒絕馬斯克的00后果然不同

又是王冠:27M小模型超越o3-mini!拒絕馬斯克的00后果然不同

發(fā)布時(shí)間:2025-08-11 20:31:44

27M小模型超越o3-mini-high和DeepSeek-R1!推理還不靠思維鏈。

開發(fā)者是那位拒絕了馬斯克、還要挑戰(zhàn)Transformer的00后清華校友,Sapient Intelligence的創(chuàng)始人王冠

這個(gè)27M小模型就是Sapient最新提出的開源可復(fù)現(xiàn)的分層推理模型Hierarchical Reasoning Model(下面簡稱HRM),模仿大腦的分層處理與多時(shí)間尺度運(yùn)作機(jī)制,克服了標(biāo)準(zhǔn)Transfomer的計(jì)算局限。

2700萬參數(shù),就實(shí)現(xiàn)了對(duì)現(xiàn)有大模型的精準(zhǔn)超車。

不用預(yù)訓(xùn)練補(bǔ)課,還不靠思維鏈打草稿,僅憑1000個(gè)訓(xùn)練樣本,就把極端數(shù)獨(dú)、30x30迷宮玩得明明白白。

甚至連衡量通用智能的ARC-AGI測試都能碾壓一眾參數(shù)規(guī)模更大、上下文更長的Claude 3.7等“大前輩”。

有網(wǎng)友感嘆,這就像四兩撥千斤AI版……

所以,HRM這個(gè)小模型是如何做到的?

核心是仿腦的雙層循環(huán)模塊設(shè)計(jì)

HRM之所以能有如此出色的表現(xiàn),源于其五項(xiàng)核心技術(shù)的巧妙設(shè)計(jì)。

首先是分層循環(huán)模塊與時(shí)間尺度分離

HRM受大腦皮層區(qū)域分層處理和時(shí)間分離機(jī)制啟發(fā),設(shè)計(jì)了兩個(gè)相互配合的循環(huán)模塊:一個(gè)高層模塊負(fù)責(zé)慢節(jié)奏的抽象規(guī)劃,一個(gè)低層模塊處理快節(jié)奏的細(xì)節(jié)計(jì)算,不用明確監(jiān)督中間過程,一次就能完成推理。

兩者在不同時(shí)間尺度上協(xié)同工作。低階模塊在每個(gè)高階周期內(nèi)完成多次計(jì)算并達(dá)到臨時(shí)穩(wěn)定狀態(tài)后,高階模塊才會(huì)更新決策,隨后低階模塊重置并開啟新一輪計(jì)算。

這種設(shè)計(jì)既保證了全局方向的正確性,又提升了局部執(zhí)行的效率。

比如,在需要大量樹搜索和回溯的Sudoku-Extreme Full任務(wù)上,增加Transformer的寬度不能提升性能,增加深度才是關(guān)鍵,而標(biāo)準(zhǔn)架構(gòu)會(huì)出現(xiàn)性能飽和,無法從深度增加中獲益。

HRM則克服了這一限制,能有效利用計(jì)算深度實(shí)現(xiàn)近乎完美的準(zhǔn)確率。

其次是分層收斂機(jī)制

普通的循環(huán)神經(jīng)網(wǎng)絡(luò)常出現(xiàn)過早收斂的問題——計(jì)算幾步就陷入穩(wěn)定狀態(tài),后續(xù)再復(fù)雜的任務(wù)也無法推進(jìn)。

而HRM中,低階模塊在每輪計(jì)算中會(huì)收斂到基于當(dāng)前高階狀態(tài)的局部結(jié)果,但高階模塊更新后,會(huì)給低階模塊設(shè)定新的目標(biāo),使其進(jìn)入新的收斂周期。

這就像完成項(xiàng)目時(shí),先攻克一個(gè)子任務(wù),再根據(jù)整體進(jìn)度調(diào)整目標(biāo),確保持續(xù)推進(jìn)不偷懶。

第三項(xiàng)是近似梯度技術(shù)

傳統(tǒng)循環(huán)模型訓(xùn)練時(shí),需要存儲(chǔ)所有中間狀態(tài)并反向追溯,類似復(fù)盤時(shí)要回看每一步操作,既耗內(nèi)存又低效。

HRM則采用一步梯度近似,只需根據(jù)最終狀態(tài)反推優(yōu)化方向,如同根據(jù)考試結(jié)果直接定位薄弱知識(shí)點(diǎn),內(nèi)存需求恒定且計(jì)算高效,更符合生物大腦的學(xué)習(xí)規(guī)律。

第四是深度監(jiān)督機(jī)制

它受大腦中神經(jīng)振蕩調(diào)節(jié)學(xué)習(xí)節(jié)奏的啟發(fā),引入了階段性測試。

模型在學(xué)習(xí)過程中被分成多個(gè)階段,每個(gè)階段結(jié)束后立即評(píng)估并調(diào)整參數(shù),且前后階段的計(jì)算互不干擾。

這種方式能及時(shí)糾正偏差,就像學(xué)生每學(xué)一單元就測試鞏固,比期末一次性考試的學(xué)習(xí)效果更扎實(shí)。

自適應(yīng)計(jì)算時(shí)間讓HRM能像人一樣靈活分配思考時(shí)間

它通過類似評(píng)估收益的算法(Q學(xué)習(xí)),動(dòng)態(tài)決定是否繼續(xù)計(jì)算,在保證準(zhǔn)確率的同時(shí)避免算力浪費(fèi),推理時(shí)還能通過增加計(jì)算資源進(jìn)一步提升表現(xiàn)。

比如,簡單任務(wù)如簡單迷宮快速給出答案,復(fù)雜任務(wù)如高難度數(shù)獨(dú)則延長計(jì)算時(shí)間。

這些技術(shù)的融合,讓HRM在多項(xiàng)測試中表現(xiàn)不凡。

下圖通過可視化中間步驟,驗(yàn)證了HRM的分層推理機(jī)制能夠有效拆解復(fù)雜任務(wù),通過漸進(jìn)式計(jì)算逼近正確結(jié)果,而非依賴黑箱式的一次性輸出。

在衡量AI通用推理能力的ARC-AGI挑戰(zhàn)中,HRM僅用2700萬參數(shù)和1000個(gè)訓(xùn)練樣本,就達(dá)到40.3%的準(zhǔn)確率,超過了參數(shù)規(guī)模更大的o3-mini-high(34.5%)和Claude 3.7 8K(21.2%)。

對(duì)于需要反復(fù)試錯(cuò)的9x9極端數(shù)獨(dú),現(xiàn)有思維鏈模型完全無法解決(準(zhǔn)確率0%),即便是結(jié)構(gòu)相似的Transformer模型,用同樣數(shù)據(jù)訓(xùn)練也毫無頭緒。而HRM幾乎能全部做對(duì)。

在30x30復(fù)雜迷宮的最優(yōu)路徑尋找任務(wù)中,HRM表現(xiàn)穩(wěn)定,而1.75億參數(shù)的大型Transformer模型準(zhǔn)確率不足20%。

雖然,HRM被指參數(shù)太小、訓(xùn)練范圍有限,只針對(duì)特定領(lǐng)域表現(xiàn)好,無法泛化到領(lǐng)域外,并不通用。但有人認(rèn)為小而精的模型或許在某些角度上更智能。

人工智能的飛躍在于創(chuàng)造性。

也有人認(rèn)為HRM的前景更在于“仿腦”,通過精心設(shè)計(jì)的高低兩個(gè)模塊避免過早收斂,對(duì)過擬合具有極強(qiáng)的抵抗力

甚至有人相當(dāng)樂觀,認(rèn)為這種新架構(gòu)是神經(jīng)網(wǎng)絡(luò)一個(gè)巨大的進(jìn)步。有可能是超越Transformer的時(shí)刻。

拒絕馬斯克,挑戰(zhàn)Transfomer

論文的第一作者王冠是一位00后,8歲開始學(xué)習(xí)編程,后保送至清華大學(xué)計(jì)算機(jī)系。

他是GitHub攬星5.1k開源項(xiàng)目OpenChat的獨(dú)立開發(fā)者,獨(dú)立完成了OpenChat全部版本的模型開發(fā)和訓(xùn)練框架搭建。

也正是因?yàn)镺penChat這個(gè)項(xiàng)目,他和馬斯克產(chǎn)生了交集。

但他算得上是一個(gè)拒絕了馬斯克的男人——此前,王冠多次拒絕了xAI等一線機(jī)構(gòu)創(chuàng)始人的加入邀請。

原因是他認(rèn)為自己要做的是顛覆Transfomer

2024年,王冠和聯(lián)合創(chuàng)始人Austin創(chuàng)辦了Sapient Intelligence,并成功融資數(shù)千萬美元。致力于打造“真正具有復(fù)雜推理和規(guī)劃能力的全新大模型架構(gòu)”。

Copyright 2015-2024 多趣味 版權(quán)所有  京ICP備2015051670號(hào)
亚洲国产精品va在线观看黑人| 日韩乱码一区二区| 黑丝av在线播放| 卡一卡二卡三在线观看| 日本在线小视频| 一二三四区在线| 中文字幕你懂得| 一代武则天秘史| 2023欧美最顶级a∨艳星| 成年网站在线| 天堂√中文最新版在线| 亚洲精品成a人ⅴ香蕉片| 日韩精品a在线观看91| 中国成人一区| 国产成人亚洲精品青草天美| 中文字幕亚洲欧美在线不卡| 色综合久久六月婷婷中文字幕| 日韩精品在线一区| 精品视频9999| 成人动漫视频在线观看完整版| 日韩欧美视频一区二区三区四区| 黄色片视频在线免费观看| 中文文字幕文字幕高清| 国产成人啪精品午夜在线观看| 亚洲精品国产精| 免费看岛国视频在线观看| 精品视频二区| 亚洲毛片在线免费| 欧美天堂亚洲电影院在线观看 | 亚洲色图第一区| 欧美裸体一区二区三区| 九色精品美女在线| 日本不卡一区二区三区视频| 手机在线视频一区| 亚洲欧美一区二区三区在线观看 | 一区二区三区在线免费视频| 欧美哺乳videos| 日本亚洲精品在线观看| 99re8这里只有精品| 亚洲婷婷在线观看| 在线免费观看高清视频| 天天操天天曰| 天堂√中文最新版在线| 一级毛片免费高清中文字幕久久网| 懂色av一区二区三区蜜臀| 欧美日韩专区在线| 午夜精品久久久久久久99热| 亚洲在线视频一区二区| 噜噜噜在线视频| 国产成人三级在线播放| 黄色网址三级| 国产一区二区三区精品在线观看| 狂野欧美一区| 精品国产老师黑色丝袜高跟鞋| 最好看的2019年中文视频| 美国av一区二区三区 | 大黑人xxx| 国产伦理精品| 亚洲美女视频在线免费观看| 亚洲国产你懂的| 久久99久久久久久久噜噜| 懂色av一区二区三区四区五区| 欧美无人区码suv| 色香蕉在线视频| av电影在线播放高清免费观看| 伊甸园亚洲一区| 国产午夜精品久久久久久久| 亚洲人成电影网站色| 色噜噜狠狠一区二区三区| 欧美性猛交xxxx乱大交少妇| 精品一区二区三区高清免费不卡| 色呦呦在线看| 国产欧美精品| 欧美亚洲国产bt| 亚洲free性xxxx护士hd| 国产制服丝袜在线| 欧美一级黄色带| 精品极品在线| 日韩av高清在线观看| 欧美一级二级三级蜜桃| 精品无人乱码一区二区三区的优势| 国产三级视频网站| 国产三级电影| 桃花岛成人影院| 国产又黄又大久久| 亚洲图片欧洲图片av| 亚洲一区二区三区欧美| 日本午夜精品理论片a级app发布| av在线影视| 精品久久91| 午夜成人在线视频| 91亚洲人电影| 一区二区三区久久久久| 口述被爽到呻吟高潮自述| 日韩视频在线直播| 国产精品美女久久久久aⅴ国产馆| 欧美日韩爱爱视频| 污版视频在线观看| 亚洲欧美小说国产图片| 国产精品原创视频| 中文字幕成人av| 国产国产精品人在线视| 中文字幕免费高清| 成人www视频网站免费观看| 经典一区二区| 日韩欧美亚洲国产一区| av在线不卡一区| 国产精品国产精品88| 永久免费不卡在线观看黄网站| 色狮一区二区三区四区视频| 欧美偷拍一区二区| 亚洲视频小说| 国产精品日韩无码| 色老头在线一区二区三区| 99re在线精品| 91精品国产91久久久久久久久| 亚洲国产精品狼友在线观看| 美女福利网站视频在线观看| 亚洲男人都懂第一日本| 欧美视频精品在线观看| ijzzijzzij亚洲大全| 好吊色在线观看| 91大神在线观看线路一区| 亚洲丝袜另类动漫二区| 91免费的视频在线播放| 久久精品国产亚洲AV无码男同 | 欧美一级二区| 伊人伊成久久人综合网小说| 男人的天堂最新网址| 九九热在线播放| 欧美在线视屏| 亚洲人成免费电影| zjzjzjzjzj亚洲女人| 捆绑紧缚一区二区三区在线观看| 亚洲精品人人| 久热99视频在线观看| aaaaa一级片| 欧美日本韩国一区二区| 国产成人一区在线| 成人精品一区二区三区| 天天干在线播放| 亚洲深夜视频| 午夜不卡在线视频| 激情五月婷婷六月| 免费视频91| 综合一区二区三区| 欧美成人全部免费| 少妇影院在线观看| 国产v日韩v欧美v| 亚洲午夜精品久久久久久久久| 中文字幕一区二区三区四区五区| 狠狠色成人综合网图片区| 精品久久电影| 一本色道久久综合亚洲精品小说| 伊人网综合视频| 天堂av在线免费观看| 99久久国产综合精品麻豆| 国产精品区一区二区三含羞草| 国产免费的av| 日韩伦理一区二区三区| 国产视频一区在线| 亚洲精品午夜视频| 欧美1—12sexvideos| 亚洲成人福利片| 国语对白做受xxxxx在线中国| 丁香综合在线| 国产激情视频一区二区在线观看 | 亚洲 欧美 另类人妖| 黄页网站在线播放| 91丝袜美腿高跟国产极品老师| 国产精品日韩一区二区| 全国男人的天堂天堂网| 欧美日韩一区自拍| 日本最新高清不卡中文字幕| 一级黄色小视频| 在线日本制服中文欧美| www.日韩视频| 国产性猛交普通话对白| 国产激情精品一区二区三区| 亚洲国产小视频| 三上悠亚作品在线观看| 成人在线黄色| 亚洲第一男人av| 九九这里只有精品视频| 免费一级欧美在线观看视频| 亚洲国产精品视频在线观看| 国产美女网站视频| 欧美美女被草| 日韩电影视频免费| 麻豆91精品91久久久| 成人av影音| 久久亚洲精品成人| 69亚洲精品久久久蜜桃小说| 九九久久婷婷| 88国产精品欧美一区二区三区| 91麻豆国产视频| 亚洲精品美女91| 蜜桃精品久久久久久久免费影院| 人人插人人射| 国产亚洲精品福利|