跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
DEX API
探索 DEX API
DEX API 文檔
API Key 管理
區塊鏈瀏覽器
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
學院
幫助中心
探索 Web3 Giveaway 活動,每週豐厚獎勵等您來領取
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
+5.48%
USELESS
-3.34%
IKUN
+3.16%
gib
-1.08%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
+4.3%
ALON
-7.26%
LAUNCHCOIN
-2.33%
GOONC
-2.62%
KLED
-7.13%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-0.31%
Boopa
-11.82%
PORK
+2.73%
主頁
Derya Unutmaz, MD
教授、生物醫學科學家、人類免疫學家、衰老和癌症免疫療法。全部投入人工智慧。興趣:生物人工智能、機器人技術、太空科幻象棋。個人觀點
查看原文
Derya Unutmaz, MD
9月15日 02:31
目前,“水管工智能”比博士級智能更有價值,因為AI模型在認知層面上已經超越了後者,但在身體智能方面仍然遠遠落後。然而,這種悖論不會持續太久;這只是下一個需要征服的前沿。
118
Derya Unutmaz, MD
9月14日 03:12
這是一篇非常有趣且我認為很重要的論文。長時間思考在我看來是一個至關重要的特徵。想象一下,一個能夠思考一百萬步的AI模型! ✅GPT-5的思維遠遠領先於我們測試的所有其他模型。它可以一次性執行1000多個步驟的任務。 ✅第二名是Claude 4 Sonnet,432步……然後是Grok-4,384步。 ✅Gemini 2.5 Pro和DeepSeek R1則遠遠落後,僅有120步。
Shashwat Goel
9月12日 23:42
新鮮出爐的論文:收益遞減的幻覺:在LLM中測量長時間執行。 小模型是代理AI的未來嗎?由於收益遞減,擴展LLM計算是否不值得成本?自迴歸LLM註定要失敗,思考是一種幻覺嗎? LLM擴展的熊市案例都與一個單一能力相關:長時間執行。然而,這正是你應該看好擴展模型規模和測試時計算的原因! > 首先,記得METR圖嗎?它可能可以通過@ylecun的複合錯誤模型來解釋 > 模型的視野長度在單步準確性上以超指數方式增長(@DaveShapi)。 > 結論1:不要被典型短任務基準上進展緩慢所迷惑 > 這足以實現視野長度的指數增長。 但我們超越了@ylecun的模型,進行了實證測試LLM... > 僅僅執行對LLM來說也是困難的,即使你提供了所需的計劃和知識。 > 我們不應該誤解執行失敗為“推理”的無能。 > 即使小模型的單步準確率為100%,較大的模型在成功率閾值以上可以執行更多的回合。 > 注意到當任務變長時你的代理表現更差嗎?這不僅僅是長上下文的限制…… > 我們觀察到:自我條件效應! > 當模型看到它們在歷史上犯的錯誤時,它們在未來的回合中更可能犯錯誤。 > 增加模型規模使這個問題更糟 - 這是逆向擴展的罕見案例! 那麼思考呢……? > 思考不是幻覺。它是執行的引擎! > 即使DeepSeek v3、Kimi K2在沒有CoT的情況下被要求執行5個回合時也無法執行…… > 有了CoT,它們可以多做10倍。 那麼前沿呢? > GPT-5的思考遠遠領先於我們測試的所有其他模型。它可以一次性執行1000+步的任務。 > 第二名是Claude 4 Sonnet,432步……然後是Grok-4,384步。 > Gemini 2.5 Pro和DeepSeek R1遠遠落後,僅有120步。 > 這就是為什麼GPT-5被命名為Horizon嗎?🤔 > 開源還有很長的路要走!;) > 讓我們一起成長!我們發佈所有代碼和數據。 我們進行了長時間的深入研究,並為您呈現最佳要點和精彩圖表 👇
101
Derya Unutmaz, MD
9月12日 10:22
GPT-5 Pro 又一次令人震驚的壯舉:僅憑一張照片就診斷出一個兒童罕見的遺傳性皮膚病! 這是我一位醫生朋友的病人,確立該病例的真實診斷花費了數月時間,並需要詳細的病理分析!
258
熱門
排行
收藏