日韩av免费在线观看-看毛片网站-久久91视频-黄色伊人-伊人久久中文字幕-日日干天天射-天天做天天操-91美女在线-亚洲天堂小说-深夜网站在线观看-婷婷激情电影-亚洲成熟女性毛茸茸-99久久人妻无码精品系列-成人久久久久久久-久久男女视频-91国内精品视频-亚洲美女在线播放-欧美草b-一边操一边摸-麻豆传媒最新网址-北条麻妃久久精品-婷婷久久丁香-最新av电影网站-午夜剧场一区二区-www国产黄色-波多野吉衣在线观看视频-日韩欧美一区二-欧美性大战久久-日韩精品射精管理在线观看-日本护士体内she精1

當前位置: 首頁 > 體育 > 電競

谷歌、OpenAI爭相讓旗下AI玩《精靈寶可夢》游戲:衡量AI真正實力

2026-01-25 23:36:57

體育資訊01月25日稱 據(jù)科技媒體 Tom's Hardware 今天報道,當今時代我們有無數(shù)種跑分測試和評測方法來衡量 AI 的聰明程度與能力,但最近一種相對小眾的測試方法也在 AI 圈內引發(fā)關注。

目前,谷歌、OpenAI 和 Anthropic 等 AI 巨頭正在讓自家模型游玩經(jīng)典的《精靈寶可夢》系列游戲,以此來評估 AI 性能表現(xiàn)。

Anthropic 公司 AI 部門負責人 David Hershey 對此表示:“《精靈寶可夢》之所以能吸引機器學習社區(qū)關注,是因為它不像《Pong》等簡單游戲那樣受限。這種游戲對電腦程序來說非常具有挑戰(zhàn)性”。

Hershey 從去年開始在 Twitch 平臺進行直播,每天的日常就是用公司自產模型 Claude 玩《精靈寶可夢》。這名負責人平時的工作就是幫助客戶部署 AI,因此他開直播本質上也是在測試模型。

這名負責人給自家 AI 直播游戲的做法也啟發(fā)了不少自由開發(fā)者,他們也陸續(xù)搞了“Gemini 玩《寶可夢》”“GPT 玩《寶可夢》”等類似的直播節(jié)目。

后來,這些直播甚至被谷歌和 OpenAI 注意到,開發(fā)團隊有時還會客串直播間親自調整模型參數(shù),在官方力量注入下,Gemini 和 GPT 已經(jīng)成功通關了 Gam Boy 時代的《寶可夢藍》,目前已在挑戰(zhàn)續(xù)作;而 Claude 至今還沒打通任何一個版本。

至于為何要用《寶可夢》評估 AI 性能?Hershey 對此解釋道:“因為它給我們提供了直觀的方法觀察模型表現(xiàn),還能用量化指標評估性能”。

通常來講,玩家在《寶可夢》系列游戲中需要升級、訓練已有 / 剛抓的寶可夢,還要打敗道館館主來捕捉新的寶可夢。這種游戲流程并非線性,而是充滿著判斷和取舍。

而且,玩家還要經(jīng)常在游戲中做出選擇:是先冒險挑戰(zhàn)強大的訓練家以獲取珍稀寶可夢,還是穩(wěn)扎穩(wěn)打造出一支實力均衡的隊伍。

顯然,人類非常擅長做此類決策,這也是游戲的樂趣所在,但對于 AI 來說,這是一場關乎邏輯推理、風險評估以及長期規(guī)劃能力的綜合考驗。

因此研究人員會深入剖析 AI 在游戲里的決策方式,深入理解模型的能力邊界。

Hershey 還會將 AI 玩《寶可夢》的結果分享給客戶以改進控制框架(IT之家注:harness),幫助他們提升算力使用效率,讓模型更高效運轉。

主站蜘蛛池模板: 粗长+灌满h双龙h男男室友猛 | 中文在线视频 | 免费av在线播放 | 羞羞漫画在线观看 | 中文久久| 亚洲综合在线视频 | 日本一区二区三区在线观看 | 中国熟老太另类 | 搡老岳熟女国产熟妇 | 成人免费观看视频 | 黄瓜视频在线观看 | 嫩草91 | 三级网站| 羞羞漫画免费观看 | 少妇高潮灌满白浆毛片免费看 | 精品视频在线观看 | 伊人久久综合 | 欧美激情一区二区三区 | 国产成人免费 | 一级a毛片 | 欧美激情一区二区 | 欧美国产一区二区 | 91涩漫成人官网入口 | 中文字幕一区二区三区四区 | 日韩二区| www久久久 | 欧美影院 | 免费看a | 九九热精品视频 | 亚洲午夜精品久久久久久人妖 | 91成人在线观看国产 | 黄色三级网站 | 免费三片在线观看网站v888 | 在厨房拨开内裤进入毛片 | 一区二区精品 | 日韩成人在线观看 | 国产欧美精品 | 97在线观看 | 日本理论片| 捆绑调教视频 | 国产在线一区二区 | 97影院 | 乖乖女的野男人们np | 毛片毛片毛片 | 色婷婷av | 国产一区在线播放 | 黄色网址在线播放 | 日本免费网站 |