メインコンテンツへスキップ
#

#Humanity's Last Exam

1件の記事

AI News
15分

Humanity's Last Exam|AIベンチマークの最終試験で各モデルの実力が見えた

Nature誌掲載のAIベンチマーク「Humanity's Last Exam」を解説。Claude Opus 4.6やGemini 3 Proなど主要モデルのスコア比較、方法論の強みと弱点、そしてこの試験が示すAIの現在地。

#AI#ベンチマーク#Humanity's Last Exam#Claude