t>

TRENDING

#1 アステモ、執行役員を解任子会社社長も交代「職務遂行の適切性に問題」

#2 FIFAワールドカップ2026 日本代表放送・試合日程・結果・出場国一覧｜最新情報まとめ

#3 日本vsスウェーデン戦の主審はイヴァン・バートン氏カタールW杯ドイツ戦やJ1でも笛

#4 JCB社員がInstagramに社内資料を投稿か同社が調査中

#5 「休日イオンモールおじさん」ファッションが揶揄される本当の理由とアップデート術

#6 FIFAワールドカップ2026：全大会情報と日本代表最新ニュースまとめ

#7 川口ケアマネ刺殺、訪問直後に男が通報「刺した。自分も刺す」

#8 マクドナルド公式X「怒らないから、だれがやったか正直に言いなさい」投稿にネット反響

#9 FIFAワールドカップ2026：開催概要、放送·配信情報、日本代表日程、全48出場国のグループ分けを徹底解説

#10 首相専用車、SUVに新調　トヨタ「センチュリー」、走る執務室が進化

水曜日, 01 7月 2026

AI自律タスク処理時間、予想超えるペースで拡大　MythosとGPT-5.5が新境地

1 minutes reading View : 23

Aiko Yamamoto

IT - 14 5月 2026

AIエージェントが自律的にタスクを処理できる時間が、研究機関の予想を上回る速さで伸びている。複数の第三者機関による最新評価では、米Anthropicの「Claude Mythos Preview」（Mythos）や米OpenAIの「GPT-5.5」といった最新モデルが既存モデルの性能を大きく上回り、現在の評価環境が測定限界に達しつつあることが明らかとなった。

米国の非営利研究機関METRは5月8日、Mythosの評価結果を公開し、同モデルが50％の確率で完遂できるソフトウェアエンジニアリング、機械学習、サイバーセキュリティに関するタスクの長さ（50％タイムホライズン）を「16時間以上」と算出した。METRは現行の測定に使用しているタスク群では、16時間を超える測定が信頼性に欠けると指摘し、同モデルの能力の上限を正確に評価できていないとした。

Read Also

埼玉・横瀬町でAIクマ検知システム実証実験、迅速駆除に期待

英国の政府機関AI Security Institute（AISI）は2月、AIモデルが80％の確率で完遂できるサイバーセキュリティ関連タスクの長さ（80％タイムホライズン）が2024年後半以降「4.7カ月ごとに倍増」していると推定。これは25年11月時点の試算「8カ月ごと」から大幅に加速している。

しかし、その後公開されたMythosとGPT-5.5はこの推定値をさらに上回った。AISIはこの成長スピードが新たなトレンドになるのか、これらのモデルが特殊なのかは不明だとしている。

METRとAISIは、AIの性能が想定を上回る速さで向上している状況を受けて、より高性能なモデルを評価できる手法を開発中だとしている。

編集部注：この記事はAIを使用して作成されており、ITmedia NEWSの記事を元に、内容を変更せずにリライトしたものです。

Read Also

英政府機関が評価、GPT-5.5のサイバー攻撃能力は一部「Mythos超え」

aiエージェント ai自律タスク処理 claude mythos gpt-5.5 llm性能測定 metr評価サイバーセキュリティソフトウェアエンジニアリングタスク完遂時間機械学習

Share Copied

Related posts

27 6月 2026

中島聡が教える！本の選び方とスペースX投資のリスク

10 5月 2026

産経ニュース「高市日誌」がGoogle優先表示、ワンクリック登録開始

17 6月 2026

7歳で仏門に入った尼僧が開山、足立区・東京大恩寺にベトナム人数百人が集結

05 6月 2026

NY原油反落、前日比2.98ドル安の終値93ドル台、米イラン巡り供給不安後退

17 6月 2026

住友電工システムソリューション、車載IoT「Eagle Sight」を出展人とくるまのテクノロジー展2026

08 5月 2026

おぎやはぎ、21年ぶり『明石家電視台』出演観覧者からの直球質問に回答

Trending Post

01.

ハーランド終盤決勝弾！ノルウェー、W杯決勝T初勝利…コートジボワールとの熱戦制し16強入り

01 7月 2026

02.

仙台「伝説のママ」経営の五葉商事、自己破産申請へコロナ禍で売上激減、負債5億円超

30 6月 2026

03.

令和8年路線価2.9%上昇、5年連続銀座が41年連続最高

01 7月 2026

04.

デンソーが2026年5～6月付の上席執行幹部・執行幹部の異動を発表 | 自動車部品業界ニュース

30 6月 2026

05.

ミラン、PSGからポルトガル代表FWゴンサロ・ラモスを完全移籍で獲得　移籍金総額約129億円

30 6月 2026

Wカップ

川崎Fにブラジル人2選手が加入…FWカイキ・ケイロスが期限付き移籍、DFペドロ・ホマーノは完全移籍

01 7月 2026

久保建英、一体感ある現代表に自信「同じクラスの学年が上がっていく感覚」4年後へは「コツコツ頑張りたい」

01 7月 2026

冨安健洋、W杯敗退から一夜明け「結局負け方は一緒」と指摘「1ミリ、1歩、1秒を詰めるしか」

01 7月 2026

タイトル：

01 7月 2026

Latest Post

カーメイト、数量限定「風鈴の香り」「夏祭りの香り」専用オイル発売

自動車 - 01 7月 2026

アフラック顧客情報漏えいで金融庁が報告命令　約23万人分の銀行口座情報も含まれる

経済 - 01 7月 2026

JX金属、上場1年で株価5倍 AIブーム以外の好調要因

経済 - 01 7月 2026

世界銀行、2031年までに中国向け融資終了へ　トランプ政権の働きかけで

国際 - 01 7月 2026

Category

カーメイト、数量限定「風鈴の香り」「夏祭りの香り」専用オイル発売

01 7月 2026

アフラック顧客情報漏えいで金融庁が報告命令　約23万人分の銀行口座情報も含まれる

01 7月 2026

JX金属、上場1年で株価5倍 AIブーム以外の好調要因

01 7月 2026

世界銀行、2031年までに中国向け融資終了へ　トランプ政権の働きかけで

01 7月 2026

正確で、速く、信頼できるニュースをあなたに

©OlaSonic. All Rights Reserved.