ブラウザエージェント14製品比較｜結局Cometが最強だった【2026年5月・日本で動くか検証】

はじめに

Safari を開かなくなって、半年が過ぎた。

きっかけは Perplexity の Comet を試しに入れたことだった。最初は「サブのブラウザ」のつもりだった。それがいつの間にかメインになり、OS標準の Safari はほとんど起動しなくなった。ブックマークも、ログインも、日々の調べものも、気づけば全部 Comet に移っていた。半年使って、戻る理由が見つからない。

仕事がら、新しいツールは一通り触る。ブラウザエージェントもそうだ。無料枠があるものは片っ端から入れて、しばらく使う。Atlas を試し、Sigma を試し、Dia を眺め、Claude を拡張で同居させた。そして、たいてい Comet に戻ってくる。

戻ってくる理由は、いつも同じだ。要約はもう、どれを使っても大差ない。 タブをまたいで読む、ページを要約する、検索結果を束ねる——この「読む」側の能力は、2026年に入ってほぼ横並びになった。だから「要約が賢いから乗り換える」という動機は、もう成立しない。

ではどこで差がつくのか。「動かす」側と、「日本で実際に動くか」だ。 どれだけ高機能を謳っても、日本で自律操作が動かなければ、エージェントとしては使えない。この記事は、その物差しで、2026年5月時点で日本から触れる主要14製品を並べ直し、一つずつ評価した記録である。結論を先に言えば、私の答えは2枚で足りている。主軸が Comet、詰まったら Claude in Chrome。なぜそうなるのかを、製品ごとに分解する。

評価の物差し——「読む」より「動かす」

まず、評価軸を固定する。混ぜると判断を誤るからだ。

ブラウザエージェントの能力は2つに分けて見る。読む軸（アシスタント力）＝要約・横断質問・リサーチ深度。動かす軸（エージェント力）＝クリック・フォーム入力・予約・購入を最後までやり切る力。要約が上手いことと、予約を完遂することは、まったく別の能力だ。

読む軸は、もう天井に張り付いている。Comet のリサーチ統合、Gemini の Workspace 連携、Edge の最大30タブ横断推論。どれも体感差は小さい。読む軸はコモディティ化した。 ここで勝負を挑んでも大手の無料機能に埋もれる。差がつくのは動かす軸だ。そしてここは、まだ各社バラバラに割れている。

もう一段、構造を足す。製品がどこで動くか（実行レイヤ）だ。私はこれを3つに分けている。

母艦型（専用ブラウザ）：Comet、Atlas、Opera Neon、Fellou、Dia、Sigma、Genspark。ブラウザを丸ごと差し替える。ログイン済みセッションをそのまま使えるのが利点。
同居型（拡張・サイドパネル）：Claude in Chrome、Gemini in Chrome、Copilot in Edge。いまのブラウザにAIを後付けする。乗り換えコストがほぼゼロ。
委託型（クラウドVM・常駐）：Manus など。クラウドに丸投げし、PCを閉じても動く。24時間稼働が利点だが、クレジット消費が読みにくい。

この3類型は排他ではない。強いツールほど複数レイヤを持つ。どのレイヤで動かすかを意識せず「自動操作が強い／弱い」を語るのは雑だ。

ローカルセッションという「堀」、そして二階建てコスト

2026年の本当の決定要因は、認証だと思う。

ブラウザエージェントの最大の壁は、ログイン・CAPTCHA・二要素認証だ。ここで止まると、どれだけ賢くても予約も購入も完遂できない。そして、この壁をいちばんきれいに越える方法は賢さではない。あなたがすでにログインしているセッションに、そのまま乗ることだ。 母艦型（Comet が典型）はここで構造的に有利になる。私はこれを「ローカルセッションの堀（モート）」と呼んでいる。技術の優劣ではなく、立地の優劣だ。Comet を半年使って詰まりが少ないのは、賢いからというより、この立地のおかげが大きい。

ただし堀には例外がある。金融・銀行系は各社そろってブロックする。 ショッピングや一般SaaSは通すが、金融機関では止まる設計だ。「金融まで自律でやってくれるエージェント」を期待すると、どれを選んでも裏切られる。堀が効くのはEC・予約・SaaS業務までだ。

コストの話も構造で押さえておく。ブラウザエージェントの費用はしばしば二階建てになる。一階がサブスク（月額固定）、二階がAPI従量だ。ChatGPT Plus / Claude Pro のサブスクで日常使いはまかなえるが、自分のワークフローにAPIを組み込んだ瞬間、二階が乗る。逆に、本体無料の Comet はこの二階を気にしなくていい。いちばん財布に優しいのは「本体無料の母艦型」——これが、後述する有料勢との決定的な差になる。

評価一覧——「日本で動くか」を最優先する

ここで本稿の採点基準を明示しておく。評価は「日本から、実際にエージェントとして動くか」を最優先する。 どれだけ高機能でも、日本で自律操作が動かない・そもそも機能がないものは、おそ松でも動く製品の下に置く。机上のスペックではなく、いま日本で手が動くかどうかで序列をつける。

ツール	経験	実行レイヤ	日本で動くか	評価
Perplexity Comet	多用	母艦	◎ 主力で常用	S
Claude in Chrome	多用	同居	◎ 詰まり時の相棒	A
ChatGPT Atlas	試用（初期・有料）	母艦	△ 動くが粗い	B
Opera Neon	試用	母艦	○ 動くが定着せず	B−
Fellou	試用	母艦	○ 動くが新興	C
Sigma	試用	母艦	△ すぐ課金要求	C
Dia	試用	母艦	△ ほぼ非エージェント	C
Genspark	未試行	母艦／委託	○（伝聞）	C
Copilot in Edge	軽く試用	同居	△ 自律操作は米国限定	C
Felo	未試行	ホスト依存	△ 独自エージェントなし	C
Manus	未試行	委託	―（懸念で見送り）	保留
Gemini in Chrome	試せない	同居	✗ 自律操作が日本で不可	最下位
xAI Grok	試せない	非専用	✗ 専用機能なし	最下位

凡例：S＝主軸／A＝相棒／B〜C＝動くが定着せず／最下位＝日本でエージェントとして機能しない／保留＝懸念により未試行。並びはおおむね「動かす軸の成熟度 × 堀の強さ」で上位を取った。読む軸だけが強い製品は、有能でも下位に沈む。繰り返すが、読む軸ではもう差がつかないからだ。 以下、経験のあるものから順に、一つずつ書く。

主軸：Perplexity Comet（多用）

半年使って、これが主軸になった。

理由は3つに分解できる。一つ、読む軸が最強クラス。リサーチ統合・複数タブの関連探索・検索深度、どれも頭ひとつ抜けている。二つ、動かす軸も合格点。予約・購入・複数タブ自動化を日常レベルでこなす。三つ、ローカルセッションの堀が効く。母艦型ゆえ認証や CAPTCHA で詰まる場面が少ない。

具体的には、こういう使い方に収束した。調べものは、複数タブを開いてから「これらを横断して要点を整理して」と投げる。比較検討は、候補ページを束ねて表に落としてもらう。予約やちょっとした購入は、サイドのアシスタントに手順ごと任せる。どれも、以前は Safari と検索エンジンを行き来して手でやっていた作業だ。それが一つのウィンドウの中で完結するようになった。乗り換えコストを一度払いきってしまえば、戻る動機が消える。

そしてこの3つが、本体無料という値付けの上に乗っている。Comet は全プラットフォームで無料化した（Mac/Win、Android/iOSも対応）。読む・動かす・堀の三拍子が追加費用なしで手に入る。私が Safari を開かなくなったのは、Comet が完璧だからではない。「これで足りてしまう」からだ。 開発者向けに Sonar API を併用すれば二階建てになるが、日常使いの範囲なら関係ない。

唯一、留保があるとすれば「賢すぎて任せきってしまう」リスクだ。母艦型は堀が効くぶん、認証済みのセッションでするすると動く。だからこそ、金融系を各社がブロックしているのは正しい設計だと思うし、こちらも「どこまで任せるか」の線は自分で引いておく必要がある。便利さと無防備さは、裏表だ。

相棒：Claude in Chrome（多用）

Comet も万能ではない。ときどき、つむじを曲げる。

こちらの指示をうまく汲まない、特定のサイトで妙に粘る、同じところを行き来して止まる——そういう日がある。そのとき私は無理に Comet で押し切らない。Chrome に同居させた Claude in Chrome に切り替える。 これでたいてい片がつく。

Claude in Chrome は全有料プランのベータで開放された同居型だ。専用ブラウザを作らず、いまの Chrome にAIを同居させる。多タブ操作・フォーム入力の信頼性はトップクラスで、Admin・ブロックリストなどガードレールも揃う。Comet が母艦として日常を回し、Claude が同居の相棒として「詰まった局面」を引き取る。役割が綺麗に分かれている。この二枚で、もうほとんどの用が済む。

切り替える局面は、だいたい決まっている。Comet が同じ画面で堂々巡りを始めたとき。指示の意図を取り違えて、こちらの想定と違う方向に進み出したとき。あるいは、少し込み入った手順を、丁寧に分解して踏ませたいとき。そういうときは Chrome を開いて Claude に同じ仕事を渡す。スクリーンショットを読ませ、何をしようとしているかを言葉で確認しながら進められるので、暴走しにくい。母艦の速度と、同居の慎重さ。この二つを場面で使い分けるのが、いまの私の最適解だ。

試したが、定着しなかったもの

無料枠を巡って一通り触った。だが主軸を張らせるには、どれも一歩足りなかった。Comet と Claude 以外は、金を払えと言う割に完成度が高くない——これが正直な総括だ。

ChatGPT Atlas（試用・初期に有料で）

出始めの頃、私はまだ ChatGPT の有料プランに入っていたので、何度か使ってみた。結果は芳しくなかった。動きがお粗末で、おまけに回数制限がタイトだった。 どのくらいタイトか。agent mode の月間上限は Plus が40回、Pro が400回（カウントされるのは利用者が起動したリクエストのみで、途中の確認・認証ステップは非カウント）。Plus の40回は、少し本気で使うと1週間で枯れる水準だ。実際「使い始めてすぐ上限」という声は当時から多かった。agent mode は Plus/Pro/Business のプレビューという位置づけで、複雑なタスクではすぐ崩れる。EC・フォーム業務の設計思想は買うが、私が触った実機の第一印象は「使い物にならない」だった。改善は進んでいるはずだが、印象を覆すには至っていない。だから「動くが粗い」のBに置いた。

Opera Neon（試用）

$19.90 の定額。Neon Do / Make / ODRA の役割分担と二重エージェント（ブラウザ内／仮想）は設計として面白い。手持ちの Claude / ChatGPT から実ブラウザを操作できる連携も独自だ。だが、定額を払ってまで主軸を張らせる完成度には届かなかった。「面白い」と「毎日使う」の間には、想像以上に深い谷がある。

Fellou（試用）

実行前に手順プランを提示し、承認後に動く「透明性」が売り。思想は好きだ。ただ複雑なレイアウトで止まる・ループする場面があり、新興ゆえ実績もこれから。透明性は評価するが、信頼して任せ切るには早い。

Sigma（試用）

端末内ローカルLLM「Eclipse」でオフライン動作・プライバシー検証可能を売りにする新興ブラウザ。期待して入れた。だが3回ほど検索したら、もう「金を払え」と出てきた。 呆れて、それきりほとんど使っていない。実際に使った範囲でも、いまいちだった。コンセプトは良いが、無料で評価させる前に課金を迫る設計に、気持ちが冷めた。

Dia（試用）

Arc の開発チームが軽量・Chrome風に作り直したAIブラウザ。Atlassian 傘下でエンタープライズ向けに転換中だ。触ってみての印象は、エージェントというより「AIウィンドウがただ横に付いているだけ」。ページ要約や質問応答はこなすが、マルチステップを自分でクリックして完遂する自律性は薄い。「賢いサイドバー」であって「動かすエージェント」ではない。

日本では出番がない——Gemini と Grok（最下位）

ここが、今回いちばん評価を動かした2つだ。机上のスペックは立派でも、日本でエージェントとして動かない以上、おそ松でも動く製品の下に置く。

Google Gemini in Chrome

残念ながら、日本では自律ブラウズが動かない。 自動でクリック・フォーム操作する auto-browse は米国限定のプレビューで、日本で使える Gemini in Chrome は要約・最大10タブ横断・ページを開く程度。Workspace 連携は魅力的なだけに、肝心の自律操作が国境で止まる。OSレベルの自動ブラウズが Android に降りてくる動きもあるが、いまこの瞬間、日本のデスクトップではエージェントとして機能しない。だから最下位だ。動かないものは、粗くても動くものより下になる。

xAI Grok

Xのリアルタイム情報と DeepSearch は他社より圧倒的に強い。あの勢いでブラウザを操作したら、どんな暴れっぷりを見せるのか——正直、一度見てみたかった。だが、そもそも専用のブラウザエージェント製品がない。 Grok Computer のデスクトップ操作 beta はあるが、Comet や Atlas のような「GUIセッションを自律操作する専用ブラウザ」は未提供だ。機能がないなら、評価のしようがない。期待込みでも、最下位に置くしかない。

触っていない——Manus という宿題

委託型の最強候補とよく挙がるのが Manus だ。Browser Operator と Wide Research、クラウドVMで、認証付きサイトの長時間タスクに強いとされる。だが私は契約しておらず、実機では一度も触っていない。 だからまず、評価は保留する。

そのうえで、触っていない理由がもう一つある。会社の素性だ。 Manus は北京（親会社 Butterfly Effect）で生まれ、2025年半ばにシンガポールへ移転、年末に Meta が約20億ドルで買収した。ところが2026年4月、中国のNDRCが安全保障を理由にこの買収の解消を命令。6月時点で Meta は事業を分離しデータ共有を遮断、創業者は出国を制限され、約10億ドルでの買い戻し・香港上場の観測が出ている。つまり、いったん成立した買収が巻き戻され、中国当局の影響圏に引き戻されつつある。

ブラウザは、ログイン情報とセッションの塊だ。その自動操作を、国家が戦略資産として扱い買収まで巻き戻させた企業に任せるのは——いまの私には、ためらいがある。性能の問題ではなく、預けるデータの機微の問題だ。状況が落ち着けば評価を見直すかもしれない。今のところは宿題のまま、棚に上げておく。

なお Genspark（Mixture of Agents の超エージェント型）、Felo（独自ブラウザを持たない多言語リサーチ層）、Microsoft Copilot in Edge（最大30タブ横断は強いが自律操作は米国限定）も、私の使用頻度は低い。Copilot は既に M365 を使う組織には有力だが、個人の「クリックして買う」用途では出番が薄かった。これらは未試行・軽く触れた範囲の評価にとどめる。

結論：二枚で足りる、それを動かすもの

冒頭の問いを回収する。なぜ私は Safari をやめ、Comet に落ち着いたのか。

要約で差がつかなくなったからだ。読む軸がコモディティ化した以上、「読む側の見栄え」で母艦を選ぶ理由は消えた。残った判断基準は「動かす軸の信頼性」と「ローカルセッションの堀」、そして「日本で実際に動くか」。この3つを同時に満たし、しかも無料化したのが Comet だった。完璧だからではない。これで足りてしまうからだ。

詰まったときの相棒が、Chrome に同居した Claude in Chrome。主軸が母艦、相棒が同居。委託型には、いまのところ手を伸ばす必要がない。二枚で足りているうちは、わざわざクレジットを燃やす理由も、素性に懸念のある委託先に鍵束を預ける理由もない。

では、何が私を Comet から引き剥がすのか。要約の賢さではない。それはもう天井に張り付いている。私のデフォルトを次に動かすのは、「動かす軸の信頼性が一段跳ねる」か、「日本で動かなかったものが動くようになる」か、どちらかだ。 Gemini のオートブラウズが日本で解禁され、Workspace 連携と地続きで自律操作できるようになったら——そのときは、もう一度この地形を測り直す。

この記事は、2026年5月時点の見取り図にすぎない。料金も、対応国も、買収の行方も、この分野は数週間で動く。状況が変わったら、また更新していく。 それまでは、メインの Comet と、相棒の Claude in Chrome で。Safari のアイコンは、Dock の隅で静かに眠っていてくれて構わない。

生成AI 8人と付き合った記録——ChatGPTとは友達に戻った（AIサブスクの擬人化。本稿の「主軸と相棒を使い分ける」思想と共鳴する）
Tesla車外ライブカメラ、日本だけ使えないのは規制のせいではない（「日本で動くか」という本稿の評価軸と地続き。機能が国境で止まる構造を別角度から）

FAQ

結局どれを最初に入れればいい？

専用ブラウザに抵抗がなければ、本体無料化した Comet。詰まったとき用に、Chrome へ Claude in Chrome を同居させておくと盤石。この二枚でほとんどの用が済む。

日本で Gemini のオートブラウズや Grok のブラウザ操作は使える？

2026年5月時点では、どちらも実用にならない。Gemini の自律 auto-browse は米国限定プレビュー、Grok は専用のブラウザエージェント製品自体がない。本稿が両者を最下位に置いたのはこのためだ。

Manus は任せて大丈夫？

性能は高いとされるが、本稿では保留。Meta による買収が中国当局の命令で巻き戻され、素性とデータの機微に懸念が残る。ブラウザは認証情報の塊なので、現時点では慎重に見ている。