2026年4月のAI評(ChatGPT / Gemini)

GeminiとChatGPTにそれぞれ20ドルプラン課金しています。

※例によって執筆にAIは使っていません

そろそろこの話題以外の記事も書きたいとは思っている。

ChatGPT 5.4

3月と比べるとChatGPTには 5.4 Thinkingが来ました。

先にCodexの方に5.4モデルが来ていて、その時から巷で言われていたのですが……話していてイライラします。

◯◯な見方です。〇〇寄りです。◯◯な形です……なんかこういう言い回しが目立つし、やたらと強調しまくります。文章が読みづらい。

Geminiでも同じ回答ができるな?と思えるような質問はGeminiに聞くようになりました。Geminiの回答はスッキリして読みやすいです。

しかし良い点を挙げるなら、やはりバージョンが上がるごとにハルシネーションが減っていることです。

5.2 Thinking1の時と比べると「それウソじゃない?」と思うことが圧倒的に減っています。

振り返ると5.4になってから「ファクトチェックして」という言葉を使っていないような気がします。

ちなみにこれ書いてる時にImages 2.0が来ました。

文字が強くなったらしいです。

我がブログ恒例の着物インスパイアガールベンチマーク

左 Images 1.5 / 右 Images 2<br/>日本のスタイルで、淡い線と淡い塗りで構成された女の子のイラスト。
こちらに向かって雪玉を投げてくる構図。
服は着物にインスパイアされた現代風のガーリーな冬の服装。
背景は透過する。
画像は縦長” class=”wp-image-6067″ srcset=”https://tsurugilog.com/wp-content/uploads/2026/04/image2.jpg 2107w, https://tsurugilog.com/wp-content/uploads/2026/04/image2-350×246.jpg 350w, https://tsurugilog.com/wp-content/uploads/2026/04/image2-1080×759.jpg 1080w, https://tsurugilog.com/wp-content/uploads/2026/04/image2-150×105.jpg 150w, https://tsurugilog.com/wp-content/uploads/2026/04/image2-768×539.jpg 768w, https://tsurugilog.com/wp-content/uploads/2026/04/image2-1536×1079.jpg 1536w, https://tsurugilog.com/wp-content/uploads/2026/04/image2-2048×1439.jpg 2048w, https://tsurugilog.com/wp-content/uploads/2026/04/image2-940×660.jpg 940w” sizes=”(max-width: 2107px) 100vw, 2107px”><figcaption class=左 Images 1.5 / 右 Images 2
日本のスタイルで、淡い線と淡い塗りで構成された女の子のイラスト。
こちらに向かって雪玉を投げてくる構図。
服は着物にインスパイアされた現代風のガーリーな冬の服装。
背景は透過する。
画像は縦長

新しい絵柄で出力されましたね。今まで見たことないスタイルなので、アップデートされてますね。なんか背景透過してくれなくなったけど……

Gemini

Lyria 3 がフルトラックに対応し、2〜3分程度の音楽が作成できるようになりました。

Whiskが終了し、Flowに統合されました。これは何かっていうと、Nanobanana(画像生成)やVeo(動画生成)に特化したメディア生成サービスですね。Gemini上でやるよりもそれらを扱いやすく、プロジェクトとして使えるみたいなサービスです。

肝心のGeminiの性能自体は相変わらず、回答自体は賢いものの検索をして裏付けをとったりしないので、ChatGPTよりも圧倒的にハルシネーションが多いです。

ただ文章は読みやすいし、応答は速いですね。「この程度、検索しなくても(=Geminiが持ってる知識だけでも)答えられるだろ〜」程度の質問ならGeminiに聞いたりもします。

逆に言えば、間違えて欲しくない質問だったり、最新の情報を参照してほしい場合はChatGPTに聞きますが。

WindowsとMacにそれぞれデスクトップアプリが来たのに加えて、日本にもGemini in Chromeが来ました。

Gemini in Chromeはまだ深く使えていませんが、ページ内の情報を自動で参照できるのは確かに良さそうですね。

ChatGPT産ブラウザAtlasでも同じことはできましたけど、普段使ってるブラウザで利用できるのはでかい……わざわざブラウザ乗り換えるほどじゃない……

アプリ版はデスクトップ版と比べてちょっと見やすいのがいいですね。チャットの表示がちょっと違うだけで見やすさが違うな〜と思いました。

ただ、不満点はいくつかあって……

  • アプリ版はなんでデフォで高速モードを使わせようとする???ブラウザ版は最後に使ったモデルをちゃんと表示してくれるのに……(なんか一番最初は「自動」モードがあったような気がするけど消えた……)
  • Gemini in Chromeと同じアイコンで同じ機能のものをメニューバーに追加するな。同じサービス内で競合するな
  • 気持ちはわかるが先発のChatGPTと同じ⌥ + Spaceをデフォルトのショートカットキーに被せるな

という感じ。まぁショートカットはともかく、なんでGoogle Chrome如きがメニューバーにGeminiアイコンを追加する????

現状としては見やすい以上にメリットはあんまないかな……

ウインドウを共有できるみたいだけど、Macってすぐスクショ撮ってそのまま(保存を介さず)ドラッグできるしな……

アプリ入れてそれを呼び出して……という認知コストを増やしてまで得られる恩恵はないかな、というのが現状。ちなみに同じ理由でChatGPTのアプリも使ってない2

手軽さという意味ではほとんど常に起動してるブラウザに統合されたGemini in Chromeの方がありがたいですね。

いいかい学生さん

4月なので学生ネタを。大学(や一部の高校)ではGoogle WorkspaceのEducationを契約してるので、ある程度(無料版より大枠で)Geminiの利用ができると思います。

もしそこから不足を感じて何かしら有料版を契約するときはChatGPTにしましょう。少なくとも今の時代は。

無料版のChatGPTはバカですが、有料版のChatGPTはかなり賢いです。

ThinkingはInstantとは雲泥の差です。ただまぁ、Thinkingが課金しないと使えないので伝わりづらいと思います。

XではClaude最強!という風潮もありますが、Claudeが最強なのはお金をジャブジャブ注ぎ込めるシチュエーションに限るので、3000円程度の課金しかしない場合はChatGPTが最強です。

Claudeは3000円程度の課金では冗談抜きですぐに上限が来ます。

さらに言えば無料の枠内ならGeminiが最強です。他なら有料モデルのProも使わせてくれるもん……そりゃすごいよ……

ただ”Gemini”に関して言えば過去に何度も書いてるけど結局自前で調べたりすることがないのでハルシネーションが激しい。私の使い方だと7割くらいまでしか信頼度がない。

資料とかのリソースが手元にあって、それを元にした作業ならGeminiでも問題ないんだけどね……

まぁただ、Nanobanana・Veo・Lyriaと言ったメディア系はかなり強く3000円課金で全部まとめて使えるのはかなり強みだな〜と思う。

もちろんそれらは特化型のサービスに使い勝手は劣るんだけど、コスパは圧倒的。動画制作とかしたい人はこっちかな〜と思う

AIにおまかせの時代がやってくる

最近はChatGPTのCodexをかなり利用しています。サービスの初期と比べるとやれることが増えたし、その名前からは分かりづらいですが、こいつはPC内のCLI3でできることはほとんど全て自動的にやってくれるアプリケーションです。

CLIでできることといえば、まぁPC内で完結することならほとんど全てやってくれます。

例えば「こういうアプリをHTMLで作って〜」と言えば簡単な個人用のツールを作成できますし、あるいは「このアプリを動作させる環境構築して〜」と頼めば自動的に導入してくれる。すごく便利。

一応GeminiでもAntigravityで同じことはできると思うけど、まぁコーディングベースなかエージェントベースか(コーディングが主か、そもそもCLIを動かすことが主か)の違いはあるので、Codexの方が使いやすいですね。

ちなみにこれをDiscordとかを経由して外部から(スマホとかから)アクセスできるようにするのがOpenClawと呼ばれるものですね。私は流石にそこまでしなくてもいいかな〜という段階なので使っていませんが。

今の所ブラウザ操作はできない(頑張ればできるらしい?純正だと無理)のでそこは残念です。

いずれにせよ、やがてPC作業のほとんどをエージェントに任せる時代がやってくるのかな〜と思います。

その流れだとMicrosoftのCopilotは最近はとりあえずいろんなものにCopilotをつける流れをやめてOfficeをはじえめとしたPC操作に舵を切り始めましたね。

そうなった時に覇権を握るのはGoogleかChatGPTか、はたまたMicrosoftか……とはいってもChatGPTも「スーパーアプリ」を作るとのことなので期待ですね。

と思ってたらCodexがアプリ操作可能になったとのこと。これはまだ試してないですが、いよいよPC操作をAIに託すのが当たり前になりそうですね。

おまけ:Grokについて

ちょっとずつ使用量が増えてるので書いておく。といっても無料で使ってて課金もしてないし、1日1回使うか程度だけど。

そんなに真面目に使ってないというか、X.comの検索がアホになってるのでその代わりに使ってるという程度。

自分で検索するよりもパッとすぐでるし、ある意味で時間を吸い取られないからそういう意味では結構便利です。ドゥームスクロールは悪だ……

少なくとも無料で使ってる分には、サブカル的やソーシャル的な正解のない文脈には強い一方で、正解を求められるし文脈には弱い印象。

特にChatGPTがアクセスできないXから情報を取得できるので、本当に何かの感想とかレビューとかを調べたいときには重宝します。

無料枠で性能を評価するわけにもいかないけど、有料プランが高い4……と思ってたらいつのまにか1500円のLite版が来てた。そのうち試すかも。

  1. Thinkingに関して言えば5.2→5.4なので5.3はありません。5.3はinstantのみ
  2. Codexが出る前のVS Codeとの連携ができる時代にはバリバリ使ってたけど
  3. Command Line Interface … つまりWindowsでいうコマンドプロンプトとかPowerShellとか、Macでいうターミナルとか。
  4. 5000円から

コメントを残す