どうも、株式会社ソフトクリエイト で情報屋やってます。山口です。
普段は企業様向けに Microsoft 365 活用のご支援をおこなっています。
最近の私はというと、ひたすら Microsoft 365 Copilot Cowork に仕事をお願いして、自分はあがってきたもののレビュー、手作業での微修正、社内打ち合わせ、次の企画づくりに時間を使う……という働き方がかなり増えてきました(^^;

Copilot Cowork は、Microsoft 365 環境の中で、メールの送信、会議のスケジュール、Word・Excel・PowerPoint・PDFの作成、Teams への投稿、予定表の管理、社内情報の検索などを、ユーザーの代わりに進めてくれるエージェント型の機能です。
正直、「Cowork × Work IQ、これはかなり仕事の形を変えるな」と日々感じています(^^
一方で、そんな強力なAI活用の裏側で、いま生成AI業界全体に大きな変化が起きています。
それは、生成AIの“使い放題感”が終わり、AI利用量をきちんと測り、管理し、最適化する時代に入ったということです(^^;
生成AIの「使い放題」が終わる日…これからの時代を勝ち抜くマルチAI戦略
■ いま何が起きているのか?Gemini API のレート制限は「AI利用のメーター化」を象徴している

今回、特に注目したいのが、Google Gemini API のレート制限に関する公式発表です。
この、Gemini API の利用制限が、主に以下のような単位で管理されることが説明されています。
| 指標 | 意味 |
|---|---|
| RPM | 1分あたりのリクエスト数 |
| TPM | 1分あたりの入力トークン数 |
| RPD | 1日あたりのリクエスト数 |
ポイントは、単に「1日何回まで使える」という単純な話ではないことです。
たとえば、RPM の上限が 20 の場合、1分以内に21回リクエストを送ると、トークン数に余裕があっても制限に引っかかります。つまり、回数・トークン量・日次上限のどれか1つでも超えれば止まるという考え方です。さらに、レート制限は API キー単位ではなく、プロジェクト単位で適用されます。プレビュー版や試験運用版のモデルは、より厳しい制限になる場合があるとも記載されています。
■ さらに重要なのは「ティア」と「請求」の考え方
Gemini API では、利用量や支払い状況に応じて使用量ティアが変わります。
無料枠から始まり、課金アカウントを設定すると Tier 1、一定の支払い実績を満たすと Tier 2、さらに大きな利用実績があると Tier 3 へ上がる構造です。公式ドキュメントでは、Tier 1 の請求先ティア上限は $250、Tier 2 は $2,000、Tier 3 は $20,000〜$100,000 以上とされています。
つまり、生成AIのAPI利用は、すでにかなり明確に「利用実績・支払い実績・上限管理」の世界に入っています。
■ GitHub Copilot も「AI Credits」へ
同じ流れは、開発者向けAIでも起きています。
GitHub Copilot は、2026年6月1日から使用量ベースの課金へ移行し、GitHub AI Credits という単位で利用量を測定する方式に変わりました。
従来のようなプレミアムリクエスト単位ではなく、入力トークン、出力トークン、キャッシュ済みトークンなど、実際にモデルが消費したリソースに応じてコストが計算されます。1 AI Credit は $0.01 USD とされ、利用するモデルとトークン量によって消費量が変わります。
ただし、すべてが課金対象になるわけではありません。コード補完や次の編集候補は、引き続き AI Credits の課金対象外です。一方で、Copilot Chat、Copilot CLI、Copilot クラウドエージェント、Copilot Spaces、Spark、サードパーティ製コーディングエージェントなど、モデルをしっかり呼び出す機能は AI Credits を消費します。
ここまでで、見えてくるのは、AIの世界が“1回使ったか”ではなく、“どれだけ重い処理をさせたか”で評価されるようになっているということです。
■ なぜ各社は制限や従量課金に舵を切るのか?

理由はシンプルで、高性能な生成AIほど、裏側で膨大な計算資源を使うからです(^^;
長いコンテキストを読み込み、複数ファイルを理解し、推論し、コードを書き換え、調査し、資料まで作る。私たちから見ると「自然文でお願いしただけ」に見えますが、裏側では大量のトークン処理とモデル実行が走っています。
しかも最近は、単発のチャットだけでなく、エージェント型AIが増えています。
エージェント型AIは、1回の依頼に対して、情報収集、分解、複数ステップの実行、再確認、出力生成を行います。便利な反面、1タスクあたりのAI消費量は大きくなりやすいです。
つまり、AI事業者側から見れば、これまでの“ざっくり定額”ではコスト構造と合わなくなってきた、ということですね。
■ これから重要になるのは「AIを使う力」ではなく「AIを選ぶ力」

これまでは、まずAIを使ってみること自体に価値がありました。
「とりあえずAIに聞いてみる」「とりあえず要約させる」「とりあえず壁打ちする」
この段階では、多少ムダ打ちしても経験値になりました(^^
しかし、これからは少し変わります。
AI利用にメーターが付き、モデルごとにコスト差が明確になり、重い処理ほど消費量が大きくなると、重要なのは“どのAIに、どの仕事を任せるか”です。
たとえば、日常的なメール要約や簡単な文章の下書きに、毎回もっとも高性能なモデルを使う必要はありません。一方で、経営方針の壁打ち、重要提案書の構成、複雑なコードレビュー、セキュリティ設計の整理などは、高性能モデルに任せる価値があります(^^v
■ 主要AIの使い分けイメージ
これからは、「一番賢いモデルを1つ契約すればよい」という考え方ではなく、業務内容に応じてAIを使い分ける発想が重要になります。
| 業務シーン | 向いているAIの考え方 | 理由 |
|---|---|---|
| 日常的な要約・下書き | 軽量・高速・低コストなモデル | 回数が多いため、コスト効率が重要 |
| 複雑な企画・事業計画 | 高推論モデル | 論点整理、仮説構築、構成力が重要 |
| コーディング支援 | 開発者体験に統合されたAI | IDE、リポジトリ、レビューとの連携が重要 |
| 機密性の高い社内データ処理 | 社内統制しやすいAI基盤 | データ保護、監査、権限管理が重要 |
| Microsoft 365 / Google Work space 業務の自動化 | Microsoft 365 Copilot / Cowork / Google Gemini | メール、予定表、会議、ビジネスファイルとの連携が強い |
この表で伝えたいのは、「どれが一番強いか」ではありません。
大事なのは、業務の難易度、頻度、機密性、必要な連携先、コスト許容度に応じて、AIをポートフォリオとして組むという考え方です。
■ まとめ:生成AIは“使い放題の魔法”から“設計して使う業務インフラ”へ
生成AIは、確実に次のフェーズに入っています。
これまでは、「とにかく使ってみよう」「AIで何ができるか試してみよう」という段階でした(^^;
これからは、「どのAIを使うのか」「どの業務に使うのか」「どのくらいのコストで使うのか」「どこまで自動化し、どこで人間が見るのか」を設計する段階です。
Gemini API のレート制限や課金設計、GitHub Copilot の AI Credits 化は、その流れを象徴する出来事だと思います(^^








