最短ルートで
生成AIを使いこなしたい方へ
- 生成AIを使ってみたが、思うような
結果が出ない - 生成AIの活用方法がわからない
- AIを使って業務を効率化したい
生成AIコース無料体験してみませんか?

- 無料で120以上の教材を学び放題!
- 理解度を記録して進捗管理できる!
- テキストの重要箇所にハイライトを
残せる!
1分で簡単!無料!
無料体験して特典を受け取るコンテキストウィンドウとは
生成AIやLLMを扱うとき、必ず出てくる用語がコンテキストウィンドウです。AIが一度のやり取りで記憶し、処理できる情報の上限を指します。
わかりやすくたとえると、作業机の広さに近い概念です。机が広ければ、資料やマニュアルを何冊も同時に広げて作業できる。狭ければ、新しい書類を出すたびに古い書類を片付けなければならない。AIにとってのコンテキストウィンドウも同じで、容量が大きいほど、長い会話の文脈を保ったまま応答したり、分厚いドキュメントを丸ごと読み込んで分析したりできるようになります。
サイズの単位は「トークン」
コンテキストウィンドウの大きさは、文字数や単語数ではなくトークンという単位で測ります。トークンとは、AIが言葉を処理するときの最小単位です。英語では1単語がおおむね1トークンに対応し、日本語ではひらがなや漢字が混在するため、1文字あたり0.7〜1トークン以上になるケースが多いとされています。モデルによって換算率は変わります。
押さえておきたいのは、コンテキストウィンドウの上限が入力と出力の合計で計算される点です。たとえば長文の要約を依頼する場合、入力する文章だけでなく、AIが生成する要約文のトークンもウィンドウに含まれます。入力だけで枠を使い切ると、AIは回答を出すスペースを失い、文章が途中で途切れてしまいます。
容量の限界を超えるとどうなるか
コンテキストウィンドウには必ず上限があります。たとえば上限が4,000トークンのモデルで、会話が5,000トークン分に膨らんだとしましょう。AIはスライディングウィンドウと呼ばれる挙動をとり、古い会話の内容から順に切り捨てていきます。直前に話した内容であっても、ウィンドウの外に押し出されてしまえば、AIはその話題を把握できません。
最新モデルの動向
2026年2月現在、コンテキストウィンドウは急速に広がっています。かつては数千トークンが主流でしたが、GPT-4oが128,000トークンに対応し、文庫本数冊分のテキストを一度に扱えるようになりました。OpenAIが2025年12月にリリースしたGPT-5.2では、コンテキストウィンドウが400,000トークン、最大出力が128,000トークンまで拡張されています。Anthropicも2026年2月にリリースしたClaude Opus 4.6で、Opusシリーズとして初めて1,000,000トークンのコンテキストウィンドウをベータ提供しています。
大容量化が進む背景には、いくつかの実務上の要請があります。
・長時間のチャットや複雑なコードのデバッグで、最初に提示した要件を最後まで保持したまま一貫した回答を得たいという需要。
・膨大な契約書や論文の中から、たった一行の事実を正確に拾い上げる精度への期待。
さらに、外部の知識をプロンプトとして大量に渡すことで、AIが事実と異なる内容を生成するハルシネーションを抑えたいという狙いもあります。
ただし、ウィンドウが大きければそれだけでよいわけではありません。サイズを大きく使えば計算リソースの消費が増え、利用コストが上がり、応答速度も落ちます。加えて、情報量が多すぎると、文章の中間部分にある情報を見落とす現象が起きることもわかっています。長い文脈を与えたとき、言語モデルが冒頭や末尾の情報ばかりを優先し、真ん中付近の内容をうまく拾えなくなるもので、Lost in the Middleと呼ばれています
※参考:Liu et al., 2024, Transactions of the Association for Computational Linguistics, https://aclanthology.org/2024.tacl-1.9/
実務では、必要な情報だけを選別してAIに渡すRAGのような技術と組み合わせて運用するのが一般的です。
まとめ
コンテキストウィンドウの概念は、AIへの指示の出し方であるプロンプトエンジニアリングや、AIを組み込んだアプリケーション開発の土台になります。作業机の広さと制約を意識するだけで、AIから引き出せる回答の質は大きく変わります。
関連記事
【用語】プロンプトエンジニアリングとは


