入力と出力トークンの違い:なぜAIの料金設定はアウトプットの方が高いのか?

May 24, 2026
GPT-4oやDeepSeekなどのAPI料金表で、なぜ出力(Output)トークンは入力(Input)の3〜5倍も高いのか?GPU显カードの動作やLLM推論のハードウェアボトルネックからその理由を解説。
トークン料金
推論ステージ
Prefill
Decode
GPUメモリ
入力と出力トークンの違い:なぜAIの料金設定はアウトプットの方が高いのか? | TokenCalc.org