チャンク化(Chunking)とは、長い文章や資料を意味のまとまりごとに分割し、AIが扱いやすい情報単位(チャンク)に整理する設計手法のこと。
適切にチャンク化することで、AIは質問に対して必要な情報だけを参照しやすくなり、誤回答や情報の抜け漏れを防ぎやすくなります。
一方で、チャンクが大きすぎると不要な情報が混ざりやすくなり、小さすぎると文脈が失われるため、用途に応じた粒度設計が重要です。
AIチャットボットやRAGの精度改善においては、単に情報を分割するだけでなく、どこで区切るか、どの単位を1チャンクとするかが実務上の成果を左右します。