Esse é o trabalho mais importante e árduo do processo de digitalização, pois aqui é que serão reconhecidas as palavras chaves que servirão de pesquisa para aquele documento, uma indexação mal feita poderá gerar inconsistências na base de imagens.
A indexação pode ser manual ou automática. No primeiro caso uma série de digitadores executa o trabalho em cada documento. Aqui a preocupação é com o erro humano, pois campos digitados errados geram problemas de consistência. No segundo caso, um software de captura faz esse trabalho, mas o documento tem que ter um bom estado de conservação para que o reconhecimento dos campos seja satisfatório.
Pode-se fazer uma indexação mista, onde os documentos mais danificados são indexados manualmente e o restante seja automatizado.