Depende.
Tem cara que gosta de ouvir tudo rolando enquanto ele grava (lógico que em um volume mais baixo do que a voz, usando só como referência)... o mais comum é o uso de uma trilha "guia", então o cara escolhe um instrumento isolado pra ouvir junto com a voz (geralmente um instrumento que esteja executando a harmonia da música) assim ele tem uma noção melhor sobre onde colocar a voz e a entonação, além de facilitar a "afinação", pois está ouvindo a harmonia/acordes ao mesmo tempo... mas também já vi doido que grava só no metrônomo e ouvindo a própria voz...