algumas observações sobre as últimas revisões:
- fragmento de palavra - palavra ficou por inteiro na página anterior e o restante da palavra não foi deletado da página seguinte;
- parágrafos interrompidos - há dicas no blog para identificar estas ocorrências durante a revisão;
- erros de grafia - atualização da língua;
- vários erros de TAG - com a planilha "caçadora de TAGs" eu consigo identificar a maior parte dos problemas de abertura e fechamento;
- palavras que perderam o acento ou o hífen - algumas não foram atualizadas;
- palavras com espaço após o hífen e/ou várias ocorrências de espaço antes da pontuação. A impressão no original faz com que o OCR coloque estes espaços É necessário observar com cuidado para excluir.
Ex: textotexto ;
Ex: água- benta
- tabelas com duas colunas ou mais: não tentar reproduzir. Caso seja possível editar a tabela, utilizando hífen para separar os dados, não faz sentido colocar também a informação de [Ver tabela no original]. Uma coisa invalida a outra;
- letra "O" no lugar do "0" (zero) - o OCR muitas vezes transforma o zero em letra "o", por conta da tipografia no original. O ideal, para melhor identificação, é configurar o Notepad com uma fonte (letra + tamanho) que permita visualizar bem esta diferença;
- bibliografia - muitas ocorrências de títulos de obra sem TAG itálico;
- hífen: no original há vários hífens e travessões, porém o OCR os converte como "--" ou "---". Em muitos livros o hífen ficou assim e/ou numa mesma página ficaram os dois tipos: "-" e "— ". É recomendável, desde as primeiras páginas, uniformizar/padronizar.
Nenhum comentário:
Postar um comentário
Deixem seus comentários e/ou suas dúvidas:
Observação: somente um membro deste blog pode postar um comentário.