OCRs de PDFs no GNU/Linux: Estudando com textos e não prints

Quem nunca foi estudar para a faculdade com um PDF e descobriu que não conseguiria marcar o texto ou copiar e colar seu conteúdo?
Que aquele lindo PDF em vez de ser um agradável texto a ser anotado e copiado mais parecia um print em que somente poderíamos fazer riscos ao redor dignos de uma criança de 7 anos no Paint?

A solução para isso é gerar um novo PDF utilizando alguma tecnologia de reconhecimento óptico de caracteres (OCR: Optical Character Recognition).

Read More

Sobre o livro Sob três bandeiras: Anarquismo e imaginação anticolonial

Deixo aqui um comentário sobre o livro “Sob três bandeiras: anarquismo e imaginação anticolonial” de Benedict Richard O’Gorman Anderson. Gostei bastante do mesmo, é um bom mergulho na apaixonante cena política de finais do século XIX.
Ah, a versão que li é em espanhol (Bajo tres banderas: anarquismo e imaginación anticolonial) e dizem que pode ser encontrada no famoso libgen[ponto]io.

Read More

Criando lindos PDFs a partir de livros ou xerox

(Atualizado em 15/12/2018. Agora temos ferramentas livres para todo o processo, incluindo o OCR.)

Quem nunca foi salvo por um PDF para estudar na universidade?

Quem costuma estudar por PDFs deve estar acostumado a encontrar PDFs de toda qualidade. Desde aqueles que são nada mais que fotos grosseiras e desfocadas de um xerox de 2 páginas lado-a-lado até aqueles que cada página está visível e bem enquadrada (para ler num e-reader) e podemos selecionar/copiar/colar o texto com o mouse.

Veremos aqui como fazer PDFs desse último tipo. E no GNU/Linux, tudo software livre!

Read More