O que a ferramenta Comparar PDFs faz
Comparar PDFs pega dois PDFs, extrai o texto dos dois e mostra linha por linha o que mudou — o que foi adicionado, o que foi removido, o que continua igual. Solte o original num slot e a versão atualizada no outro, clique em Comparar e você tem uma visão de redline em alguns segundos. Escolha Lado a lado para o layout clássico de dois painéis que revisores de contrato esperam, ou escolha Unificado para uma única coluna com marcadores +/− (o formato que o git usa para diffs de código).
Uma coisa para dizer alto, porque é a pergunta que a maioria das pessoas faria primeiro: este é um diff de TEXTO, não um diff visual. A ferramenta lê o fluxo de conteúdo de texto de cada PDF e compara essas strings. Ela não compara layout, fontes, cores, imagens, assinaturas ou onde as coisas ficam na página. Se você precisa de comparação visual a nível de pixel, o recurso Comparar Arquivos do Adobe Acrobat é a ferramenta certa e falaremos disso de novo mais adiante. Para comparar as palavras em dois PDFs — que é o que 90% do trabalho de revisão de contrato, revisão de texto e monitoramento de política precisa — esta ferramenta tem o formato certo e roda em segundos.
Todo o pipeline roda no seu navegador. O PDF.js (o renderizador da Mozilla, o mesmo que vai dentro do Firefox) extrai o texto. O pacote diff — mesmo algoritmo usado pelo git e pela maioria das ferramentas de revisão de código — roda a comparação por linhas. Os PDFs nunca são enviados.
Como o diff funciona, em linguagem simples
O algoritmo se chama diffLines e a ideia é simples: encontre a maior subsequência comum de linhas entre os dois documentos, marque o resto como "adicionado" (linhas que aparecem no PDF atualizado mas não no original) ou "removido" (linhas que aparecem no original mas não no atualizado) e emita o resultado em ordem de origem. É o mesmo algoritmo que cientistas da computação vêm refinando desde os anos 1970 e é o que o GitHub usa cada vez que você abre um pull request.
O que conta como uma "mudança"? Qualquer linha que não seja byte por byte idêntica. Mude uma única palavra num parágrafo e a linha inteira é marcada como removida E a nova versão é marcada como adicionada — é o comportamento padrão de diff. Espaço em branco conta: um espaço sobrando no final muda a linha. Pontuação conta: trocar uma vírgula por ponto e vírgula muda a linha. Se você precisa de granularidade por palavra — só as palavras alteradas destacadas dentro de uma frase de resto inalterada — abra os dois arquivos numa ferramenta de redline dedicada como Litera Compare ou Workshare Compare. É outro algoritmo e um produto muito mais pesado.
Para a maioria das revisões reais — a outra parte editou a cláusula de indenização, o editor reescreveu o segundo parágrafo, a equipe de política trocou "deverá" por "irá" em três lugares — diff por linha é suficiente para ver exatamente o que mudou. O resumo no topo te diz os números brutos: X adicionadas, Y removidas, Z inalteradas. O corpo te mostra quais linhas.
Lado a lado vs. unificado — qual visão usar
A ferramenta oferece as duas visões porque trabalhos diferentes querem formatos diferentes.
| Visão | O que você vê | Melhor para |
|---|---|---|
| Lado a lado | Duas colunas. Esquerda = original. Direita = atualizado. Trechos removidos e adicionados são pareados na mesma linha quando ficam adjacentes no fluxo de diff. | Revisões de contrato, prosa onde você quer ler a versão antiga e a nova em paralelo e sentir a textura da mudança. |
| Unificado | Uma coluna. Linhas removidas com prefixo − (vermelho). Linhas adicionadas com prefixo + (verde). Linhas de contexto inalteradas. Mesmo formato que o git diff emite. | Escaneio rápido, compartilhar screenshots com devs, qualquer pessoa fluente em revisão git. |
As duas visões alimentam dos mesmos dados de diff, então alternar não reroda nada. Vá e volte conforme precisar — a maioria dos revisores fica com lado a lado na primeira passada (para sentir o formato das mudanças) e unificado na segunda passada (para contar adições e remoções exatas).
Como comparar dois PDFs
- Solte seus dois PDFs nos slots. O slot "Original" é a versão anterior. O slot "Atualizado" é a mais nova. A ordem importa: linhas removidas são as que estão no Original e não estão no Atualizado; linhas adicionadas são o inverso. Inverta os slots e "adicionada" vira "removida".
- Clique em Comparar. A ferramenta lê cada PDF (alguns segundos por cem páginas), extrai o texto com PDF.js, reconstrói quebras de linha a partir do layout e roda
diffLines. - Leia o resumo no topo: X adicionadas, Y removidas, Z inalteradas. Esse número sozinho já costuma te dizer o que você precisa — "só 4 linhas mudaram em 80 páginas" é uma conversa diferente de "412 linhas mudaram".
- Role o diff. Alterne entre Lado a lado e Unificado conforme sua preferência.
- Precisa compartilhar o que achou? Tire um screenshot — não há download porque isto é um visualizador, não um editor. A maioria dos revisores tira screenshot de alguns trechos-chave e cola no Slack, e-mail ou no sistema de gestão de contratos.
Exemplo prático: um contrato que voltou com redline
Você mandou um contrato de assinatura SaaS para uma contraparte chamada Globex em 3 de abril. Em 8 de maio eles devolveram com as revisões propostas. O e-mail de capa diz "mudanças menores" mas você está nessa há tempo suficiente para querer verificar.
Você solta globex-msa-2026-04-03.pdf em Original e globex-msa-2026-05-08-revised.pdf em Atualizado. Clica Comparar. O resumo mostra: 23 adicionadas, 18 removidas, 1.847 inalteradas. Então cerca de 41 linhas se moveram no que parece ser um documento de 60 páginas. "Menores" está fazendo um trabalho pesado naquele e-mail.
Você escaneia a visão lado a lado. O primeiro lote de mudanças é administrativo — endereços atualizados, uma data de vigência mudou. A Seção 4 (Honorários) tem três edições onde a Globex mudou a forma de pagamento de Net 30 para Net 45 — isso é uma mudança real para sinalizar. A Seção 7 (Limitação de Responsabilidade) tem oito linhas removidas e doze adicionadas; o teto foi reescrito e as exceções foram ampliadas. Essa precisa de leitura cuidadosa. A Seção 12 (Rescisão) tem duas trocas menores de palavras que não mudam o sentido.
Você tira screenshot do diff da Seção 7, cola no canal do Slack com a sua consultoria jurídica, escreve "Globex reescreveu a 7. Vale uma olhada de 10 minutos". Tempo total do recebimento do redline até a sinalização da mudança substantiva: cerca de quatro minutos. A alternativa — ler os dois PDFs lado a lado em duas janelas da tela, mentalmente fazendo diff de 60 páginas de texto jurídico — é a versão de meio expediente do mesmo trabalho.
Por que só texto e não visual
A primeira pergunta que as pessoas fazem quando ouvem "comparação de PDF" é "detecta blocos movidos e mudanças de fonte?" Resposta honesta: não, e isso é proposital.
Um diff visual de verdade é um software sério. Renderizar os dois PDFs em pixels, alinhar páginas correspondentes, detectar blocos que se moveram, colorir mudanças de fonte e cor, distinguir edições significativas de reflows de layout — são meses de trabalho de engenharia e o campo é dominado por produtos pagos (Adobe Acrobat Compare Files, Litera Compare, Workshare Compare, Draftable). Eles cobram por isso porque o trabalho é difícil e os clientes são escritórios de advocacia com orçamentos sérios.
O que observamos é que a maioria das pessoas que busca "comparar PDF" não precisa de análise no nível de pixel. Elas têm duas versões de um contrato, de uma política, de um artigo científico ou de um memo, e querem saber o que as palavras dizem de diferente. O conteúdo de texto de um PDF é direto de extrair, o algoritmo de diff é bem entendido e o resultado é mais rápido de escanear do que um redline visual multicolor. Construir a ferramenta de 90% que abre num navegador, rodar grátis, e apontar para o Acrobat para os 10% de casos que genuinamente precisam de comparação visual. É essa a troca.
O que a ferramenta pega e o que ela perde
Vale ser preciso, porque o valor de qualquer ferramenta de diff é saber o que ela pode te dizer.
| Tipo de mudança | Detectada? | Como aparece |
|---|---|---|
| Palavra adicionada ou removida numa frase | Sim | Linha inteira marcada como removida + nova linha marcada como adicionada |
| Parágrafo inserido ou apagado | Sim | Bloco de linhas adicionadas ou removidas |
| Números, datas, valores alterados | Sim | Troca em nível de linha, igual ao texto |
| Diferença de espaço em branco (espaço final, espaço duplo) | Sim | Linha marcada como alterada |
| Fonte alterada (Times → Arial) | Não | Mesmo texto → não sinalizado |
| Cor alterada (preto → vermelho) | Não | Mesmo texto → não sinalizado |
| Imagem inserida, removida ou movida | Não | Imagens não estão no fluxo de texto |
| Assinatura adicionada na página 12 | Não | Assinaturas são imagens |
| Bloco movido da página 3 para a página 7 | Parcialmente | Aparece como remoção na página 3 e adição na página 7 |
| Reordenação de páginas com mesmo conteúdo | Parcialmente | Igual a movimentação de bloco |
| Mudança de layout (margens, colunas) com mesmo texto | Não | Mesmo texto → não sinalizado |
O padrão: se uma mudança afeta as palavras, esta ferramenta encontra. Se uma mudança só afeta como as palavras parecem, esta ferramenta não encontra. Para revisão de contrato, revisão de prosa e monitoramento de política isso quase sempre é o escopo certo. Para auditoria de guidelines de marca, revisão de layout e verificação de assinatura, não é.
Casos de uso comuns
Trabalhos reais que as pessoas trazem.
- Revisões de contrato. Uma contraparte devolve um contrato com edições. Você quer confirmar o que de fato mudou, além do que tenham destacado no e-mail de capa. Diff em 30 segundos; revise só as mudanças substantivas.
- Revisão de rascunhos. Comparar rascunho N com rascunho N+1 para verificar se suas edições entraram e nada mais se moveu. Especialmente útil quando várias pessoas estão editando o mesmo documento.
- Monitoramento de políticas e termos. Aquela política de privacidade foi atualizada em silêncio? O código de conduta da empresa foi reescrito? Salve o PDF uma vez por mês, faça diff contra a cópia do mês passado. Você verá exatamente o que mudou.
- Revisão de tradução. O mesmo documento em duas variantes regionais — português do Brasil vs Portugal, inglês americano vs britânico. O diff revela cada frase traduzida que difere.
- Demonstrativos financeiros ano a ano. Mesmo template, exercício diferente. O diff mostra quais linhas cresceram, quais encolheram, quais apareceram, quais sumiram.
- Revisões de artigo acadêmico. Um revisor devolve um artigo com edições; você quer uma contagem rápida de quão pesadamente revisaram antes de ler linha por linha.
- Atestados de compliance. Muitos documentos de compliance têm controle de versão. Faça diff da versão atual publicada contra a última atestada para confirmar o que mudou desde a última auditoria.
Sobre o Adobe Acrobat Comparar Arquivos
O Adobe Acrobat Pro tem um recurso Comparar Arquivos que faz o que esta ferramenta faz mais a comparação visual. Ele pega mudanças de fonte, edições de imagem, deslocamentos de layout, mudanças de cor, tudo. Custa US$ 20-30 por mês dependendo do plano e exige o Acrobat Pro instalado localmente. Se você está fazendo trabalho de redline jurídico de alto volume, comparações de ativos de marca ou qualquer coisa onde fidelidade visual importa tanto quanto conteúdo de texto, o Acrobat é a resposta certa e recomendaríamos sem hesitação.
O que esta ferramenta oferece em vez disso: arraste dois arquivos, veja o diff de texto em segundos, grátis, sem instalar, sem upload. Para o caso de comparação de prosa — que é a maioria dos casos — a troca é boa. O fluxo inteligente é usar o diff de texto gratuito primeiro para triar o escopo da mudança, depois pegar o Acrobat se e só se a camada visual importar.
A história de privacidade
Os PDFs que você compara são frequentemente os documentos que você mais não quer compartilhar. Contratos. Petições judiciais seladas. Rascunhos de papelada de M&A. Relatórios de remuneração. Prontuários médicos pessoais. Memorandos de investigação interna. Esses são os documentos onde "a gente faz upload para um servidor e processa lá" — o design que o iLovePDF, SmallPDF e a maioria das ferramentas de comparação de PDF na nuvem usam — é o formato errado.
Comparar PDFs roda inteiramente no seu navegador. O PDF.js extrai o texto na memória JavaScript. O pacote diff roda a comparação na memória JavaScript. Os resultados aparecem no DOM. Os PDFs nunca tocam uma rede. Não há servidor para honrar uma política de privacidade porque não há servidor no caminho. Abra as ferramentas de desenvolvedor do navegador, vá na aba Network, rode uma comparação completa: zero requisições de saída durante a comparação. O carregamento da página é a única atividade de rede.
Isso não é uma promessa de privacidade — é uma arquitetura. Não há nada para vazar porque não há nada em trânsito.
Ferramentas PDF relacionadas
- Extrair Texto do PDF — extraia o texto bruto de um PDF, útil quando você quer fazer diff num editor de texto dedicado ou alimentar o conteúdo em outra ferramenta.
- Comparador de Texto — o mesmo diff por linhas para entrada de texto simples em vez de PDFs. Cole dois blocos de texto, veja a comparação.
- Dividir PDF — quebre PDFs grandes em capítulos antes do diff; seção por seção é mais rápido do que rodar uma comparação de milhares de páginas de uma vez.
- Juntar PDFs — combine o resultado do diff (como screenshot) com os PDFs originais num único pacote de revisão.
- Assinar PDF — quando você revisou o contrato revisado e está pronto para assinar.
Sobre o Microapp
Microapp é uma coleção de ferramentas pequenas e focadas que abrem numa aba, fazem um trabalho e deixam você ir embora. Comparar PDFs é uma das cerca de 140 ferramentas do catálogo. O modelo de Members é estilo Costco — Members têm páginas limpas e IA ao custo de processamento; não-Members têm as mesmas ferramentas com anúncios na página. 10% de cada dólar que o Microapp ganha vai para caridade, do topo, auditado trimestralmente. As ferramentas são escolhidas, não só agregadas.
Perguntas frequentes
O que conta como uma "mudança"?
Qualquer linha que não seja byte por byte idêntica. A ferramenta divide os dois PDFs em linhas, roda o algoritmo padrão diffLines e marca cada linha como adicionada, removida ou inalterada. Mudar uma única palavra marca a linha inteira como removida E adiciona a nova versão — é assim que diffs por linha funcionam. Espaço em branco conta: um espaço sobrando muda a linha. Para granularidade por palavra, use uma ferramenta de redline dedicada como Litera Compare.
Por que só texto? Um PDF não tem layout?
Porque honesto é mais rápido do que meia-mágica. Um diff visual de verdade é um produto sério — renderizar os dois PDFs em pixels, alinhar páginas, detectar blocos movidos, colorir mudanças de fonte. O recurso Comparar Arquivos do Adobe Acrobat faz isso, e custa dinheiro por uma razão. Nós comparamos o texto extraído, que cobre o que 90% do trabalho de revisão de contrato e revisão de texto precisa. Layout, fontes, imagens, assinaturas — nada disso é detectado. Dizemos isso claramente acima de cada resultado.
Como funciona o diff por linhas?
Usamos o algoritmo diffLines do pacote diff — a mesma abordagem que o git e a maioria das ferramentas de revisão de código usam. Ele encontra a maior subsequência comum de linhas e marca o restante como adicionado ou removido. Na visão Lado a lado, trechos removidos e adicionados adjacentes são pareados na mesma linha. Na visão Unificada, linhas removidas vêm antes das adicionadas correspondentes, com prefixo − e +.
Funciona em PDFs grandes?
Até 100 MB e 500 páginas por arquivo. A extração de texto é o passo lento (alguns segundos por cem páginas num laptop normal); o diff em si é quase instantâneo para documentos abaixo de ~50.000 linhas. Para trabalho de discovery jurídico de milhares de páginas, divida cada PDF em capítulos primeiro com nossa ferramenta Dividir PDF e faça o diff seção por seção.
Funciona em PDFs digitalizados?
Não. PDFs digitalizados são imagens de texto, não texto. O extrator retorna resultado vazio ou quase vazio, e o diff não faria sentido. Se seus PDFs são scans, passe pelo OCR primeiro (Adobe Acrobat, Visualização do macOS, Tesseract) para adicionar uma camada de texto, e depois compare as versões com OCR aqui.
Meus PDFs realmente não são enviados?
Correto. O PDF.js (a biblioteca que renderiza PDFs dentro do Firefox) e o algoritmo de diff rodam no seu navegador. Seus arquivos vão do disco para a memória do navegador, são comparados e o resultado aparece na tela — nunca para um servidor. Confira a aba de rede enquanto compara: zero requisições de saída.
Por que usar isto no lugar do Adobe Acrobat Comparar Arquivos?
O Comparar Arquivos do Acrobat é o padrão ouro para comparação visual de PDF — renderização de página, detecção de fonte, diff de imagem — e se você precisa disso, use. Esta ferramenta é para o caso só-texto: mais rápida (arraste dois arquivos, veja resultados em segundos), gratuita, sem instalar, roda em qualquer navegador. Para comparação de prosa pura — contratos, artigos, documentos de política — só-texto costuma ser o que você quer e é mais rápido de escanear do que um redline visual.