Co faktycznie robi kompresor PDF
Większość kompresorów PDF online — iLovePDF, SmallPDF, kompresor webowy Adobe — obiecuje mniejszy plik i nie tłumaczy kompromisu. Nasz kompresor PDF robi jedną konkretną rzecz: rasteryzuje każdą stronę. To znaczy, że renderuje każdą stronę jako obraz, a potem zapisuje nowy PDF zawierający te obrazy. Duże spadki rozmiaru na właściwym wejściu. Realne straty na niewłaściwym. Mówimy Ci, co masz, zanim klikniesz.
To przeciwieństwo tego, jak działa „prawdziwa” kompresja PDF. Porządny optymalizator PDF rekompresuje osadzone obrazy i czcionki wewnątrz pliku, jednocześnie zachowując tekst jako tekst. Taki kompresor robi Adobe Acrobat na desktopie, a iLovePDF na serwerze po przesłaniu pliku. My tego jeszcze nie robimy — wymaga to albo serwera (i opuszczenia Twojej maszyny przez plik), albo cięższego toolchainu WASM, którego nie wydaliśmy. Zamiast więc udawać, dajemy wersję uczciwą: rasteryzuj, ostrzegaj, pozwól Ci zdecydować.
Kiedy to narzędzie jest właściwą odpowiedzią
PDF-y pełne obrazów to miejsce, gdzie rasteryzuj-i-rekompresuj błyszczy. 50 MB skan 30-stronicowej umowy zwykle spada do 3–6 MB w ustawieniu Zbalansowanym, bez widocznej straty jakości. Album zdjęć wyeksportowany z telefonu może skurczyć się z 80 MB do 8 MB. Kolekcje zrzutów ekranu, zeskanowane paragony, oferty nieruchomości, podpisane papiery — wszystko, gdzie strona już jest obrazem — kompresuje się dramatycznie, bo oryginalne JPG zapisano z wyższą jakością, niż potrzeba.
Matematyka jest prosta. Zeskanowana strona przechowywana w 300 DPI jako pełnej jakości JPG ma z grubsza 1–3 MB. Przerenderowana w 100 DPI i zakodowana w 75% jakości JPG, ta sama strona ma 100–300 KB. W 30-stronicowym dokumencie to różnica między załącznikiem e-maila, który zostaje odbity, a takim, który przechodzi.
Uczciwe ostrzeżenie: jeśli Twój PDF jest pełen tekstu — książka, umowa, w której będziesz szukać, praca naukowa, cokolwiek, gdzie potrzebujesz kopiować cytaty albo wyszukiwać słowa — nie używaj tego narzędzia. Stracisz zaznaczalny tekst, osadzone czcionki i możliwość Ctrl-F wewnątrz dokumentu. Słowa staną się pikselami. Nie ma przycisku cofnij na zrasteryzowanym PDF-ie.
Jak używać kompresora PDF
Upuść lub wybierz swój PDF. Narzędzie akceptuje do 100 MB i 200 stron — wystarczająco dla niemal każdego rzeczywistego dokumentu. Większe pliki uderzają w limity pamięci przeglądarki; dla tych użyj narzędzia desktopowego.
- Upuść lub wybierz swój PDF. Narzędzie odczyta liczbę stron i rozmiar pliku i pokaże je, zanim cokolwiek się stanie.
- Przeczytaj ostrzeżenie. Jeśli ostrzeżenie wykryje, że Twój PDF jest pełen tekstu, powie to. Jeśli to głównie obrazy, też Ci powie. Narzędzie jest stronnicze w stronę niedopuszczania, by zniszczyć dokument, który był dla Ciebie ważny.
- Wybierz ustawienie. Wysoka jakość (150 DPI, 85% JPG) jest najbliższa oryginałowi. Zbalansowane (100 DPI, 75% JPG) to to, czego większość ludzi naprawdę chce. Agresywne (72 DPI, 60% JPG) jest tylko ekranowe i widocznie pogorszy krawędzie tekstu.
- Kliknij Kompresuj PDF. Każda strona renderuje się do canvas w wybranym DPI, koduje jako JPG w wybranej jakości i osadza w nowym PDF-ie. Pasek postępu pokazuje strona po stronie.
- Kliknij Pobierz. Blok wyniku pokazuje rozmiar przed, rozmiar po i procent redukcji. Wyjście nazywa się
oryginalna-nazwa-compressed.pdf.
Twój PDF nigdy nie opuszcza Twojej przeglądarki. Strony renderują się przez pdfjs-dist, JPG-i pochodzą z natywnego enkodera canvas przeglądarki, a nowy PDF buduje pdf-lib — wszystko WebAssembly i JavaScript, zero żądań sieciowych podczas kompresji. Otwórz zakładkę sieci w przeglądarce podczas przebiegu, a zobaczysz zero wychodzących żądań.
Trzy ustawienia i które wybrać
DPI kontroluje, ile pikseli na cal strona dostanie podczas renderowania. Jakość JPG kontroluje, jak agresywnie te piksele są kompresowane potem. Oba pokrętła oddziałują — obniżenie jednego i podniesienie drugiego często daje podobne rozmiary plików, z różnymi trybami utraty jakości.
| Ustawienie | DPI renderowania | Jakość JPG | Typowy spadek rozmiaru | Najlepsze do |
|---|---|---|---|---|
| Wysoka jakość | 150 DPI | 85% | 30–50% | Wyjście gotowe do druku, archiwizacja, wszystko, co będziesz oglądać z bliska |
| Zbalansowane (domyślne) | 100 DPI | 75% | 50–70% | Załączniki e-mail, udostępnianie, oglądanie na ekranie |
| Agresywne | 72 DPI | 60% | 70–90% | Szybkie podglądy, dopasowanie pod twardy limit wysyłki, nigdy do druku |
Najprostsza zasada decyzji: jeśli będziesz drukować PDF, wybierz Wysoką. Jeśli udostępnisz albo będziesz czytać na ekranie, wybierz Zbalansowane. Jeśli masz limit wysyłki, który za chwilę przekroczysz, i możesz znieść rozmyte krawędzie tekstu, wybierz Agresywne — i załóż, że wynik jest jednorazowy.
Przykład z rzeczywistymi liczbami
Weźmy realny przypadek: 38-stronicowy zeskanowany PDF podpisanej umowy, oryginalnie 47,2 MB. Strony skanowano w 300 DPI jako pełnej jakości JPG-i — znacznie więcej rozdzielczości, niż ktokolwiek potrzebuje do PDF-a do czytania na ekranie. Oto co produkują trzy ustawienia:
| Ustawienie | Rozmiar wyjścia | Redukcja | Uwagi o jakości |
|---|---|---|---|
| Wysoka (150 DPI, 85%) | 14,1 MB | 70% | Nieodróżnialne od oryginału na 14" ekranie laptopa, drukuje się czysto |
| Zbalansowane (100 DPI, 75%) | 5,8 MB | 88% | Lekko miększe przy bliskim oglądzie, w porządku do czytania na ekranie i większości druku |
| Agresywne (72 DPI, 60%) | 2,9 MB | 94% | Widoczne artefakty JPG na tekście, w porządku do szybkiego udostępnienia, źle do druku |
Oryginał miał 47,2 MB — za dużo dla większości systemów e-mail (Gmail ogranicza załączniki do 25 MB, Outlook do 20 MB). Po kompresji Zbalansowanej ma 5,8 MB i przechodzi wszędzie. Podpisana umowa nadal czyta się czysto. Zaznaczenie tekstu z oryginału (dodane przez OCR po skanowaniu) zniknęło, ale nikt go nie potrzebował przy umowie, którą tylko trzeba przekazać dalej.
Teraz to samo narzędzie na innym wejściu: 4 MB praca naukowa z prawdziwym tekstem i równaniami. Po kompresji Zbalansowanej ma 6,2 MB — większy. Rasteryzowanie tekstu wektorowego jest mniej wydajne niż trzymanie go jako tekst, a narzędzie ostrzega, gdy wyjście jest większe niż wejście. To samo narzędzie, zły typ pliku. Dlatego ostrzeżenie jest na początku.
Jak to wypada w porównaniu z iLovePDF, SmallPDF, Adobe
Uczciwe porównanie: tamte narzędzia robią bardziej wyrafinowaną kompresję niż my, kosztem przesłania Twojego pliku na ich serwer.
iLovePDF i SmallPDF kompresują po stronie serwera używając ghostscriptu albo podobnego optymalizatora natywnego dla PDF. Rekompresują osadzone obrazy, zachowując tekst i czcionki. Wyjście jest zwykle mniejsze niż nasze na PDF-ach pełnych tekstu i podobne albo lekko większe na pełnych obrazów. Mają też limity bezpłatnej warstwy (liczba plików dziennie, limit rozmiaru) i klasyczny upsell „Upload to remove limits”. Twój PDF żyje na ich serwerach co najmniej kilka godzin, a być może dłużej w zależności od polityki retencji.
Kompresor webowy Adobe robi to samo co iLovePDF, w ładniejszym opakowaniu, za ścianą logowania, z kontyngentem, który prowadzi Cię w stronę subskrypcji Creative Cloud. To najczystsze wyjście z całej trójki na PDF-ach pełnych tekstu. Jest też najwolniejszy, najbardziej nalegający na Twój adres e-mail i najdroższy, gdy wyrośniesz z bezpłatnej warstwy.
My to przeciwny kompromis. Wolniejsi niż nic w przeglądarce, ale bez wysyłki, bez konta, bez kontyngentu, bez retencji. Rasteryzujemy, bo to, co możemy dziś dobrze zrobić w przeglądarce; mówimy Ci, kiedy to zły wybór. Gdy wydamy prawdziwy optymalizator PDF w przeglądarce zachowujący tekst (jest na liście), pojawi się obok tego z opisanym kompromisem.
Co tracisz, gdy PDF jest rasteryzowany
Kilka rzeczy i warto znać wszystkie, zanim klikniesz Kompresuj:
- Zaznaczanie tekstu — nie możesz już podświetlać, kopiować ani wyszukiwać słów w PDF-ie. Każde słowo to grupa pikseli wewnątrz obrazu.
- Osadzone czcionki — czcionki nie są już częścią pliku. Wyrenderowane piksele zawierają kształty liter, ale nie metadane czcionki. Przeformatowanie tekstu albo zmiana czcionki jest niemożliwa.
- Hiperłącza — klikalne linki i zakładki rasteryzują się w obraz. Niebieski podkreślony tekst nadal jest widoczny, ale nigdzie nie prowadzi.
- Pola formularzy — pola wejściowe, pola wyboru, bloki podpisu spłaszczają się do obrazu strony. PDF jest teraz tylko do odczytu.
- Grafika wektorowa — wykresy, diagramy i inne elementy wektorowe stają się pikselami. Powiększenie pokazuje pikselizację zamiast czystych linii.
- Tagi dostępności — czytniki ekranu nie mogą odczytać zrasteryzowanego PDF-a, dopóki nie zostanie ponownie zastosowany OCR. To realny koszt dla dokumentów krytycznych pod kątem dostępności.
Jeśli któraś z tych rzeczy ma znaczenie dla Twojego dokumentu, to nie jest właściwe narzędzie. Użyj naszego Split PDF, żeby podzielić plik na mniejsze kawałki, jeśli próbujesz zmieścić się pod limitem wysyłki, albo użyj kompresora desktopowego jak Adobe Acrobat, który robi właściwą optymalizację PDF.
Powiązane narzędzia PDF
Kompresor PDF to jeden kafelek w większym zestawie narzędzi PDF. Kilku sąsiadów, którzy często wchodzą w grę:
- Split PDF — podziel duży PDF na mniejsze pliki według zakresu stron. Często lepsze rozwiązanie niż kompresja, gdy musisz tylko udostępnić część dokumentu.
- PDF to JPG — ten sam silnik renderujący co kompresor, ale wyjście to pojedyncze obrazy stron zamiast przepakowywania ich z powrotem w PDF. Przydatne, gdy chcesz stron jako samodzielnych plików.
- PDF Merger — połącz wiele PDF-ów w jeden. Często sparowany z kompresorem przy składaniu dokumentu z wielu źródeł.
- Delete PDF Pages — wyrzuć niepotrzebne strony przed kompresją. Szybsze niż kompresja i to właściwy pierwszy krok, jeśli Twój PDF ma 200 stron, a potrzebujesz tylko 10.
- Image Compressor — jeśli to, co naprawdę masz, to folder JPG-ów, które miałeś zamiar zamienić na PDF, najpierw je skompresuj, a pominiesz krok rasteryzacji PDF całkowicie.
Najczęściej zadawane pytania
Czemu kompresja usuwa zaznaczanie tekstu?
Bo ten kompresor działa, rasteryzując każdą stronę — renderując ją jako obraz, a potem zapisując ten obraz w PDF-ie. Gdy strona staje się obrazem, nie ma już obiektów tekstowych; słowa to piksele. Większość kompresorów PDF online, które obiecują „zachować tekst”, albo właściwie niewiele kompresują, albo wymagają wysłania PDF-a na ich serwer, gdzie mogą użyć bardziej zaawansowanych narzędzi. Wybraliśmy: w przeglądarce, uczciwie o kompromisie, duże oszczędności rozmiaru na właściwym wejściu.
Kiedy to dobre narzędzie?
PDF-y pełne obrazów to słodki punkt: zeskanowane dokumenty (paragony, umowy, podpisane formularze), PDF-y ze zdjęciami (albumy z wakacji, oferty nieruchomości), kolekcje zrzutów ekranu, wszystko w większości rastrowe. Te często kompresują się o 70–90% bez widocznej straty jakości. Zaznaczenie tekstu, które byś stracił, to zwykle i tak fałszywy OCR nałożony na skan.
Kiedy to złe narzędzie?
PDF-ów wyłącznie tekstowych (książki, umowy, artykuły, instrukcje techniczne) nie należy kompresować w ten sposób. Dostajesz mniejszy plik, ale staje się niewyszukiwalny, krawędzie tekstu rozmywają się przy agresywnych ustawieniach, a czytelnik nie może już kopiować cytatów. Dla tych właściwe narzędzie to brak kompresji (PDF-y rodzące się z tekstu są już małe) albo kompresor po stronie serwera, który osobno rekompresuje osadzone czcionki i obrazy.
Czy mój PDF naprawdę nie jest wysyłany?
Zgadza się. Strony renderują się przez pdfjs-dist w Twojej przeglądarce, są kodowane jako JPG przez natywny canvas przeglądarki, a nowy PDF buduje pdf-lib — wszystko w WebAssembly i JavaScript. Zero wychodzących żądań w trakcie kompresji. Sprawdź zakładkę sieci przeglądarki, jeśli chcesz to zweryfikować.
Jakiej redukcji rozmiaru mogę się spodziewać?
Bardzo zmienna. PDF-y pełne obrazów w ustawieniu Agresywnym często spadają o 80–95% (50 MB skan staje się 3–8 MB). PDF-y pełne tekstu mogą nawet urosnąć, bo rasteryzacja tekstu wektorowego jest mniej wydajna niż trzymanie go jako tekst — narzędzie ostrzega, jeśli wyjście jest większe. Większość użytkowników ląduje na 50–70% mniejszych plikach w ustawieniu Zbalansowanym na właściwym typie wejścia.
Czy wyjście nadal drukuje się dobrze?
Tak dla ustawień Wysoka i Zbalansowana — 150 DPI i 100 DPI drukują się czysto przy standardowych ustawieniach drukarki biurowej. Ustawienie Agresywne (72 DPI) jest tylko ekranowe; wydruk pokaże widoczną pikselizację, zwłaszcza na tekście. Wybierz Wysoką, jeśli druk jest częścią procesu.
Czy mogę skompresować PDF chroniony hasłem?
Nie — pdf-lib odmawia otwarcia zaszyfrowanych PDF-ów. Najpierw usuń hasło używając czytnika desktopowego (lub jakiegokolwiek narzędzia do usuwania haseł, któremu ufasz), potem skompresuj niezabezpieczoną kopię.
Czy liczba stron lub kolejność się zmieni?
Nie. Kompresor dokładnie zachowuje pierwotną liczbę stron i kolejność — każda strona wejścia staje się jedną stroną wyjścia, zrasteryzowana w miejscu. Zakładki, hiperłącza i pola formularzy nie przetrwają (rasteryzują się w obraz strony), więc to narzędzie służy udostępnianiu i archiwizacji, nie dokumentom, które muszą pozostać interaktywne.