Что Компрессор PDF делает на самом деле
Большинство онлайн-компрессоров PDF — iLovePDF, SmallPDF, веб-компрессор Adobe — обещают меньший файл и не объясняют размен. Наш Компрессор PDF делает одну конкретную вещь: растеризует каждую страницу. То есть рендерит каждую страницу как изображение, а затем пишет новый PDF, в который кладёт эти изображения. Сильное падение размера на правильном входе. Реальные потери на неправильном. Мы говорим тебе, что у тебя на руках, до того, как ты нажмёшь.
Это противоположно «настоящему» сжатию PDF. Настоящий оптимизатор PDF пересохраняет встроенные картинки и шрифты внутри файла, сохраняя текст текстом. Так делает Adobe Acrobat на десктопе и iLovePDF на сервере после загрузки. Мы пока так не делаем — для этого нужен либо сервер (и твой файл, покидающий устройство), либо более тяжёлый WASM-стек, которого мы пока не поставили. Поэтому вместо притворства мы выпускаем честный вариант: растеризуем, предупреждаем, даём решить.
Когда этот инструмент — правильный ответ
PDF с большим количеством изображений — там, где растеризация и пересжатие блестят. Скан на 50 МБ из 30 страниц договора обычно падает до 3-6 МБ на «Сбалансированно» без заметной потери качества. Фотоальбом, экспортированный с телефона, может уменьшиться с 80 МБ до 8 МБ. Подборки скриншотов, сканы чеков, листинги недвижимости, подписанные документы — всё, где страница и так картинка, — сжимается значительно, потому что исходные JPG сохраняли в более высоком качестве, чем нужно.
Математика простая. Сканированная страница в 300 DPI как полнокачественный JPG — это примерно 1-3 МБ. Перерендеренная в 100 DPI и пересохранённая в 75% JPG, та же страница — 100-300 КБ. На 30-страничном документе это разница между вложением, которое отскочит на почте, и тем, что пройдёт.
Честное предупреждение: если у тебя текстовый PDF — книга, договор, в котором ты потом будешь искать, научная статья, что угодно, где нужно копировать цитаты или искать по словам — не используй этот инструмент. Ты потеряешь выделение текста, встроенные шрифты и возможность Cmd-F. Слова станут пикселями. У растеризованного PDF нет кнопки «отмена».
Как пользоваться Компрессором PDF
Перетащи или выбери PDF. Инструмент принимает до 100 МБ и 200 страниц — этого хватает почти для любого реального документа. Большие файлы упираются в память браузера; для таких — десктопное решение.
- Перетащи или выбери PDF. Инструмент читает число страниц и размер файла и показывает их до всего остального.
- Прочитай предупреждение. Если оно обнаружит, что PDF текстовый, скажет об этом. Если в основном картинки — тоже скажет. Инструмент склонен не давать тебе испортить документ, который тебе дорог.
- Выбери пресет. «Высокое качество» (150 DPI, 85% JPG) — ближе всего к оригиналу. «Сбалансированно» (100 DPI, 75% JPG) — то, что хочет большинство. «Агрессивно» (72 DPI, 60% JPG) — только для экрана и заметно ухудшает края текста.
- Нажми «Сжать PDF». Каждая страница рендерится на canvas в выбранном DPI, кодируется в JPG с выбранным качеством и встраивается в свежий PDF. Прогресс — по страницам.
- Нажми «Скачать». Блок результата покажет размер до, размер после и процент уменьшения. Файл называется
original-name-compressed.pdf.
PDF не покидает браузер. Страницы рендерит pdfjs-dist, JPG делает нативный кодировщик canvas, а новый PDF собирает pdf-lib — всё WebAssembly и JavaScript, без сетевых обращений на шаге сжатия. Открой вкладку Network в браузере и увидишь ноль исходящих запросов.
Три пресета и какой выбрать
DPI задаёт, сколько пикселей на дюйм рендерится. Качество JPG — насколько агрессивно эти пиксели потом сжимаются. Обе ручки влияют друг на друга — уменьшение одной и увеличение другой часто даёт похожие размеры с разными режимами потерь.
| Пресет | DPI рендера | Качество JPG | Типичное падение размера | Лучше всего для |
|---|---|---|---|---|
| Высокое качество | 150 DPI | 85% | 30-50% | Печатной выдачи, архивирования, чего-то для пристального просмотра |
| Сбалансированно (по умолчанию) | 100 DPI | 75% | 50-70% | Email-вложения, отправки, экранного просмотра |
| Агрессивно | 72 DPI | 60% | 70-90% | Быстрого превью, лимита загрузки, в печать никогда не пойдёт |
Простое правило: если будешь печатать — «Высокое качество». Если отправляешь или читаешь с экрана — «Сбалансированно». Если лимит загрузки сейчас провалится и ты готов жить с мыльными краями — «Агрессивно», и считай результат одноразовым.
Пример с реальными цифрами
Реальный случай: 38-страничный сканированный PDF подписанного договора, изначально 47,2 МБ. Страницы сканировали в 300 DPI как полнокачественные JPG — гораздо больше разрешения, чем нужно для экранного чтения. Вот что дают три пресета:
| Пресет | Размер выхода | Уменьшение | Заметки о качестве |
|---|---|---|---|
| Высокое (150 DPI, 85%) | 14,1 МБ | 70% | Неотличимо от оригинала на 14" ноутбуке, печатает чисто |
| Сбалансированно (100 DPI, 75%) | 5,8 МБ | 88% | Слегка мягче при пристальном осмотре, ок для экрана и большинства распечаток |
| Агрессивно (72 DPI, 60%) | 2,9 МБ | 94% | Заметные JPG-артефакты на тексте, ок для быстрой отправки, плохо для печати |
Оригинал был 47,2 МБ — слишком много для большинства почтовых систем (Gmail ограничивает вложения 25 МБ, Outlook — 20 МБ). После «Сбалансированно» он 5,8 МБ и проходит везде. Подписанный договор по-прежнему читается чисто. Выделение текста, которое было в оригинале (добавленное OCR после сканирования), пропало — но никому оно и не нужно в договоре, который ты просто пересылаешь.
А вот тот же инструмент на другом входе: 4 МБ научной статьи с настоящим текстом и формулами. После «Сбалансированно» — 6,2 МБ, больше. Растеризация векторного текста менее эффективна, чем хранение его как текста, и инструмент предупреждает, когда выход больше входа. Тот же инструмент, не тот тип файла. Поэтому мы вешаем предупреждение в самое начало.
Сравнение с iLovePDF, SmallPDF, Adobe
Честное сравнение: эти инструменты делают более продвинутое сжатие, чем мы, ценой загрузки твоего файла на их сервер.
iLovePDF и SmallPDF сжимают на сервере через ghostscript или похожий PDF-нативный оптимизатор. Они пересохраняют встроенные картинки, сохраняя текст и шрифты. Вывод обычно меньше нашего на текстовых PDF и сопоставим или чуть больше на «картиночных». У них тоже есть лимиты бесплатного тарифа (число файлов в день, размер) и стандартный апселл «Зарегистрируйся, чтобы убрать лимиты». Твой PDF живёт на их серверах минимум несколько часов, возможно дольше — зависит от политики хранения.
Веб-компрессор Adobe делает то же, что iLovePDF, в более красивой обёртке, за стенкой логина, с квотой, которая ведёт к подписке Creative Cloud. На текстовых PDF — самый чистый вывод. Также самый медленный, самый настойчивый по части email-адреса и самый дорогой, как только перерос бесплатный тариф.
Мы — обратный размен. Медленнее, чем «ничего», в браузере, но без загрузки, без аккаунта, без квот, без хранения. Мы растеризуем, потому что это то, что мы умеем делать хорошо в браузере сегодня; и мы говорим тебе, когда это не тот выбор. Когда мы выпустим настоящий браузерный оптимизатор PDF, сохраняющий текст (он в плане), он появится рядом, с подписанным разменом.
Что теряется при растеризации PDF
Несколько вещей, и о них стоит знать до клика по «Сжать»:
- Выделение текста — нельзя подсветить, скопировать или искать слова. Каждое слово — группа пикселей внутри картинки.
- Встроенные шрифты — шрифты больше не часть файла. Рендеренные пиксели содержат формы букв, но не метаданные шрифта. Перестроить текст или сменить шрифт нельзя.
- Гиперссылки — кликабельные ссылки и закладки растеризуются в картинку. Синий подчёркнутый текст видно, но он никуда не ведёт.
- Поля форм — поля ввода, чекбоксы, блоки подписи сплющиваются в страницу-картинку. PDF становится только для чтения.
- Векторная графика — графики, диаграммы и другие векторные элементы превращаются в пиксели. При увеличении видна пикселизация вместо чистых линий.
- Теги доступности — экранные читалки не прочитают растеризованный PDF, пока не сделать повторный OCR. Это реальная цена для документов, критичных по доступности.
Если что-то из этого важно для твоего документа — это не тот инструмент. Используй наш «Разделить PDF», чтобы разбить файл на куски, если хочешь уложиться в лимит загрузки, или возьми десктопный компрессор вроде Adobe Acrobat, который делает настоящую оптимизацию PDF.
Похожие PDF-инструменты
Компрессор PDF — одна плитка большего набора. Несколько соседей, которые часто всплывают:
- Разделить PDF — разбить большой PDF на меньшие по диапазону страниц. Часто это лучшее решение, чем сжатие, когда нужно отправить только часть документа.
- PDF в JPG — тот же движок рендера, но выдаёт отдельные картинки страниц вместо пересборки в PDF. Полезно, когда страницы нужны отдельными файлами.
- Объединить PDF — собрать несколько PDF в один. Часто используется в паре с компрессором, когда собираешь документ из нескольких источников.
- Удалить страницы PDF — выбрось ненужные страницы перед сжатием. Быстрее, и часто это правильный первый шаг, если в PDF 200 страниц, а нужны 10.
- Сжать изображения — если у тебя на руках папка JPG, которые ты собирался превратить в PDF, сожми их сначала и пропусти шаг растеризации совсем.
Частые вопросы
Почему после сжатия текст не выделяется?
Потому что компрессор растеризует каждую страницу — рендерит её как изображение и сохраняет картинку внутри PDF. Как только страница стала картинкой, текстовых объектов в ней больше нет; слова — это пиксели. Большинство онлайн-компрессоров, обещающих «сохранить текст», либо сжимают слабо, либо требуют загрузить PDF на сервер, где могут использовать более серьёзные инструменты. Мы выбрали: в браузере, честно о размене, большой выигрыш на правильном входе.
Когда это хороший инструмент?
PDF с большим количеством изображений: сканы (чеки, договоры, подписанные формы), фотопдф (отпускные альбомы, листинги недвижимости), подборки скриншотов — всё, что в основном растровое. Такие часто сжимаются на 70-90% без заметной потери качества. Выделение текста, которое тут теряется, обычно и так фейковое — слой OCR поверх скана.
Когда это плохой инструмент?
Чисто текстовые PDF (книги, договоры, статьи, технические руководства) так сжимать не стоит. Файл будет меньше, но станет непоискомым, края текста на агрессивных пресетах станут мыльными, читатель не сможет копировать цитаты. Для таких PDF либо вообще не нужно сжатие, либо нужен серверный компрессор, отдельно пересохраняющий шрифты и картинки.
Точно ли мой PDF не загружается?
Да. Страницы рендерятся через pdfjs-dist в браузере, кодируются в JPG нативным canvas, а новый PDF собирает pdf-lib — всё WebAssembly и JavaScript. Ноль исходящих запросов на шаге сжатия. Открой вкладку Network в браузере, если хочешь проверить.
На сколько уменьшится размер?
Сильно зависит. PDF с большим количеством изображений на «Агрессивно» часто теряют 80-95% (скан на 50 МБ становится 3-8 МБ). Текстовые PDF могут и подрасти — инструмент предупредит, если выход больше входа. Большинство получает 50-70% уменьшения на «Сбалансированно» на правильном типе входа.
Хорошо ли потом печатается?
Да для «Высокое качество» и «Сбалансированно» — 150 DPI и 100 DPI оба чисто печатаются на офисном принтере. «Агрессивно» (72 DPI) — только для экрана; при печати будет видна пикселизация, особенно на тексте. Если планируешь печатать, бери «Высокое качество».
Можно сжать PDF с паролем?
Нет — pdf-lib отказывается открывать зашифрованные PDF. Сначала сними пароль десктопным просмотрщиком (или любым инструментом снятия пароля, которому доверяешь), потом сжимай разблокированную копию.
Изменится ли число страниц или порядок?
Нет. Компрессор точно сохраняет исходное число страниц и порядок — каждая страница входа становится одной страницей выхода, растеризованной на месте. Закладки, гиперссылки и поля форм не выживают (растеризуются в картинку страницы), поэтому инструмент — для отправки и архивирования, а не для документов, которым нужно остаться интерактивными.