Что делает конвертер Word в PDF
Конвертер Word в PDF берёт .docx и выдаёт скачиваемый PDF. Библиотека mammoth читает структуру .docx (это ZIP из XML; mammoth знает схему), результат рендерится как HTML, html2canvas снимает этот HTML в canvas на 2×, а jsPDF выкладывает canvas плиткой на страницы PDF в выбранном размере. Выбери A4 или Letter, выбери поле, нажми конвертацию. Заголовки, абзацы, маркированные и нумерованные списки, жирный, курсив, ссылки — всё рабочее форматирование проходит чисто. Всё работает в браузере. Документ не загружается.
Будем честны про предназначение. Если Word установлен, встроенный «Файл → Сохранить как → PDF» точнее — он знает свои разрывы страниц, кастомные шрифты, модель таблиц и привязку картинок на уровне, который не повторит сторонний инструмент. Наш инструмент — тот, к которому тянешься, когда Word нет: на Chromebook, на чужом ноутбуке, на Linux, на телефоне или когда не хочется загружать документ в iLovePDF, SmallPDF или веб-конвертер Adobe ради PDF. Для резюме, сопроводительного письма, короткой статьи, краткой записки встречи — частые случаи — это работает. Для 60-страничного отчёта с таблицами с объединёнными ячейками, журнальной вёрсткой и бренд-специфичными шрифтами открывай Word.
Как пользоваться конвертером Word в PDF
Один экран, один файл, один клик. Вся конверсия идёт в браузере.
- Брось или выбери .docx. Максимум 25 МБ. Старые .doc не поддерживаются — открой в Word и сохрани как .docx.
- Выбери размер страницы: A4 (210×297 мм, большая часть мира) или Letter (8.5×11 дюйма, США/Канада). По умолчанию A4.
- Выбери поле: 10 мм (узкое), 20 мм (стандартное, по умолчанию) или 40 мм (широкое).
- Нажми «Конвертировать в PDF». Виджет читает .docx, рендерит на off-screen-страницу, снимает как картинку и режет на страницы PDF.
- Нажми «Скачать». PDF назван по входному файлу (
mydoc.docx→mydoc.pdf).
Открой вкладку Network во время конвертации. После загрузки самой страницы вкладка молчит — ноль исходящих запросов, никакой телеметрии, никакой загрузки. Mammoth парсит .docx в памяти; html2canvas рисует на canvas в памяти; jsPDF пишет PDF в памяти; скачивание идёт через blob-URL. Документ не покидает машину.
Разбор примера с реальными цифрами
Возьмём реальный случай: 3-страничное резюме в .docx, 18 КБ на диске. Times New Roman 11 пт основной текст, Calibri 14 пт заголовки (шрифт Microsoft, лицензии на встраивание которого у нас нет), три маркированных списка, без таблиц, без картинок.
При A4 / 20 мм: конверсия занимает 1,8 секунды. На выходе 280 КБ на 3 страницах. Основной текст рендерится чисто. Маркеры — как маркеры. Заголовки Calibri подменяются на sans-serif-фоллбэк (Helvetica на Mac, Arial на Windows) — слегка другой визуальный характер, то же число строк. Жирный и курсив проходят. Раздел «навыки», который был двухколонной таблицей в .docx, рендерится как одна колонка с сохранением порядка чтения, потому что мы не воспроизводим точную геометрию колонок таблицы Word.
То же резюме при A4 / 10 мм: 2 страницы вместо 3. При A4 / 40 мм: 4 страницы. Letter / 20 мм: 3 страницы, общее ощущение как у A4 — ширины колонок почти идентичны.
Переверни вход: 22-страничный отчёт компании со встроенными графиками, врезкой на каждой странице, таблицами с объединёнными ячейками и бренд-шрифтом компании (Inter). Конверсия завершается за 18 секунд. Графики проходят как картинки, но два сместились за край страницы, потому что привязанное позиционирование Word не транслировалось. Объединённые ячейки в финансовой таблице рендерятся как отдельные ячейки рядом, ломая визуальную структуру. Шрифт Inter упал на системный serif. Выход правильный по содержанию и примерно правильный по визуальному ощущению, но не то, что вышло бы из «Сохранить как PDF» в Word. Для такого сложного отчёта Word — правильный инструмент. Мы сказали это сверху.
Как это сравнивается с Adobe Acrobat, SmallPDF, iLovePDF
Три категории конкурентов: сам Word, большие веб-конвертеры и наш инструмент.
«Файл → Сохранить как → PDF» в Microsoft Office — золотой стандарт верности. Он знает всё про Word, потому что это Word. Разрывы страниц приземляются там, где Word сказал; шрифты встраиваются как контуры или через лицензионный путь Microsoft; таблицы остаются табличными; привязка картинок сохраняется. Если документ важен и Word есть, бери Word. Мы не пытаемся конкурировать с Word — мы пытаемся быть там, где Word нет.
iLovePDF, SmallPDF, веб-конвертер Adobe Acrobat, PDFCrowd, Convertio — оборачивают серверный LibreOffice или коммерческие движки конверсии за веб-формой. Выход ближе к качеству Word, чем у нас, потому что у них настоящий стек конверсии документов. Цена: твой .docx путешествует на их серверы, сидит там какое-то время хранения, потом возвращается PDF. Они ограничивают бесплатное использование (размер файла, дневной счёт, водяные знаки без регистрации), а платные тарифы стартуют от $5–15/мес. Веб-версия Adobe Acrobat активнее всех ведёт к Creative Cloud за $20+/мес. Для резюме, копию которого не хочется оставлять незнакомцу, это неправильная сделка. Для 200-страничного руководства, где верность вёрстки — весь смысл, правильная.
Google Docs «Скачать → PDF» — ещё путь, если .docx достаточно мал, чтобы туда загрузить. Та же сделка — документ идёт на серверы Google — но известная величина, если ты уже в экосистеме Google. Верность пристойная для простых документов.
Наш инструмент — локально-first вариант. Медленнее, чем ничего (конверсия идёт на твоём CPU в WebAssembly), менее верный, чем Word или серверные сервисы, без аккаунта, без квот, без водяного знака, без загрузки. Компромисс открыто живёт в предупреждениях над кнопкой конвертации и в этой статье — мы говорим, когда это правильный инструмент и когда нет.
Что рендерится хорошо, а что — нет
Качество выхода зависит от того, что в .docx. Зная форму своего документа заранее, видишь, тот ли это инструмент.
| Элемент документа | Рендерится | Заметки |
|---|---|---|
| Основной текст, заголовки (H1–H6) | Хорошо | Иерархия сохраняется, размеры шрифтов корректны |
| Жирный, курсив, подчёркнутый, зачёркнутый | Хорошо | Все инлайн-форматирования проходят чисто |
| Маркированные и нумерованные списки | Хорошо | Вложенные списки с правильными отступами; кастомные форматы нумерации могут упроститься |
| Гиперссылки | Хорошо | Текст ссылки стилизован правильно; ссылка кликабельна в PDF |
| Простые таблицы | OK | Рамки, выравнивание, базовые ячейки рендерятся нормально |
| Встроенные картинки | OK | JPEG и PNG проходят; позиционирование может слегка сместиться от Word |
| Стандартные шрифты (Times, Arial, Helvetica) | Хорошо | Рендерятся нативно в браузере |
| Шрифты Microsoft (Calibri, Aptos, Cambria, Segoe) | Подменяются | Падают на serif или sans-serif эквивалент — текст читаемый, характер меняется |
| Сложные таблицы (объединённые ячейки, вложенные, повторяющиеся шапки) | Плохо | Могут рендериться как плоские ячейки; сложные вёрстки не выживут |
| Привязанные картинки (текст-вокруг-плотно, под-текстом) | Плохо | Модель позиционирования Word выразительнее, чем HTML; ожидай сдвигов |
| Шапки, подвалы, номера страниц | Пока нет | Только основной контент — мы не рендерим модель шапок/подвалов Word |
| Комментарии, отслеженные правки | Не рендерятся | Сначала прими или отклони правки в Word, потом экспортируй |
| Уравнения (Microsoft Equation Editor) | Плохо | Могут рендериться поломанными глифами; уплощай в картинки в Word, если важно |
Простое правило решения: если документ в основном текст + списки + заголовки + жирный/курсив + редкая таблица или картинка, инструмент в своей лучшей форме. Если это дизайнерский документ с кастомной вёрсткой, бренд-шрифтами или сложными таблицами, открывай Word.
Шрифты: почему визуальное ощущение иногда смещается
Шрифты Microsoft Word по умолчанию — Calibri, Cambria, Aptos (новый дефолт в свежих версиях Office) — лицензированы Microsoft. Они не подлежат перераспространению; мы не можем поставить их в браузер и не можем легально подтянуть с CDN, чтобы рендерить твой документ. То же касается любого стороннего шрифта, который ты установил локально и использовал в .docx.
Когда mammoth конвертирует документ в HTML, CSS-правило font-family всё ещё говорит «Calibri», но в браузере Calibri нет, и он падает по стеку шрифтов на системный эквивалент. На macOS основной текст обычно приземляется на Times New Roman или Helvetica. На Windows — на Arial. На Linux — на то, что поставил дистрибутив (часто DejaVu или Liberation Serif). Текст читаем. Характер документа меняется — Calibri это слегка гуманистический sans-serif; фоллбэк может быть нейтральнее. Разрывы строк могут смещаться, потому что у подменяемого шрифта другая ширина символов, что иногда приводит к тому, что абзац, помещавшийся на одну страницу в Word, переливается на две у нас.
Если важна точная гарнитура — брендовый одностраничник, набранное эссе, статья в журнал — используй встроенный экспорт PDF в Word. Он встраивает оригинальный шрифт прямо в PDF через лицензионную договорённость Microsoft, и выход будет идентичен тому, что на экране в Word. Для резюме, идущего рекрутёру, который распечатает его на офисном принтере, фоллбэк-шрифты нормальны.
Дерево решений
Три вопроса решают, какой инструмент правильный.
- Есть ли на этой машине Word (или LibreOffice, или Pages)? Если да и документ для финальной печати, используй встроенный экспорт PDF в приложении. Готово.
- Готов ли ты, чтобы документ ушёл на чужой сервер? Если да, iLovePDF / SmallPDF / веб-версия Adobe дают почти Word-верность. Они хранят файл какое-то время (читай политику хранения, если важно) и направят к подписке на втором-третьем файле.
- Нужен PDF, Word не установлен, не хочется загружать? Используй этот инструмент. Выход хорош для простых документов (резюме, письма, короткие статьи, записки). Открой результат и посмотри на него до отправки — проверь, что вёрстка совпадает с ожидаемой. Если что-то сдвинулось настолько, что важно, упади на вариант 2 или найди машину с Word.
Стыдиться нечего ни одного из трёх. Это разные сделки на одну задачу.
Похожие PDF-инструменты
Word в PDF естественно пары с несколькими в стопке Microapp PDF:
- PDF в Word — обратное направление. Только текст, работает в том же браузерном режиме.
- Изображения в PDF — собрать JPEG или PNG в PDF. Полезно, если «Word-документ» — это серия скриншотов, которые тебе прислали.
- HTML в PDF — тот же браузерный конвейер рендера, другой формат входа.
- Объединить PDF — соединить выход Word-в-PDF с другими PDF в один файл.
- Сжатие PDF — уменьшить результат. Выход Word-в-PDF может быть картинками-heavy, потому что страница растеризуется; для пересылки сжатие часто срезает 50–70%.
- Подписать PDF — добавить подпись к итоговому PDF без загрузки.
Microapp шипит каждый PDF-инструмент в браузере. 10% от каждого доллара выручки идут на благотворительность — сверху, с аудитом раз в квартал — поэтому инструменты должны зарабатывать своё, то есть реально работать без зарывания пользователя в апселл.
Частые вопросы
Почему только .docx? У меня .doc.
Старый бинарный формат .doc (Word 97–2003) использует другую структуру файла, которую наш конвертер (библиотека mammoth) не читает. Современный Word по умолчанию сохраняет .docx. Чтобы конвертировать .doc, открой его в Word (или LibreOffice, Pages, Google Docs) и используй «Файл → Сохранить как → Word Document (.docx)». Потом брось .docx в этот инструмент. Большинство .doc можно перевести в .docx с 2007-го — скорее всего, у тебя просто старый файл.
Как обрабатывает таблицы?
Простые таблицы (несколько строк и колонок текста) рендерятся нормально — рамки, выравнивание и содержимое проходят. Сложные таблицы — объединённые ячейки, вложенные таблицы, повторяющиеся шапки, заливка ячеек, тонкая настройка ширины колонок — могут поплыть или выглядеть иначе. Причина: мы рендерим документ Word как HTML, а потом снимаем HTML в PDF. У HTML-таблиц нет такого точного контроля, как у нативного движка таблиц Word. Если документ сильно табличный (финансовая отчётность, счета, расписания с объединёнными ячейками), «Сохранить как PDF» в самом Word будет вернее.
А шрифты? У меня в документе кастомный шрифт.
Кастомные или системно-специфические шрифты (Calibri, Aptos, Cambria и т. д.) подменяются на serif-фоллбэк (Times New Roman / Georgia), потому что мы не можем встроить лицензионные шрифты Word в браузер. Текст остаётся читаемым, число строк может сместиться, и визуальный характер документа меняется. Если важна точная гарнитура (брендовый одностраничник, набранное эссе), используй встроенный экспорт PDF в Word — он встраивает оригинальный шрифт прямо в PDF.
Почему мои встроенные картинки отображаются не так?
Картинки, встроенные в .docx, проходят, но их позиционирование может не совпасть с точной расстановкой Word. Word поддерживает продвинутую привязку (текст-вокруг-плотно, под-текстом, перед-текстом, точные координаты в дюймах), которую HTML напрямую выразить не может. Если позиция картинки критична (диаграммное руководство, журнальная вёрстка), используй «Файл → Сохранить как → PDF» в Word — он сохраняет оригинальную привязку. Для текст-heavy документов с несколькими картинками наш инструмент даст 90%.
Чем это отличается от «Файл → Сохранить как → PDF» в Word?
Встроенный экспорт Word точнее: он знает свои разрывы страниц, шрифты, модель таблиц и привязку картинок на уровне, который не может сравниться ни один сторонний инструмент. Это правильный инструмент для финальной печати. Word в PDF от Microapp для случая, когда Word не открыт (ты на чужой машине, на Linux, на Chromebook, на мобильном), документ простой (резюме, письмо, статья), и нужен быстрый PDF без загрузки на чужой сервер. Мы не пытаемся заменить Word — мы пытаемся быть там, где Word нет.
Мой документ правда не загружается?
Верно. mammoth читает байты .docx в браузере. html2canvas снимает отрендеренный HTML в canvas в браузере. jsPDF собирает PDF в браузере. Итоговый blob отдаётся ссылкой скачивания из локальной памяти. Ноль исходящих запросов во время конвертации — проверь во вкладке Network. Сама страница Microapp загружается с нашего CDN; всё после этого локально.
Почему мой выходной PDF такой большой?
Потому что каждая страница рендерится как JPEG (на 2× для резкости) и встраивается в PDF — то есть размер файла растёт с числом страниц и плотностью содержимого. 10-страничный текстовый документ может выйти 1–3 МБ; 50-страничный отчёт — 10+ МБ. Если размер важен, прогони результат через наше сжатие PDF или, для самого маленького выхода с резким текстом, используй «Сохранить как PDF» в Word — там текст остаётся векторным, а не пикселями.
Когда использовать это, а когда просто открыть Word?
Используй это, когда: Word не установлен, ты на телефоне или Chromebook, документ простой (письмо, резюме, короткая статья), хочется ноль загрузки, ты шлёшь одноразовый PDF и пиксель-перфектность не нужна. Используй «Сохранить как PDF» в Word, когда: документ для финальной печати, использует кастомные шрифты, которые важны, имеет много таблиц или точное размещение картинок, или его будут читать построчно те, кто заметит тонкие сдвиги вёрстки.
Списки и маркеры проходят?
Да. Маркированные списки, нумерованные списки и базовые вложенные списки рендерятся правильно. Многоуровневые структуры с кастомными форматами нумерации (1.a.i.) могут упроститься до обычной нумерации. Если документ в основном текст + списки + заголовки + жирный/курсив, инструмент в своей лучшей форме.