PDF na Word

🔒 Everything happens in your browser. The PDF never uploads. Close the tab and it's gone.

Konwerter PDF na Word bierze PDF, wyciąga zaznaczalny tekst i pakuje go jako edytowalny dokument Word .docx — otwórz go w Microsoft Word, Google Docs, LibreOffice Writer albo Apple Pages i zacznij edytować. Uczciwe ramowanie: to konwersja tylko-tekst. Układ, tabele, obrazy, osadzone czcionki i wizualne formatowanie nie są zachowane — te nie przeżywają ekstrakcji tekstu PDF po stronie klienta w użytecznej formie. Jeśli potrzebujesz prawdziwej konwersji zachowującej układ (z tabelami, obrazami, kolumnami, czcionkami), potrzebujesz Adobe Acrobat Pro albo innego płatnego produktu, który uruchamia odtworzenie dokumentu po stronie serwera. To narzędzie jest dla bardzo częstego przypadku, gdy po prostu chcesz edytować słowa i nie zależy Ci na replikowaniu oryginalnego designu. Działa w całości w Twojej przeglądarce dzięki PDF.js firmy Mozilla do ekstrakcji i bibliotece `docx` do pliku Word — Twój PDF nigdy nie opuszcza Twojej maszyny.

Built by Bob Article by Lace QA by Ben Shipped

Jak używać

  1. 1

    Wrzuć lub wybierz swój PDF. Do 100 MB i 500 stron.

  2. 2

    Przeczytaj żółte zastrzeżenie — to konwersja tylko-tekst. Jeśli potrzebujesz zachowanych tabel, obrazów albo układu, to nie jest właściwe narzędzie; użyj Adobe Acrobat Pro zamiast tego.

  3. 3

    Kliknij „Konwertuj na Word". Narzędzie czyta każdą stronę, rekonstruuje podziały linii z układu i zapisuje tekst do .docx z jednym akapitem na wizualną linię i pustą linią między stronami.

  4. 4

    Pobierz .docx, nazwany po Twoim źródłowym PDF (np. report.pdf → report.docx). Otwórz go w Word, Google Docs, LibreOffice albo Pages i edytuj normalnie.

Często zadawane pytania

Ratings & Reviews

Rate this tool

Sign in to rate and review this tool.

Loading reviews…

Co właściwie robi Konwerter PDF na Word

Konwerter PDF na Word wyciąga zaznaczalny tekst z PDF i pakuje go jako edytowalny plik .docx. Otwórz go w Microsoft Word, Google Docs, LibreOffice Writer albo Apple Pages i zacznij edytować. Ekstrakcja tekstu działa w PDF.js firmy Mozilla — tej samej bibliotece, której Firefox używa do natywnego renderowania PDF-ów — a .docx jest zapisywany przez bibliotekę `docx` w przeglądarce. Twój PDF nigdy nie jest wysyłany.

Bądźmy uczciwi z góry: to konwersja tylko-tekstowa. Układ, tabele, obrazy, osadzone czcionki, kolumny, pozycjonowanie zakotwiczone w stronie, starannie dostrojone marginesy oryginału — żadne z tych nie przeżywa. Wyjście to słowa Twojego PDF, w akapitach, w kolejności czytania, gotowe do edycji. Jeśli potrzebujesz dokumentu Word, który otwiera się wyglądając jak oryginalny PDF (zachowane tabele, obrazy, kolumny, czcionki), potrzebujesz Adobe Acrobat Pro, który uruchamia silnik odzyskiwania dokumentu po stronie serwera, który był szlifowany przez dwie dekady i kosztuje około 20 USD/miesiąc. Nie próbujemy z tym konkurować. Pokrywamy przypadek, gdy po prostu chcesz edytować sformułowanie — zmienić nazwisko, zaktualizować datę, poprawić akapit, wysłać zrewidowaną wersję — i nie potrzebujesz replikować oryginalnego designu. To częsty przypadek i dla niego to narzędzie jest właściwym wyborem.

Jak go używać

Jeden ekran, jeden plik, jedno kliknięcie. Wszystko działa lokalnie.

  1. Wrzuć lub wybierz swój PDF. Do 100 MB i 500 stron.
  2. Przeczytaj żółte zastrzeżenie — to konwersja tylko-tekst. Jeśli potrzebujesz zachowanych tabel, obrazów albo układu, to nie jest właściwe narzędzie; użyj Adobe Acrobat Pro zamiast tego.
  3. Kliknij Konwertuj na Word. Narzędzie czyta każdą stronę, rekonstruuje podziały linii z układu i zapisuje tekst do .docx z jednym akapitem na wizualną linię i pustą linią między stronami.
  4. Pobierz .docx, nazwany po Twoim źródłowym PDF (np. report.pdfreport.docx). Otwórz go w Word, Google Docs, LibreOffice albo Pages i edytuj normalnie.

Otwórz zakładkę sieci przeglądarki podczas konwersji: po załadowaniu samej strony zakładka jest cicha. PDF.js czyta bajty lokalnie. Biblioteka docx zapisuje plik Word lokalnie. Pobranie jest serwowane z blob URL. Twój PDF nie opuszcza maszyny.

Konkretny przykład z prawdziwymi liczbami

Weź realny przypadek: 12-stronicowa umowa w PDF, 240 KB, wyeksportowana z Microsoft Word pierwotnie (więc tekst jest osadzony, nie zeskanowany). Dwie kolumny prawniczego tekstu na stronę, stopka z numerami stron, bez obrazów, kilka klauzul pogrubionych.

Konwersja zajmuje około 1,4 sekundy. Wyjście to 28 KB .docx, który otwiera się czysto w Word. Tekst jest cały — akapit-po-akapicie, w kolejności czytania. Dwukolumnowy układ zniknął (.docx jest jednokolumnowy). Pogrubione formatowanie zniknęło (wyciągamy tylko tekst, nie stylizację). Numery stron w stopce zmieszały się z treścią na granicy między stronami. Problem pogrubionego-tekstu-staje-się-zwykłym-tekstem oznacza, że stracisz wizualne podkreślenie; możesz ponownie pogrubić kluczowe klauzule ręcznie, gdy będzie otwarte w Word.

Wynik netto: użyteczny. Umowa, którą możesz edytować. Możesz zmienić nazwę strony, zaktualizować datę wejścia w życie, zrewidować klauzulę, zaakceptować śledzone zmiany od kogoś innego, a potem wyeksportować z powrotem do PDF z Word. Dwukolumnowy układ nie ma znaczenia, gdy jest edytowalnym dokumentem, bo Word układa to tak, jak Word chce.

Przerzuć wejście: 50-stronicowy zeskanowany PDF technicznego podręcznika z lat 70. Przycisk konwertuj uruchamia się, a potem zwraca niemal pusty .docx. PDF nie ma osadzonego tekstu — to stos obrazów stron — więc nie ma nic, co ekstraktor mógłby wyciągnąć. Właściwe narzędzie tutaj to OCR. Najpierw przepuść skan przez nasze narzędzie OCR PDF, a potem przenieś wynikowy tekst do Worda.

Dlaczego układ nie jest zachowany

Prawdziwa konwersja PDF-na-Word zachowująca układ jest naprawdę trudna. PDF przechowuje tekst jako strumień pozycjonowanych glifów — każdy znak ma współrzędną (x, y), referencję czcionki i indeks glifu. Nie ma markera dla „to jest nagłówek", „to jest wiersz tabeli", „to jest przypis". Konwerter, który chce zapisać wierny dokument Word, musi wywnioskować całą tę strukturę z pozycji: wykryć, które glify tworzą nagłówek po rozmiarze i grubości czcionki, wykryć, które linie tworzą tabelę, dostrzegając wzorzec siatki w pozycjach linii, wykryć, która treść jest callout-em paskowym, wykryć granice kolumn, wykryć podpisy. To trudny problem uczenia maszynowego i głęboki problem ergonomii.

Adobe Acrobat Pro robi to dobrze, bo Adobe szlifuje silnik odzyskiwania od późnych lat 90., trenowany na korpusie milionów dokumentów, ze stosem heurystyk, których większość z nas nigdy nie widzi. Odzyskują tabele z powrotem jako tabele, obrazy z powrotem jako obrazy, kolumny z powrotem jako kolumny. To warte 20 USD/miesiąc, jeśli Twoja praca obejmuje przenoszenie dokumentów między PDF a Word cały dzień.

Otwarto-źródłowe biblioteki po stronie przeglądarki nie mogą tego dorównać. Albo produkują zepsute wyjście na rzeczywistych PDF-ach (heurystyki zawodzą w zaskakujący sposób), albo całkowicie odpuszczają układ i po prostu dają Ci tekst. Większość „darmowych narzędzi PDF na Word", które znajdziesz online — iLovePDF, SmallPDF, Smallpdf znów rebrandowany, online2pdf, freepdfconvert.com — wybiera opcję trzecią: wysłać Twój PDF na swój serwer, uruchomić tam komercyjny silnik, wysłać z powrotem .docx. Wynik jest bliżej jakości Acrobata. Koszt: Twój plik żyje na ich serwerze przez jakieś okno retencji, darmowy poziom szybko Cię ogranicza, a płatny poziom kieruje do subskrypcji 5-15 USD/miesiąc.

Wybraliśmy inaczej: wyciągamy czysty tekst, zapisujemy prawidłowy .docx, mówimy Ci z góry, co dostajesz. Dla przypadku, gdy potrzebujesz edytować słowa — co jest najczęstszym powodem, dla którego ludzie otwierają te narzędzia — to właściwa wymiana.

Jak to się ma do Adobe Acrobat, SmallPDF, iLovePDF

Trzy poziomy w tym rynku, wybranie właściwego poziomu oszczędza bólów głowy.

NarzędziePrywatnośćWierność układuKosztNajlepsze dla
Adobe Acrobat Pro (desktop)Lokalnie — działa na Twojej maszynieWysoka — tabele, obrazy, kolumny odzyskane~20 USD/miesiącCodzienna praca PDF↔Word, profesjonalne odzyskiwanie dokumentów
iLovePDF / SmallPDF (web)Pliki wysłane, trzymane przez godzinyŚrednio-wysoka — komercyjny silnik po stronie serweraDarmowe z limitami, 9-15 USD/miesiąc za nieograniczoneOkazjonalne konwersje, układ ma znaczenie, nie obchodzi Cię upload
To narzędzieLokalnie — działa w Twojej przeglądarceNiska — tylko tekst, bez układuDarmowe„Po prostu chcę edytować sformułowanie", wrażliwe dokumenty, bez uploadu
Google Docs („Otwórz z")Wysłane do Google DriveŚrednia — konwerter Google jest przyzwoity na prostych PDF-achDarmowe, jeśli masz konto GoogleJesteś już w ekosystemie Google

Wybierz według wymiany, na której Ci zależy. Prywatność na pierwszym miejscu → nasze narzędzie, akceptując, że stracisz układ. Wierność na pierwszym miejscu → Acrobat Pro na desktopie albo jedna z usług uploadu. Darmowe-i-dość-dobre-dla-prostych-PDF-ów → Google Docs, jeśli OK Ci z danymi idącymi do Google.

Co dostajesz, a co tracisz

Znajomość inwentarza z góry zapobiega rozczarowaniu.

Co przychodzi:

  • Tekst ciała. Każdy zaznaczalny glif w PDF, w przybliżonej kolejności czytania, zorganizowany w akapity przez wizualne podziały linii.
  • Struktura akapitów. Pusta linia między stronami, podziały linii, gdzie PDF je ma, przebiegi tekstu pogrupowane tam, gdzie współrzędna y jest spójna.
  • Unicode. Znaki diakrytyczne, cyrylica, greka, typowe symbole matematyczne, emoji — wszystko, co PDF zapisał jako glif Unicode — trafia do .docx jako właściwe znaki.
  • Kolejność czytania, głównie. Jednokolumnowe dokumenty wychodzą czysto. Dwukolumnowe dokumenty czasem przeplatają kolumny; będziesz musiał to naprawić ręcznie w Word.

Co jest odrzucane:

  • Tabele. Tekst wewnątrz komórek tabeli pojawia się w .docx jako zwykłe akapity w przybliżonej kolejności czytania, nie jako tabela Word. Odzyskanie siatki komórek wymagałoby wykrycia struktury tabeli z pozycji linii — poza zakresem narzędzia text-fidelity.
  • Obrazy. Pomijane całkowicie. Jeśli ich potrzebujesz, nasze narzędzie Wyciągnij obrazy PDF wyciągnie je jako osobne pliki, byś mógł wstawić do Worda ręcznie.
  • Formatowanie. Pogrubienie, kursywa, rozmiary czcionek, kolory, style — wszystkie odrzucone. .docx jest zwykłym tekstem. Sformatuj ponownie, co potrzebujesz, ręcznie, gdy będzie otwarte w Word.
  • Kolumny. Układy wielokolumnowe zwijają się do jednokolumnowego.
  • Nagłówki, stopki, numery stron. Te często mieszają się z treścią na granicach stron, bo PDF.js nie oznacza ich osobno.
  • Przypisy. Lądują w treści blisko miejsca, gdzie pojawiają się na stronie, nie na dole strony w panelu przypisów Worda.
  • Hiperlinki. Tekst linku przechodzi jako zwykły tekst; podstawowy URL jest odrzucany.

Prosty test: jeśli Twój cel to „chcę edytować słowa", to jest właściwe narzędzie. Jeśli Twój cel to „chcę dokument Word, który otwiera się wyglądając jak PDF", nie jest.

Problem dwóch kolumn i jak go naprawić

Najczęstsza skarga na ekstrakcję tekstu z rzeczywistych PDF-ów to przeplatanie kolumn. Papiery naukowe, artykuły magazynowe, gazety, dokumenty prawne — wszystko w dwu- lub trójkolumnowym układzie — może wyjść z naprzemiennymi kolumnami linia-po-linii: linia 1 kolumny 1, potem linia 1 kolumny 2, potem linia 2 kolumny 1, potem linia 2 kolumny 2. Nieczytelne.

To się dzieje, bo PDF.js zwraca elementy tekstu w kolejności źródłowej — z grubsza od góry do dołu, od lewej do prawej w małej tolerancji y — a dwukolumnowy układ ma linie na tej samej współrzędnej y w obu kolumnach. Bez wykrywania kolumn (krok odzyskiwania układu, którego nie robimy) ekstraktor czyta je jako pojedynczą linię, która przekracza granicę kolumny.

Trzy poprawki, w kolejności wysiłku:

  1. Najpierw spróbuj konwersji. Niektóre PDF-y kodują granice kolumn wystarczająco czysto, że tolerancja y naturalnie oddziela kolumny. Możesz dostać czyste wyjście bez robienia niczego.
  2. Jeśli kolumny się przeplotły, podziel PDF. Użyj naszego narzędzia Podziel PDF, by wyciągnąć tylko jedną stronę, a potem przytnij stronę do pojedynczej kolumny przed konwersją. Męczące dla długich dokumentów, ale niezawodne.
  3. Użyj narzędzia odzyskiwania układu. Dla ciężkich kolumnowych dokumentów Adobe Acrobat Pro albo jedna z usług po stronie serwera wykryje kolumny poprawnie. Wymianą jest upload, koszt albo oba.

Kiedy to narzędzie jest właściwe, a kiedy nie

Właściwe przypadki:

  • Potrzebujesz edytować sformułowanie. Umowa ze zmianą nazwy. Artykuł, który chcesz zrewidować. Raport, który musisz zaktualizować przed wysłaniem.
  • Jednokolumnowy tekst ciała. Memo, listy, artykuły, umowy, eBooki — większość PDF-ów „w kształcie tekstu" przychodzi czysto.
  • Wrażliwe dokumenty. Wszystko, co rozważałbyś dwa razy przed uploadem: prawnicze, medyczne, finansowe, osobiste. Konwersja działa w Twojej przeglądarce; nic nie opuszcza maszyny.
  • Długie PDF-y. Limit 500 stron jest hojny, bo ekstrakcja tekstu jest tania. Większość usług online ogranicza do 25-50 stron na darmowym poziomie.

Złe przypadki:

  • Potrzebujesz, by PDF wyglądał tak samo w Word. Użyj Acrobat Pro albo usługi po stronie serwera. Mówimy to z góry — nie ma sensu udawać.
  • PDF to głównie tabele. Sprawozdania finansowe, faktury, dane strukturalne — wypróbuj nasze narzędzie PDF na Excel albo użyj Acrobat Pro.
  • PDF jest zeskanowany. Brak zaznaczalnego tekstu oznacza nic do wyciągnięcia. Najpierw przepuść przez OCR PDF, by wyciągnąć tekst do użytecznej formy.
  • Potrzebujesz zachowanych obrazów. Użyj Wyciągnij obrazy PDF, by je wyciągnąć, a potem wstaw do Worda ręcznie.

Powiązane narzędzia PDF

PDF na Word to jeden kafelek w stosie narzędzi PDF po stronie przeglądarki:

  • Word na PDF — odwrotny kierunek. Działa w tym samym trybie po stronie przeglądarki.
  • Wyciągnij tekst z PDF — ten sam krok ekstrakcji, wyjście zwykły .txt. Wybierz to, jeśli nie potrzebujesz opakowania .docx.
  • PDF na Excel — wyciąga dane tabelaryczne z PDF. Właściwe narzędzie, gdy Twój PDF to głównie tabele.
  • OCR PDF — dla zeskanowanych PDF-ów, które nie mają zaznaczalnego tekstu. Rozpoznaje słowa z pikseli za pomocą Tesseracta.
  • Wyciągnij obrazy PDF — wyciąga osadzone obrazy jako osobne pliki. Sparuj z tym narzędziem, by odzyskać zarówno tekst, jak i obrazy.
  • Podziel PDF — rozbij długi PDF na kawałki przed konwersją.

Microapp wysyła każde narzędzie PDF po stronie przeglądarki, z tymi samymi wymianami wypisanymi na każdej stronie. 10% każdego dolara przychodu Microapp idzie na cele charytatywne, z góry, audytowane kwartalnie — więc narzędzia muszą robić uczciwą pracę, co oznacza, że mówimy Ci, kiedy to nie jest właściwa odpowiedź.

Często zadawane pytania

Dlaczego układ nie jest zachowany?

Prawdziwa konwersja zachowująca układ PDF → Word to trudny problem: konwerter musi wykryć nagłówki, akapity, kolumny, tabele, listy i umiejscowienie obrazów ze strumienia pozycjonowanych glifów, który nie ma semantycznej struktury. Adobe Acrobat Pro robi to dobrze, bo uruchamiają silnik odzyskiwania po stronie serwera trenowany na milionach dokumentów. Otwarto-źródłowe biblioteki po stronie klienta nie mogą tego dorównać — każda uczciwa próba albo produkuje zepsute wyjście dla rzeczywistych PDF-ów, albo wymaga wysłania pliku do usługi chmurowej. Wybraliśmy ani jedno, ani drugie: wyciągamy czysty tekst, pakujemy jako prawidłowy .docx i mówimy Ci z góry, co dostajesz. To właściwa wymiana dla 'po prostu chcę edytować sformułowanie'.

A co z tabelami — czy przejdą?

Nie. Tabele w PDF nie są przechowywane jako tabele — są przechowywane jako siatka niezależnie pozycjonowanych przebiegów tekstu i narysowanych linii. Aby zrekonstruować tabelę, musisz wykryć siatkę komórek z pozycji linii i odpowiednio pogrupować tekst, co jest dokładnie tym rodzajem odzyskiwania układu, którego to narzędzie celowo nie robi. Tekst komórki pojawi się w Twoim .docx, ale jako zwykłe akapity w przybliżonej kolejności czytania, nie jako tabela Word. Jeśli Twój PDF to głównie tabele (np. sprawozdanie finansowe, faktura), użyj dedykowanego narzędzia PDF-na-Excel albo Adobe Acrobat Pro.

Czy obrazy przychodzą?

Nie. Obrazy osadzone w PDF są pomijane całkowicie. Pass ekstrakcji tekstu czyta tylko glify, a zapisywanie obrazów do .docx wymaga ich ponownego zakodowania i obliczenia współrzędnych umiejscowienia, które pasują do oryginalnej strony — poza zakresem narzędzia text-fidelity. Jeśli potrzebujesz obrazów, wyciągnij je osobno naszymi narzędziami PDF na PNG albo PDF na JPG i wstaw do Worda ręcznie.

Czym to się różni od Adobe Acrobat Pro?

Acrobat Pro uruchamia pełen pipeline odzyskiwania dokumentu: wykrywa nagłówki, akapity, kolumny, listy, tabele i regiony obrazów, a potem zapisuje dokument Word, który wygląda wizualnie podobnie do oryginalnego PDF. To branżowy standard dla tego i kosztuje ~20 USD/miesiąc. Nie próbujemy konkurować w wierności — pokrywamy przypadek, gdy nie potrzebujesz wizualnej wierności, tylko edytowalnego tekstu. Jeśli Twoje wyjście 'musi wyglądać jak oryginalny PDF, gdy ponownie otwierane w Word', użyj Acrobat Pro. Jeśli Twoje wyjście 'musi zawierać tekst z PDF, żebym mógł go edytować w Word', użyj tego narzędzia.

Czy mój PDF naprawdę nie jest wysyłany?

Zgadza się. Oba etapy działają w przeglądarce. PDF.js (ta sama biblioteka, która renderuje PDF-y w Firefoxie) wyciąga tekst, a biblioteka `docx` buduje plik Word w pamięci przeglądarki. Twoje bajty nigdy nie opuszczają Twojej maszyny. Sprawdź zakładkę sieci w przeglądarce podczas konwersji: zero żądań wychodzących po załadowaniu samej strony.

Czy działa na zeskanowanych PDF-ach?

Nie — i mówimy to wyraźnie, gdy nie działa. Zeskanowane PDF-y to obrazy tekstu, nie zaznaczalny tekst. Aby wyciągnąć słowa ze skanu, potrzebujesz OCR (Optical Character Recognition), co jest inną operacją. To narzędzie wyciąga tekst, który już jest w PDF. Dla skanów najpierw przepuść PDF przez narzędzie OCR (Adobe Acrobat, macOS Preview, Tesseract albo jedną z darmowych usług OCR online), zapisz wynik, a potem przepuść go przez to narzędzie.

Czy mogę konwertować PDF chroniony hasłem?

Nie — PDF.js odmawia otwarcia zaszyfrowanych PDF-ów. Najpierw odblokuj PDF używając czytnika desktopowego (Adobe Acrobat: Plik → Właściwości → Zabezpieczenia → 'Zapisz jako' kopię bez ochrony; albo macOS Preview: Plik → Eksportuj → odznacz 'Szyfruj') i przepuść odblokowaną kopię przez to narzędzie.

Jaki jest maksymalny rozmiar pliku lub liczba stron?

100 MB i 500 stron na PDF. Ekstrakcja tekstu jest szybsza niż pełne renderowanie strony, więc limit jest hojny. Dla wielotysięcznostronicowych dokumentów (postępowania prawne, duże manuskrypty) najpierw podziel PDF naszym Podziel PDF i konwertuj w kawałkach.

Dlaczego moje podziały linii są dziwne?

PDF.js zwraca elementy tekstu w kolejności źródłowej ze współrzędnymi x/y; wstawiamy podział linii, gdy współrzędna y skacze. Większość PDF-ów wychodzi czysto, ale dwukolumnowe dokumenty przeplatają kolumny, a niektóre PDF-y mają niezwykłe pozycjonowanie tekstu, które produkuje dodatkowe podziały w środku akapitu. Gdy .docx jest otwarty w Word, użyj Znajdź i Zamień, by oczyścić: zamień `^p` (znacznik akapitu) na spację, a potem ręcznie ponownie podziel akapity. To wciąż szybsze niż przepisywanie.