PDF na Excel

🔒 Everything happens in your browser. The PDF never uploads. Close the tab and it's gone.

Konwerter PDF na Excel czyta fragmenty tekstu w Twoim PDF i klastruje je w siatkę: wiersze według współrzędnej Y, kolumny według odstępów X. Wynik to prawdziwy skoroszyt .xlsx z jednym arkuszem na stronę PDF — otwórz go w Excelu, Google Sheets albo Numbers. Uczciwie o zakresie: to działa dobrze na PDF-ach, które już SĄ tabelami (sprawozdania finansowe, eksporty z arkusza kalkulacyjnego, wyciągi z konta). PDF-y z prozą zwijają się do pojedynczej kolumny tekstu akapitów. Dla skomplikowanych wielokolumnowych układów stron lub scalonych komórek lepiej pasuje narzędzie desktopowe z ręcznym wyborem regionu. Działa w całości w Twojej przeglądarce dzięki PDF.js firmy Mozilla i SheetJS. Bez uploadu, bez serwera.

Built by Bob Article by Lace QA by Ben Shipped

Jak używać

  1. 1

    Wrzuć lub wybierz swój PDF. Do 100 MB i 200 stron.

  2. 2

    Przeczytaj żółty callout — mówi, na jakim rodzaju PDF to działa (tabele) i na jakim nie (proza, skany, skomplikowane układy).

  3. 3

    Kliknij „Konwertuj na Excel". Narzędzie czyta każdą stronę, klastruje fragmenty tekstu w siatkę 2D i emituje jeden arkusz na stronę PDF.

  4. 4

    Pobierz plik .xlsx (nazwany po Twoim źródłowym PDF — invoice.pdf → invoice.xlsx). Otwórz go w Excelu, Google Sheets, Numbers albo LibreOffice Calc.

  5. 5

    Sprawdź wynik wzrokiem. Granice kolumn to najlepszy zgadywany pomysł oparty na poziomych odstępach — jeśli podział kolumny wylądował źle, popraw go w aplikacji arkuszowej z Tekst-na-kolumny albo edytując komórki bezpośrednio.

Często zadawane pytania

Ratings & Reviews

Rate this tool

Sign in to rate and review this tool.

Loading reviews…

Co robi Konwerter PDF na Excel

PDF przechowuje tekst jako pozycjonowane fragmenty — każde słowo zna swoje położenie (x, y) na stronie, ale nic w pliku nie wie, czym jest „wiersz" lub „kolumna". Konwerter PDF na Excel patrzy na te fragmenty, klastruje je w wiersze według ich współrzędnej Y, dzieli każdy wiersz na kolumny wszędzie tam, gdzie jest szeroki poziomy odstęp, i zapisuje wynik w prawdziwy skoroszyt .xlsx. Jeden arkusz na stronę PDF. Otwórz go w Excelu, Google Sheets, Numbers albo LibreOffice Calc. Bez uploadu, bez znaku wodnego, bez rejestracji.

Cały pipeline działa w Twojej przeglądarce. PDF.js (otwarto-źródłowa biblioteka PDF Mozilli — ta sama, której Firefox używa wewnętrznie) czyta Twój PDF i daje nam fragmenty tekstu ze współrzędnymi. SheetJS koduje wynik do binarnego formatu .xlsx. Obie biblioteki działają na Twoim CPU, w Twojej karcie. Otwórz DevTools, przełącz na zakładkę Sieć, kliknij Konwertuj. Zero żądań wychodzących. Twoje bajty nie opuszczają maszyny.

Jedno uczciwe zastrzeżenie z góry: to działa dobrze na PDF-ach, które już tabelami — sprawozdania finansowe, wyciągi, eksporty z arkusza, zrzuty rządowych danych, załączniki do posiedzeń zarządu. Działa mniej dobrze na PDF-ach z prozą (dokument z kolumną tekstu zwija się do pojedynczej kolumny wartości komórek, co jest poprawne, ale prawdopodobnie nie tego chciałeś) i wcale na zeskanowanych PDF-ach (obraz tekstu, nie tekst — to praca OCR, zobacz poniżej). Wiedząc, co narzędzie robi, a czego nie, z góry, oszczędza zmarnowaną minutę.

Kiedy PDF na Excel to właściwe narzędzie

Tabele uwięzione w PDF-ach pojawiają się codziennie. Raporty kwartalne, wyciągi bankowe, formularze podatkowe, faktury dostawców, wydania rządowych danych, wewnętrzne eksporty MIS, papiery naukowe z tabelami wyników — wszędzie tam, gdzie pierwotnie żył arkusz, ktoś w końcu zdecydował „podziel się wersją PDF". Liczby są tam na stronie; po prostu nie są w formacie, który możesz sumować, filtrować, sortować ani pivotować.

Realne sytuacje, w których to narzędzie się opłaca:

  • Uzgadnianie wyciągu bankowego. Twój bank wysyła co miesiąc wyciągi jako PDF-y. Chcesz transakcje w arkuszu, żeby móc je kategoryzować, sumować według sprzedawcy i przekazać księgowemu. Transakcje to tabela na każdej stronie wyciągu.
  • Faktury od dostawców. Dostawca wysyła 6 faktur miesięcznie jako PDF-y. Twój workflow należności potrzebuje ich jako wierszy w skoroszycie, żebyś mógł sumować według miesiąca i uzgadniać z PO.
  • Dane badawcze. Agencja rządowa, papier naukowy lub raport branżowy publikuje kluczową tabelę danych wewnątrz raportu PDF. Chcesz to w Excelu, żeby narysować wykres albo połączyć z własnymi danymi.
  • Raporty sprzedaży z CRM. CRM ma przycisk „Pobierz jako PDF", ale nie ma „Pobierz jako Excel" — albo tylko w płatnej warstwie. PDF ma tabelę, za którą inaczej płaciłbyś 20 USD/user/miesiąc, żeby eksportować inaczej.
  • Listy klas lub dzienniki obecności. Nauczyciel lub administrator dostaje listę jako PDF, potrzebuje jej w arkuszu, żeby brać obecność, oceniać lub udostępniać zastępstwom.

W każdym przypadku dane bazowe są tabelaryczne — stałe wiersze i kolumny — a PDF to po prostu opakowanie, które ktoś wybrał. Konwerter strippuje opakowanie i oddaje Ci tabelę.

Jak używać Konwertera PDF na Excel

Jeden ekran. Strefa wrzucenia na górze, krótki callout wyjaśniający, co działa, a co nie, przycisk konwertuj poniżej.

  1. Wrzuć lub wybierz swój PDF. Do 100 MB i 200 stron.
  2. Przeczytaj żółty callout — mówi, na jakim rodzaju PDF to działa (tabele) i na jakim nie (proza, skany, skomplikowane układy).
  3. Kliknij „Konwertuj na Excel". Narzędzie czyta każdą stronę, klastruje fragmenty tekstu w siatkę 2D i emituje jeden arkusz na stronę PDF.
  4. Pobierz plik .xlsx (nazwany po Twoim źródłowym PDF — invoice.pdfinvoice.xlsx). Otwórz go w Excelu, Google Sheets, Numbers albo LibreOffice Calc.
  5. Sprawdź wynik wzrokiem. Granice kolumn to najlepszy zgadywany pomysł oparty na poziomych odstępach — jeśli podział kolumny wylądował źle, popraw go w aplikacji arkuszowej z Tekst-na-kolumny albo edytując komórki bezpośrednio.

To wszystko. Bez „zarejestruj się, żeby odblokować konwersję więcej niż 5 stron". Bez limitu 10 MB darmowego poziomu. Bez znaku wodnego stempelowanego przez Twoje dane.

Jak właściwie działa wykrywanie wierszy i kolumn

To interesująca część i warto ją rozumieć, bo wyjaśnia zarówno wygrane, jak i tryby porażki.

PDF.js daje nam listę fragmentów tekstu na stronę. Każdy fragment ma: string, który zawiera, pozycję x/y na stronie (w punktach — 72 na cal) i szerokość. Typowa strona to setki do tysięcy fragmentów. Nasza praca: zamienić to w siatkę.

Krok pierwszy — klastruj wiersze według Y. Fragmenty, których współrzędne Y są w odległości około 5 punktów od siebie, są traktowane jako ten sam wiersz. 5pt to mniej więcej pół linii tekstu ciała, więc to absorbuje naturalną wariację linii bazowej w dowolnym wierszu tabeli, jednocześnie wciąż oddzielając jeden wiersz od następnego. Wynik to uporządkowana lista wierszy, od góry do dołu.

Krok drugi — dziel kolumny według odstępów X. W każdym wierszu fragmenty są sortowane od lewej do prawej. Tam, gdzie poziomy odstęp między sąsiednimi fragmentami przekracza około 8 punktów, wstawiamy granicę kolumny. 8pt jest szerszy niż typowy odstęp międzysłowowy (spacja to około 3pt przy rozmiarze czcionki 10pt), ale węższy niż rynna, której większość projektantów tabel używa między kolumnami. Więc sąsiednie słowa w tej samej kolumnie zostają w tej samej komórce; sąsiednie kolumny się dzielą.

To cały algorytm. Dwie heurystyki dostrojone do tego, jak prawdziwe tabele faktycznie są układane. Bez uczenia maszynowego, bez API w chmurze, bez upload-i-czekaj-na-nasze-AI. Po prostu geometria. Działa dobrze na prawdziwych tabelach z tego samego powodu: prawdziwe tabele geometrią, której oczekuje.

Gdzie się waha: „tabela", która jest faktycznie wielokolumnową stroną prozy (pomyśl o magazynowym artykule, dwukolumnowym papierze konferencyjnym), zostanie podzielona na kolumny przez detektor odstępów X. To algorytm robiący dokładnie to, co ma robić — tam szerokie poziome odstępy między dwoma blokami tekstu. Jeśli chciałeś prozę z powrotem, użyj PDF Wyciągnij tekst, który zachowuje kolejność czytania.

Alternatywy Big Software — i deal, który każda oferuje

Masz trzy inne opcje wyciągnięcia tabel z PDF i każda przychodzi z własnym podatkiem.

Adobe Acrobat Pro (19,99 USD/miesiąc albo 239,88 USD/rok) to złoty standard. Ma prawdziwy pipeline wykrywania tabel dostrojony przez dekady — wykrywanie linii, fallback OCR dla zeskanowanych tabel, rozpoznawanie nagłówków, obsługa przypisów. Dla PDF-ów bez oczywistej struktury tabeli (bez obramowań, scalone komórki, nieregularne układy) jest lepszy niż my. Cena to cena: wieczna miesięczna subskrypcja, czy konwertujesz 100 PDF-ów miesięcznie, czy jednego. Większość ludzi, którzy mają Acrobata, używa go w 5% tego, co robi.

iLovePDF, SmallPDF, PDF24, ABBYY FineReader Online, Convertio — tłum upload-first. Biorą Twój PDF, wysyłają na serwer gdzieś, uruchamiają tam konwersję, odsyłają .xlsx. Ta sama jakość konwersji co nasza w łatwych przypadkach; czasem lepsza w trudnych (niektóre OCR-ują zeskanowane tabele; my nie). Wymiana: Twój PDF jest teraz na czyimś serwerze. Dla publicznego PDF z danymi kogo to obchodzi. Dla wyciągu bankowego, tabeli wynagrodzeń, umowy z pozycjami, dokumentu HR — właśnie wysłałeś to obcemu i zaufałeś, że to usunie. Plus limity (SmallPDF ogranicza Cię do 2 konwersji przed rejestracją; Sejda do 3/godzinę) i propozycja Pro Plan na każdej stronie.

„Kopiuj i wklej z PDF do Excela". Spróbuj raz na wielokolumnowej tabeli i zobacz, jak kolumny zwijają się do pojedynczej kolumny wartości komórek. Kopiowanie-wklejanie z PDF zachowuje tekst, ale odrzuca układ — to dokładnie problem, dla którego nasze wykrywanie kolumn zostało zbudowane. Działa w porządku dla jednokolumnowej listy. Rozpada się na czymkolwiek szerszym.

Propozycja Big Software jest zawsze: konwersja jest „darmowa!", ale doświadczenie jest bramkowane. Darmowy poziom z limitem 2 plików, 10 stron każdy, ze znakiem wodnym. Poziom Pro odblokowuje resztę. Zarejestruj się, by usunąć limit. Subskrybuj, by usunąć znak wodny. Wybieramy walkę z tym modelem celowo. Przeglądarka robi pracę. Nie ma kosztu marginalnego dla nas. Więc nie ma marginalnej ceny dla Ciebie. „Jest rozwiązanie dla wszystkiego" nie oznacza „jest płatne rozwiązanie dla wszystkiego".

Konkretny przykład: 6-stronicowy wyciąg bankowy

Uzgadniasz wydatki za kwartał. Twój bank wysyła co miesiąc wyciąg jako PDF. Sześć stron, trzy wyciągi w folderze. Każdy wyciąg ma nagłówek (strona 1 z informacjami o koncie, podsumowanie), trzy strony transakcji w 5-kolumnowej tabeli (data, opis, debet, kredyt, saldo) i końcową stronę drobnego druku.

Co się dzieje, gdy wrzucisz jeden wyciąg do konwertera:

  1. Wrzucasz statement-2026-04.pdf na strefę wrzucenia. Widget pokazuje liczbę stron (6) i przycisk Konwertuj.
  2. Kliknij Konwertuj na Excel. Około 2 sekundy później aktywuje się pobranie.
  3. Otwierasz statement-2026-04.xlsx. Ma sześć arkuszy: „Page 1", „Page 2", ..., „Page 6".
  4. Strona 1 ma nagłówek konta — imię, adres, numer konta — klastrowane w przybliżone wiersze. Niezbyt użyteczne jako tabela, ale wierne temu, co jest na stronie.
  5. Strony 2–4 to transakcje. Każdy wiersz ma 5 kolumn: data, opis, debet, kredyt, saldo. Wiersz nagłówka z PDF banku to pierwszy wiersz każdego arkusza.
  6. Strony 5–6 to sumy i drobny druk. Głównie bezużyteczne do uzgadniania; zignoruj je.

Wybierasz strony 2–4, kopiujesz wiersze, wklejasz je do swojego master skoroszytu. Pięć sekund czyszczenia — kilka komórek debet/kredyt, gdzie PDF banku używał dziwnej konwencji odstępów, a nasz detektor kolumn podzielił je nieco inaczej. Klik, klik, gotowe. Powtórz dla pozostałych dwóch wyciągów. Łączny czas: około 5 minut. Ta sama praca przez Adobe Acrobat zajęłaby z grubsza tyle samo czasu plus subskrypcja 19,99 USD. Przez SmallPDF: wolniejszy krok uploadu plus dane banku są teraz na serwerze SmallPDF.

Co zachowuje, czego nie

Uczciwe ustawienie oczekiwań oszczędza frustracji. Oto co przeżywa konwersję, a co nie:

CechaCo się dzieje
Tekst i liczby w komórkachZachowane dokładnie tak, jak czyta je PDF.js
Kolejność wierszyZachowana (od góry do dołu każdej strony)
Kolejność kolumnZachowana (lewo-do-prawo każdego wiersza)
Wiersz nagłówkaStaje się pierwszym wierszem arkusza (bez specjalnego statusu „nagłówka")
Tabele wielostronicoweJeden arkusz na stronę — tabela jest podzielona na arkusze, połączyłbyś w Excelu
Scalone komórkiNajlepsze możliwe: wartość idzie do najbardziej lewej komórki scalenia
Obramowania, kolory, czcionkiUsuwane — tylko wartości
FormułyNie dotyczy — PDF-y nie niosą formuł, tylko obliczone wartości
Zeskanowane tabeleNie działa — bez OCR. PDF-y obrazowe wychodzą puste.
Wielokolumnowy układ strony (np. kolumny magazynowe)Obie kolumny lądują obok siebie w arkuszu — zwykle nie to, czego chcesz
Obrazy osadzone w komórkachUsuwane — zobacz Wyciągnij obrazy PDF dla tych

Jeśli granica kolumny ląduje źle na Twoim konkretnym PDF — powiedzmy konwerter scalił dwie kolumny, które powinny być oddzielne, bo ich poziomy odstęp wynosił 6pt zamiast 8pt — poprawka jest w samym Excelu, nie w naszym narzędziu. Wybierz kolumnę, Dane → Tekst na kolumny → Stała szerokość → przeciągnij granicę we właściwe miejsce. 30 sekund. Alternatywa — zbudowanie UI dla użytkowników do ręcznego przeciągania granic kolumn w naszym widgecie — podwoiłaby złożoność narzędzia dla 5% konwersji, gdzie by pomogła. Pledge Prostoty mówi: rób jedną rzecz. Robimy.

O zeskanowanych PDF-ach i OCR

Najczęstszy raport „narzędzie nie zadziałało" na dowolnym konwerterze PDF to: Wrzuciłem skan, wynik był pusty. Oto dlaczego i co robić.

Zeskanowany PDF to zdjęcie strony opakowane w metadane PDF. Nie ma tekstu wewnątrz — każda „litera" to wzorzec pikseli. PDF.js, poproszony o wyciągnięcie tekstu ze skanu, znajduje zero fragmentów tekstu i daje nam nic. Więc nasz detektor wiersz/kolumna nie ma nic do klastrowania, a wyjście .xlsx jest puste. To nie bug, który możemy naprawić w tym narzędziu; to wejście jest innym rodzajem obiektu niż to, co narzędzie czyta.

Co robić: najpierw OCR-uj PDF. Optical Character Recognition konwertuje piksele z powrotem na fragmenty tekstu — gdy to zrobione, masz „prawdziwy" PDF z wyciągalnym tekstem, a konwerter zadziała. Opcje:

  • Adobe Acrobat Pro ma wbudowane OCR (Tools → Recognize Text). Uruchom, zapisz, a potem przepuść wynik tutaj.
  • macOS Preview auto-OCR-uje PDF-y, gdy otwierasz je na ostatnich wersjach macOS. Zapisz kopię.
  • Tesseract (open source, linia poleceń) — zainstaluj przez Homebrew albo apt, uruchom na swoim PDF.
  • Google Drive — prześlij, „Otwórz z Google Docs", a Drive OCR-uje treść. Notatka o prywatności: Twój PDF jest teraz w Google.

Możemy dodać narzędzie OCR w przeglądarce później (tesseract.js działa w przeglądarce, tylko wolno), ale to zasadniczo inna operacja niż ekstrakcja oparta na tekście i zasługuje na własne narzędzie.

Prywatność to cały powód, dla którego to istnieje w przeglądarce

Powód, dla którego konwertery PDF-na-Excel są głównie w chmurze, jest prosty: dostawcy jest łatwiej uruchomić konwersję na swoim serwerze niż wysłać szybki parser PDF do przeglądarki każdego użytkownika. Wymiana prywatności użytkownika — „daj nam swój PDF, obiecujemy go usunąć" — to koszt łatwiejszego wyboru inżynieryjnego.

Microapp wybrał trudniejszy wybór inżynieryjny celowo. PDF.js działa w Twojej przeglądarce, szybko, na każdym nowoczesnym urządzeniu. SheetJS działa w Twojej przeglądarce, szybko, na każdym nowoczesnym urządzeniu. Nie ma powodu, dla którego konwersja musi dziać się na czyjejś maszynie — poza tym, że to nieco więcej pracy dla dostawcy, by tak nie było.

Więc zrobiliśmy nieco więcej pracy. Wynik: Twój wyciąg bankowy, Twoja tabela wynagrodzeń, Twoja lista klientów, Twoja umowa — czymkolwiek PDF konwertujesz — zostaje na Twoim laptopie. Strona Microapp ładuje się z naszego CDN; konwersja działa lokalnie; .xlsx jest budowany lokalnie i oferowany jako lokalny blob do pobrania. Zero ruchu sieciowego podczas konwersji. Możesz zweryfikować z DevTools. To nie obietnica marketingowa — to architektura.

Powiązane narzędzia

Narzędzia, które naturalnie parują się z Konwerterem PDF na Excel:

  • Wyciągnij tekst z PDF — wyciąga biegnącą prozę z PDF (kolejność czytania, nie tabelaryczna). Właściwy wybór, gdy Twój PDF nie jest tabelaryczny.
  • Wyciągnij obrazy z PDF — wyciąga osadzone zdjęcia z PDF w oryginalnej rozdzielczości.
  • Podziel PDF — rozbij bardzo duży PDF na mniejsze pliki przed konwersją (pomocne ponad 200 stron).
  • Łączenie PDF — połącz wiele PDF-ów w jeden przed konwersją (przydatne do partii miesięcznych wyciągów).
  • Excel na PDF — odwrotny kierunek. Zamień skoroszyt z powrotem w PDF.
  • Liczba stron PDF — szybkie sprawdzenie długości PDF przed konwersją.
  • Cenzurowanie PDF — zaczerń wrażliwe pola przed udostępnieniem źródłowego PDF.

Jak Microapp płaci czynsz: roczne członkostwo dla czystych stron i pracy AI po cenie kosztu; nie-Members dostają te same narzędzia z reklamami. Tak czy inaczej, 10% każdego dolara, który Microapp zarabia, idzie na cele charytatywne — z góry, audytowane, publikowane kwartalnie. Konwerter PDF na Excel to jeden z ~115 microappów zbudowanych do tego samego standardu. Premium quality, dla wszystkich.

Często zadawane pytania

Jak właściwie wykrywana jest tabela?

Dwustopniowa heurystyka na fragmentach tekstu, które daje nam PDF.js. Krok pierwszy: klastrowanie fragmentów według współrzędnej Y — fragmenty w odległości około 5pt od siebie pionowo są traktowane jako ten sam wiersz. Krok drugi: w każdym wierszu, sortuj fragmenty lewo-do-prawej i dziel na osobne kolumny wszędzie tam, gdzie poziomy odstęp między sąsiednimi fragmentami przekracza około 8pt (szerszy niż odstęp międzysłowowy, ale węższy niż typowe rynny tabel). To heurystyka, nie magia — działa dobrze na prawdziwych tabelach, mniej dobrze na tekście, który po prostu zdarza się być ułożony w kolumnach.

Czy obsługuje scalone komórki?

Nie. PDF-y nie mają strukturalnej koncepcji „scalonych komórek" — mają wizualnie pozycjonowany tekst na stronie, a scalona komórka to po prostu pojedynczy fragment tekstu, który zdarza się rozciągać na to, co byłoby dwiema pozycjami kolumn. Konwerter umieszcza ten fragment w jednej komórce (najbardziej lewej, którą nakłada). Jeśli potrzebujesz zachowania scalonych komórek, będziesz musiał scalić je ręcznie w Excelu po konwersji — ale z naszego doświadczenia narzędzia w dalszych etapach działają lepiej z niescalonymi komórkami i tak.

Co jeśli mój PDF ma wiele stron?

Dostajesz jeden arkusz na stronę w wyjściowym skoroszycie, nazwane „Page 1", „Page 2" itd. Łączna liczba stron z limitem 200 (ustawiona wyżej niż 500 ekstrakcji tekstu, bo krok klastrowania i zapisu jest cięższy per strona). Jeśli Twój PDF jest dłuższy, najpierw podziel go naszym Podziel PDF i konwertuj każdy kawałek osobno.

Jak to się ma do Adobe Acrobat lub płatnego konwertera?

Adobe Acrobat (i ABBYY, Foxit itd.) są dostarczane z wieloprzebiegowymi algorytmami wykrywania tabel dostrojonymi przez dekady — wykrywanie linii, fallback OCR dla zeskanowanych tabel, rozpoznawanie nagłówków, obsługa przypisów. Są lepsze w edge case'ach: tabele bez obramowań, tabele ze scalonymi komórkami, zeskanowane PDF-y (których w ogóle nie obsługujemy — bez OCR). Dla typowego przypadku — PDF, który dosłownie jest eksportem arkusza, albo sprawozdanie finansowe, które jest strukturalnie tabelaryczne — nasze narzędzie dochodzi w 80% za 0 dolarów i zero uploadu. Użyj Adobe, gdy potrzebujesz ostatnich 20%.

Czy mój PDF naprawdę nie jest wysyłany?

Zgadza się. PDF.js (biblioteka, której Firefox używa wewnętrznie do renderowania PDF-ów) działa w Twojej przeglądarce. SheetJS (enkoder .xlsx) też działa w Twojej przeglądarce. Twoje bajty idą z systemu plików do pamięci przeglądarki do pobrania .xlsx — nigdy na serwer. Sprawdź zakładkę sieci w przeglądarce podczas konwersji: zero żądań wychodzących.

Dlaczego mój PDF z prozą wygląda jak pojedyncza kolumna w Excelu?

Bo strukturalnie to jest właśnie to. Akapity tekstu biegnącego nie mają poziomych odstępów wystarczająco szerokich, by wyzwolić podział kolumny — słowa są oddzielone pojedynczymi spacjami, znacznie poniżej naszego progu 8pt. Konwerter poprawnie identyfikuje każdą linię jako jedną komórkę. Jeśli chcesz każdą linię we własnej komórce kolumny A, to faktycznie działa — jeśli chcesz słów podzielonych przez kolumny, prawdopodobnie chcesz Wyciągnij tekst z PDF, a potem krok Tekst-na-kolumny w samym Excelu.

A co z zeskanowanymi PDF-ami?

Nie działa — tak samo jak nasze inne narzędzia PDF. Zeskanowane PDF-y to obrazy tekstu, nie tekst. Konwersja ich wymaga OCR (Optical Character Recognition), co jest zasadniczo inną operacją i nie jest tym, co to narzędzie robi. Najpierw przepuść skan przez narzędzie OCR (Adobe Acrobat, macOS Preview albo Tesseract), zapisz OCR-owany PDF, a potem uruchom to tutaj.

Jaki jest maksymalny rozmiar pliku?

100 MB i 200 stron. Krok klastrowania i kodowania jest pamięciożerny; ograniczamy go niżej niż narzędzie liczące strony. Dla naprawdę dużych PDF-ów najpierw podziel naszym Podziel PDF.