ماذا يفعل ضاغط PDF فعلاً
معظم ضواغط PDF عبر الإنترنت — iLovePDF، SmallPDF، ضاغط Adobe الويب — يعدون بملف أصغر ولا يشرحون المقايضة. ضاغط PDF خاصتنا يفعل شيئاً محدداً واحداً: يرسطر كل صفحة. ذلك يعني أنه يصيّر كل صفحة كصورة، ثم يكتب ملف PDF جديد يحتوي تلك الصور. انخفاضات حجم كبيرة على الإدخال الصحيح. خسائر حقيقية على الإدخال الخاطئ. نخبرك أيها لديك قبل أن تنقر.
هذا عكس كيف يعمل ضغط PDF "الحقيقي". محسن PDF السليم يعيد ضغط الصور والخطوط المضمنة داخل الملف مع الحفاظ على النص كنص. ذلك النوع من الضاغط هو ما يفعله Adobe Acrobat على سطح المكتب، وما يفعله iLovePDF على خادم بعد رفع ملفك. لا نفعل ذلك بعد — يتطلب إما خادماً (وملفك يغادر جهازك) أو سلسلة أدوات WASM أثقل لم نشحنها. فبدلاً من التظاهر، نشحن النسخة الصادقة: رسطر، حذِّر، دعك تقرر.
متى تكون هذه الأداة الإجابة الصحيحة
ملفات PDF الغنية بالصور هي حيث يتألق الرسطرة وإعادة الضغط. مسحة 50 ميغابايت لعقد من 30 صفحة عادة تنخفض إلى 3-6 ميغابايت في الإعداد المتوازن، بلا فقدان جودة مرئي. ألبوم صور مصدَّر من هاتفك قد يتقلص من 80 ميغابايت إلى 8 ميغابايت. مجموعات لقطات الشاشة، الإيصالات الممسوحة، قوائم العقارات، الأوراق الموقعة — أي شيء حيث الصفحة بالفعل صورة — يضغط بشكل كبير لأن JPG الأصلية حُفظت بجودة أعلى مما تحتاج.
الرياضيات مباشرة. صفحة ممسوحة مخزنة في 300 DPI كـ JPG بجودة كاملة تقريباً 1-3 ميغابايت. مُعاد التصيير في 100 DPI ومُعاد الترميز في 75% جودة JPG، نفس الصفحة 100-300 كيلوبايت. عبر مستند من 30 صفحة هذا الفرق بين مرفق بريد إلكتروني يُرفض وآخر يمر.
تحذير صادق: إن كان ملف PDF خاصتك غنياً بالنص — كتاب، عقد ستبحث داخله، ورقة بحثية، أي شيء تحتاج فيه لنسخ اقتباسات أو البحث عن كلمات — لا تستخدم هذه الأداة. ستفقد النص القابل للتحديد، الخطوط المضمنة، والقدرة على Cmd-F داخل المستند. الكلمات تصبح بكسلات. لا يوجد زر تراجع على ملف PDF مرسطر.
كيف تستخدم ضاغط PDF
أسقط أو اختر ملف PDF خاصتك. الأداة تقبل حتى 100 ميغابايت و200 صفحة — كافٍ لكل مستند تقريباً في العالم الحقيقي. الملفات الأكبر تصطدم بحدود ذاكرة المتصفح؛ لتلك، استخدم أداة سطح مكتب.
- أسقط أو اختر ملف PDF خاصتك. الأداة تقرأ عدد الصفحات وحجم الملف وتظهرهما قبل أي شيء آخر.
- اقرأ التحذير. إن اكتشف التحذير أن ملف PDF خاصتك غني بالنص، سيقول ذلك. إن كان غالباً صوراً، سيخبرك ذلك أيضاً. الأداة متحيزة نحو عدم تركك تخرب مستنداً اهتممت به.
- اختر إعداداً مسبقاً. الجودة العالية (150 DPI، 85% JPG) أقرب للأصل. المتوازن (100 DPI، 75% JPG) ما يريده معظم الناس فعلاً. العدواني (72 DPI، 60% JPG) للشاشة فقط وسيدهور حواف النص بشكل مرئي.
- انقر ضغط PDF. كل صفحة تُصيَّر إلى canvas في DPI المختار، تُشفَّر كـ JPG في الجودة المختارة، وتُضمَّن في ملف PDF جديد. شريط تقدم يظهر صفحة بصفحة.
- انقر تنزيل. كتلة النتيجة تظهر الحجم قبل، الحجم بعد، وانخفاض النسبة المئوية. الإخراج يُسمى
original-name-compressed.pdf.
ملف PDF خاصتك لا يغادر متصفحك أبداً. الصفحات تُصيَّر عبر pdfjs-dist، ملفات JPG تأتي من مشفر canvas الأصلي للمتصفح، وملف PDF الجديد يُبنى بـ pdf-lib — كل WebAssembly وJavaScript، لا جولات شبكة خلال خطوة الضغط. افتح علامة تبويب الشبكة في متصفحك خلال التشغيل وسترى صفر طلبات صادرة.
الإعدادات الثلاثة المسبقة، وأيها تختار
DPI يتحكم في كم بكسل لكل بوصة تُصيَّر الصفحة. جودة JPG تتحكم في كم بعدوانية تُضغط تلك البكسلات بعد ذلك. كلا المقبضين يتفاعلان — خفض أحدهما ورفع الآخر غالباً ينتج أحجام ملفات مشابهة بأوضاع فشل مختلفة.
| الإعداد | DPI التصيير | جودة JPG | انخفاض الحجم النموذجي | الأفضل لـ |
|---|---|---|---|---|
| جودة عالية | 150 DPI | 85% | 30-50% | إخراج جاهز للطباعة، أرشفة، أي شيء ستنظر إليه عن قرب |
| متوازن (افتراضي) | 100 DPI | 75% | 50-70% | مرفقات البريد، المشاركة، العرض على الشاشة |
| عدواني | 72 DPI | 60% | 70-90% | المعاينات السريعة، التناسب تحت حد رفع ضيق، عدم الطباعة أبداً |
قاعدة القرار الأبسط: إن كنت ستطبع ملف PDF، اختر عالي. إن كنت ستشاركه أو تقرأه على شاشة، اختر متوازن. إن كان لديك حد رفع على وشك الفشل ويمكنك التعايش مع حواف نص ضبابية، اختر عدواني — وافترض أن النتيجة للاستخدام مرة واحدة.
مثال محلول بأرقام حقيقية
خذ حالة حقيقية: ملف PDF ممسوح من 38 صفحة لعقد موقع، أصلاً 47.2 ميغابايت. الصفحات مُسحت في 300 DPI كـ JPG بجودة كاملة — دقة أكثر بكثير مما يحتاج أي شخص لملف PDF لقراءة الشاشة. هذا ما تنتجه الإعدادات الثلاثة:
| الإعداد | حجم الإخراج | التخفيض | ملاحظات الجودة |
|---|---|---|---|
| عالي (150 DPI، 85%) | 14.1 ميغابايت | 70% | لا يمكن تمييزه عن الأصل على شاشة لابتوب 14 بوصة، يطبع نظيفاً |
| متوازن (100 DPI، 75%) | 5.8 ميغابايت | 88% | أنعم قليلاً عند الفحص الدقيق، جيد لقراءة الشاشة ومعظم الطباعة |
| عدواني (72 DPI، 60%) | 2.9 ميغابايت | 94% | تشوهات JPG مرئية على النص، جيد لمشاركة سريعة، سيء للطباعة |
الأصل كان 47.2 ميغابايت — كبير جداً لمعظم أنظمة البريد (Gmail يحد المرفقات في 25 ميغابايت، Outlook في 20 ميغابايت). بعد الضغط المتوازن هو 5.8 ميغابايت ويمر في أي مكان. العقد الموقع لا يزال يُقرأ نظيفاً. تحديد النص الذي كان في الأصل (مُضاف بـ OCR بعد المسح) ذهب، لكن لا أحد احتاجه لعقد عليك فقط إعادة توجيهه.
الآن نفس الأداة على إدخال مختلف: ورقة أكاديمية 4 ميغابايت بنص حقيقي ومعادلات. بعد الضغط المتوازن هي 6.2 ميغابايت — أكبر. رسطرة النص المتجه أقل كفاءة من إبقائه كنص، والأداة تحذر عندما يكون الإخراج أكبر من الإدخال. نفس الأداة، نوع ملف خاطئ. لهذا نضع التحذير في المقدمة.
كيف يقارن هذا بـ iLovePDF و SmallPDF و Adobe
المقارنة الصادقة: تلك الأدوات تفعل ضغطاً أكثر تطوراً مما نفعل، بثمن رفع ملفك إلى خادمهم.
iLovePDF و SmallPDF يضغطان من جانب الخادم باستخدام ghostscript أو محسن PDF أصلي مشابه. يعيدان ضغط الصور المضمنة مع الحفاظ على النص والخطوط. الإخراج عادة أصغر من إخراجنا على ملفات PDF غنية بالنص ومشابه أو أكبر قليلاً على ملفات PDF غنية بالصور. لديهما أيضاً حدود الفئة المجانية (عدد ملفات في اليوم، حد حجم ملف) وترقية "ارفع لإزالة الحدود" المعيارية. ملف PDF خاصتك يعيش على خوادمهم لعدة ساعات على الأقل وربما أطول حسب سياسة الاحتفاظ.
ضاغط Adobe الويب يفعل نفس الشيء الذي يفعله iLovePDF، في تغليف أجمل، خلف جدار تسجيل دخول، بحصة تقمعك نحو اشتراك Creative Cloud. هو الإخراج الأنظف من المجموعة على ملفات PDF غنية بالنص. هو أيضاً الأبطأ، الأكثر إصراراً على عنوان بريدك، والأغلى بمجرد تجاوز الفئة المجانية.
نحن المقايضة المعاكسة. أبطأ من لا شيء في المتصفح، لكن بلا رفع، بلا حساب، بلا حصة، بلا احتفاظ. نرسطر لأن ذلك ما يمكننا فعله جيداً في المتصفح اليوم؛ نخبرك متى يكون ذلك الخيار الخاطئ. عندما نشحن محسن PDF حقيقي في المتصفح يحفظ النص (هو على القائمة)، سيظهر بجانب هذا مع المقايضة موسومة.
ما الذي يُفقد عند رسطرة PDF
عدة أشياء، ويستحق معرفتها كلها قبل النقر على ضغط:
- تحديد النص — لم يعد بإمكانك تظليل أو نسخ أو البحث عن كلمات في ملف PDF. كل كلمة مجموعة من البكسلات داخل صورة.
- الخطوط المضمنة — الخطوط لم تعد جزءاً من الملف. البكسلات المُصيَّرة تتضمن أشكال الحروف، لكن ليس بيانات وصفية للخط. إعادة تدفق النص أو تغيير الخط مستحيل.
- الروابط التشعبية — الروابط القابلة للنقر والإشارات المرجعية تُرسطر في الصورة. النص الأزرق المسطر لا يزال مرئياً لكنه لا يذهب إلى أي مكان.
- حقول النماذج — حقول الإدخال، خانات الاختيار، كتل التوقيع كلها تتسطح في صورة الصفحة. ملف PDF الآن للقراءة فقط.
- الرسوميات المتجهة — المخططات، الرسوم البيانية، وعناصر متجهة أخرى تتحول إلى بكسلات. التكبير يُظهر البكسلة بدلاً من خطوط نظيفة.
- وسوم إمكانية الوصول — قارئات الشاشة لا يمكنها قراءة ملف PDF مرسطر إلا إن أُعيد تطبيق OCR. هذه تكلفة حقيقية للوثائق الحرجة لإمكانية الوصول.
إن كان أي من تلك يهم لمستندك، ليست هذه الأداة. استخدم أداة تقسيم PDF لكسر الملف إلى قطع أصغر إن كنت تحاول النزول تحت حد رفع، أو استخدم ضاغط سطح مكتب مثل Adobe Acrobat الذي يقوم بتحسين PDF السليم.
أدوات PDF ذات صلة
ضاغط PDF هو بلاطة في مجموعة أدوات PDF أكبر. بضع جيران يظهرون كثيراً:
- تقسيم PDF — اكسر ملف PDF كبيراً إلى ملفات أصغر حسب نطاق الصفحات. غالباً إصلاح أفضل من الضغط عندما تحتاج فقط مشاركة جزء من مستند.
- PDF إلى JPG — نفس محرك التصيير كالضاغط، لكن يخرج صور الصفحات الفردية بدلاً من إعادة تجميعها في ملف PDF. مفيد عندما تريد الصفحات كملفات قائمة بذاتها.
- دامج PDF — اجمع ملفات PDF متعددة في واحد. غالباً يقترن بالضاغط عند تجميع مستند متعدد المصادر.
- حذف صفحات PDF — أسقط الصفحات غير الضرورية قبل الضغط. أسرع من الضغط، وهو الخطوة الأولى الصحيحة إن كان لديك ملف PDF بـ 200 صفحة وتحتاج 10 فقط.
- ضاغط الصور — إن كان ما لديك فعلاً مجلد من ملفات JPG كنت على وشك تحويلها إلى PDF، اضغطها أولاً وستتخطى خطوة رسطرة PDF كلياً.
الأسئلة الشائعة
لماذا يزيل الضغط تحديد النص؟
لأن هذا الضاغط يعمل برسطرة كل صفحة — تصييرها كصورة، ثم تخزين الصورة داخل ملف PDF. بمجرد أن تكون الصفحة صورة، لا توجد كائنات نص بعد الآن؛ الكلمات بكسلات. معظم ضواغط PDF عبر الإنترنت التي تعد بـ "الحفاظ على النص" إما لا تضغط فعلاً بكثير، أو تطلب منك رفع ملف PDF إلى خادمهم حيث يمكنهم استخدام أدوات أكثر تطوراً. اخترنا: في المتصفح، صادق بشأن المقايضة، فوز حجم كبير على الإدخال الصحيح.
متى تكون هذه أداة جيدة للاستخدام؟
ملفات PDF الغنية بالصور هي المنطقة المثالية: المستندات الممسوحة (الإيصالات، العقود، النماذج الموقعة)، ملفات PDF الصور (ألبومات العطلة، قوائم العقارات)، مجموعات لقطات الشاشة، أي شيء بمحتوى راستر في الغالب. هذه غالباً تضغط 70-90% بلا فقدان جودة مرئي. تحديد النص الذي ستفقده عادة OCR مزيف ملقى فوق مسحة على أي حال.
متى تكون هذه أداة سيئة للاستخدام؟
ملفات PDF النصية فقط (الكتب، العقود، المقالات، الأدلة التقنية) لا ينبغي ضغطها بهذه الطريقة. تحصل على ملف أصغر لكنه يصبح غير قابل للبحث، حواف النص تصبح ضبابية تحت الإعدادات العدوانية، ولم يعد القارئ قادراً على نسخ الاقتباسات. لهذه، الأداة الصحيحة إما لا ضغط على الإطلاق (ملفات PDF المولودة من نص بالفعل صغيرة) أو ضاغط من جانب الخادم يعيد ضغط الخطوط والصور المضمنة بشكل منفصل.
هل ملف PDF خاصتي فعلاً لا يُرفع؟
صحيح. الصفحات تُصيَّر عبر pdfjs-dist في متصفحك، تُشفَّر كـ JPG باستخدام canvas الأصلي للمتصفح، وملف PDF الجديد يُبنى بـ pdf-lib — كل ذلك في WebAssembly و JavaScript. صفر طلبات صادرة خلال خطوة الضغط. تحقق من علامة تبويب الشبكة في متصفحك إن أردت التحقق.
ما تخفيض الحجم الذي يمكنني توقعه؟
متفاوت جداً. ملفات PDF الغنية بالصور في الإعداد العدواني غالباً تنخفض 80-95% (مسحة 50 ميغابايت تصبح 3-8 ميغابايت). ملفات PDF الغنية بالنص قد تنمو فعلاً لأن رسطرة النص المتجه أقل كفاءة من إبقائه كنص — الأداة تحذرك إن كان الإخراج أكبر. معظم المستخدمين يهبطون 50-70% أصغر مع الإعداد المتوازن على النوع الصحيح من الإدخال.
هل لا يزال الإخراج يطبع جيداً؟
نعم للإعدادين العالي والمتوازن — 150 DPI و 100 DPI يطبعان نظيف على إعدادات طابعة المكتب المعيارية. الإعداد العدواني (72 DPI) للشاشة فقط؛ طباعته ستظهر بكسلة مرئية، خاصة على النص. اختر عالي إن كانت الطباعة جزءاً من سير العمل.
هل يمكنني ضغط ملف PDF محمي بكلمة مرور؟
لا — pdf-lib يرفض فتح ملفات PDF المشفرة. أزل كلمة المرور أولاً باستخدام قارئ سطح المكتب (أو أي أداة إزالة كلمة مرور تثق بها)، ثم اضغط النسخة غير المحمية.
هل سيتغير عدد الصفحات أو ترتيبها؟
لا. الضاغط يحفظ عدد الصفحات الأصلي وترتيبها بالضبط — كل صفحة في الإدخال تصبح صفحة واحدة في الإخراج، مرسطرة في مكانها. الإشارات المرجعية، الروابط التشعبية، وحقول النماذج لا تنجو (يتم رسطرتها في صورة الصفحة)، فهذه الأداة للمشاركة والأرشفة، لا للمستندات التي تحتاج البقاء تفاعلية.