ما تفعله أداة مقارنة PDF
مقارنة PDF تأخذ ملفي PDF، تستخرج النص من كليهما، وتُريك سطراً بسطر ما الذي تغيّر — ما أُضيف، ما حُذف، ما هو نفسه. اسحب الأصلي إلى خانة والنسخة المُحدّثة إلى الأخرى، اضغط قارن، وستحصل على عرض المراجعة في ثوانٍ. اختر جنباً إلى جنب لتخطيط اللوحتين الكلاسيكي الذي يتوقعه مراجعو العقود، أو اختر موحد لعمود واحد بعلامات +/− (الصيغة التي يستخدمها git لفروق الكود).
شيء واحد نقوله بوضوح، لأن هذا هو السؤال الذي سيسأله معظم الناس أولاً: هذه مقارنة نصية، وليست بصرية. الأداة تقرأ تدفق محتوى النص من كل PDF وتقارن سلاسل الأحرف. لا تقارن التخطيط، الخطوط، الألوان، الصور، التواقيع، أو أين تجلس الأشياء على الصفحة. إذا احتجت مقارنة بصرية على مستوى البكسل، ميزة Compare Files في Adobe Acrobat هي الأداة الصحيحة وسنقول ذلك مرة أخرى لاحقاً. لمقارنة الكلمات في ملفي PDF — وهو ما يحتاجه 90% من عمل مراجعة العقود والتدقيق ومراقبة السياسات — هذه الأداة هي الشكل الصحيح وتعمل في ثوانٍ.
الأنبوب كله يعمل داخل متصفحك. PDF.js (عارض Mozilla، نفس الذي يأتي داخل Firefox) يستخرج النص. حزمة diff — نفس الخوارزمية التي يستخدمها git ومعظم أدوات مراجعة الكود — تُشغّل المقارنة على مستوى الأسطر. ملفات PDF لا تُرفع أبداً.
كيف يعمل الفرق، بلغة بسيطة
الخوارزمية تُسمى diffLines والفكرة بسيطة: ابحث عن أطول سلسلة فرعية مشتركة من السطور بين الوثيقتين، ضع كل شيء آخر إما "مُضاف" (السطور التي تظهر في PDF المُحدّث وليس الأصلي) أو "محذوف" (السطور التي تظهر في الأصلي وليس المُحدّث)، وأصدر النتيجة بترتيب المصدر. إنها نفس الخوارزمية التي يصقلها علماء الحاسوب منذ السبعينات وهي ما يستخدمه GitHub في كل مرة تفتح فيها pull request.
ما الذي يُعتبر "تغييراً"؟ أي سطر ليس متطابقاً بايت ببايت. غيّر كلمة واحدة في فقرة، ويُعلّم السطر بأكمله محذوفاً ويُعلّم النسخة الجديدة مُضافة — هذا سلوك مقارنة معياري. المسافات تُحسب: مسافة لاحقة تُغير السطر. علامات الترقيم تُحسب: استبدال فاصلة بفاصلة منقوطة يُغير السطر. إذا احتجت دقة على مستوى الكلمة — فقط الكلمات المتغيرة مُبرزة داخل جملة لم تتغير — افتح الملفين في أداة مراجعة مخصصة مثل Litera Compare أو Workshare Compare. تلك خوارزمية مختلفة ومنتج أثقل بكثير.
لمعظم التعديلات الحقيقية — الطرف المقابل عدّل بند التعويض، المحرر أعاد كتابة الفقرة الثانية، فريق السياسات استبدل "shall" بـ "will" في ثلاثة أماكن — على مستوى الأسطر يكفي لرؤية ما تحرك بالضبط. الملخص في الأعلى يخبرك بالأرقام الخام: X مُضاف، Y محذوف، Z دون تغيير. الجسم يُريك أي السطور.
جنباً إلى جنب مقابل موحد — أي عرض تستخدم
الأداة تقدم كلا العرضين لأن المهام المختلفة تريد أشكالاً مختلفة.
| العرض | ما تراه | الأفضل لـ |
|---|---|---|
| جنباً إلى جنب | عمودان. اليسار = الأصلي. اليمين = المُحدّث. الكتل المحذوفة والمُضافة تُقرن في نفس الصف عندما تكون متجاورة في تدفق الفرق. | مراجعات العقود، النثر حيث تريد قراءة النسخة القديمة والجديدة بالتوازي والشعور بنسيج التغيير. |
| موحد | عمود واحد. السطور المحذوفة مُسبوقة بـ − (أحمر). السطور المُضافة مُسبوقة بـ + (أخضر). سطور السياق دون تغيير. نفس الصيغة التي يُصدرها git diff. | المسح السريع، مشاركة لقطات الشاشة مع المطورين، أي شخص يُتقن مراجعة git. |
كلا العرضين يتغذى من نفس بيانات الفرق، فالتبديل لا يُعيد تشغيل أي شيء. تنقّل ذهاباً وإياباً حسب الحاجة — معظم المراجعين يستقرون على جنباً إلى جنب للتمريرة الأولى (لاستشعار شكل التغييرات) والموحد للثانية (لعد الإضافات والحذوفات بدقة).
كيفية مقارنة ملفي PDF
- اسحب ملفي PDF إلى الخانات. خانة "الأصلي" هي الإصدار الأقدم. خانة "المُحدّث" هي الأحدث. الترتيب يهم: السطور المحذوفة هي في الأصلي وليست في المُحدّث؛ السطور المُضافة هي العكس. بدّل الخانتين و"المُضاف" يصبح "محذوف."
- اضغط قارن. الأداة تقرأ كل PDF (بضع ثوانٍ لكل مئة صفحة)، تستخرج النص بـ PDF.js، تعيد بناء فواصل الأسطر من التخطيط، وتُشغّل
diffLines. - اقرأ الملخص في الأعلى: X مُضاف، Y محذوف، Z دون تغيير. هذا الرقم وحده غالباً يخبرك بما تحتاج معرفته — "فقط 4 سطور تغيّرت عبر 80 صفحة" محادثة مختلفة عن "412 سطراً تغيّر."
- تصفّح الفرق. بدّل بين جنباً إلى جنب وموحد حسب ما تفضله عيناك.
- تحتاج لمشاركة ما وجدت؟ خذ لقطة شاشة — لا يوجد تحميل لأن هذا عارض، وليس محرر. معظم المراجعين يلتقطون عدة كتل رئيسية ويلصقونها في Slack أو البريد الإلكتروني أو نظام إدارة العقود.
مثال عملي: عقد عاد بمراجعة
أرسلت اتفاقية اشتراك SaaS إلى طرف مقابل اسمه Globex في 3 أبريل. في 8 مايو أعادوها بتعديلاتهم المقترحة. رسالة الغلاف تقول "تغييرات طفيفة" لكنك في هذا المجال منذ ما يكفي لتريد التحقق بنفسك.
تسحب globex-msa-2026-04-03.pdf إلى الأصلي و globex-msa-2026-05-08-revised.pdf إلى المُحدّث. اضغط قارن. الملخص يقول: 23 مُضافاً، 18 محذوفاً، 1,847 دون تغيير. إذن حوالي 41 سطراً تحرّك عبر ما يبدو كوثيقة 60 صفحة. "طفيفة" تقوم بعمل في تلك الرسالة.
تمسح عرض جنباً إلى جنب. الدفعة الأولى من التغييرات هي تنظيف — تحديث العناوين، تحريك تاريخ السريان. القسم 4 (الرسوم) به ثلاثة تعديلات حيث غيّر Globex شروط الدفع من Net 30 إلى Net 45 — هذا تغيير حقيقي يستحق الإشارة. القسم 7 (تقييد المسؤولية) به ثمانية سطور محذوفة واثنا عشر مُضافاً؛ تم إعادة كتابة الحد وتوسيع الاستثناءات. هذا الذي يحتاج قراءة دقيقة. القسم 12 (الإنهاء) به استبدالا كلمات بسيطان لا يغيران المعنى.
تلتقط شاشة لفرق القسم 7، تلصقها في قناة Slack مع مستشارك العام، تكتب "Globex أعاد كتابة 7. يستحق نظرة 10 دقائق." الوقت الإجمالي من استلام المراجعة إلى إظهار التغيير الجوهري: حوالي أربع دقائق. البديل — قراءة ملفي PDF جنباً إلى جنب في نافذتين من شاشتك، ومقارنة 60 صفحة من النثر القانوني ذهنياً — هو نسخة نصف اليوم من نفس العمل.
لماذا نصي فقط وليس بصرياً
أول سؤال يطرحه الناس عند سماع "مقارنة PDF" هو "هل يجد الكتل المنقولة وتغييرات الخط؟" إجابة صادقة: لا، وهذا مقصود.
المقارنة البصرية الحقيقية قطعة جادة من البرمجيات. تصيير ملفي PDF إلى بكسلات، محاذاة الصفحات المُقابلة، اكتشاف الكتل التي تحركت، ترميز ألوان تغييرات الخط واللون، التمييز بين التعديلات الجوهرية وإعادة تدفق التخطيط — هذا شهور من العمل الهندسي والمجال تسيطر عليه منتجات مدفوعة (Adobe Acrobat Compare Files, Litera Compare, Workshare Compare, Draftable). تتقاضى مالاً لأن العمل صعب والعملاء مكاتب محاماة بميزانيات جادة.
ما لاحظناه هو أن معظم من يصلون لـ "مقارنة PDF" لا يحتاجون تحليل بكسل. لديهم نسختان من عقد، سياسة، ورقة بحث، أو مذكرة، ويريدون معرفة ما الذي تقوله الكلمات بشكل مختلف. محتوى النص في PDF واضح للاستخراج، خوارزمية المقارنة مفهومة جيداً، والنتيجة أسرع للمسح من مراجعة بصرية متعددة الألوان. ابنِ أداة الـ 90% التي تفتح في متصفح، شغّلها مجاناً، وأشِر إلى Acrobat للـ 10% من الحالات التي تحتاج حقاً مقارنة بصرية. هذه هي المقايضة.
ما تلتقطه الأداة وما تفوّته
يستحق الدقة، لأن قيمة أي أداة مقارنة هي معرفة ما يمكن أن تخبرك به.
| نوع التغيير | ملتقط؟ | كيف يظهر |
|---|---|---|
| كلمة مُضافة أو محذوفة في جملة | نعم | السطر بأكمله مُعلّم محذوفاً + سطر جديد مُعلّم مُضافاً |
| فقرة مُدرجة أو محذوفة | نعم | كتلة من السطور المُضافة أو المحذوفة |
| أرقام، تواريخ، مبالغ بالدولار تغيّرت | نعم | استبدال على مستوى السطر، نفس النص |
| فرق مسافات (مسافة لاحقة، مسافة مزدوجة) | نعم | السطر مُعلّم متغيراً |
| تغيّر الخط (Times → Arial) | لا | نفس النص → لا يُعلّم |
| تغيّر اللون (أسود → أحمر) | لا | نفس النص → لا يُعلّم |
| صورة مُدرجة أو محذوفة أو منقولة | لا | الصور ليست في تدفق النص |
| توقيع مُضاف على الصفحة 12 | لا | التواقيع صور |
| كتلة منقولة من الصفحة 3 إلى الصفحة 7 | جزئياً | تظهر كحذف على الصفحة 3 وإضافة على الصفحة 7 |
| إعادة ترتيب الصفحات بنفس المحتوى | جزئياً | نفس النقل الكتلي |
| تغيير التخطيط (الهوامش، الأعمدة) بنفس النص | لا | نفس النص → لا يُعلّم |
النمط: إذا أثّر التغيير في الكلمات، هذه الأداة تجده. إذا أثّر التغيير فقط في كيف تبدو الكلمات، هذه الأداة لا تجده. لمراجعة العقود، تدقيق النثر، ومراقبة السياسات هذا تقريباً النطاق الصحيح. لتدقيقات إرشادات العلامة التجارية، مراجعة التخطيط، والتحقق من التواقيع ليس كذلك.
حالات استخدام شائعة
مهام حقيقية يحضرها الناس.
- مراجعات العقود. طرف مقابل يُعيد عقداً بتعديلاته. تريد التأكد مما غيّروه فعلاً، خارج ما أبرزوه في رسالة الغلاف. قارن في 30 ثانية؛ راجع فقط التغييرات الجوهرية.
- تدقيق المسودات. مقارنة المسودة N بـ N+1 للتحقق من نزول تعديلاتك ولم يتحرك شيء آخر. مفيد بشكل خاص عندما يحرّر عدة أشخاص نفس الوثيقة.
- مراقبة السياسات والشروط. هل تم تحديث سياسة الخصوصية بهدوء؟ هل أُعيد كتابة مدونة سلوك الشركة؟ احفظ PDF مرة في الشهر، قارن بنسخة الشهر الماضي. ستشاهد بالضبط ما تغيّر.
- مراجعة الترجمة. نفس الوثيقة في متغيرين إقليميين — أمريكية مقابل بريطانية، برتغالية برازيلية مقابل أوروبية. الفرق يُظهر كل عبارة مُترجمة مختلفة.
- البيانات المالية سنة بعد سنة. نفس القالب، سنة مالية مختلفة. الفرق يُريك أي بنود نمت، أي تقلّصت، أي ظهرت، أي اختفت.
- مراجعات الأوراق الأكاديمية. مراجع يُعيد ورقة بتعديلات؛ تريد عداً سريعاً لمدى مراجعتها قبل قراءتها سطراً بسطر.
- إقرارات الامتثال. كثير من وثائق الامتثال خاضعة لتحكم الإصدارات. قارن النسخة المنشورة الحالية بالنسخة المُقرّة الأخيرة لتأكيد ما تغيّر منذ آخر تدقيق.
عن Adobe Acrobat Compare Files
Adobe Acrobat Pro لديه ميزة Compare Files تفعل ما تفعله هذه الأداة بالإضافة إلى المقارنة البصرية. تلتقط تغييرات الخط، تعديلات الصور، تحولات التخطيط، تغييرات الألوان، كل شيء. تكلف 20-30 دولاراً شهرياً حسب الخطة وتتطلب Acrobat Pro مثبتاً محلياً. إذا كنت تقوم بعمل مراجعة قانونية عالي الحجم، أو مقارنات أصول العلامة التجارية، أو أي شيء حيث الدقة البصرية تهم بقدر محتوى النص، Acrobat هو الإجابة الصحيحة وننصح بها بلا تردد.
ما تقدمه هذه الأداة بدلاً من ذلك: اسحب ملفين، شاهد الفرق النصي في ثوانٍ، مجاناً، بدون تثبيت، بدون رفع. لحالة مقارنة النثر — التي هي معظم الحالات — تلك مقايضة جيدة. سير العمل الذكي هو استخدام الفرق النصي المجاني أولاً لفرز نطاق التغيير، ثم سحب Acrobat فقط إذا كانت الطبقة البصرية تهم.
قصة الخصوصية
ملفات PDF التي تقارنها غالباً هي الوثائق التي لا تريد مشاركتها أكثر. عقود. ملفات محكمة مختومة. مسودات أوراق الاستحواذ. تقارير التعويضات. سجلات طبية شخصية. مذكرات تحقيق داخلية. هذه الوثائق حيث "نرفع إلى خادم ونعالج هناك" — التصميم الذي يستخدمه iLovePDF و SmallPDF ومعظم أدوات مقارنة PDF السحابية — هو الشكل الخطأ.
مقارنة PDF تعمل بالكامل داخل متصفحك. PDF.js يستخرج النص في ذاكرة JavaScript. حزمة diff تُشغّل المقارنة في ذاكرة JavaScript. النتائج تُعرض في DOM. ملفات PDF لا تلمس الشبكة أبداً. لا يوجد خادم ليكرّم سياسة الخصوصية لأنه لا يوجد خادم في المسار. افتح أدوات المطور في متصفحك، اذهب إلى تبويب الشبكة، شغّل مقارنة كاملة: صفر طلبات صادرة أثناء المقارنة. تحميل الصفحة هو نشاط الشبكة الوحيد.
هذا ليس وعد خصوصية — إنه معمارية. لا يوجد شيء ليتسرّب لأنه لا يوجد شيء في الجو.
أدوات PDF ذات الصلة
- استخراج النص من PDF — اسحب النص الخام من PDF، مفيد عندما تريد المقارنة في محرر نص مخصص أو تغذية المحتوى لأداة أخرى.
- مدقق فرق النص — نفس الفرق على مستوى الأسطر لإدخال نص عادي بدلاً من ملفات PDF. الصق كتلتي نص، شاهد المقارنة.
- Split PDF — اكسر ملفات PDF الكبيرة إلى فصول قبل المقارنة؛ قسم بقسم أسرع من تشغيل مقارنة متعددة آلاف الصفحات في تمريرة واحدة.
- PDF Merger — اجمع نتيجة الفرق (كلقطة شاشة) مع ملفات PDF الأصلية في حزمة مراجعة واحدة.
- Sign PDF — عندما تكون قد راجعت العقد المُعدّل وأنت جاهز لتوقيعه.
عن Microapp
Microapp هو مجموعة من الأدوات الصغيرة المركزة التي تفتح في تبويب، تقوم بمهمة واحدة، وتتركك تغادر. مقارنة PDF واحدة من نحو 140 أداة في الكتالوج. نموذج العضوية مشابه لـ Costco — Members يحصلون على صفحات نظيفة وذكاء اصطناعي بسعر التكلفة؛ غير الأعضاء يحصلون على نفس الأدوات مع إعلانات على الصفحة. 10% من كل دولار يكسبه Microapp يذهب للجمعيات الخيرية، من القمة، مُدقق فصلياً. الأدوات منتقاة، ليست مُجمّعة فقط.
الأسئلة الشائعة
ما الذي يُعتبر "تغييراً"؟
أي سطر ليس متطابقاً بايت ببايت. الأداة تقسم كلا ملفي PDF إلى سطور، تُشغّل خوارزمية diffLines القياسية، وتضع كل سطر مُضافاً أو محذوفاً أو دون تغيير. تغيير كلمة واحدة يضع السطر بأكمله محذوفاً ويُضيف النسخة الجديدة — هكذا تعمل المقارنات على مستوى الأسطر. المسافات تُحسب: مسافة لاحقة تُغيّر السطر. لدقة على مستوى الكلمة، استخدم أداة مراجعة مخصصة مثل Litera Compare.
لماذا نصي فقط؟ ألا يحتوي PDF على تخطيط؟
لأن الصدق أسرع من نصف السحر. مقارنة بصرية حقيقية منتج جاد — تصيير ملفي PDF إلى بكسلات، محاذاة الصفحات، اكتشاف الكتل المنقولة، ترميز ألوان تغييرات الخط. ميزة Compare Files في Adobe Acrobat تفعل ذلك، وتكلف مالاً لسبب. نحن نقارن النص المُستخرج، الذي يلتقط ما تحتاجه 90% من حالات مراجعة العقود والتدقيق. التخطيط، الخطوط، الصور، التواقيع — لا شيء من ذلك يُكتشف. نقول ذلك بوضوح فوق كل نتيجة.
كيف يعمل الفرق على مستوى الأسطر؟
نستخدم خوارزمية diffLines من حزمة diff — نفس النهج الذي يستخدمه git ومعظم أدوات مراجعة الكود. تجد أطول سلسلة فرعية مشتركة من السطور وتضع الباقي كمُضاف أو محذوف. في عرض جنباً إلى جنب، الكتل المحذوفة والمُضافة المتجاورة تُقرن في نفس الصف. في العرض الموحد، السطور المحذوفة تأتي قبل المُقابلة المُضافة، مُسبوقة بـ − و +.
هل ستعمل على ملفات PDF كبيرة؟
حتى 100 MB و 500 صفحة لكل ملف. استخراج النص هو الخطوة البطيئة (بضع ثوانٍ لكل مئة صفحة على حاسوب عادي)؛ الفرق نفسه شبه فوري لوثائق أقل من ~50,000 سطر. للعمل القانوني متعدد آلاف الصفحات، قسّم كل PDF إلى فصول أولاً بأداتنا Split PDF وقارن قسماً بقسم.
هل يعمل على ملفات PDF الممسوحة ضوئياً؟
لا. ملفات PDF الممسوحة ضوئياً هي صور للنص، وليست نصاً. المُستخرج يُرجع نتائج فارغة أو شبه فارغة، والفرق سيكون بلا معنى. إذا كانت ملفاتك ممسوحة، مرّرها عبر أداة OCR أولاً (Adobe Acrobat أو macOS Preview أو Tesseract) لإضافة طبقة نصية، ثم قارن النسخ المُعالجة بـ OCR هنا.
هل ملفات PDF فعلاً لا تُرفع؟
صحيح. PDF.js (المكتبة التي تعرض ملفات PDF داخل Firefox) وخوارزمية الفرق كلاهما يعمل داخل متصفحك. ملفاتك تذهب من القرص إلى ذاكرة المتصفح، تُقارن، والنتيجة تُعرض على الشاشة — أبداً إلى خادم. تحقق من تبويب الشبكة أثناء المقارنة: صفر طلبات صادرة.
لماذا أستخدم هذا بدلاً من Adobe Acrobat Compare Files؟
Compare Files في Acrobat هو المعيار الذهبي لمقارنة PDF البصرية — تصيير الصفحات، اكتشاف الخطوط، مقارنة الصور — وإن احتجت ذلك، استخدمه. هذه الأداة للحالة النصية فقط: أسرع (اسحب ملفين، شاهد النتائج في ثوانٍ)، مجانية، بدون تثبيت برنامج، تعمل في أي متصفح. للمقارنة النثرية البحتة — عقود، مقالات، وثائق سياسة — النصي عادة ما تريد وهو أسرع للمسح من مراجعة بصرية.