pdf - पीडीएफ स्ट्रीम को कैसे डिकोड करें?




adobe reverse-engineering (3)

मैं एक पीडीएफ फाइल में स्ट्रीम ऑब्जेक्ट का विश्लेषण करना चाहता हूं जो कि /FlateDecode का उपयोग करके एन्कोडेड है /FlateDecode

क्या कोई ऐसे उपकरण हैं जो पीडीएफ में इस्तेमाल किए गए ऐसे एन्कोडिंग (एएससीआईआईएआईएटीएडीडीडीएड, एलजेड डिक्डेड, रन्लेंघटडेकोड इत्यादि) को डीकोड करने की इजाजत देते हैं?

स्ट्रीम सामग्री सबसे अधिक संभावना है एक पीई फ़ाइल संरचना, जो पीडीएफ शायद शोषण में बाद में उपयोग करेंगे।

इसके अलावा, पीडीएफ में दो xref टेबल हैं, यह ठीक है लेकिन दो %% ईओएफ जो xref का पालन करते हैं

क्या ये सब ठीक है? (ध्यान दें: दूसरा xref अंक 1 xref से /prev नाम का उपयोग करता है।

यह xref दूसरे xref को संदर्भित करता है:

xref 
5 6
0000000618 00000 n
0000000658 00000 n
0000000701 00000 n
0000000798 00000 n
0000045112 00000 n
0000045219 00000 n
1 1
0000045753 00000 n
3 1
0000045838 00000 n
trailer
>
startxref
46090
%%EOF

दूसरा xref :

xref
0 5
0000000000 65535 f
0000000010 00000 n
0000000067 00000 n
0000000136 00000 n
0000000373 00000 n
trailer
>
startxref
429
%%EOF

आप पीडीएफ और निर्यात का विश्लेषण करने के लिए RUPS का उपयोग कर सकते हैं या बस स्ट्रीम को पहले ही डीकोड कर सकते हैं। %% ईओएफ के बारे में, आपके पास पीडीएफ में किए गए ऐपेंड की संख्या हो सकती है।


उपकरण के संबंध में, जैसा कि अन्य उत्तर में कहा गया है कि कई उपकरण हैं जो कि धाराओं (कमांड लाइन या अन्यथा) पर असंपीड़ित करने के लिए उपयोग किए जा सकते हैं। हालांकि, वहाँ भी कई उपकरण हैं जो आपको ऑब्जेक्ट ट्री पर चलने की अनुमति देकर पीडीएफ फाइल का निरीक्षण करना आसान बनाते हैं और यह देखते हैं कि संपीड़ित धाराओं में आसानी से क्या होता है मैंने जो प्रयोग किया है, वे हैं:

1) कॉलस पीडीएफ टूल्सबॉक्स डेस्कटॉप (सावधानी, मैं इस कंपनी से जुड़ा हूं)। pdfToolbox में एक "पीडीएफ एक्सप्लोर करें" विकल्प है जो आपको वास्तविक पेज ऑपरेटरों को शामिल करने और उस पृष्ठ से जुड़े वस्तुओं को देखने की अनुमति देता है।

2) एनफोकस ब्राउज़र मुझे यकीन नहीं है कि यह अभी भी पाया जा सकता है, लेकिन यह उपकरण आपको पीडीएफ फाइल के ऑब्जेक्ट ट्री की जड़ खोलने की अनुमति देगा और फिर ऑब्जेक्ट पदानुक्रम को उसी तरीके से पेश करेगा जिस पर मैक पर फ़ाइंडर फ़ाइल के साथ मिलते हैं सिस्टम। ब्राउज़र आपको पीडीएफ फाइलों को संपादित करने की अनुमति भी देगा (आपको इस मामले में वास्तव में पता होना चाहिए कि क्या आप इस मामले में क्या कर रहे हैं) निम्न-स्तरीय ऑब्जेक्ट्स संपादित करके, नई ऑब्जेक्ट बना सकते हैं या स्ट्रीम की सामग्री बदल सकते हैं। बहुत कूल।

अपडेट: ब्राउज़र अभी भी उपलब्ध है, आप इसे यहां डाउनलोड कर सकते हैं: http://www.enfocus.com/en/products/browser/


  1. "दो xref टेबल और दो %%EOF "?

    यह अकेला दुर्भावनापूर्ण पीडीएफ फाइल का संकेत नहीं है। प्रत्येक के दो या उससे भी अधिक उदाहरणों में, यदि फ़ाइल "वृद्धिशील अद्यतन" सुविधा के माध्यम से उत्पन्न हुई थी (प्रत्येक डिजिटली रूप से हस्ताक्षरित पीडीएफ फाइल उस जैसी है, और प्रत्येक फाइल जो Acrobat में बदल दी गई थी और 'सेव' बटन / मेनू का उपयोग करके 'सेव ए ...' बटन / मेनू के बजाय सहेजी गई है।

  2. "किसी विशिष्ट ऑब्जेक्ट से संपीड़ित पीडीएफ स्ट्रीम को कैसे डिकोड करें"?

    डिडिएर स्टीवंस की पाइथन स्क्रिप्ट pdf-parser.py । इस कमांड लाइन टूल के साथ, आप किसी भी पीडीएफ वस्तु की डिकोड स्ट्रीम को एक फ़ाइल में डंप कर सकते हैं। पीडीएफ ऑब्जेक्ट नंबर 13 की धारा को डंप करने के लिए उदाहरण कमांड:

    pdf-parser.py -o 13 -f -d obj13.dump my.pdf
    




exploit