pdf - एसवीजी को साफ करने के लिए पीडीएफ कनवर्ट करें?




svg (6)

मैं एक पीडीएफ को एसवीजी में बदलने का प्रयास कर रहा हूं। हालांकि, मैं वर्तमान में उपयोग कर रहा हूं, पाठ के हर टुकड़े में प्रत्येक पत्र के लिए पथ का अर्थ है, जिसका अर्थ है कि यदि मैं अपनी स्रोत फ़ाइल में टेक्स्ट बदलता हूं, तो यह बदसूरत दिखता है।

मैं सोच रहा था कि एसवीजी कनवर्टर के लिए सबसे साफ पीडीएफ क्या है, उम्मीद है कि उसके पास ऐसे टेक्स्ट क्षेत्रों के लिए पथ नहीं है, जिन्हें केवल एक की आवश्यकता नहीं है। जैसा कि हम जानते हैं, पीडीएफ और एसवीजी काफी समान हैं, इसलिए मुझे लगता है कि वहां कुछ अच्छे कन्वर्टर्स हैं।


आप केवल जीयूआई खोलने के बिना, कमांडलाइन पर इंकस्केप का उपयोग कर सकते हैं। इसे इस्तेमाल करे:

inkscape \
  --without-gui \
  --file=input.pdf \
  --export-plain-svg=output.svg 

सभी कमांडलाइन विकल्पों की पूरी सूची के लिए, inkscape --help चलाएं।


इनकेस्केप का उपयोग विकिपीडिया पर कई लोगों द्वारा पीडीएफ को एसवीजी में परिवर्तित करने के लिए किया जाता है।

http://inkscape.org/

उनके पास ऐसा करने के तरीके पर एक आसान गाइड भी है!

http://en.wikipedia.org/wiki/Wikipedia:Graphic_Lab/Resources/PDF_conversion_to_SVG#Conversion_with_Inkscape


मैं वर्तमान में PDFBox का उपयोग कर रहा हूं जिसमें ग्राफिक आउटपुट के लिए अच्छा समर्थन है। वेक्टर स्ट्रोक निकालने और फोंट के प्रबंधन के लिए भी अच्छा समर्थन है। इसे आज़माने के लिए कुछ अच्छे टूल हैं (उदाहरण के लिए पीडीएफ रीडर जावा ग्राफिक्स 2 डी के रूप में प्रदर्शित होगा)। आप ग्राफिक्स टूल को एसटीजी उपकरण जैसे बाटिक (मैं ऐसा करता हूं और यह अच्छा कैप्चर देता है) के साथ इंटरैप्ट कर सकता है।

सभी पीडीएफ को एसवीजी में परिवर्तित करने का कोई आसान तरीका नहीं है - यह पीडीएफ बनाने के लिए उपयोग की जाने वाली रणनीति और औजारों पर निर्भर करता है। कुछ पाठ वैक्टर में परिवर्तित हो जाते हैं और आसानी से पुनर्निर्मित नहीं किए जा सकते - आपको वेक्टर फोंट स्थापित करना होगा और उन्हें देखना होगा।

अद्यतन: मैंने अब इसे पैकेज पीडीएफ 2 एसवीजी में विकसित किया है जो अब बटिक का उपयोग नहीं करता है:

जिसे पीडीएफ की एक श्रृंखला पर परीक्षण किया गया है। यह एसवीजी आउटपुट का उत्पादन करता है

  • पात्रों के रूप में वर्ण <svg:text> प्रति वर्ण
  • पथ <svg:path>
  • छवियों के रूप में <svg:image>

बाद के पैकेज (आशावादी) पात्रों को पाठ को चलाने और उच्च-स्तरीय ग्राफिक्स ऑब्जेक्ट्स के पथों को परिवर्तित करने के लिए परिवर्तित करेंगे

अद्यतन: अब हम एसवीजी पात्रों से चल रहे पाठ को फिर से बना सकते हैं। हमने आरेखों को डोमेन-विशिष्ट एक्सएमएल (जैसे रासायनिक स्पेक्ट्रा) में भी परिवर्तित कर दिया है। https://bitbucket.org/petermr/svg2xml-dev देखें। यह अभी भी अल्फा में है, लेकिन एक उपयोगी गति से आगे बढ़ रहा है। कोई भी शामिल हो सकता है!

अद्यतन करें। (@ टिम केल्टी) हम पीडीएफ 2 एसवीजी पर काम करना जारी रखते हैं और डाउनस्ट्रीम टूल्स जो सीमित (जावा) जावा ओसीआर करते हैं और उच्च स्तरीय ग्राफिक्स प्राइमेटिव्स (तीर, बक्से इत्यादि) का निर्माण करते हैं। https://bitbucket.org/petermr/imageanalysis देखें https://bitbucket.org/petermr/imageanalysis https://bitbucket.org/petermr/diagramanalyzer https://bitbucket.org/petermr/norma और https://bitbucket.org/petermr/ami-core । यह वैज्ञानिक साहित्य (contentmine.org) से 100 मिलियन तथ्यों को पकड़ने के लिए एक वित्त पोषित परियोजना है जिसमें से अधिकांश पीडीएफ है।


मैंने पाया कि xfig ने एक उत्कृष्ट काम किया है:

pstoedit -f fig foo.pdf foo.fig
xfig foo.fig

export to svg

यह इंकस्केप की तुलना में काफी बेहतर काम करता है। असल में यह शायद pdtoedit था कि यह किया था।


यह विषय काफी पुराना है, लेकिन यहां एक आसान समाधान है जो मैंने पाया:

http://www.cityinthesky.co.uk/opensource/pdf2svg/

यह एक उपकरण, पीडीएफ 2 पीएनजी प्रदान करता है, जो एक बार स्थापित होता है, वास्तव में कमांड लाइन में नौकरी करता है। मैंने बिटमैप्स सहित अब तक अपरिवर्तनीय परिणामों के साथ इसका परीक्षण किया है।

संपादित करें: मेरी गलती, यह टूल अक्षरों को पथों में भी परिवर्तित करता है, इसलिए यह प्रारंभिक प्रश्न को संबोधित नहीं करता है। हालांकि यह वैसे भी अच्छा काम करता है, और किसी भी व्यक्ति के लिए उपयोगी हो सकता है जो svg फ़ाइल में कोड को संशोधित करने का इरादा नहीं रखता है, इसलिए मैं पोस्ट छोड़ दूंगा।


यहां दो पीडीएफ रेंडर स्क्रिप्ट के लिए नोडजेएस रीस्ट एपीआई है। https://github.com/pumppi/pdf2images

स्क्रिप्ट्स हैं: पीडीएफ 2 एसवीजी और इमेजमैगिक्स कन्वर्ट







svg