image processing - 3 डी पुनर्निर्माण-2 डी छवि से 3 डी मॉडल कैसे बनाएं?




image-processing 3d (4)

इस समस्या को Photogrammetry रूप में जाना जाता है।

Google आपको अंतहीन संदर्भों की आपूर्ति करेगा, केवल जागरूक रहें कि यदि आप अपना खुद का रोल करना चाहते हैं, तो यह एक बहुत ही कठिन समस्या है।

अगर मैं कैमरे के साथ एक तस्वीर लेता हूं, तो मुझे कैमरे से ऑब्जेक्ट की दूरी पता है, जैसे घर के स्केल मॉडल, मैं इसे एक 3 डी मॉडल में बदलना चाहता हूं जिसे मैं चारों ओर घुमा सकता हूं ताकि मैं टिप्पणी कर सकूं घर के विभिन्न हिस्सों।

यदि मैं बैठता हूं और एक से अधिक चित्र लेने, दिशा निर्देश और दूरी लेने के बारे में सोचता हूं, तो मुझे यह पता लगाने में सक्षम होना चाहिए कि यह कैसे करना है, लेकिन, मैंने सोचा कि मैं पूछूंगा कि क्या कोई ऐसा कागज़ है जो अधिक व्याख्या करने में मदद कर सकता है।

आप जिस भाषा में व्याख्या करते हैं, इससे कोई फर्क नहीं पड़ता, क्योंकि मैं सबसे अच्छा दृष्टिकोण ढूंढ रहा हूं।

अभी मैं घर दिखाने पर विचार कर रहा हूं, फिर उपयोगकर्ता ऊंचाई के लिए कुछ सहायता कर सकता है, जैसे कि कैमरे से मॉडल के उस हिस्से के शीर्ष तक दूरी, और इसके लिए पर्याप्त है, इसके लिए ऊंचाई की गणना करना संभव होगा बाकी, विशेष रूप से अगर शीर्ष-नीचे वाली छवि होती है, तो सापेक्ष ऊंचाइयों की गणना करने के लिए चार तरफ कोणों से चित्र।

फिर मुझे उम्मीद है कि मॉडल के विभिन्न हिस्सों को अलग करने में मदद के लिए भागों को रंग में अलग-अलग होना होगा।


जैसा कि बताया गया है, समस्या बहुत कठिन है और इसे अक्सर बहु-दृश्य वस्तु पुनर्निर्माण के रूप में भी जाना जाता है। यह आमतौर पर लगातार छवियों की प्रत्येक जोड़ी के लिए स्टीरियो-दृश्य पुनर्निर्माण समस्या को हल करके संपर्क किया जाता है।

स्टीरियो पुनर्निर्माण करने के लिए आवश्यक है कि छवियों के जोड़े को भौतिक बिंदुओं की एक बड़ी मात्रा में दिखाई देने वाली ओवरलैप हो। आपको संबंधित बिंदुओं को खोजने की आवश्यकता है जैसे कि आप बिंदुओं के 3 डी समन्वय को खोजने के लिए त्रिभुज का उपयोग कर सकते हैं।

Epipolar ज्यामिति

स्टीरियो पुनर्निर्माण आमतौर पर आपके कैमरे के सेटअप को कैलिब्रेट करके किया जाता है ताकि आप एपिप्लोर ज्यामिति के सिद्धांत का उपयोग करके अपनी छवियों को सुधार सकें। यह संबंधित बिंदुओं के साथ-साथ अंतिम त्रिभुज गणना को सरल बनाता है।

यदि आपके पास है:

आप केवल मैट्रिक्स सिद्धांत का उपयोग करके fundamental और आवश्यक मैट्रिक्स की गणना कर सकते हैं और इन्हें अपनी छवियों को सुधारने के लिए उपयोग कर सकते हैं। इसके लिए समरूप समन्वय के साथ समन्वय अनुमानों के बारे में कुछ सिद्धांत और पिन्होल कैमरा मॉडल और कैमरा मैट्रिक्स का ज्ञान भी आवश्यक है।

यदि आप एक ऐसी विधि चाहते हैं जिसके लिए कैमरे के पैरामीटर की आवश्यकता नहीं है और अज्ञात कैमरा सेट-अप के लिए काम करता है तो आपको शायद अनलिब्रेटेड स्टीरियो पुनर्निर्माण के तरीकों को देखना चाहिए।

पत्राचार समस्या

इसी बिंदु को ढूंढना मुश्किल हिस्सा है जिसके लिए आपको छवियों के जोड़ों में समान बिंदुओं की पहचान करने के लिए समान चमक या रंग के बिंदुओं की तलाश करने, या बनावट पैटर्न या कुछ अन्य विशेषताओं का उपयोग करने की आवश्यकता होती है। इसके लिए तकनीकें प्रत्येक बिंदु के चारों ओर एक छोटे से क्षेत्र में, या पूरी तरह से छवि पर विचार करके वैश्विक स्तर पर सर्वश्रेष्ठ मिलान की तलाश करके स्थानीय रूप से काम करती हैं।

यदि आपके पास पहले से fundamental , तो यह आपको छवियों को सुधारने की अनुमति देगा जैसे कि दो छवियों में संबंधित अंक एक पंक्ति (सिद्धांत में) के लिए बाध्य होंगे। यह आपको तेजी से स्थानीय तकनीकों का उपयोग करने में मदद करता है।

वर्तमान में पत्राचार समस्या को हल करने के लिए अभी भी कोई आदर्श तकनीक नहीं है, लेकिन इन श्रेणियों में संभावित दृष्टिकोण गिर सकते हैं:

  • मैन्युअल चयन : एक व्यक्ति हाथ से चयन मिलान अंक है।
  • कस्टम मार्कर : स्थान मार्कर या विशिष्ट पैटर्न / रंगों का उपयोग करें जिन्हें आप आसानी से पहचान सकते हैं।
  • वर्ग मतभेदों का योग : एक बिंदु के चारों ओर एक क्षेत्र ले लो और दूसरी छवि में निकटतम पूरा मिलान क्षेत्र खोजें।
  • ग्राफ कटौती : ग्राफ़ सिद्धांत का उपयोग करके अनुकूलन के आधार पर एक वैश्विक अनुकूलन तकनीक।

विशिष्ट कार्यान्वयन के लिए आप वर्तमान साहित्य के माध्यम से खोजने के लिए Google विद्वान का उपयोग कर सकते हैं। यहां विभिन्न तकनीकों की तुलना में एक अत्यधिक उद्धृत पेपर है: घनत्व दो-फ्रेम स्टीरियो पत्राचार एल्गोरिदम का वर्गीकरण और मूल्यांकन

बहु-दृश्य पुनर्निर्माण

एक बार आपके पास संबंधित अंक हो जाने के बाद, आप बिंदुओं के 3 डी समन्वय को खोजने के लिए त्रिभुज गणनाओं के लिए एपिप्लोर ज्यामिति सिद्धांत का उपयोग कर सकते हैं।

इस पूरे स्टीरियो पुनर्निर्माण को लगातार छवियों की प्रत्येक जोड़ी के लिए दोहराया जाएगा (जिसका मतलब है कि आपको छवियों के आदेश की आवश्यकता है या कम से कम ज्ञान के बारे में जानकारी है कि किस छवियों में कई ओवरलैपिंग पॉइंट हैं)। प्रत्येक जोड़ी के लिए आप एक अलग मौलिक मैट्रिक्स की गणना करेंगे।

बेशक, इन चरणों में से प्रत्येक पर शोर या त्रुटियों के कारण आप इस बात पर विचार करना चाहेंगे कि समस्या को और अधिक वैश्विक तरीके से कैसे हल किया जाए। उदाहरण के लिए, यदि आपके पास किसी ऑब्जेक्ट के चारों ओर खींची गई छवियों की एक श्रृंखला है और एक लूप बनाते हैं, तो यह अतिरिक्त बाधाएं प्रदान करता है जिसका उपयोग बंडल समायोजन जैसे कुछ चरणों का उपयोग करके पहले चरणों की सटीकता को बेहतर बनाने के लिए किया जा सकता है।

जैसा कि आप देख सकते हैं, दोनों स्टीरियो और बहु-दृश्य पुनर्निर्माण हल की गई समस्याओं से बहुत दूर हैं और अभी भी सक्रिय रूप से शोध किए गए हैं। जितना कम आप स्वचालित तरीके से करना चाहते हैं उतना ही अच्छी तरह से परिभाषित समस्या बन जाती है, लेकिन इन मामलों में भी शुरू करने के लिए काफी सिद्धांत की आवश्यकता होती है।

वैकल्पिक

यदि आप जो करना चाहते हैं उसकी बाधाओं के भीतर है, तो मैं केवल सामान्य कैमरों का उपयोग करने के बजाय समर्पित हार्डवेयर सेंसर (जैसे एक्सबॉक्स केनेक्ट ) पर विचार करने की सलाह दूंगा । ये सेंसर एक गहराई वाली छवि उत्पन्न करने के लिए संरचित प्रकाश, समय-समय-उड़ान या कुछ अन्य रेंज इमेजिंग तकनीक का उपयोग करते हैं, जिसे वे अपने कैमरे से रंग डेटा के साथ जोड़ सकते हैं। वे व्यावहारिक रूप से आपके लिए एकल-दृश्य पुनर्निर्माण समस्या को हल करते हैं और अक्सर कई विचारों को सिलाई / संयोजन के लिए पुस्तकालयों और औजारों को शामिल करते हैं।

Epipolar ज्यामिति संदर्भ

मेरा ज्ञान वास्तव में अधिकांश सिद्धांतों पर काफी पतला है, इसलिए मैं सबसे अच्छा कर सकता हूं ताकि आप कुछ संदर्भ प्रदान कर सकें जो आशावादी रूप से उपयोगी हैं (प्रासंगिकता के क्रम में):

मुझे यकीन नहीं है कि यह सब कितना उपयोगी है, लेकिन उम्मीद है कि इसमें आगे संसाधन खोजने के लिए पर्याप्त उपयोगी शब्दावली और संदर्भ शामिल हैं।


डेडलस प्रोजेक्ट देखें , इस बात पर विचार किया गया है कि वेबसाइट में समाधान के बारे में चित्रकारी जानकारी के साथ गैलरी नहीं है, यह कई कागजात और कामकाजी विधि के बारे में जानकारी पोस्ट करती है।

मैंने प्रोजेक्ट के मुख्य शोधकर्ताओं (रोजर हबॉल्ड) में से एक व्याख्यान देखा, और छवि के परिणाम काफी आश्चर्यजनक हैं! Althought एक जटिल और लंबी समस्या है। 3 डी डेटा का अनुमान लगाने के लिए इसमें बहुत मुश्किल विवरण हैं, उदाहरण के लिए दीवार सतहों से 3 डी जानकारी लें, जिसके लिए काम करने के लिए ह्युरिस्टिक निम्नानुसार है: दृश्य की सामान्य रोशनी के साथ एक फोटो लें, और फिर पूरी फ्लैश सक्रिय के साथ एक ही स्थिति में तस्वीर को फिर से ले जाएं, फिर दोनों छवियों को प्रतिस्थापित करें और परिणाम को पूर्व-लीड फ्लैश कैलिब्रेशन छवि द्वारा विभाजित करें, इस नए नतीजे पर एक बॉक्स फ़िल्टर लागू करें और फिर गहराई मूल्यों का अनुमान लगाने के लिए पोस्ट-प्रोसेस करें इस पेपर में प्रक्रिया को विस्तार से समझाया गया है (जिसे परियोजना वेबसाइट में भी पोस्ट / संदर्भित किया गया है)


Google स्केचअप (फ्री) में एक फोटो मिलान उपकरण है जो आपको एक तस्वीर लेने और आसान मॉडलिंग के लिए अपने परिप्रेक्ष्य से मेल खाता है।

संपादित करें: ऐसा प्रतीत होता है कि आप अपना स्वयं का समाधान विकसित करने में रुचि रखते हैं। मैंने सोचा था कि आप एक उदाहरण में एक छवि का 3 डी मॉडल प्राप्त करने की कोशिश कर रहे थे। यदि यह उत्तर सहायक नहीं है, तो मैं क्षमा चाहता हूं।





3d-model