unicode - यूनिकोड, यूटीएफ, एएससीआईआईआई, एएनएसआई प्रारूप अंतर




character-encoding ascii (2)

अपनी सूची नीचे जा रहे हैं:

  • " Unicode " एक एन्कोडिंग नहीं है, हालांकि दुर्भाग्यवश, बहुत से दस्तावेज असीमित रूप से इसका उपयोग करते हैं ताकि यूनिकोड एन्कोडिंग जो विशिष्ट सिस्टम डिफ़ॉल्ट रूप से उपयोग करता हो। विंडोज और जावा पर, इसका मतलब अक्सर यूटीएफ -16 होता है; कई अन्य स्थानों में, इसका मतलब यूटीएफ -8 है। ठीक है, यूनिकोड अमूर्त चरित्र को संदर्भित करता है, न कि किसी विशेष एन्कोडिंग के लिए।
  • UTF-16 : प्रति "कोड इकाई" 2 बाइट्स। यह .NET में स्ट्रिंग का मूल प्रारूप है, और आमतौर पर विंडोज और जावा में। बेसिक बहुभाषी विमान (बीएमपी) के बाहर के मूल्य सरोगेट जोड़े के रूप में एन्कोड किए गए हैं। (ये अपेक्षाकृत कम ही उपयोग किए जाते हैं - जो एक अच्छी नौकरी है, क्योंकि बहुत कम डेवलपर्स उन्हें सही पाते हैं, मुझे संदेह है। मुझे बहुत संदेह है कि मैं करता हूं।)
  • UTF-8 : परिवर्तनीय लंबाई एन्कोडिंग, प्रति कोड बिंदु 1-4 बाइट्स। ASCII मानों को 1 बाइट का उपयोग करके ASCII के रूप में एन्कोड किया गया है।
  • UTF-7 : आमतौर पर मेल एन्कोडिंग के लिए उपयोग किया जाता है। संभावना है कि अगर आपको लगता है कि आपको इसकी आवश्यकता है और आप मेल नहीं कर रहे हैं, तो आप गलत हैं। (यह सिर्फ न्यूज ग्रुप इत्यादि में पोस्ट करने वाले लोगों का मेरा अनुभव है - मेल के बाहर, यह वास्तव में व्यापक रूप से व्यापक रूप से उपयोग नहीं किया जाता है।)
  • UTF-32 : प्रति कोड बिंदु 4 बाइट्स का उपयोग करके निश्चित चौड़ाई एन्कोडिंग। यह बहुत कुशल नहीं है, लेकिन बीएमपी के बाहर जीवन आसान बनाता है। मेरे MiscUtil लाइब्रेरी के हिस्से के रूप में मेरे पास .NET Utf32String क्लास है, क्या आपको कभी यह चाहिए। (यह बहुत अच्छी तरह से परीक्षण नहीं किया गया है, आपको दिमाग।)
  • ASCII : एकल बाइट एन्कोडिंग केवल नीचे 7 बिट्स का उपयोग कर। (यूनिकोड कोड अंक 0-127।) कोई उच्चारण आदि
  • एएनएसआई: कोई भी निश्चित एएनएसआई एन्कोडिंग नहीं है - उनमें से बहुत सारे हैं। आम तौर पर जब लोग "एएनएसआई" कहते हैं तो उनका मतलब है "मेरे सिस्टम के लिए डिफ़ॉल्ट लोकेल / कोडपेज" जो Encoding.Default माध्यम से प्राप्त होता है, और अक्सर Windows-1252 लेकिन अन्य Windows-1252 भी हो सकता है।

यूनिकोड पेज पर और यूनिकोड समस्याओं को डीबग करने के लिए युक्तियों पर और भी कुछ है

कोड का दूसरा बड़ा संसाधन unicode.org है जिसमें अधिक जानकारी होती है, आप कभी भी अपना रास्ता काम करने में सक्षम होंगे - संभावित रूप से सबसे उपयोगी बिट कोड चार्ट है

Unicode , UTF8 , UTF7 , UTF8 , UTF7 UTF32 , ASCII , और ANSI एन्कोडिंग के बीच क्या अंतर है?

प्रोग्रामर के लिए ये किस तरह सहायक हैं?


कुछ आपको चरित्र एन्कोडिंग पर शुरू करने के लिए पढ़ रहे हैं: सॉफ्टवेयर पर जोएल: निरपेक्ष न्यूनतम सॉफ्टवेयर डेवलपर बिल्कुल, सकारात्मक रूप से यूनिकोड और कैरेक्टर सेट्स के बारे में जानना चाहिए (कोई बहाना नहीं!)

वैसे - एएसपी.नेट के पास इसके साथ कुछ लेना देना नहीं है। एनकोडिंग सार्वभौमिक हैं।





utf