unicode - यूनिकोड, यूटीएफ, एएससीआईआईआई, एएनएसआई प्रारूप अंतर
character-encoding ascii (2)
अपनी सूची नीचे जा रहे हैं:
- " Unicode " एक एन्कोडिंग नहीं है, हालांकि दुर्भाग्यवश, बहुत से दस्तावेज असीमित रूप से इसका उपयोग करते हैं ताकि यूनिकोड एन्कोडिंग जो विशिष्ट सिस्टम डिफ़ॉल्ट रूप से उपयोग करता हो। विंडोज और जावा पर, इसका मतलब अक्सर यूटीएफ -16 होता है; कई अन्य स्थानों में, इसका मतलब यूटीएफ -8 है। ठीक है, यूनिकोड अमूर्त चरित्र को संदर्भित करता है, न कि किसी विशेष एन्कोडिंग के लिए।
- UTF-16 : प्रति "कोड इकाई" 2 बाइट्स। यह .NET में स्ट्रिंग का मूल प्रारूप है, और आमतौर पर विंडोज और जावा में। बेसिक बहुभाषी विमान (बीएमपी) के बाहर के मूल्य सरोगेट जोड़े के रूप में एन्कोड किए गए हैं। (ये अपेक्षाकृत कम ही उपयोग किए जाते हैं - जो एक अच्छी नौकरी है, क्योंकि बहुत कम डेवलपर्स उन्हें सही पाते हैं, मुझे संदेह है। मुझे बहुत संदेह है कि मैं करता हूं।)
- UTF-8 : परिवर्तनीय लंबाई एन्कोडिंग, प्रति कोड बिंदु 1-4 बाइट्स। ASCII मानों को 1 बाइट का उपयोग करके ASCII के रूप में एन्कोड किया गया है।
- UTF-7 : आमतौर पर मेल एन्कोडिंग के लिए उपयोग किया जाता है। संभावना है कि अगर आपको लगता है कि आपको इसकी आवश्यकता है और आप मेल नहीं कर रहे हैं, तो आप गलत हैं। (यह सिर्फ न्यूज ग्रुप इत्यादि में पोस्ट करने वाले लोगों का मेरा अनुभव है - मेल के बाहर, यह वास्तव में व्यापक रूप से व्यापक रूप से उपयोग नहीं किया जाता है।)
- UTF-32 : प्रति कोड बिंदु 4 बाइट्स का उपयोग करके निश्चित चौड़ाई एन्कोडिंग। यह बहुत कुशल नहीं है, लेकिन बीएमपी के बाहर जीवन आसान बनाता है। मेरे MiscUtil लाइब्रेरी के हिस्से के रूप में मेरे पास .NET
Utf32String
क्लास है, क्या आपको कभी यह चाहिए। (यह बहुत अच्छी तरह से परीक्षण नहीं किया गया है, आपको दिमाग।) - ASCII : एकल बाइट एन्कोडिंग केवल नीचे 7 बिट्स का उपयोग कर। (यूनिकोड कोड अंक 0-127।) कोई उच्चारण आदि
- एएनएसआई: कोई भी निश्चित एएनएसआई एन्कोडिंग नहीं है - उनमें से बहुत सारे हैं। आम तौर पर जब लोग "एएनएसआई" कहते हैं तो उनका मतलब है "मेरे सिस्टम के लिए डिफ़ॉल्ट लोकेल / कोडपेज" जो Encoding.Default माध्यम से प्राप्त होता है, और अक्सर Windows-1252 लेकिन अन्य Windows-1252 भी हो सकता है।
यूनिकोड पेज पर और यूनिकोड समस्याओं को डीबग करने के लिए युक्तियों पर और भी कुछ है ।
कोड का दूसरा बड़ा संसाधन unicode.org है जिसमें अधिक जानकारी होती है, आप कभी भी अपना रास्ता काम करने में सक्षम होंगे - संभावित रूप से सबसे उपयोगी बिट कोड चार्ट है ।
Unicode
, UTF8
, UTF7
, UTF8
, UTF7
UTF32
, ASCII
, और ANSI
एन्कोडिंग के बीच क्या अंतर है?
प्रोग्रामर के लिए ये किस तरह सहायक हैं?
कुछ आपको चरित्र एन्कोडिंग पर शुरू करने के लिए पढ़ रहे हैं: सॉफ्टवेयर पर जोएल: निरपेक्ष न्यूनतम सॉफ्टवेयर डेवलपर बिल्कुल, सकारात्मक रूप से यूनिकोड और कैरेक्टर सेट्स के बारे में जानना चाहिए (कोई बहाना नहीं!)
वैसे - एएसपी.नेट के पास इसके साथ कुछ लेना देना नहीं है। एनकोडिंग सार्वभौमिक हैं।