character encoding - एक चरित्र में कितने बिट्स या बाइट्स होते हैं?




character-encoding byte (2)

एक बाइट में 8 बिट्स होते हैं (सामान्य रूप से विंडोज़ में बोलते हुए)।

हालाँकि, यदि आप वर्णों के साथ काम कर रहे हैं, तो यह चारसेट / एन्कोडिंग पर निर्भर करेगा। यूनिकोड चरित्र 2 या 4 बाइट्स हो सकते हैं, इसलिए यह 16 या 32 बिट्स होगा, जबकि Windows-1252 कभी Windows-1252 कभी गलत तरीके से एएनएसआई कहा जाता है, केवल 8 बाइट्स होते हैं इसलिए 8 बिट्स।

विंडोज के एशियाई संस्करण और कुछ अन्य में, पूरी प्रणाली डबल-बाइट में चलती है, इसलिए एक चरित्र 16 बिट्स है।

संपादित

मैटियो की टिप्पणी के अनुसार, विंडोज के सभी समकालीन संस्करण 16-बिट्स का आंतरिक रूप से प्रति वर्ण उपयोग करते हैं।

"चरित्र" के अनुसार कितने बिट्स या बाइट्स हैं?


यह निर्भर करता है कि चरित्र क्या है और इसमें कौन सी एन्कोडिंग है:

  • 8-बिट ASCII एन्कोडिंग में एक ASCII चरित्र 8 बिट्स (1 बाइट) है, हालांकि यह 7 बिट्स में फिट हो सकता है।

  • ISO-8859-1 एन्कोडिंग में ISO-8895-1 वर्ण 8 बिट्स (1 बाइट) है।

  • UTF-8 एन्कोडिंग में एक यूनिकोड चरित्र 8 बिट्स (1 बाइट) और 32 बिट्स (4 बाइट्स) के बीच है।

  • UTF-16 एन्कोडिंग में एक यूनिकोड चरित्र 16 (2 बाइट्स) और 32 बिट्स (4 बाइट्स) के बीच है, हालांकि अधिकांश सामान्य वर्ण 16 बिट्स लेते हैं। यह विंडोज द्वारा आंतरिक रूप से उपयोग किया जाने वाला एन्कोडिंग है।

  • UTF-32 एन्कोडिंग में एक यूनिकोड वर्ण हमेशा 32 बिट्स (4 बाइट्स) होता है।

  • UTF-8 में एक ASCII वर्ण 8 बिट्स (1 बाइट) है, और UTF-16 - 16 बिट्स में है।

  • ISO-8895-1 (0xA0-0xFF) में अतिरिक्त (गैर-ASCII) वर्ण UTF-8 और UTF-16 में 16 बिट्स ले जाएगा।

इसका मतलब होगा कि बिट में 0.03125 और 0.125 अक्षर हैं।