windows - কনভ - বাংলা বিজয় টু ইউনিকোড কনর্ভাটার




ইউনিকোড ডেকোডের ত্রুটি: 'কমনপ্যাপ' কোডেক অবস্থানের বাইটি এক্স ডিকোড করতে পারে না Y: অক্ষর মানচিত্রগুলি<undefined> (2)

আমি একটি পাইথন 3 প্রোগ্রাম তথ্য ভরা একটি টেক্সট ফাইল সঙ্গে কিছু manipulations করতে চেষ্টা করছি। যাইহোক, ফাইলটি পড়ার চেষ্টা করার সময় আমি নিম্নলিখিত ত্রুটি পেতে পারি:

ট্রেসব্যাক (সবচেয়ে সাম্প্রতিকতম কল সর্বশেষ):
ফাইল "স্ক্রিপ্ট অবস্থান", লাইন NUMBER, মধ্যে
text = file.read()
ফাইল "সি: \ পাইথন 31 \ lib \ এনকোডিং \ cp1252.py", লাইন 23, ডিকোডে
return codecs.charmap_decode(input,self.errors,decoding_table)[0]
ইউনিকোড ডেকোডের ত্রুটি: 'charmap' কোডেক বিট 0x90 পজিশনে 2907500 এ ডিকোড করতে পারে না: অক্ষর মানচিত্রগুলি <undefined>

যদি কেউ আমাকে এই সমস্যাটি চেষ্টা করে এবং চেষ্টা করতে সাহায্য করে তবে আমি সবচেয়ে কৃতজ্ঞ হব।


অনুবাদ মূল উক্তি @ লেনার্টআরগেব্রো উত্তর:

যদি আপনি এটির এনকোডিং বলতে না পারেন এবং উপরের সমাধানটি কাজ করে না (এটি utf8 নয়) এবং আপনি কেবল নিজেকে অনুমান করতে পারেন - অনলাইন এনকোডিং যা আপনি ব্যবহার করতে পারেন তা সনাক্ত করতে পারে। তারা নিখুঁত নয় কিন্তু সাধারণত সূক্ষ্ম কাজ। আপনি এনকোডিং আউট figured পরে আপনি উপরে সমাধান ব্যবহার করতে সক্ষম হওয়া উচিত।

সম্পাদনা করুন: (মন্তব্য থেকে কপি করা)

একটি বেশ জনপ্রিয় পাঠ্য সম্পাদক Sublime Text যদি এটি সেট করা থাকে তবে এনকোডিং প্রদর্শন করার একটি কমান্ড রয়েছে ...

  1. View -> Show Console (অথবা Ctrl + ` )

  1. নীচে দেখুন। view.encoding() এ ক্ষেত্রটি টাইপ করুন এবং view.encoding() জন্য আশা করুন (আমি Undefined হলেও অন্য কিছু পেতে অক্ষম ছিলাম তবে হয়তো আপনার ভাল ভাগ্য থাকবে ...)


প্রশ্ন ফাইলটি CP1252 এনকোডিং ব্যবহার করে না। এটি অন্য এনকোডিং ব্যবহার করে। আপনি নিজেকে খুঁজে বের করতে হবে কোনটি। সাধারণ Latin-1 এবং UTF-8 । যেহেতু 0x90 আসলে Latin-1 , UTF-8 কিছু বোঝায় না (যেখানে 0x90 একটি ধারাবাহিক বাইট হয়) সম্ভবত বেশি।

যখন আপনি ফাইলটি খুলবেন তখন আপনি এনকোডিং নির্দিষ্ট করুন:

file = open(filename, encoding="utf8")




decode