testing - सेट थ्योरी नोट्स इन हिंदी



क्या हम निष्कर्ष निकाल सकते हैं कि उसके उपसमुच्चय को देखकर एक सेट यादृच्छिक नहीं हो सकता है? (1)

यह पूरी तरह से निर्भर करता है कि नमूना कितना बड़ा है।

मूल संभाव्यता से, यदि पी एक "सफलता" (परिणाम जिसे आपने केंद्रित किया है) प्राप्त करने की संभावना है, तो बाईरी परीक्षण से, q = (1-p) "असफलता" (वैकल्पिक परिणाम) प्राप्त करने की संभावना है । चलो परीक्षणों की संख्या हो यदि परीक्षण स्वतंत्र हैं, तो परिणामों की संख्या एक्स में पैरामीटर n और p के साथ एक द्विपदीय वितरण होता है, और p-hat = X / n पी के लिए एक निष्पक्ष अनुमानक है। पी-टोट का मतलब और विचरण क्रमशः पी और पीक / एन है, और पर्याप्त बड़े नमूना आकार के लिए वितरण गाऊसी (घंटी के आकार की वक्र) के लिए वितरण होता है। इसके आधार पर, जब तक पी और क्यू पर्याप्त रूप से 0 से बड़ा हो, हम यह कह सकते हैं कि दोहराया जाने वाले प्रयोगों में उनमें से 95% सही मायने में 1.96 * sqrt (pq / n) की दूरी के भीतर आते हैं। उस दूरी को त्रुटि के मार्जिन (एमई) कहा जाता है

आप अनुमान लगा रहे हैं कि p = 1/2 नतीजतन, आपके मार्जिन की गलती ME = 1.96 * sqrt (pq / n) = 0.98 / sqrt (एन) है आप किसी विशिष्ट ME: n = छत ((0.98 / एमई) 2 ) प्राप्त करने के लिए कितना नमूना आकार की आवश्यकता पता कर सकते हैं।

त्रुटि के कुछ विशेष मार्जिन में प्लगिंग:

  • ME = 0.20 ==> n = 25 (गौसी अभिसरण पर विश्वास करने के लिए सीमा रेखा)
  • एमई = 0.10 ==> एन = 97
  • ME = 0.05 ==> n = 385
  • ME = 0.03 ==> n = 1068
  • ME = 0.01 ==> n = 9604

दूसरे शब्दों में, छोटे आप अपने मार्जिन की त्रुटि चाहते हैं, बड़ा नमूना आकार आवश्यक है, और नमूनाकरण की आवश्यकता quadratically बढ़ता है

उन पिछले दो राजनीतिक मतदान के लिए प्रासंगिक हैं लगभग 1000 के नमूने आकार लेना आम बात है और अनुमान की गहराई के बारे में अनुमान लगाते हैं; लोग सहज रूप से पसंद करेंगे & pm; 1%, लेकिन यह 9 गुना नमूना ले जाएगा और इसे लागत प्रभावी नहीं माना जाएगा

अपने सबसेट के आकार के आधार पर अपने प्रश्न के बारे में यह वापस लाना, आप इस बारे में एक संभाव्य बयान कर सकते हैं कि आप अपने अनुमान को कैसे समझते हैं कि पी = 1/2, लेकिन यह सैकड़ों या हजारों मूल्यों को ले जाने के लिए एक तंग बाध्य।

इसके अलावा, कृपया ध्यान दें कि गैर-वर्दी या गैर-स्वतंत्र नॉन-रैंडम के समान ही नहीं हैं। जो परीक्षण आप करने का प्रयास कर रहे हैं वह चयन बिट्स की एकरूपता के लिए है, और आपको अन्य बिट्स के बारे में और न ही डेटा की आजादी के बारे में कुछ नहीं बताता है

सेट ए में 1000 नंबर शामिल हैं मैंने जाँच कर लिया कि इस सेट में आधे अंक भी हैं I

मैंने सेट बी को सेट ए से निकाला है: सेट ए में कोई भी संख्या जो 1 के साथ शुरू होता है, बी सेट में है (बी में सभी नंबर 1 से शुरू होता है)।

मैंने जांच की कि सेट बी में आधे से ज्यादा संख्याएं भी हैं I

ए में नंबरों का आधा भी हमें बी के लिए भी अपेक्षा करनी चाहिए? लेकिन बी के आधे से भी अधिक हैं। तो यह निष्कर्ष निकाल सकता है कि सेट ए यादृच्छिक नहीं है?

अगर 60% बी बी भी हैं, तो क्या हम अब भी निष्कर्ष निकाल सकते हैं कि ए को यादृच्छिक उत्पन्न नहीं हुआ है?

कैसे बी का 70% अजीब है?





subset