1. तंत्रिका नेटवर्क के साथ क्यू-लर्निंग के लिए एक पुरानी प्रणाली को अद्यतन करना
  2. मूल्य पुनरावृत्ति और नीति पुनरावृत्ति के बीच क्या अंतर है?
  3. तंत्रिका नेटवर्क गेम खेलने के लिए आनुवंशिक एल्गोरिदम और बैकप्रोपैजेशन का उपयोग कैसे करते हैं?
  4. नि: शुल्क ऊर्जा सुदृढीकरण सीखना कार्यान्वयन
  5. सुदृढीकरण सीखने के साथ एक तंत्रिका नेटवर्क प्रशिक्षण
  6. Q-Learning और SARSA में क्या अंतर है?
  7. समर्थन वेक्टर मशीनें-कृत्रिम तंत्रिका नेटवर्क से बेहतर जिसमें सीखने की स्थितियां?
  8. विज़ुअल इनपुट का उपयोग करके डायब्लो 2 खेलने के लिए कृत्रिम तंत्रिका नेटवर्क को कैसे प्रशिक्षित किया जाए?
  9. मजबूती सीखने के अच्छे कार्यान्वयन?