javascript - مميزات - كيف يمكنني استخراج سلسلة طويلة من النص من بعض جافا سكريبت على صفحة ويب باستخدام بوتيفولسوب؟




مميزات الجافا سكريبت (2)

بوتيفولسوب لا تحليل جس، تحتاج إلى دوثيس مع التعبير العادي أو ما شابه ذلك.

أنا أحاول أن أكتب سيناريو حتى أتمكن من تسجيل الدخول إلى موقع على شبكة الانترنت، ولكن من أجل القيام بذلك أحتاج لتقديم كابتشا. الطريقة الوحيدة للحصول على تلك الصورة المباشرة من كابتشا من ورل هو لاستخراج اسم السلسلة العملاقة "التحدي" ولكن لم أكن قادرا على القيام بذلك مع بوتيفولسوب لسبب ما. ما هي أفضل طريقة لاستخراج السلسلة الطويلة؟

var RecaptchaState = {
    site : '4LfjPgEA56AABAJExraAeYXdMbVhPcG__Hyv-URXF',
    challenge : '03AHJ_VusE_PgNB0vfBpD2h53o8uGMt1MeKi9bzhOTsjt0ze7SKmHVNe8uADceoU3JLPjpp8cJCVDGiYKo1ho-r1JcV19tm26doUHqevixJjH8SZ26i4EWbUOQLEuODf0Kt6JI0ZhtfiIaIXDg9MhUyDCEt_qxFWbSHA',
    is_incorrect : false,
    programming_error : '',
    error_message : '',
    server : 'http://www.google.com/recaptcha/api/',
    timeout : 18000
};

document.write('
<scr>
 ');
</scr>

كنت مجرد استخدام التعبير العادي. غير متأكد من هذا، ولكن لا أعتقد أن بوتيفولسوب يوزع جافا سكريبت - فقط (س) هتمل:

challenge = re.search(r"challenge *: *'(\S+)'", x).group(1)

يعطي:

"03AHJ_VusE_PgNB0vfBpD2h53o8uGMt1MeKi9bzhOTsjt0ze7SKmHVNe8uADceoU3JLPjpp8cJCVDGiYKo1ho-r1JcV19tm26doUHqevixJjH8SZ26i4EWbUOQLEuODf0Kt6JI0ZhtfiIaIXDg9MhUyDCEt_qxFWbSHA"







beautifulsoup