html urllib - Obtenir la page générée avec Javascript en Python





download file (2)


Vous pouvez utiliser Selenium Webdriver :

#!/usr/bin/env python
from contextlib import closing
from selenium.webdriver import Firefox # pip install selenium
from selenium.webdriver.support.ui import WebDriverWait

# use firefox to get page with javascript generated content
with closing(Firefox()) as browser:
     browser.get(url)
     button = browser.find_element_by_name('button')
     button.click()
     # wait for the page to load
     WebDriverWait(browser, timeout=10).until(
         lambda x: x.find_element_by_id('someId_that_must_be_on_new_page'))
     # store it to string variable
     page_source = browser.page_source
print(page_source)

Je voudrais télécharger la page Web générée par Javascript et la stocker dans une variable de chaîne en code Python . La page est générée lorsque vous cliquez sur le bouton.

Si je connaissais l'URL obtenue, j'utiliserais urllib2 mais ce n'est pas le cas.

Je vous remercie




Étant donné qu'il y a une plainte à propos de l'utilisation du prototype et de l'utilisation de indexOf votre code est moins lisible, et puisque l'expression rationnelle est excessive:

function stringContains(inputString, stringToFind) {
    return (inputString.indexOf(stringToFind) != -1);
}

C'est le compromis pour lequel j'ai fini par aller.





javascript python html download urllib2