Pythonのスクレイピング



Answers

Question

私はキャプションを取得したかった。 特定のユーザーの最近の10枚の画像の好き嫌いとコメントの数 私はちょうど最新のものを得ることができる以下のコードを使用しています。

コード:

from selenium import webdriver
from bs4 import BeautifulSoup
import json, time, re
phantomjs_path = r'C:\Users\ravi.janjwadia\Desktop\phantomjs-2.1.1-windows\bin\phantomjs.exe'
browser = webdriver.PhantomJS(phantomjs_path)
user = "barackobama"     
browser.get('https://instagram.com/' + user)
time.sleep(0.5)
soup = BeautifulSoup(browser.page_source, 'html.parser')
script_tag = soup.find('script',text=re.compile('window\._sharedData'))
shared_data = script_tag.string.partition('=')[-1].strip(' ;')
result = json.loads(shared_data)
print(result['entry_data']['ProfilePage'][0]['user']['media']['nodes'][0]['caption'])

結果:LAST CALL:今夜、今夜の締め切り前にオバマ大統領と会うチャンスを入力してください。 →プロフィールにリンクしてください。




Links