Pythonでブラウザ自動操作

どうもヨスケです。

今日も楽しくPythonプログラミングです。

以前の記事で、Webスクレイピング（Yahoo!ニュースの自動取得）プログラミングができるようになりました。どんどん、Webページ上でできる操作を増やしていくべく、Webブラウザ操作についても勉強中です。

今回は、少し慣れてきたSeleniumによるブラウザ操作を活用して、会員ページへのログインとマイページの情報を取ることを目的にプログラムしてみます。

この記事でできるブラウザ操作
①　会員ページ（例：Amazon）へログイン
②　商品の購入履歴から領収書の情報を取得する

どうもヨスケです。プログラミングがやりたくて、Pythonを勉強し始めて早くも約1か月です。コーディングルールはprogate有料コース 1078円/月（税込み）で学習できましたので、これからは、写経！写経！写経でレベル上げ中です！※「写経...

Pythonでブラウザ自動操作　Seleniumできること

Pythonの学習も進み、ついにWebブラウザの自動操作までたどり着きました。実際に作動確認をしたプログラムを掲載しますので、コピペして遊んでみてください。

pythonでGoogle Chromeを自動操作
まとめ：ブラウザ自動操作成功！

pythonでGoogle Chromeを自動操作

長い記事をグダグダ書くのはニーズに合っていないと思いますので、さっそく作ったプログラムを紹介しようと思います。

ブラウザ処理の要素ごとに紹介しますので、みなさんの用途に応じて、組み合わせて使ってください。

成果物:Google Chromeを自動操作するPythonプログラム

① Amazonのマイページへログインする

② 購入履歴ページ⇒最新の購入商品の領収書ページへ遷移

③ 領収書のダウンロード（今回はスクショ）

ログインページURLとID/パスワードの指定

ログインページのURLとID/パスワードの指定です。また今回の処理で使用するライブラリのインポートも併せて。今回もSelenium, webdriverを使用します。

ログインしたいサイトのログインページを書きましょう。

from selenium import webdriver
import time

# AmazonのログインページとID,パスワードの指定
login_url = 'https://www.amazon.co.jp/ap/signin?openid.pape.max_auth_age=0&openid.return_to=https%3A%2F%2Fwww.amazon.co.jp%2Fref%3Dnav_signin&openid.identity=http%3A%2F%2Fspecs.openid.net%2Fauth%2F2.0%2Fidentifier_select&openid.assoc_handle=jpflex&openid.mode=checkid_setup&openid.claimed_id=http%3A%2F%2Fspecs.openid.net%2Fauth%2F2.0%2Fidentifier_select&openid.ns=http%3A%2F%2Fspecs.openid.net%2Fauth%2F2.0&'
user_id, password = ('******ID******', '*****PASSWORD******')

ログイン処理

ログインの処理です。今回の例のAmazonのログインは以下の順に遷移します。

①　ID（メールアドレス）を入力

②　フォーム送信

③　パスワード入力

④　フォーム送信

# ログインの処理
def try_login(driver):
    # ログインページを開く
    driver.get(login_url)
    # ユーザー名とパスワードを書き込む
    usr = driver.find_element_by_name('email')
    usr.send_keys(user_id)
    #フォーム送信
    usr.submit()
    pwd = driver.find_element_by_name('password')
    pwd.send_keys(password)
    #フォーム送信
    pwd.submit()

リンクのテキストを探してクリック

HTMLソースの中で、ブラウザ上でクリックしたいリンクがどこにあるかをリンクが埋め込まれたテキストを探して、クリックします。本日のプログラムの肝です◎

Amazonのマイページですが、右上あたりに購入履歴に飛べるリンクがあります。

これら、クリックしたいリンクを検索しクリックする操作を記述します。

# labelを指定して検索し、リンクをクリックする
def link_click(driver, label):
    a = driver.find_element_by_partial_link_text(label)
    a.click()

メソッド（関数）としては非常に短いですが、htmlを読み解き、検索すべき「label」をみつけるところに苦労しました。

Progateで、HTMLの講座を受けていると、とっつきやすいです。

購入履歴ページ⇒領収書の表示

購入履歴ページ内で、領収書のリンクまでクリックしていきます。

途中、「領収書等」をクリックしたときに、注文書と領収書のリンクがポップしてきてクリックする必要があるのですが、ちょっとはまりかけました。

driver.find_element_by_partial_link_text('検索ラベル')

をうまく使って、一意のリンクをクリックできるように工夫する必要があります。

実際のAmazonの遷移画面

右上の注文履歴をクリック

①マイページ

「領収書等」をクリック

「領収書／購入明細書」をクリック

③領収書のリンク部分

領収書のページ

今回のソース

# メイン処理
# Chromeを起動 
driver = webdriver.Chrome()
# Amazonアカウントにログイン
try_login(driver)
time.sleep(1)

# 「注文履歴」をクリック
link_click(driver, '注文履歴')
time.sleep(2)

# 「領収書等」をクリック
link_click(driver, '領収書等')
time.sleep(2)

# 「領収書／購入明細書」をクリック
link_click(driver, '購入明細書')
time.sleep(2)

# 領収書をスクリーンショットして保存
driver.get_screenshot_as_file('receipt.png')
time.sleep(30)

効率的ではないコーディングに見えますが。。。

シンプルなメソッドの使いまわしでもやりたいことができているので良しとします◎