Selenium WebDriver、Pythonをインストールし Chromeの自動操作の環境構築手順のまとめ
2017/04/29
Selenium WebDriver、Pythonをインストールし Chromeの自動操作の環境構築手順のまとめ
selenium WebDriverとは?
Seleniumは、ブラウザの操作を自動化することで、Webシステムのデバッグをするために開発されたプログラムです。
ですが、ブラウザを自動的に操作することができますので、デバッグのためのツールとしてだけではなく、ロボットツールとしても利用されているプログラムです。
Seleniumには、selenium Core、selenium RC、selenium IDE、selenium WebDriver...など開発の歴史の中でいくつものバージョンが作られてきましたが、基本的には Firefoxが密接な関係にあったブラウザですので、Seleniumというと Firefox、という感じなのですが、ここでは、Google Chromeを使って自動操作するための環境構築の方法を解説します。
selenium WebDriverの Firefox版と Chrome版の違い
Selenium WebDriverと Pythonを使って、Firefoxを自動操作する環境構築の手順は「Selenium WebDriver、Pythonをインストールしブラウザ自動操作の環境構築手順のまとめ」で解説をしましたので、こちらを参照してください。
この記事で Firefoxの場合は、Firefoxを操作するために「geckodriver」というドライバーを入れましたが、Chromeの場合は、「ChromeDriver – WebDriver for Chrome」を入れます。
もちろん、「geckodriver」と「ChromeDriver」の両方入れても全く問題ありません。
Pythonや seleniumをインストールする手順
- Pythonのインストール
- setuptoolsのインストール
- easy_installで pipをインストール
- seleniumのインストール
- pytestのインストール
- ChromeDriverのインストール
- Pythonスクリプトで seleniumを動作させる
このうち、「ChromeDriverのインストール」と「Pythonスクリプトで seleniumを動作させる」以外は、Firefoxの時と同じですので、「Selenium WebDriver、Pythonをインストールしブラウザ自動操作の環境構築手順のまとめ」を参考にインストールをしてください。
ChromeDriver – WebDriver for Chromeのインストール
chromedriver_win32.zipのダウンロード
下記の Googleのサイトから、ChromeDriverをダウンロードします。
https://sites.google.com/a/chromium.org/chromedriver/downloads
上記のサイトの「Latest Release」のバージョンのダウンロード画面に遷移し、インストールする環境に合うものをダウンロードします。
私の場合は Windows10でしたので、「chromedriver_win32.zip」をダウンロードしました。
chromedriver.exeの設置
「chromedriver_win32.zip」をダウンロードし、展開すると「chromedriver.exe」が取り出せますので、これをパスが通ったところに設置します。
パスが通っているところであればどこでもいいのですが、「Selenium WebDriver、Pythonをインストールしブラウザ自動操作の環境構築手順のまとめ」で解説していますが、「geckodriver.exe」は「C:\Python27\Scripts」に設置していますので、同じ場所に設置すると分かりやすくていいでしょう。
Pythonスクリプトで seleniumを動作させる
設定した seleniumが正しく動作するかを確認するため、動作検証のための Pythonスクリプトを実行してみます。
Pythonスクリプトを実行
動作検証のためのサンプルスクリプトは以下のようになります。
これをフォルダ「test」の中にファイル名「selenium_test.py」として保存します。
1 2 3 4 5 6 |
# coding: utf-8 from selenium import webdriver browser = webdriver.Chrome() browser.get('http://blog.s-giken.net/') |
上記のスクリプトを下記のコマンドで実行します。
1 |
c:\python27\Scripts\py.test -v -s c:\test\selenium_test.py |
このサンプルスクリプトは、Chromeを起動して、指定した URLのページを表示する、というだけのシンプルなものですが、このスクリプトが問題なく動作すれば、あとは、動作させたい処理を Pythonで記述していくだけですね。
selenium+Pythonで処理の自動化に関する記事
Selenium WebDriver、Pythonをインストールしブラウザ自動操作の環境構築手順のまとめ
PythonでUTF-8など日本語(全角文字)を使う方法。コメントにも必要。
Pythonをコマンドラインで実行。全角文字(日本語)を引数にする場合の対処方法
Selenium WebDriverでFirefoxをプライベートウィンドウ/Chromeをシークレットモードで起動する方法・言語はpython
Selenium WebDriver、Pythonをインストールし Chromeの自動操作の環境構築手順のまとめ
Beautiful Soupを利用してPythonでスクレイピングを行う環境構築方法の解説
PythonでMySQLへの接続ライブラリMySQL-pythonの簡単インストール方法
PythonでURLの有無、存在をチェックするスクリプト
GoogleAdwords
GoogleAdwords
この記事が参考になったと思いましたらソーシャルメディアで共有していただけると嬉しいです!
関連記事
-
-
Selenium WebDriver、Pythonをインストールしブラウザ自動操作の環境構築手順のまとめ
ブラウザを自動操作しテストを実行するロボットをselenium WebDriver+Pythonの環境を構築し、動作確認までの手順のまとめ。初心者向けに詳細解説。サンプルソースも。
-
-
.gitignoreで無視フォルダの中の特定のファイルを除外「!(否定文)」を使う場合の注意点
Gitで管理する対象、対象外のファイル、フォルダの指定は .gitignoreに記述する。その基本的な記述の方法に加え、無視対象にしたフォルダの中の特定のファイルを管理対象にする記述方法を解説。
-
-
直リンク禁止の.htaccessを超分かりやすく解説。日本語じゃなくてPHPで説明
直リンクを禁止する.htaccessの記述内容を日本語ではなくPHPで解説!私自身もこの方法ですっかり理解できました。.htaccessって簡単!って思えますよ。
-
-
コピーコンテンツ対策.htaccessで直リンク禁止しリダイレクトで対応
不正なコピーコンテンツからの直リンクを拒否する.htaccessの設定方法。拒否するサイトを指定、許可するサイトを指定する方法、単純な拒否と画像の差し替えを解説。
-
-
EストアのショップサーブのWordPressサービスにメリット無し
ショップサーブのオプションサービスのWordPressを使ってみましたがデータベースには直接触れず使えないサービスでした。
-
-
本当に?GMO系ロリポップ・ヘテムルを無料で運用する方法があった!
ロリポップ、ヘテムルを株主優待を利用して実質無料で運営しよう!という解説記事です。株主優待で提供されるサービスの内容を解説し、無料になる仕組みを解説します。
-
-
Gitはフォルダ自体を管理対象にはできない。空のフォルダを設定する手順
Gitはフォルダだけを管理対象にすることはできない。そのため空の.gitkeepファイルを作成し管理対象にすることで、それが入っているフォルダも管理対象にする、と言う手順で管理を行う。
-
-
直リンクとは何か?直リンクとディープリンクの違いと著作権問題
直リンクは著作権違反なのか?議論の前にまず「直リンク」の意味を正しく理解しよう。直リンクは他のサイトの画像を読み込む、ディープリンクなど多様な意味がある。
-
-
さくらサーバのmb_send_mailでメール送信時にmalformed header from script ‘xxx.php’: Bad header: xxxのエラーが
さくらインターネットのレンタルサーバからPHPのmb_send_mail()関数を利用してメールを送信するとInternal Server Errorが発生。その原因は、メールアドレスが登録されていないこと。
-
-
コピーコンテンツ・直リンクの3つの対策Google通報などのまとめ
コピーコンテンツを発見したときにやること!Googleに通報、画像の直リンクを禁止、RSSの全文配信を停止。この対策をしないとあなたのサイトの評価も下がるかも!