Selenium WebDriver、Pythonをインストールし Chromeの自動操作の環境構築手順のまとめ
2017/04/29
Selenium WebDriver、Pythonをインストールし Chromeの自動操作の環境構築手順のまとめ
selenium WebDriverとは?
Seleniumは、ブラウザの操作を自動化することで、Webシステムのデバッグをするために開発されたプログラムです。
ですが、ブラウザを自動的に操作することができますので、デバッグのためのツールとしてだけではなく、ロボットツールとしても利用されているプログラムです。
Seleniumには、selenium Core、selenium RC、selenium IDE、selenium WebDriver...など開発の歴史の中でいくつものバージョンが作られてきましたが、基本的には Firefoxが密接な関係にあったブラウザですので、Seleniumというと Firefox、という感じなのですが、ここでは、Google Chromeを使って自動操作するための環境構築の方法を解説します。
selenium WebDriverの Firefox版と Chrome版の違い
Selenium WebDriverと Pythonを使って、Firefoxを自動操作する環境構築の手順は「Selenium WebDriver、Pythonをインストールしブラウザ自動操作の環境構築手順のまとめ」で解説をしましたので、こちらを参照してください。
この記事で Firefoxの場合は、Firefoxを操作するために「geckodriver」というドライバーを入れましたが、Chromeの場合は、「ChromeDriver – WebDriver for Chrome」を入れます。
もちろん、「geckodriver」と「ChromeDriver」の両方入れても全く問題ありません。
Pythonや seleniumをインストールする手順
- Pythonのインストール
- setuptoolsのインストール
- easy_installで pipをインストール
- seleniumのインストール
- pytestのインストール
- ChromeDriverのインストール
- Pythonスクリプトで seleniumを動作させる
このうち、「ChromeDriverのインストール」と「Pythonスクリプトで seleniumを動作させる」以外は、Firefoxの時と同じですので、「Selenium WebDriver、Pythonをインストールしブラウザ自動操作の環境構築手順のまとめ」を参考にインストールをしてください。
ChromeDriver – WebDriver for Chromeのインストール
chromedriver_win32.zipのダウンロード
下記の Googleのサイトから、ChromeDriverをダウンロードします。
https://sites.google.com/a/chromium.org/chromedriver/downloads
上記のサイトの「Latest Release」のバージョンのダウンロード画面に遷移し、インストールする環境に合うものをダウンロードします。
私の場合は Windows10でしたので、「chromedriver_win32.zip」をダウンロードしました。
chromedriver.exeの設置
「chromedriver_win32.zip」をダウンロードし、展開すると「chromedriver.exe」が取り出せますので、これをパスが通ったところに設置します。
パスが通っているところであればどこでもいいのですが、「Selenium WebDriver、Pythonをインストールしブラウザ自動操作の環境構築手順のまとめ」で解説していますが、「geckodriver.exe」は「C:\Python27\Scripts」に設置していますので、同じ場所に設置すると分かりやすくていいでしょう。
Pythonスクリプトで seleniumを動作させる
設定した seleniumが正しく動作するかを確認するため、動作検証のための Pythonスクリプトを実行してみます。
Pythonスクリプトを実行
動作検証のためのサンプルスクリプトは以下のようになります。
これをフォルダ「test」の中にファイル名「selenium_test.py」として保存します。
1 2 3 4 5 6 |
# coding: utf-8 from selenium import webdriver browser = webdriver.Chrome() browser.get('http://blog.s-giken.net/') |
上記のスクリプトを下記のコマンドで実行します。
1 |
c:\python27\Scripts\py.test -v -s c:\test\selenium_test.py |
このサンプルスクリプトは、Chromeを起動して、指定した URLのページを表示する、というだけのシンプルなものですが、このスクリプトが問題なく動作すれば、あとは、動作させたい処理を Pythonで記述していくだけですね。
selenium+Pythonで処理の自動化に関する記事
Selenium WebDriver、Pythonをインストールしブラウザ自動操作の環境構築手順のまとめ
PythonでUTF-8など日本語(全角文字)を使う方法。コメントにも必要。
Pythonをコマンドラインで実行。全角文字(日本語)を引数にする場合の対処方法
Selenium WebDriverでFirefoxをプライベートウィンドウ/Chromeをシークレットモードで起動する方法・言語はpython
Selenium WebDriver、Pythonをインストールし Chromeの自動操作の環境構築手順のまとめ
Beautiful Soupを利用してPythonでスクレイピングを行う環境構築方法の解説
PythonでMySQLへの接続ライブラリMySQL-pythonの簡単インストール方法
PythonでURLの有無、存在をチェックするスクリプト
GoogleAdwords
GoogleAdwords
この記事が参考になったと思いましたらソーシャルメディアで共有していただけると嬉しいです!
関連記事
-
-
Beautiful Soupを利用してPythonでスクレイピングを行う環境構築方法の解説
BeautifulSoupはPythonでスクレイピングを行う際に便利なツール。インストール方法も簡単。ただ、事前にpipのインストールが必要でその解説もしてます。
-
-
.htaccessのmod_expiresでブラウザキャッシュで高速化でSEO対策!
Page Speed Insightsの指摘事項のファイルのブラウザキャッシュの設定方法。解説もしてるけど、.htaccessにコピペするだけの簡単設置で効果抜群!SEOにも威力を発揮!
-
-
Gitで基本的なデプロイ(push、pullで本番公開)環境を作る手順解説
開発進行中の環境、公開中の環境にGitを導入する。その基本的な手続きを解説。Gitの導入、ローカルリポジトリを作成。リモートリポジトリを利用し、本番環境にデプロイする手続きを解説。
-
-
本当に?GMO系ロリポップ・ヘテムルを無料で運用する方法があった!
ロリポップ、ヘテムルを株主優待を利用して実質無料で運営しよう!という解説記事です。株主優待で提供されるサービスの内容を解説し、無料になる仕組みを解説します。
-
-
.gitignoreを更新しても反映されないときは「git rm -r –cached .」でキャッシュを削除
gitの.gitignoreを変更しても記述内容が反映されない時がある。それはGitのキャッシュが残っているため。そんなときは「git rm」コマンドを使ってキャッシュを削除すれば解決する。
-
-
コピーコンテンツ・直リンクの3つの対策Google通報などのまとめ
コピーコンテンツを発見したときにやること!Googleに通報、画像の直リンクを禁止、RSSの全文配信を停止。この対策をしないとあなたのサイトの評価も下がるかも!
-
-
Selenium WebDriverでFirefoxをプライベートウィンドウ/Chromeをシークレットモードで起動する方法・言語はpython
Seleniumでは初期状態でブラウザを起動する Seleniumでブラウザ …
-
-
Selenium WebDriver、Pythonをインストールしブラウザ自動操作の環境構築手順のまとめ
ブラウザを自動操作しテストを実行するロボットをselenium WebDriver+Pythonの環境を構築し、動作確認までの手順のまとめ。初心者向けに詳細解説。サンプルソースも。
-
-
PythonでUTF-8など日本語(全角文字)を使う方法。コメントにも必要。
Pythonの標準では日本語(全角文字)を利用できないので、利用する際は文字コードを宣言する必要がある。「# coding: utf-8」の様に記述すればOK。
-
-
PythonでURLの有無、存在をチェックするスクリプト
PythonでURLが存在するか否かのチェックスクリプト。ライブラリ「urllib2」を使い、指定のURLにアクセスしそのレスポンスコードを判別するという仕組み。