Selenium WebDriver、Pythonをインストールし Chromeの自動操作の環境構築手順のまとめ
2017/04/29
Selenium WebDriver、Pythonをインストールし Chromeの自動操作の環境構築手順のまとめ
selenium WebDriverとは?
Seleniumは、ブラウザの操作を自動化することで、Webシステムのデバッグをするために開発されたプログラムです。
ですが、ブラウザを自動的に操作することができますので、デバッグのためのツールとしてだけではなく、ロボットツールとしても利用されているプログラムです。
Seleniumには、selenium Core、selenium RC、selenium IDE、selenium WebDriver...など開発の歴史の中でいくつものバージョンが作られてきましたが、基本的には Firefoxが密接な関係にあったブラウザですので、Seleniumというと Firefox、という感じなのですが、ここでは、Google Chromeを使って自動操作するための環境構築の方法を解説します。
selenium WebDriverの Firefox版と Chrome版の違い
Selenium WebDriverと Pythonを使って、Firefoxを自動操作する環境構築の手順は「Selenium WebDriver、Pythonをインストールしブラウザ自動操作の環境構築手順のまとめ」で解説をしましたので、こちらを参照してください。
この記事で Firefoxの場合は、Firefoxを操作するために「geckodriver」というドライバーを入れましたが、Chromeの場合は、「ChromeDriver – WebDriver for Chrome」を入れます。
もちろん、「geckodriver」と「ChromeDriver」の両方入れても全く問題ありません。
Pythonや seleniumをインストールする手順
- Pythonのインストール
- setuptoolsのインストール
- easy_installで pipをインストール
- seleniumのインストール
- pytestのインストール
- ChromeDriverのインストール
- Pythonスクリプトで seleniumを動作させる
このうち、「ChromeDriverのインストール」と「Pythonスクリプトで seleniumを動作させる」以外は、Firefoxの時と同じですので、「Selenium WebDriver、Pythonをインストールしブラウザ自動操作の環境構築手順のまとめ」を参考にインストールをしてください。
ChromeDriver – WebDriver for Chromeのインストール
chromedriver_win32.zipのダウンロード
下記の Googleのサイトから、ChromeDriverをダウンロードします。
https://sites.google.com/a/chromium.org/chromedriver/downloads
上記のサイトの「Latest Release」のバージョンのダウンロード画面に遷移し、インストールする環境に合うものをダウンロードします。
私の場合は Windows10でしたので、「chromedriver_win32.zip」をダウンロードしました。
chromedriver.exeの設置
「chromedriver_win32.zip」をダウンロードし、展開すると「chromedriver.exe」が取り出せますので、これをパスが通ったところに設置します。
パスが通っているところであればどこでもいいのですが、「Selenium WebDriver、Pythonをインストールしブラウザ自動操作の環境構築手順のまとめ」で解説していますが、「geckodriver.exe」は「C:\Python27\Scripts」に設置していますので、同じ場所に設置すると分かりやすくていいでしょう。
Pythonスクリプトで seleniumを動作させる
設定した seleniumが正しく動作するかを確認するため、動作検証のための Pythonスクリプトを実行してみます。
Pythonスクリプトを実行
動作検証のためのサンプルスクリプトは以下のようになります。
これをフォルダ「test」の中にファイル名「selenium_test.py」として保存します。
1 2 3 4 5 6 |
# coding: utf-8 from selenium import webdriver browser = webdriver.Chrome() browser.get('http://blog.s-giken.net/') |
上記のスクリプトを下記のコマンドで実行します。
1 |
c:\python27\Scripts\py.test -v -s c:\test\selenium_test.py |
このサンプルスクリプトは、Chromeを起動して、指定した URLのページを表示する、というだけのシンプルなものですが、このスクリプトが問題なく動作すれば、あとは、動作させたい処理を Pythonで記述していくだけですね。
selenium+Pythonで処理の自動化に関する記事
Selenium WebDriver、Pythonをインストールしブラウザ自動操作の環境構築手順のまとめ
PythonでUTF-8など日本語(全角文字)を使う方法。コメントにも必要。
Pythonをコマンドラインで実行。全角文字(日本語)を引数にする場合の対処方法
Selenium WebDriverでFirefoxをプライベートウィンドウ/Chromeをシークレットモードで起動する方法・言語はpython
Selenium WebDriver、Pythonをインストールし Chromeの自動操作の環境構築手順のまとめ
Beautiful Soupを利用してPythonでスクレイピングを行う環境構築方法の解説
PythonでMySQLへの接続ライブラリMySQL-pythonの簡単インストール方法
PythonでURLの有無、存在をチェックするスクリプト
GoogleAdwords
GoogleAdwords
この記事が参考になったと思いましたらソーシャルメディアで共有していただけると嬉しいです!
関連記事
-
-
Beautiful Soupを利用してPythonでスクレイピングを行う環境構築方法の解説
BeautifulSoupはPythonでスクレイピングを行う際に便利なツール。インストール方法も簡単。ただ、事前にpipのインストールが必要でその解説もしてます。
-
-
.htaccessのmod_deflateでファイル圧縮送信で高速化でSEO対策!
Page Speed Insightsの指摘事項であるファイルの圧縮送信の対応方法。処理内容の解説もあるけど、.htaccessにコピペするだけの簡単設置で効果抜群!SEOにも威力を発揮!
-
-
直リンクとは何か?直リンクとディープリンクの違いと著作権問題
直リンクは著作権違反なのか?議論の前にまず「直リンク」の意味を正しく理解しよう。直リンクは他のサイトの画像を読み込む、ディープリンクなど多様な意味がある。
-
-
.gitignoreで無視フォルダの中の特定のファイルを除外「!(否定文)」を使う場合の注意点
Gitで管理する対象、対象外のファイル、フォルダの指定は .gitignoreに記述する。その基本的な記述の方法に加え、無視対象にしたフォルダの中の特定のファイルを管理対象にする記述方法を解説。
-
-
mod_pagespeedカスタマイズで高速化を詳細解説・Google謹製
mod_pagespeedをデフォルトのまま使っていませんか?mod_pagespeedはデフォルトのままでも速い!でも仕組みを理解し設定し直せばより速くなる!
-
-
コピーコンテンツ・直リンクの3つの対策Google通報などのまとめ
コピーコンテンツを発見したときにやること!Googleに通報、画像の直リンクを禁止、RSSの全文配信を停止。この対策をしないとあなたのサイトの評価も下がるかも!
-
-
Selenium WebDriverでFirefoxをプライベートウィンドウ/Chromeをシークレットモードで起動する方法・言語はpython
Seleniumでは初期状態でブラウザを起動する Seleniumでブラウザ …
-
-
ブラウザのキャッシュを活用するの対策!広告バナーを消して表示を高速化
あなたのサイトが遅いのはバリューコマースのバナーではないですか?バリューコマースのバナーを外すだけでmod_deflateとmod_expiresを設定するより効果があります!
-
-
FTPでダウンロード時にファイルが重複するため上書きしますか?と表示される問題
FTPでファイルをダウンロードする際に「ファイルが重複しています。上書きしますか?」というメッセージが出る場合がありますが、これの原因と対策、解決策の記事です。
-
-
本当に?GMO系ロリポップ・ヘテムルを無料で運用する方法があった!
ロリポップ、ヘテムルを株主優待を利用して実質無料で運営しよう!という解説記事です。株主優待で提供されるサービスの内容を解説し、無料になる仕組みを解説します。