エス技研

WordPress、CakePHP、PHP、baserCMSなどの Web系システムを中心に情報を提供します!


Selenium WebDriver、Pythonをインストールし Chromeの自動操作の環境構築手順のまとめ

      2017/04/29

Selenium WebDriver、Pythonをインストールし Chromeの自動操作の環境構築手順のまとめ

 

selenium WebDriverとは?

 
Seleniumは、ブラウザの操作を自動化することで、Webシステムのデバッグをするために開発されたプログラムです。
 
ですが、ブラウザを自動的に操作することができますので、デバッグのためのツールとしてだけではなく、ロボットツールとしても利用されているプログラムです。
 
Seleniumには、selenium Core、selenium RC、selenium IDE、selenium WebDriver...など開発の歴史の中でいくつものバージョンが作られてきましたが、基本的には Firefoxが密接な関係にあったブラウザですので、Seleniumというと Firefox、という感じなのですが、ここでは、Google Chromeを使って自動操作するための環境構築の方法を解説します。
 
 

selenium WebDriverの Firefox版と Chrome版の違い

 
Selenium WebDriverと Pythonを使って、Firefoxを自動操作する環境構築の手順は「Selenium WebDriver、Pythonをインストールしブラウザ自動操作の環境構築手順のまとめ」で解説をしましたので、こちらを参照してください。
 
この記事で Firefoxの場合は、Firefoxを操作するために「geckodriver」というドライバーを入れましたが、Chromeの場合は、「ChromeDriver – WebDriver for Chrome」を入れます。
 
もちろん、「geckodriver」と「ChromeDriver」の両方入れても全く問題ありません。
 
 

Pythonや seleniumをインストールする手順

 

 
 
このうち、「ChromeDriverのインストール」と「Pythonスクリプトで seleniumを動作させる」以外は、Firefoxの時と同じですので、「Selenium WebDriver、Pythonをインストールしブラウザ自動操作の環境構築手順のまとめ」を参考にインストールをしてください。
 
 


 
 

ChromeDriver – WebDriver for Chromeのインストール

 

chromedriver_win32.zipのダウンロード

 
下記の Googleのサイトから、ChromeDriverをダウンロードします。
 https://sites.google.com/a/chromium.org/chromedriver/downloads
 
上記のサイトの「Latest Release」のバージョンのダウンロード画面に遷移し、インストールする環境に合うものをダウンロードします。
 
私の場合は Windows10でしたので、「chromedriver_win32.zip」をダウンロードしました。
 

chromedriver.exeの設置

 
「chromedriver_win32.zip」をダウンロードし、展開すると「chromedriver.exe」が取り出せますので、これをパスが通ったところに設置します。
 
パスが通っているところであればどこでもいいのですが、「Selenium WebDriver、Pythonをインストールしブラウザ自動操作の環境構築手順のまとめ」で解説していますが、「geckodriver.exe」は「C:\Python27\Scripts」に設置していますので、同じ場所に設置すると分かりやすくていいでしょう。
 
 
 

Pythonスクリプトで seleniumを動作させる

 
設定した seleniumが正しく動作するかを確認するため、動作検証のための Pythonスクリプトを実行してみます。
 

Pythonスクリプトを実行

 
動作検証のためのサンプルスクリプトは以下のようになります。
これをフォルダ「test」の中にファイル名「selenium_test.py」として保存します。
 

 
上記のスクリプトを下記のコマンドで実行します。
 

 
このサンプルスクリプトは、Chromeを起動して、指定した URLのページを表示する、というだけのシンプルなものですが、このスクリプトが問題なく動作すれば、あとは、動作させたい処理を Pythonで記述していくだけですね。
 
 

selenium+Pythonで処理の自動化に関する記事

Selenium WebDriver、Pythonをインストールしブラウザ自動操作の環境構築手順のまとめ
PythonでUTF-8など日本語(全角文字)を使う方法。コメントにも必要。
Pythonをコマンドラインで実行。全角文字(日本語)を引数にする場合の対処方法
Selenium WebDriverでFirefoxをプライベートウィンドウ/Chromeをシークレットモードで起動する方法・言語はpython
Selenium WebDriver、Pythonをインストールし Chromeの自動操作の環境構築手順のまとめ
Beautiful Soupを利用してPythonでスクレイピングを行う環境構築方法の解説
PythonでMySQLへの接続ライブラリMySQL-pythonの簡単インストール方法
PythonでURLの有無、存在をチェックするスクリプト

 - プログラミング・Web関連技術

GoogleAdwords

GoogleAdwords

最後までお読みいただきましてありがとうございます。
この記事が参考になったと思いましたらソーシャルメディアで共有していただけると嬉しいです!

Message

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

下記の空欄を埋めてください。 * Time limit is exhausted. Please reload CAPTCHA.

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)

※入力いただいたコメントは管理者の承認後に掲載されます。

  関連記事

コピーコンテンツ・直リンクの3つの対策Google通報などのまとめ

コピーコンテンツを発見したときにやること!Googleに通報、画像の直リンクを禁止、RSSの全文配信を停止。この対策をしないとあなたのサイトの評価も下がるかも!

FTPでダウンロード時にファイルが重複するため上書きしますか?と表示される問題

FTPでファイルをダウンロードする際に「ファイルが重複しています。上書きしますか?」というメッセージが出る場合がありますが、これの原因と対策、解決策の記事です。

mod_pagespeedでWebサイトを超簡単高速化・Google謹製の最終兵器

Webサイトの表示スピード高速化の最終兵器、Google謹製mod_pagespeedの解説です。レンタルサーバではX-Serverでしか利用できませんが、ワンクリックで高速化します。

Webサイト公開時に重複コンテンツを排除する.htaccessのリダイレクトの設定のまとめ

サイトを公開する際にはURLの正規化は必須です。正規化とは何かを解説し、.htaccessに設定すべきリダイレクトの設定を具体的に説明します。

X Serverへの引越しの注意点まとめ。ロリポップとの違いと対処方法 6事例

ロリポップからX Serverに引越し。ロリポップとX Serverの違いに注目することでX Serverの設定方法を明確にします。またX Serverならではの設定ポイントなども解説。

本当に?GMO系ロリポップ・ヘテムルを無料で運用する方法があった!

ロリポップ、ヘテムルを株主優待を利用して実質無料で運営しよう!という解説記事です。株主優待で提供されるサービスの内容を解説し、無料になる仕組みを解説します。

.htaccessのmod_expiresでブラウザキャッシュで高速化でSEO対策!

Page Speed Insightsの指摘事項のファイルのブラウザキャッシュの設定方法。解説もしてるけど、.htaccessにコピペするだけの簡単設置で効果抜群!SEOにも威力を発揮!

.gitignoreで無視フォルダの中の特定のファイルを除外「!(否定文)」を使う場合の注意点
.gitignoreで無視フォルダの中の特定のファイルを除外「!(否定文)」を使う場合の注意点

Gitで管理する対象、対象外のファイル、フォルダの指定は .gitignoreに記述する。その基本的な記述の方法に加え、無視対象にしたフォルダの中の特定のファイルを管理対象にする記述方法を解説。

直リンクとは何か?直リンクとディープリンクの違いと著作権問題

直リンクは著作権違反なのか?議論の前にまず「直リンク」の意味を正しく理解しよう。直リンクは他のサイトの画像を読み込む、ディープリンクなど多様な意味がある。

Gitはフォルダ自体を管理対象にはできない。空のフォルダを設定する手順
Gitはフォルダ自体を管理対象にはできない。空のフォルダを設定する手順

Gitはフォルダだけを管理対象にすることはできない。そのため空の.gitkeepファイルを作成し管理対象にすることで、それが入っているフォルダも管理対象にする、と言う手順で管理を行う。