PythonでUTF-8など日本語(全角文字)を使う方法。コメントにも必要。
2017/04/29
Pythonで日本語(全角文字、マルチバイト文字)を使う方法
Pythonで日本語を指定する方法
Pythonで日本語(全角文字、マルチバイト文字)を使う場合は、最初に UTF-8などの文字コードを宣言する必要があります。
プログラムで printなどで使う場合にとどまらず、コメント行に日本語(全角文字、マルチバイト文字)を使う場合もこの設定をしないとエラーになります。
具体的には、UTF-8を指定する場合は、下記のような文字コードの宣言を 1行目に記述します。
|
1 |
# coding: utf-8 |
ちなみに、大文字小文字は区別されませんので、「UTF-8」と書いても問題ありません。
Pythonのパスを記述する場合は 2行目に記述
場合によっては、下記の様に 1行目には Pythonへのパスを記述する必要がある場合もありますので、その場合は、1行目に Pythonのパスを記述し、2行目に文字コード指定の記述を書きます。
|
1 2 |
#!/usr/bin/python # coding: utf-8 |
もちろん、ここで指定した文字コードとファイルの文字コードは一致するように保存します。
UTF-8以外の文字コードを指定する場合
UTF-8以外の文字コードの場合は、以下の通りに指定をします。
|
1 2 3 4 |
# coding: Shift_JIS # coding: EUC-JIS # coding: ISO-2022-JP # coding: CP932 |
Pythonのオフィシャルサイトでの記述方法
Pythonの基本的な処理としては「# coding: utf-8」だけ記述すれば動作します。
ですが、サンプルプログラムなどでは下記の様に「-*-」が付けられているものもよく見かけます。
この記述方法でも問題なく文字コードの指定することができます。
|
1 |
# -*- coding: utf-8 -*- |
では、なぜこの記述方法も広く見かけるのでしょうか?
理由の一つとしては、Pythonのオフィシャルサイトのドキュメントにその記述方法が書いてあるからではないでしょうか?
【Python Ver 2.7】
http://docs.python.jp/2.7/tutorial/interpreter.html#source-code-encoding
【Python Ver 3.5】
http://docs.python.jp/3.5/tutorial/interpreter.html#source-code-encoding
その他の理由としては、「Emacs」というエディタが文字コードを認識するためには、「# # -*- coding: utf-8 -*-」と記述する必要があるということもあるようです。
どちらでも動きますので、個々人の環境に合わせて好きな方を選択すればいいかと思います。
selenium+Pythonで処理の自動化に関する記事
Selenium WebDriver、Pythonをインストールしブラウザ自動操作の環境構築手順のまとめ
PythonでUTF-8など日本語(全角文字)を使う方法。コメントにも必要。
Pythonをコマンドラインで実行。全角文字(日本語)を引数にする場合の対処方法
Selenium WebDriverでFirefoxをプライベートウィンドウ/Chromeをシークレットモードで起動する方法・言語はpython
Selenium WebDriver、Pythonをインストールし Chromeの自動操作の環境構築手順のまとめ
Beautiful Soupを利用してPythonでスクレイピングを行う環境構築方法の解説
PythonでMySQLへの接続ライブラリMySQL-pythonの簡単インストール方法
PythonでURLの有無、存在をチェックするスクリプト
GoogleAdwords
GoogleAdwords
この記事が参考になったと思いましたらソーシャルメディアで共有していただけると嬉しいです!
関連記事
-
-
CentOS環境に ntpdをインストールして自動的に時刻を取得して合わせる設定にする
VirtualBoxに構築した CentOSの環境の時計がずれているとき、ntpdをインストールし、時計を合わせる方法を解説。NTPサーバを指定する方法や ntpdを自動起動する設定も解説。
-
-
Selenium WebDriver、Pythonをインストールし Chromeの自動操作の環境構築手順のまとめ
Selenium WebDriverを使ってChromeを自動操作する環境を構築する手順のまとめ。使用するPythonのインストールから、サンプルスクリプトの動作確認までを詳細解説。
-
-
Git管理のソースを元に新しく構築する環境に反映させる手順
Gitで管理しているソースを使って環境を構築する方法を解説。CakePHPを使う想定で、環境を構築したのちpullして、重複ファイルを削除して、改めてpullすれば出来上がる。
-
-
Webサイト公開時に重複コンテンツを排除する.htaccessのリダイレクトの設定のまとめ
サイトを公開する際にはURLの正規化は必須です。正規化とは何かを解説し、.htaccessに設定すべきリダイレクトの設定を具体的に説明します。
-
-
サイト更新、引越時に.htaccessでリダイレクトする方法解説
サイト更新,引越しなどでサイトのURLが変わった場合のリダイレクトを.htaccessのRewriteEngineを使って処理する方法の解説です。
-
-
mod_pagespeedでWebサイトを超簡単高速化・Google謹製の最終兵器
Webサイトの表示スピード高速化の最終兵器、Google謹製mod_pagespeedの解説です。レンタルサーバではX-Serverでしか利用できませんが、ワンクリックで高速化します。
-
-
FTPでダウンロード時にファイルが重複するため上書きしますか?と表示される問題
FTPでファイルをダウンロードする際に「ファイルが重複しています。上書きしますか?」というメッセージが出る場合がありますが、これの原因と対策、解決策の記事です。
-
-
Pythonをコマンドラインで実行。全角文字(日本語)を引数にする場合の対処方法
Pythonをコマンドラインで実行する際、引数を付与して実行する方法の解説。その時問題となる日本語(全角文字)を利用する方法を解説。Windows環境での解説。
-
-
コピーコンテンツ・直リンクの3つの対策Google通報などのまとめ
コピーコンテンツを発見したときにやること!Googleに通報、画像の直リンクを禁止、RSSの全文配信を停止。この対策をしないとあなたのサイトの評価も下がるかも!
-
-
本当に?GMO系ロリポップ・ヘテムルを無料で運用する方法があった!
ロリポップ、ヘテムルを株主優待を利用して実質無料で運営しよう!という解説記事です。株主優待で提供されるサービスの内容を解説し、無料になる仕組みを解説します。