PythonでUTF-8など日本語(全角文字)を使う方法。コメントにも必要。
2017/04/29
Pythonで日本語(全角文字、マルチバイト文字)を使う方法
Pythonで日本語を指定する方法
Pythonで日本語(全角文字、マルチバイト文字)を使う場合は、最初に UTF-8などの文字コードを宣言する必要があります。
プログラムで printなどで使う場合にとどまらず、コメント行に日本語(全角文字、マルチバイト文字)を使う場合もこの設定をしないとエラーになります。
具体的には、UTF-8を指定する場合は、下記のような文字コードの宣言を 1行目に記述します。
|
1 |
# coding: utf-8 |
ちなみに、大文字小文字は区別されませんので、「UTF-8」と書いても問題ありません。
Pythonのパスを記述する場合は 2行目に記述
場合によっては、下記の様に 1行目には Pythonへのパスを記述する必要がある場合もありますので、その場合は、1行目に Pythonのパスを記述し、2行目に文字コード指定の記述を書きます。
|
1 2 |
#!/usr/bin/python # coding: utf-8 |
もちろん、ここで指定した文字コードとファイルの文字コードは一致するように保存します。
UTF-8以外の文字コードを指定する場合
UTF-8以外の文字コードの場合は、以下の通りに指定をします。
|
1 2 3 4 |
# coding: Shift_JIS # coding: EUC-JIS # coding: ISO-2022-JP # coding: CP932 |
Pythonのオフィシャルサイトでの記述方法
Pythonの基本的な処理としては「# coding: utf-8」だけ記述すれば動作します。
ですが、サンプルプログラムなどでは下記の様に「-*-」が付けられているものもよく見かけます。
この記述方法でも問題なく文字コードの指定することができます。
|
1 |
# -*- coding: utf-8 -*- |
では、なぜこの記述方法も広く見かけるのでしょうか?
理由の一つとしては、Pythonのオフィシャルサイトのドキュメントにその記述方法が書いてあるからではないでしょうか?
【Python Ver 2.7】
http://docs.python.jp/2.7/tutorial/interpreter.html#source-code-encoding
【Python Ver 3.5】
http://docs.python.jp/3.5/tutorial/interpreter.html#source-code-encoding
その他の理由としては、「Emacs」というエディタが文字コードを認識するためには、「# # -*- coding: utf-8 -*-」と記述する必要があるということもあるようです。
どちらでも動きますので、個々人の環境に合わせて好きな方を選択すればいいかと思います。
selenium+Pythonで処理の自動化に関する記事
Selenium WebDriver、Pythonをインストールしブラウザ自動操作の環境構築手順のまとめ
PythonでUTF-8など日本語(全角文字)を使う方法。コメントにも必要。
Pythonをコマンドラインで実行。全角文字(日本語)を引数にする場合の対処方法
Selenium WebDriverでFirefoxをプライベートウィンドウ/Chromeをシークレットモードで起動する方法・言語はpython
Selenium WebDriver、Pythonをインストールし Chromeの自動操作の環境構築手順のまとめ
Beautiful Soupを利用してPythonでスクレイピングを行う環境構築方法の解説
PythonでMySQLへの接続ライブラリMySQL-pythonの簡単インストール方法
PythonでURLの有無、存在をチェックするスクリプト
GoogleAdwords
GoogleAdwords
この記事が参考になったと思いましたらソーシャルメディアで共有していただけると嬉しいです!
関連記事
-
-
Apacheの起動しているかの確認方法と起動、再起動、終了のコマンド
Apacheが起動しているかを確認する方法の解説に加え、Apacheの起動、停止、再起動のコマンドを解説。再起動のコマンドには restart、condrestart、reload、gracefulがあり、違いを解説。
-
-
PythonでMySQLへの接続ライブラリMySQL-pythonの簡単インストール方法
PythonはMySQLに接続するライブラリは別途インストールが必要。なのでMySQL-pythonライブラリのインストール方法とサンプルスクリプトで動作検証までを解説。
-
-
Webサイト公開時に重複コンテンツを排除する.htaccessのリダイレクトの設定のまとめ
サイトを公開する際にはURLの正規化は必須です。正規化とは何かを解説し、.htaccessに設定すべきリダイレクトの設定を具体的に説明します。
-
-
.htaccessのmod_expiresでブラウザキャッシュで高速化でSEO対策!
Page Speed Insightsの指摘事項のファイルのブラウザキャッシュの設定方法。解説もしてるけど、.htaccessにコピペするだけの簡単設置で効果抜群!SEOにも威力を発揮!
-
-
直リンクとは何か?直リンクとディープリンクの違いと著作権問題
直リンクは著作権違反なのか?議論の前にまず「直リンク」の意味を正しく理解しよう。直リンクは他のサイトの画像を読み込む、ディープリンクなど多様な意味がある。
-
-
借りてはいけないレンタルサーバ実例4社・アルファメール・WEBアリーナ
餅は餅屋。サーバはサーバ屋が提供するサービスを利用するべきという記事で、具体例 4サービスを例にこんなサーバはNGと紹介しています。
-
-
Gitはフォルダ自体を管理対象にはできない。空のフォルダを設定する手順
Gitはフォルダだけを管理対象にすることはできない。そのため空の.gitkeepファイルを作成し管理対象にすることで、それが入っているフォルダも管理対象にする、と言う手順で管理を行う。
-
-
FTPでダウンロード時にファイルが重複するため上書きしますか?と表示される問題
FTPでファイルをダウンロードする際に「ファイルが重複しています。上書きしますか?」というメッセージが出る場合がありますが、これの原因と対策、解決策の記事です。
-
-
Pythonをコマンドラインで実行。全角文字(日本語)を引数にする場合の対処方法
Pythonをコマンドラインで実行する際、引数を付与して実行する方法の解説。その時問題となる日本語(全角文字)を利用する方法を解説。Windows環境での解説。
-
-
Selenium WebDriver、Pythonをインストールし Chromeの自動操作の環境構築手順のまとめ
Selenium WebDriverを使ってChromeを自動操作する環境を構築する手順のまとめ。使用するPythonのインストールから、サンプルスクリプトの動作確認までを詳細解説。