PythonでUTF-8など日本語(全角文字)を使う方法。コメントにも必要。
2017/04/29
Pythonで日本語(全角文字、マルチバイト文字)を使う方法
Pythonで日本語を指定する方法
Pythonで日本語(全角文字、マルチバイト文字)を使う場合は、最初に UTF-8などの文字コードを宣言する必要があります。
プログラムで printなどで使う場合にとどまらず、コメント行に日本語(全角文字、マルチバイト文字)を使う場合もこの設定をしないとエラーになります。
具体的には、UTF-8を指定する場合は、下記のような文字コードの宣言を 1行目に記述します。
1 |
# coding: utf-8 |
ちなみに、大文字小文字は区別されませんので、「UTF-8」と書いても問題ありません。
Pythonのパスを記述する場合は 2行目に記述
場合によっては、下記の様に 1行目には Pythonへのパスを記述する必要がある場合もありますので、その場合は、1行目に Pythonのパスを記述し、2行目に文字コード指定の記述を書きます。
1 2 |
#!/usr/bin/python # coding: utf-8 |
もちろん、ここで指定した文字コードとファイルの文字コードは一致するように保存します。
UTF-8以外の文字コードを指定する場合
UTF-8以外の文字コードの場合は、以下の通りに指定をします。
1 2 3 4 |
# coding: Shift_JIS # coding: EUC-JIS # coding: ISO-2022-JP # coding: CP932 |
Pythonのオフィシャルサイトでの記述方法
Pythonの基本的な処理としては「# coding: utf-8
」だけ記述すれば動作します。
ですが、サンプルプログラムなどでは下記の様に「-*-
」が付けられているものもよく見かけます。
この記述方法でも問題なく文字コードの指定することができます。
1 |
# -*- coding: utf-8 -*- |
では、なぜこの記述方法も広く見かけるのでしょうか?
理由の一つとしては、Pythonのオフィシャルサイトのドキュメントにその記述方法が書いてあるからではないでしょうか?
【Python Ver 2.7】
http://docs.python.jp/2.7/tutorial/interpreter.html#source-code-encoding
【Python Ver 3.5】
http://docs.python.jp/3.5/tutorial/interpreter.html#source-code-encoding
その他の理由としては、「Emacs」というエディタが文字コードを認識するためには、「# # -*- coding: utf-8 -*-
」と記述する必要があるということもあるようです。
どちらでも動きますので、個々人の環境に合わせて好きな方を選択すればいいかと思います。
selenium+Pythonで処理の自動化に関する記事
Selenium WebDriver、Pythonをインストールしブラウザ自動操作の環境構築手順のまとめ
PythonでUTF-8など日本語(全角文字)を使う方法。コメントにも必要。
Pythonをコマンドラインで実行。全角文字(日本語)を引数にする場合の対処方法
Selenium WebDriverでFirefoxをプライベートウィンドウ/Chromeをシークレットモードで起動する方法・言語はpython
Selenium WebDriver、Pythonをインストールし Chromeの自動操作の環境構築手順のまとめ
Beautiful Soupを利用してPythonでスクレイピングを行う環境構築方法の解説
PythonでMySQLへの接続ライブラリMySQL-pythonの簡単インストール方法
PythonでURLの有無、存在をチェックするスクリプト
GoogleAdwords
GoogleAdwords
この記事が参考になったと思いましたらソーシャルメディアで共有していただけると嬉しいです!
関連記事
-
Gitで基本的なデプロイ(push、pullで本番公開)環境を作る手順解説
開発進行中の環境、公開中の環境にGitを導入する。その基本的な手続きを解説。Gitの導入、ローカルリポジトリを作成。リモートリポジトリを利用し、本番環境にデプロイする手続きを解説。
-
CentOS環境に ntpdをインストールして自動的に時刻を取得して合わせる設定にする
VirtualBoxに構築した CentOSの環境の時計がずれているとき、ntpdをインストールし、時計を合わせる方法を解説。NTPサーバを指定する方法や ntpdを自動起動する設定も解説。
-
SyntaxHighlighterを導入してソースコードを見やすくしてみました
PHP、HTMLなどのソースコードをブログで紹介するとき、SyntaxHighlighterを利用することで見やすく提供することが出来ます。
-
chromedriver.exe – ディスクがありませんと出てSeleniumの設定が上手くいかない
Selenium WebDriverを使ってChromeを自動操作する仕組みを作る際、chromedriver.exeを利用しますが、ディスクがありません、というエラーが発生する場合があります。その対処方法を解説します。
-
コピーコンテンツ・直リンクの3つの対策Google通報などのまとめ
コピーコンテンツを発見したときにやること!Googleに通報、画像の直リンクを禁止、RSSの全文配信を停止。この対策をしないとあなたのサイトの評価も下がるかも!
-
直リンクとは何か?直リンクとディープリンクの違いと著作権問題
直リンクは著作権違反なのか?議論の前にまず「直リンク」の意味を正しく理解しよう。直リンクは他のサイトの画像を読み込む、ディープリンクなど多様な意味がある。
-
ブラウザのキャッシュを活用するの対策!広告バナーを消して表示を高速化
あなたのサイトが遅いのはバリューコマースのバナーではないですか?バリューコマースのバナーを外すだけでmod_deflateとmod_expiresを設定するより効果があります!
-
Gitはフォルダ自体を管理対象にはできない。空のフォルダを設定する手順
Gitはフォルダだけを管理対象にすることはできない。そのため空の.gitkeepファイルを作成し管理対象にすることで、それが入っているフォルダも管理対象にする、と言う手順で管理を行う。
-
WordPress、Webサイトの表示高速化!画像を軽くする基本的な考え方
画面表示の高速化には画像のファイル容量を小さくする方法があります。ツールを使わなくても小さくするための基本的な考え方を解説します。
-
ロリポップからX-Serverに引越し。サーバの月額費用が増えても求めた理由は?
ロリポップからX-Serverに引越すその理由とは?SEOの観点からも少しでもサーバレスポンスが早いサーバが求められロリポップでは限界を感じたからです。