PythonでUTF-8など日本語(全角文字)を使う方法。コメントにも必要。
2017/04/29
Pythonで日本語(全角文字、マルチバイト文字)を使う方法
Pythonで日本語を指定する方法
Pythonで日本語(全角文字、マルチバイト文字)を使う場合は、最初に UTF-8などの文字コードを宣言する必要があります。
プログラムで printなどで使う場合にとどまらず、コメント行に日本語(全角文字、マルチバイト文字)を使う場合もこの設定をしないとエラーになります。
具体的には、UTF-8を指定する場合は、下記のような文字コードの宣言を 1行目に記述します。
1 |
# coding: utf-8 |
ちなみに、大文字小文字は区別されませんので、「UTF-8」と書いても問題ありません。
Pythonのパスを記述する場合は 2行目に記述
場合によっては、下記の様に 1行目には Pythonへのパスを記述する必要がある場合もありますので、その場合は、1行目に Pythonのパスを記述し、2行目に文字コード指定の記述を書きます。
1 2 |
#!/usr/bin/python # coding: utf-8 |
もちろん、ここで指定した文字コードとファイルの文字コードは一致するように保存します。
UTF-8以外の文字コードを指定する場合
UTF-8以外の文字コードの場合は、以下の通りに指定をします。
1 2 3 4 |
# coding: Shift_JIS # coding: EUC-JIS # coding: ISO-2022-JP # coding: CP932 |
Pythonのオフィシャルサイトでの記述方法
Pythonの基本的な処理としては「# coding: utf-8
」だけ記述すれば動作します。
ですが、サンプルプログラムなどでは下記の様に「-*-
」が付けられているものもよく見かけます。
この記述方法でも問題なく文字コードの指定することができます。
1 |
# -*- coding: utf-8 -*- |
では、なぜこの記述方法も広く見かけるのでしょうか?
理由の一つとしては、Pythonのオフィシャルサイトのドキュメントにその記述方法が書いてあるからではないでしょうか?
【Python Ver 2.7】
http://docs.python.jp/2.7/tutorial/interpreter.html#source-code-encoding
【Python Ver 3.5】
http://docs.python.jp/3.5/tutorial/interpreter.html#source-code-encoding
その他の理由としては、「Emacs」というエディタが文字コードを認識するためには、「# # -*- coding: utf-8 -*-
」と記述する必要があるということもあるようです。
どちらでも動きますので、個々人の環境に合わせて好きな方を選択すればいいかと思います。
selenium+Pythonで処理の自動化に関する記事
Selenium WebDriver、Pythonをインストールしブラウザ自動操作の環境構築手順のまとめ
PythonでUTF-8など日本語(全角文字)を使う方法。コメントにも必要。
Pythonをコマンドラインで実行。全角文字(日本語)を引数にする場合の対処方法
Selenium WebDriverでFirefoxをプライベートウィンドウ/Chromeをシークレットモードで起動する方法・言語はpython
Selenium WebDriver、Pythonをインストールし Chromeの自動操作の環境構築手順のまとめ
Beautiful Soupを利用してPythonでスクレイピングを行う環境構築方法の解説
PythonでMySQLへの接続ライブラリMySQL-pythonの簡単インストール方法
PythonでURLの有無、存在をチェックするスクリプト
GoogleAdwords
GoogleAdwords
この記事が参考になったと思いましたらソーシャルメディアで共有していただけると嬉しいです!
関連記事
-
さくらサーバのmb_send_mailでメール送信時にmalformed header from script ‘xxx.php’: Bad header: xxxのエラーが
さくらインターネットのレンタルサーバからPHPのmb_send_mail()関数を利用してメールを送信するとInternal Server Errorが発生。その原因は、メールアドレスが登録されていないこと。
-
ブラウザのキャッシュを活用するの対策!広告バナーを消して表示を高速化
あなたのサイトが遅いのはバリューコマースのバナーではないですか?バリューコマースのバナーを外すだけでmod_deflateとmod_expiresを設定するより効果があります!
-
Apacheの起動しているかの確認方法と起動、再起動、終了のコマンド
Apacheが起動しているかを確認する方法の解説に加え、Apacheの起動、停止、再起動のコマンドを解説。再起動のコマンドには restart、condrestart、reload、gracefulがあり、違いを解説。
-
Webサイト公開時に重複コンテンツを排除する.htaccessのリダイレクトの設定のまとめ
サイトを公開する際にはURLの正規化は必須です。正規化とは何かを解説し、.htaccessに設定すべきリダイレクトの設定を具体的に説明します。
-
借りてはいけないレンタルサーバ実例4社・アルファメール・WEBアリーナ
餅は餅屋。サーバはサーバ屋が提供するサービスを利用するべきという記事で、具体例 4サービスを例にこんなサーバはNGと紹介しています。
-
chromedriver.exe – ディスクがありませんと出てSeleniumの設定が上手くいかない
Selenium WebDriverを使ってChromeを自動操作する仕組みを作る際、chromedriver.exeを利用しますが、ディスクがありません、というエラーが発生する場合があります。その対処方法を解説します。
-
PythonでURLの有無、存在をチェックするスクリプト
PythonでURLが存在するか否かのチェックスクリプト。ライブラリ「urllib2」を使い、指定のURLにアクセスしそのレスポンスコードを判別するという仕組み。
-
.htaccessのmod_deflateでファイル圧縮送信で高速化でSEO対策!
Page Speed Insightsの指摘事項であるファイルの圧縮送信の対応方法。処理内容の解説もあるけど、.htaccessにコピペするだけの簡単設置で効果抜群!SEOにも威力を発揮!
-
FTPでダウンロード時にファイルが重複するため上書きしますか?と表示される問題
FTPでファイルをダウンロードする際に「ファイルが重複しています。上書きしますか?」というメッセージが出る場合がありますが、これの原因と対策、解決策の記事です。
-
本当に?GMO系ロリポップ・ヘテムルを無料で運用する方法があった!
ロリポップ、ヘテムルを株主優待を利用して実質無料で運営しよう!という解説記事です。株主優待で提供されるサービスの内容を解説し、無料になる仕組みを解説します。