Python中的默認(rèn)編碼

####1. Python源代碼文件的執(zhí)行過程

我們都知道，磁盤上的文件都是以二進(jìn)制格式存放的，其中文本文件都是以某種特定編碼的字節(jié)形式存放的。對于程序源代碼文件的字符編碼是由編輯器指定的，比如我們使用Pycharm來編寫Python程序時會指定工程編碼和文件編碼為UTF-8，那么Python代碼被保存到磁盤時就會被轉(zhuǎn)換為UTF-8編碼對應(yīng)的字節(jié)（encode過程）后寫入磁盤。當(dāng)執(zhí)行Python代碼文件中的代碼時，Python解釋器在讀取Python代碼文件中的字節(jié)串之后，需要將其轉(zhuǎn)換為UNICODE字符串（decode過程）之后才執(zhí)行后續(xù)操作。

上面已經(jīng)解釋過，這個轉(zhuǎn)換過程（decode，解碼）需要我們指定文件中保存的字節(jié)使用的字符編碼是什么，才能知道這些字節(jié)在UNICODE這張萬國碼和統(tǒng)一碼中找到其對應(yīng)的代碼點(diǎn)是什么。這里指定字符編碼的方式大家都很熟悉，如下所示：

# -*- coding:utf-8 -*-

2. 默認(rèn)編碼

那么，如果我們沒有在代碼文件開始的部分指定字符編碼，Python解釋器就會使用哪種字符編碼把從代碼文件中讀取到的字節(jié)轉(zhuǎn)換為UNICODE代碼點(diǎn)呢？就像我們配置某些軟件時，有很多默認(rèn)選項一樣，需要在Python解釋器內(nèi)部設(shè)置默認(rèn)的字符編碼來解決這個問題，這就是文章開頭所說的“默認(rèn)編碼”。因此大家所說的Python中文字符問題就可以總結(jié)為一句話： 當(dāng)無法通過默認(rèn)的字符編碼對字節(jié)進(jìn)行轉(zhuǎn)換時，就會出現(xiàn)解碼錯誤(UnicodeEncodeError) 。

Python2和Python3的解釋器使用的默認(rèn)編碼是不一樣的，我們可以通過sys.getdefaultencoding()來獲取默認(rèn)編碼：

>> > # Python2
 >> > import sys
 >> > sys.getdefaultencoding()
'ascii'

 >> > # Python3
 >> > import sys
 >> > sys.getdefaultencoding()
'utf-8'

因此，對于Python2來講，Python解釋器在讀取到中文字符的字節(jié)碼嘗試解碼操作時，會先查看當(dāng)前代碼文件頭部是否有指明當(dāng)前代碼文件中保存的字節(jié)碼對應(yīng)的字符編碼是什么。如果沒有指定則使用默認(rèn)字符編碼"ASCII"進(jìn)行解碼導(dǎo)致解碼失敗，導(dǎo)致如下錯誤：

SyntaxError: Non-ASCII character '\\xc4' in file xxx.py on line 11, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details

對于Python3來講，執(zhí)行過程是一樣的，只是Python3的解釋器以"UTF-8"作為默認(rèn)編碼，但是這并不表示可以完全兼容中文問題。比如我們在Windows上進(jìn)行開發(fā)時，Python工程及代碼文件都使用的是默認(rèn)的GBK編碼，也就是說Python代碼文件是被轉(zhuǎn)換成GBK格式的字節(jié)碼保存到磁盤中的。Python3的解釋器執(zhí)行該代碼文件時，試圖用UTF-8進(jìn)行解碼操作時，同樣會解碼失敗，導(dǎo)致如下錯誤：

SyntaxError: Non-UTF-8 code starting with '\\xc4' in file xxx.py on line 11, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details

3. 最佳實(shí)踐

創(chuàng)建一個工程之后先確認(rèn)該工程的字符編碼是否已經(jīng)設(shè)置為UTF-8
為了兼容Python2和Python3，在代碼頭部聲明字符編碼：-*- coding:utf-8 -*-

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

編碼

編碼

+關(guān)注

關(guān)注
6

文章
969

瀏覽量
55798
python

python

+關(guān)注

關(guān)注
56

文章
4827

瀏覽量
86830

麥辣雞腿堡
專欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個人主頁

Hot 麒麟9000s相當(dāng)于驍龍多少和驍龍多少處理器相當(dāng)
Hot 華為麒麟9000s是多少納米的麒麟9000s什么檔次

New 15KV ESD保護(hù) RS-232發(fā)射器/接收器ICL3237E數(shù)據(jù)手冊
New ICL3223 1A電源電流250kbps RS-232發(fā)射器/接收器數(shù)據(jù)手冊

精選推薦
更多

文章

資料

帖子

詳解上海貝嶺16/24位高精度低功耗模數(shù)轉(zhuǎn)換器BL1090系列最高速率達(dá)960SPS

上海貝嶺
10小時前

303 閱讀

凡億Allegro Skill工藝輔助之導(dǎo)出PDF

凡億PCB
11小時前

350 閱讀

基于FPGA和USB3.0通信的UVC攝像機(jī)設(shè)計方案

FPGA技術(shù)江湖
12小時前

356 閱讀

PMOS電路設(shè)計分析

張飛電子實(shí)戰(zhàn)營
12小時前

323 閱讀

借助TI ±80V接地電平轉(zhuǎn)換器解決失調(diào)電壓挑戰(zhàn)

德州儀器
12小時前

445 閱讀

無鉛焊接工藝介紹

溫暖鏡頭
433

5積分

48下載

基于openharmony適配移植的搜索控件

姚小熊27
1.92 MB

免費(fèi)

1下載

TelegramSwift macOS版Telegram

ah此生不換
34.71 MB

免費(fèi)

0下載

PyLinden靜態(tài)博客生成器

張鵬
1.73 MB

2積分

3下載

16A 輸出電流，高可靠、高效率同步降壓轉(zhuǎn)換器PCD3201產(chǎn)品手冊

pc16211
0.47 MB

免費(fèi)

6下載

【微五科技CF5010RBT60開發(fā)板試用體驗(yàn)】使用微五科技CF5010RBT60藍(lán)牙進(jìn)行通信

jf_61512546
1天前

144 閱讀

每周推薦！電源設(shè)計及EMI精解、電機(jī)設(shè)計資料分享

ElecFans小喇叭
1天前

343 閱讀

【米爾RK3576開發(fā)板免費(fèi)體驗(yàn)】4、移植SOEM主站

EPTmachine
1天前

308 閱讀

【米爾RK3576開發(fā)板免費(fèi)體驗(yàn)】3、移植EtherCAT Igh

EPTmachine
1天前

330 閱讀

【RA4L1-SENSOR】電壓檢測器第一個程序FreeRTOS增加讀key,rtc,uart隊列

lustao
1天前

427 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

搜索歷史

Python中的默認(rèn)編碼

2. 默認(rèn)編碼

3. 最佳實(shí)踐

評論