在支持unicode软件中,经常需要在不同的编码与unicode之间进行转换。那么对于一个本地文件的处理,首先要将其内容读出来转换成unicode编码,在软件中处理完毕后,再保存为原来的编码。如果我们不知道文件的确切编码方式,可以使用默认的编码方式。那么我们可以使用locale模块来判断默认编码方式。
>>>import locale
>>>print locale.getdefaultlocale()
('zh_CN', 'cp936')
可以看出,我的机器上默认语言是简体中文,编码是GBK。
Trackback: http://tb.donews.net/TrackBack.aspx?PostId=11510