其实我平时的习惯都是使用转换函数,在开发了NewEdit之中,更是使用国际化处理来实现汉字的Unicode转换。在论坛中也有人问过此类的问题。其实很简单,我们可以做一个小测试:
#coding=cp936
a=u'中国'
print repr(a)
将上面的代码保存,并在命令行下运行,结果是:
u'\u4e2d\u56fd'
看吧,已经转成unicode了。
为了通用,还可以使用utf-8编码来保存文件,但第一行的编码要改成utf-8,再试一下:
#coding=utf-8
a=u'中国'
print repr(a)
运行结果是一样的。这样在程序中使用汉字unicode就简单了。
但要注意,这完全要归功于 Python ,因为它可以识别出 python 程序所定义的编码。但如果是 python 程序以外的东西还是要自已处理的。当然也就不可能出现 python 的代码在其中了。只要是 python 的程序,这种方法就可以正确处理unicode了。
Trackback: http://tb.donews.net/TrackBack.aspx?PostId=195625