最新公告
  • 欢迎您光临知事网,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境!立即加入我们
  • python3中utf-8编码如何转换?

    python中的编码之间可以相互转换,这个我们在之前的文章中有讲到。那小编来考考大家,utf-8编码如何转换?有的小伙伴可能不知道了。但是如果我们提到unicode编码大家就会觉得很熟悉。所以今天讲的是unicode编码里的utf-8,大家一起来试试两个不同编码的区别吧,也许会有新的惊喜。

    utf-8编码将一个 unicode 字符编码成 1~6 个字节,常用的英文字母被编码成 1 个字节,汉字通常是 3 个字节,只有很生僻的字符才会被编码成 4~6 个字节。注意,从 unicode 到 utf-8 并不是直接的对应,而是通过一些算法和规则来转换的。

    来看一下具体编码例子吧:

    >>> list('中'.encode('utf-8'))
    [228, 184, 173]
    >>> list('a'.encode('utf-8'))
    [97]

    可以看出,utf-8 将汉字 ‘中’ 编码成了三个字节,将英文字母 ‘a’ 编码成了一个字节,且 utf-8 编码兼容 ASCII 编码。

    拓展:unicode 编码

    为每种语言制定一套编码方式实在是太蠢了!为什么不能把所有语言的所有字符一起编码呢?

    把所有语言统一到一套编码里,这套编码就是 unicode 编码。使用 unicode 编码,无论处理什么文本都不会出现乱码问题了。

    unicode 编码使用两个字节(16 位 bit)表示一个字符,比较偏僻的字符需要使用 4 个字节。

    但是新的问题又来了,如果一段纯英文文本,用 unicode 编码存储会比用 ASCII 编码多占用一倍空间!无论是存储还是传输都很浪费!

    今天对utf-8编码转换的讲解到这里就结束了,不知道小伙伴们有没有熟练掌握呀~小编看了一遍就会了,代码真的很简单。后续有新的类似拓展,小编也会及时更新出来。

    猜你在找

    找互联网优质资源,上知事网!
    知事网 » python3中utf-8编码如何转换?

    常见问题FAQ

    网盘提取密码在哪里?
    在网站右侧有个“文件密码”,点击复制即可!
    网站的积分如何获得?
    注册登录后,每天签到可获得2个积分,每天可签到一次!

    发表评论

    • 1245会员总数(位)
    • 665资源总数(个)
    • 3本周发布(个)
    • 1 今日发布(个)
    • 3458稳定运行(天)

    提供最优质的资源集合

    Mac软件 Dedecms源码
    升级SVIP尊享更多特权立即升级