这要看使用的哪种编码方式,utf-8的话是用了3个字节,GBK的话是用了两个
>>> '汉'.encode('utf-8')b'\xe6\xb1\x89'>>> '汉'.encode('GBK')b'\xba\xba'