wc命令输出的是行数字数和字节数,字节数是byte,是用于计量存储的一种单位,常见的计量单位包括Kb,Mb,Gb,这么说你应该知道。字符和字节换算还要看是什么编码,常见的有ascii码,utf-8编码和unicode编码,编码不同,换算不同。
ASCII码:一个英文字母占一个字节的空间,一个中文汉字占两个字节的空间。
UTF-8编码:一个英文字符等于一个字节,一个中文等于三个字节。
Unicode编码:一个英文等于两个字节,一个中文(含繁体)等于两个字节。
符号:英文标点占一个字节,中文标点占两个字节。
wc输出行数、词数、字节数
有的字符是多字节编码,与字符编码有关。可能一个字符为多个字节编码。