Unicode规范中的BOM

Unicode规范中的BOM的概念:

BOM——Byte Order Mark,就是字节序标记。

BOM的作用:

UTF-8不需要BOM来表明字节顺序,但可以用BOM来表明编码方式。
字符"ZERO WIDTH NO-BREAK SPACE"的UTF-8编码是"EF BB BF"。
所以如果接收者收到以"EF BB BF"开头的字节流,就知道这是UTF-8编码了。
Windows就是使用BOM来标记文本文件的编码方式的。UTF-8编码的文件中,BOM占三个字节。

如图:


文本内容有BOM

如图:


文本内容无BOM
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。