至于BOM是什么,这里就不解释了,百科解释的很详细,BOM - 字节顺序标记(ByteOrderMark)
简单来说,BOM主要是为了解决Linux文件在Windows上乱码的问题
主要有以下几个场景:
- 在linux上生成一个csv文件,在excel中打开,乱码
- 在linux生成一个txt文件,在windows上用记事本打开,乱码
linux上是无视BOM的,在linux上生成的文件也是不带BOM,尽管不带BOM的utf-8才是标准,但是为了能在windows上打开文件不乱吗,我们就需要手动添加BOM头
用法:
# 在report.csv文件中添加BOM头
printf '\xEF\xBB\xBF' > report_new.csv
cat report.csv >> report_new.csv
需要注意的是:
windows记事本默认会给文件添加BOM头,尽管这几个字符正常情况肉眼不可见,但是在程序处理这些文件时,这些字符是能被识别到的,所以经常会出现看似正常的文件,程序处理却报错,以及window上看似正确的脚本在Linux下执行却报错。
所以建议使用sublime,而不是windows自带的记事本来编辑文件。