文档备案控制台

开发者社区问答正文

请问一下，c++怎么读取文件不乱码：报错

无论是记事本，notepad++，还是UltraEdit，都可以轻松打开文本文件，

无论文件是Ansi编码，还是Unicode，Utf8.

实现这种功能的原理是什么，有没有代码比较简单的开源代码呢？

展开

收起

kun坤 2020-06-07 12:51:22 739 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

kun坤

以 Windows 为例，通常来说文件编码有 GBK UTF8-Without-BOM UTF8-BOM, UTF16LE UTF16BE ，实际上你只要解析这些编码即可，通过读取文件的 BOM 也就是前3个或者4个字符，可以判断是否为 UTF16 或者是 UTF8 BOM,对于 GBK 或者 UTF8 without BOM 就不行了，https://github.com/BYVoid/uchardet 这是 Byvoid 从 Mozilla 提取出来的检测文件编码的，除掉主文件其他文件可以用于 Windows，检测出编码后，比如 Windows 可以使用 MultiByteToWideChar 转成 UTF16 然后输出。只是过程比较繁琐。
######"无论是记事本，notepad++，还是UltraEdit，都可以轻松打开文本文件 "，只是你没碰到，其实他们都会出现乱码，如果文件内容是任意编码的混合编码文件，没有哪个编辑器可以正确显示，因为不存在足够多的信息让编辑器识别每个编码的类型。对于单一编码的文件，可以通过对编码规则的试探来猜测是哪种编码的，比如一个文件的内容，如果每个字节的最高位都为0，则可以猜测它是assic码，再比如上面那位说的ucs2，如果前两个字节是0xfffe或0xfeff则认为这是ucs2编码，但实际文件中这两个字节经常不存在，所以编辑器没法识别，gb系列则每个字节的高位都是1，utf有很强的规则性也比较好识别，这里说的比较好识别不是一定能识别出来，而是规律性与其他编码区别较大，不太容易搞混。

2020-06-07 12:51:25

赞同展开评论

问答分类：

C++

问答标签：

C++报错 C++文件 C++乱码 C++读取文件 C++文件报错

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

【OSS 新版C++ SDK BUG】C++使用阿里云OSS SDK时，遍历OSS上的文件时崩溃

787

3

0

在C语言或C++中,ffigen.yaml 文件是什么，它的作用是什么？

205

1

0

在原有的C++部分，文件采集采用的是哪种模式？

151

1

0

我deploy编译好的c++，发现没有成功。线上的文件还是以前的。这是怎么回事？我用的是use-re

507

3

0

c++例子不带x-fc-request-id，header就会报错,除了log里可以标记，其他用处是

19687

15

0

pip安装MySQL-python报错error: Microsoft Visual C++ 14.

781

0

0

freeswitch 集成阿里云asr c++ 3.0 sdk SendAudio 报错

1323

0

0

使用OSS C++ SDK,下载到本地文件，报错

1245

0

0

为什么这个代码运行的时候不报错，但是对方计算机收不到消息？请问是VC++没有编译么？ ?报错

733

1

0

C++中一个cpp引用另一个cpp中的函数，为什么会报错？ ?报错

1617

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

我用qoder 和 codex+deepseek 及claude + qwen 3.7同时解题目

阿里云服务器多少钱一年？支持40个连接的配置

阿里云服务器多少钱一年企业用？公司用什么配置？

阿里云服务器多少钱一年？企业用的配置费用价格

阿里云服务器多少钱一年？学生用的配置价格

相关文章

分布式JOIN优化首选_阿里云PolarDB-X下推广播Co-located实战

Qt 软件外包开发流程

10类可食用蘑菇检测4000张YOLO农业采摘数据集分享

VS Code 使用 Codex 教程：从安装到配置，一篇讲清楚

语义规范体系：YAML里写的不是颜色值是语义令牌

还有其他疑问?