我想问一下如下一个问题。
问题:我用cssselect爬取了中文信息,但是无法在terminal中显示出来。
无效措施:
1.我修改了/etc/sysconfig/i18n下的配置:
LANG="en_US"
LANGUAGE="zh_CN.GB18030:zh_CN.GB2312:zh_CN"
SUPPORTED="zh_CN.UTF-8:zh_CN.GB2312:zh_CN:zh:en_US.UTF-8:en_US:en"
SYSFONT="latarcyrheb-sun16"
SYSFONT="lat0-sun16"
2.yum groupinstall "Chinese Support"成功。
3.yum install fonts-chinese 无法成功。我安装的源有中科大源、交大源、默认源。
4.centos开机登录用户的时候,选择语言为中文。失败。
5.将LANG="en_US"改为LANG=“zh_CN.GB18030”同样失败了,系统所有英文全部换成了中文,但抓到的仍然是方块,应该是汉字的。
非常希望,感谢大家能够帮我解决一下。Thanks again.
CentOS6字符界面下面目前没有中文显示的方案。如果安装了中文支持的话,用SSH连接时可以显示中文。
两年前就有原问题:http://www.oschina.net/question/92765_33904
今天终于把他搞清楚了,不过绕了个很大的圈子。 ######你terminal是本地的还是用putty或xshell的?如果是后者,你把字符编码改成UTF8试试呢!######不是putty或xshell的原因,############thx######我是直接在centos上使用的,没有远程。也许是我爬取的时候就没有按中文爬取下来。 相关python代码如下: page = urllib.urlopen("某一个网址*") html = page.read() page_html = lxml.html.fromstring(html) sd_selector = page_html.cssselect(".field-label")###### 把第一行的
LANG="en_US"
改成
LANG="zh_CN.GB18030"
######谢谢,但是我试过了,还是不行。######在 /etc/sysconfig/i18n 改 LANG="en_US" 成 LANG="zh_CN.GB18030", 在xshell 里 “终端”-》转换-》“编码” 选择的是“默认语言”, 可以正常显示中文文件名,但是用vim打开有中文的文件就乱码。######是这样的,
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。