先上代码,实现一个从DBF文件中导入再转成pandas中的dataframe方式,读的时候出现了问题。
from simpledbf import Dbf5
import pandas as pd
dbf = Dbf5('Y:\show2003.dbf', codec='GBK')
df= pd.DataFrame(dbf.to_dataframe())#转成dataframe格式
报错UnicodeDecodeError: 'ascii' codec can't decode byte 0xe8 in position 37: ordinal not in range(128)
结果打开dbf文件查看妈呀。什么鬼,第一行的格式似乎不对
那么碰到这个,我把第一行删掉就正常了,可是,问题是实时读取的时候,我应该如何先删掉第一行呢,或是在读的时候能否直接从第二行读取,,或是,可以解决那个报错的问题呢,,求大牛帮助
加个try:except:吧.
确定是GBK编码吗,看上去是utf8
是的,,我尝试了用了utf8但是读不出来,可以帮我看看吗?我可以把DBF文件发给你!!第一行的编码可以用二进制工具看一下,也许数据是拼接的实时数据,是3秒一次的那种包吗,哪里买的?
是实时的数据,才要用程序来删这一条,在哪买的就不方便在这说了,有兴趣可以一起研究一下,看私信如何写
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。