备案控制台

开发者社区问答正文

检查pandas里面的重复数据

我有以下代码：

import pandas as pd
import datetime
import pandas as pd
from pandas_datareader import data as web
import matplotlib.pyplot as plt
from alpha_vantage.foreignexchange import ForeignExchange
import os
from os import path
from alpha_vantage.timeseries import TimeSeries 
import matplotlib.pyplot as plt 
import sys



while True:
    if path.exists('stockdata.csv') == True:
        data1 = pd.read_csv('stockdata.csv')
        ts = TimeSeries(key='1ORS1XLM1YK1GK9Y', output_format='pandas')
        data, meta_data = ts.get_intraday(symbol = 'spy', interval='1min', outputsize='full')
        data = data.rename(columns={'1. open':'Open','2. high': 'High','3. low': 'Low', '4. close':'Close', '5. volume': 'Volume'})
        data1 = data1.append(data)
        data1.to_csv('stockdata.csv', sep= ' ')
        break
    else:
        data1 = pd.DataFrame(columns=['Open','High','Low', 'Close','Volume'])
        data1.to_csv('stockdata.csv', sep= ' ')

我想做的是检查文件stockdata.csv是否在当前目录中。如果找不到，则创建文件。如果找到该文件，则下载数据data，并将该数据附加到data1.csv文件中并保存。

问题：

1.我如何摆脱Unnamed:0专栏？为什么在那里？ 2.我如何检查并删除其中的重复数据data并将其附加到data1？

展开

收起

安忆333 2019-11-28 17:04:29 849 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

安忆333
问题1： 如果要摆脱column Unnamed:0，则必须使用
```
data1.drop(['Unnamed:0'], axis = 1)，
```
这将从表中删除该列。

问题2：

如果要删除重复的行，可以使用
```
data.drop_duplicates()
```
这将删除重复的行，并使第一个行保持不变。之后，你可以简单地进行操作
```
pandas.concat(data1, data)
```
2019-11-28 17:09:05

赞同展开评论

问答分类：

Python

问答标签：

检查Pandas

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

Pandas为什么能高效率的分析数据呢？

1210

1

0

pandas中有什么用于选择和重新选择数据的方法呀?

416

1

0

pandas数据分组中分组信息并不在数据中应该用什么代码表示呢？

554

1

0

pandas数据分组中group key如何变成任意的数组呢？

557

1

0

Pandas数据中rename怎么使用呀？

649

1

0

Pandas数据中map方法是什么呢？

924

2

0

Pandas数据中重命名是什么意思呢？

552

1

0

Pandas数据中怎么用一次替换多个值呢？

735

1

0

Pandas数据中怎么使用替换值呢？

464

1

0

Pandas数据中替换值是什么呢?

416

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

12月冬日咖啡礼｜大模型解决方案邀你来体验

相关文章

Python实现RSA加解密

快手 item_search - 根据关键词获取商品列表接口对接全攻略：从入门到精通

用 API 把淘宝商品介绍页视频“搬”回来——从注册到落盘全流程

任务队列明明在跑，为什么整体速度却越来越慢

Python编程实战：从类与对象到设计优雅代码

还有其他疑问?