【Python】csv与json,哪个才是你的数据之选?

简介: 【Python】csv与json,哪个才是你的数据之选?

882ef14b589f4addae0d0f97c7f0161a.png


一、写在前面✨


大家好!我是初心,希望我们一路走来能坚守初心!

今天跟大家分享的文章是 `` ,希望能帮助到大家!本篇文章收录于 初心Python从入门到精通 专栏。


🏠 个人主页:初心%个人主页

🧑 个人简介:大家好,我是初心,和大家共同努力

💕欢迎大家:这里是CSDN,我记录知识的地方,喜欢的话请三连,有问题请私信😘

💕 没有BUG的代码是不完美的!』—— Sodium_Sulfate「Sodium_Sulfate」


二、读写csv文件


2.1 什么是CSV文件


CSV(Comma-Separated Values,逗号分隔的值)是一种简单、实用的文件格式,用于存储和表示包括文本、数值等各种类型的数据。


CSV 文件通常以 .csv 作为文件扩展名。这种文件格式的一个显著特点是:文件内的数据以逗号 , 分隔,呈现一个表格形式。CSV 文件已广泛应用于存储、传输和编辑数据。


2.2 csv文件的优点


1.简单易懂:CSV 文件基于纯文本格式,因此可以使用任何文本编辑器(如Notepad)轻松打开和编辑。

2.数据兼容性:CSV 文件中的数据可以很容易地跨平台进行传输和处理,任何具有 CSV 处理功能的软件(如Microsoft Excel、Google Sheets、甚至编程语言库)都能处理该类型的文件。

3.资源占用低:CSV 文件以纯文本形式存储数据,其体积相对较小,便于节省存储空间。


2.3 应用

下面请看具体的例子:

编程要求:按注释要求完成下列文件读写操作。

import re
import csv
def normalize(lines):
    return [line.replace('\t', '    ') for line in lines]
def read_file(file_path):
    """
    读取文本文件内容,并返回所有行的列表
    >>> normalize(read_file('test.txt'))
    ['学号    出生年月    政治面貌    民族    考生类别', '0001    2003/2/23    共青团员    汉族    城镇应届', '0002    2002/4/18    共青团员    汉族    农村应届']
    """
def write_file(file_path, lines):
    """
    将指定的行写入 CSV 文件中
    >>> write_file('output.csv', read_file('test.txt'))
    >>> read_file('output.csv')
    ['学号,出生年月,政治面貌,民族,考生类别', '0001,2003/2/23,共青团员,汉族,城镇应届', '0002,2002/4/18,共青团员,汉族,农村应届']
    """
import doctest
doctest.testmod()

具体实现:

def read_file(file_path):
    """
    读取文本文件内容,并返回所有行的列表
    >>> normalize(read_file('test.txt'))
    ['学号    出生年月    政治面貌    民族    考生类别', '0001    2003/2/23    共青团员    汉族    城镇应届', '0002    2002/4/18    共青团员    汉族    农村应届']
    """
    file_data = []
    with open(file_path, encoding='utf-8') as f:
        for i in f:
            file_data.append(i.strip())
    return file_data
def write_file(file_path, lines):
    """
    将指定的行写入 CSV 文件中
    >>> write_file('output.csv', read_file('test.txt'))
    >>> read_file('output.csv')
    ['学号,出生年月,政治面貌,民族,考生类别', '0001,2003/2/23,共青团员,汉族,城镇应届', '0002,2002/4/18,共青团员,汉族,农村应届']
    """
    with open(file_path, 'w', encoding='utf-8', newline='') as f:
        writer = csv.writer(f)
        for line in lines:
            writer.writerow(line.split('\t'))  # 使用 split() 将line变成列表



三、读取json文件

3.1 json介绍


json的全称为:JavaScript Object Notation,是一种轻量级的数据交互格式。它基于 ECMAScript (欧洲计算机协会制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。


简单来说:json就是一种在各个编程语言中流通的数据格式,负责不同编程语言中的数据传递和交互。


3.2 例题

import json
def read_future_weather(filepath):
    """
    >>> read_future_weather("weather.json")
    ['小雨转多云', '多云转阴', '多云', '小雨转多云', '多云转小雨']
    >>> read_future_weather("test.txt")
    Error: not json file!
    """
  # Edit Your Code Here
import doctest
doctest.testmod()


具体实现:

json_data = {}
with open(filepath, 'r', encoding='utf-8') as f:
    try:
        json_data = json.load(f)  # 读取到 json 数据
    except ValueError:
        print('Error: not json file!')
        return None
future_list = json_data.get("result").get('future')
weather_list = []
for i in future_list:
    weather_list.append(i.get('weather'))
return weather_list


四、总结撒花😊


本文主要讲解了Python中如何使用csv文件和json文件,希望能帮助到大家。😊

这就是今天要分享给大家的全部内容了,我们下期再见!😊

🏠 本文由初心原创,首发于CSDN博客, 博客主页:初心%🏠

🏠 我在CSDN等你哦!😍


相关文章
|
1月前
|
数据采集 数据可视化 数据挖掘
利用Python自动化处理Excel数据:从基础到进阶####
本文旨在为读者提供一个全面的指南,通过Python编程语言实现Excel数据的自动化处理。无论你是初学者还是有经验的开发者,本文都将帮助你掌握Pandas和openpyxl这两个强大的库,从而提升数据处理的效率和准确性。我们将从环境设置开始,逐步深入到数据读取、清洗、分析和可视化等各个环节,最终实现一个实际的自动化项目案例。 ####
162 10
|
8天前
|
JSON 前端开发 搜索推荐
关于商品详情 API 接口 JSON 格式返回数据解析的示例
本文介绍商品详情API接口返回的JSON数据解析。最外层为`product`对象,包含商品基本信息(如id、name、price)、分类信息(category)、图片(images)、属性(attributes)、用户评价(reviews)、库存(stock)和卖家信息(seller)。每个字段详细描述了商品的不同方面,帮助开发者准确提取和展示数据。具体结构和字段含义需结合实际业务需求和API文档理解。
|
1天前
|
JSON 缓存 API
解析电商商品详情API接口系列,json数据示例参考
电商商品详情API接口是电商平台的重要组成部分,提供了商品的详细信息,支持用户进行商品浏览和购买决策。通过合理的API设计和优化,可以提升系统性能和用户体验。希望本文的解析和示例能够为开发者提供参考,帮助构建高效、可靠的电商系统。
20 12
|
5天前
|
数据采集 Web App开发 数据可视化
Python用代理IP获取抖音电商达人主播数据
在当今数字化时代,电商直播成为重要的销售模式,抖音电商汇聚了众多达人主播。了解这些主播的数据对于品牌和商家至关重要。然而,直接从平台获取数据并非易事。本文介绍如何使用Python和代理IP高效抓取抖音电商达人主播的关键数据,包括主播昵称、ID、直播间链接、观看人数、点赞数和商品列表等。通过环境准备、代码实战及数据处理与可视化,最终实现定时任务自动化抓取,为企业决策提供有力支持。
|
25天前
|
数据采集 Web App开发 监控
Python爬虫:爱奇艺榜单数据的实时监控
Python爬虫:爱奇艺榜单数据的实时监控
|
20天前
|
数据采集 存储 XML
python实战——使用代理IP批量获取手机类电商数据
本文介绍了如何使用代理IP批量获取华为荣耀Magic7 Pro手机在电商网站的商品数据,包括名称、价格、销量和用户评价等。通过Python实现自动化采集,并存储到本地文件中。使用青果网络的代理IP服务,可以提高数据采集的安全性和效率,确保数据的多样性和准确性。文中详细描述了准备工作、API鉴权、代理授权及获取接口的过程,并提供了代码示例,帮助读者快速上手。手机数据来源为京东(item.jd.com),代理IP资源来自青果网络(qg.net)。
|
1月前
|
数据采集 分布式计算 大数据
构建高效的数据管道:使用Python进行ETL任务
在数据驱动的世界中,高效地处理和移动数据是至关重要的。本文将引导你通过一个实际的Python ETL(提取、转换、加载)项目,从概念到实现。我们将探索如何设计一个灵活且可扩展的数据管道,确保数据的准确性和完整性。无论你是数据工程师、分析师还是任何对数据处理感兴趣的人,这篇文章都将成为你工具箱中的宝贵资源。
|
2月前
|
传感器 物联网 开发者
使用Python读取串行设备的温度数据
本文介绍了如何使用Python通过串行接口(如UART、RS-232或RS-485)读取温度传感器的数据。详细步骤包括硬件连接、安装`pyserial`库、配置串行端口、发送请求及解析响应等。适合嵌入式系统和物联网应用开发者参考。
75 3
|
2月前
|
数据采集 存储 数据挖掘
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第27天】在数据分析领域,Python的Pandas库因其强大的数据处理能力而备受青睐。本文介绍了Pandas在数据导入、清洗、转换、聚合、时间序列分析和数据合并等方面的高效技巧,帮助数据分析师快速处理复杂数据集,提高工作效率。
106 0
|
2月前
|
机器学习/深度学习 数据采集 数据挖掘
解锁 Python 数据分析新境界:Pandas 与 NumPy 高级技巧深度剖析
Pandas 和 NumPy 是 Python 中不可或缺的数据处理和分析工具。本文通过实际案例深入剖析了 Pandas 的数据清洗、NumPy 的数组运算、结合两者进行数据分析和特征工程,以及 Pandas 的时间序列处理功能。这些高级技巧能够帮助我们更高效、准确地处理和分析数据,为决策提供支持。
58 2

热门文章

最新文章