别再手工造假数据了,faker了解一下

简介: 别再手工造假数据了,faker了解一下

项目开发初期,为了测试方便,我们总要造不少假数据到系统中,尽量模拟真实环境。

比如要创建一批用户,创建一段文本,或者是电话号码,抑或着是街道地址或者IP地址等等。

以前要么就是键盘一顿乱敲,随便造个什么字符串出来,当然最后谁也不认识谁。

现在你不要这样做了。

用faker就能满足你的一切需求。

先安装faker

pip install Faker

创建faker对象

from faker import Faker
fake = Faker()

fake 一个名字

>>> fake.name()
'Joshua Reed'

fake 一个地址

>>> fake.address()
'554 Hoffman Locks Suite 216\nElizabethstad, RI 23081'

fake 一个浏览器UA

>>> fake.chrome()
'Mozilla/5.0 (X11; Linux i686) AppleWebKit/532.0 (KHTML, like Gecko) Chrome/35.0.870.0 Safari/532.0'

fake 一个日期

>>> fake.date()
'1984-08-17'
>>> fake.date_object()
datetime.date(1980, 9, 27)

但凡是你需要的东西他都能帮你fake,如果你不知道它能fake哪些东西,可以用 dir(fake)查看一下。

1682345336927.png

它能fake近300种东西出来,如果还有你满足不了需求的,你可以像它的Github提交PR或者自己扩展

上面fake的东西,比如名字,街道都是英文的,他支不支持中文呢?

可以的

只要在创建Faker对象的时候,指定语言就可以

>>> fake = Faker("zh_CN")
>>> fake.name()
'庄阳'
>>> fake.address()
'浙江省台北县沈北新北京街i座 285123'
>>> fake.phone_number()
'13223924289'
复制代码

你会发现,fake的假数据还挺真实的。除了中文,它还支持日语、韩语、德语等上百种语言

1682345354006.png

当然,它还支持命令行模式

-h 查看帮助文档

faker [-h] [--version] [-o output]
      [-l {bg_BG,cs_CZ,...,zh_CN,zh_TW}]
      [-r REPEAT] [-s SEP]
      [-i {package.containing.custom_provider otherpkg.containing.custom_provider}]
      [fake] [fake argument [fake argument ...]]
C:\Users\lzjun\workspace\>faker name
Samantha Washington
复制代码

我可不可以创建属于自己的fake数据呢?比如我想随机生成一个基于Android设备的User-Agent

from faker import Faker
fake = Faker()
from faker.providers import BaseProvider
# 创建自定义的provider
class MyProvider(BaseProvider):
    def android_ua(self):
        return 'xxxxxx'
# 添加一个provider
fake.add_provider(MyProvider)
>>>fake.android_ua()
>>>'xxxxxx'
复制代码

是不是太简单了。另外,faker还是一个非常值得作为源码研究的库。


目录
相关文章
|
机器学习/深度学习 Web App开发 数据可视化
训练可视化工具哪款是你的菜?MMCV一行代码随你挑
在深度学习中可视化模型的训练过程有助于我们分析模型的状态。可视化训练过程的库很多,我们将一些常用的库集成到 MMCV 中方便用户使用。在 MMCV 中使用这些库只需简单配置。在本文中将介绍这些库以及它们在 MMCV 中的使用方法。
872 0
训练可视化工具哪款是你的菜?MMCV一行代码随你挑
|
5月前
|
机器学习/深度学习 数据采集 算法
【2024泰迪杯】A 题:生产线的故障自动识别与人员配置 Python代码实现
本文提供了2024泰迪杯A题“生产线的故障自动识别与人员配置”的Python代码实现,包括问题分析、故障数据特征分析、故障报警模型构建、故障时长计算、产量与合格率分析以及操作人员排班方案制定的详细步骤和代码示例。
122 3
【2024泰迪杯】A 题:生产线的故障自动识别与人员配置 Python代码实现
|
4月前
|
Python
Python量化炒股的数据信息获取—获取上市公司分红送股数据信息
Python量化炒股的数据信息获取—获取上市公司分红送股数据信息
71 3
|
5月前
|
安全 测试技术 数据库
比起造假,还有比Faker更牛的吗?
比起造假,还有比Faker更牛的吗?
44 1
|
5月前
|
机器学习/深度学习 数据采集 自然语言处理
基于Python thinker GUI界面的股票评论数据及投资者情绪分析设计与实现
本文介绍了一个基于Python Tkinter库开发的GUI股票评论数据及投资者情绪分析系统,该系统提供股票数据展示、情绪与股价分析、模型指标分析、评论数据展示、词云分析和情感分析结果展示等功能,帮助投资者通过情感分析了解市场舆论对股票价格的影响,以辅助投资决策。
145 0
基于Python thinker GUI界面的股票评论数据及投资者情绪分析设计与实现
|
8月前
|
数据可视化 Python
Python办公自动化【合并单元格-openpyxl、增加图表-openpyxl、合并工作薄-openpyxl、合并多个文件工作薄-openpyxl】(三)-全面详解(学习总结---从入门到深化)
Python办公自动化【合并单元格-openpyxl、增加图表-openpyxl、合并工作薄-openpyxl、合并多个文件工作薄-openpyxl】(三)-全面详解(学习总结---从入门到深化)
159 0
|
机器学习/深度学习 监控 TensorFlow
利用TensorFlow实现机器学习代码以用防止员工泄密软件检测员工泄密行为
随着信息安全的重要性日益增加,保护敏感数据免受员工泄密的风险成为组织的首要任务之一。在本文中,我们将讨论如何使用TensorFlow,一种强大的开源机器学习框架,来实现防止员工泄密软件。我们将演示如何编写代码来监控员工的行为,检测潜在的泄密行为,并在必要时采取自动化措施。这一切将有助于加强数据安全,防止敏感信息泄露。
215 2
|
Linux Python
彩蛋丨利用R语言脚本实现批量合并Excel表格,再也不用手动点来点去了!
彩蛋丨利用R语言脚本实现批量合并Excel表格,再也不用手动点来点去了!
【太好用了!】使用openpyxl 对比两个excel表格之间的差异
【太好用了!】使用openpyxl 对比两个excel表格之间的差异
|
数据安全/隐私保护 Python
基于交叉指标的加密货币(股票、期货、期权)量化交易系统[Python]开发源码规则解析
基于交叉指标的加密货币(股票、期货、期权)量化交易系统[Python]开发源码规则解析