花海

花海

Faker数据生成

2023-07-11

Python模拟数据生成库

Faker 概述

引用官方文档的一段概述:

Faker is a Python package that generates faker data for you. Whether you need to bootstrap your database, create good-looking XML documents, fill-in your persistence to stress test it, or anonymize data taken from a production service, Faker is for you.

Faker is heavily inspired by PHP Faker, Perl Faker, and by Ruby Faker.

Faker 是一个可生成假数据 Python 依赖包,无论你是否是需要初始化数据库、创建美观的XML文档、填充持久化存储进行压力测试或者是从产品供应商获取匿名数据,用 Faker 就对了。

Faker 安装

使用 pip指令安装即可

pip install faker

基本用法

# 导入
from faker import Faker
# 创建faker对象(可添加 locale 参数添加特定区域代码,例如 "en_US","zh_CN" 等)
faker = Faker()
# 随机生成姓名
faker_name = faker.name()
# 随机生成地址
faker_address = faker.address()

国际化支持

创建 Faker 对象是输入不同地区的国际化代码,可根据指定区域生成特定的伪数据,例如en_US代表美国地区,zh_CN代表中国大陆地区。以下是国际化区域代码:

zh_CN - Chinese (中国-简体字)
zh_TW - Chinese (中国-繁体字)
ar_PS - Arabic (巴勒斯坦)
ar_SA - Arabic (沙特阿拉伯)
bg_BG - Bulgarian (保加利亚)
bs_BA - Bosnian (波黑)
cs_CZ - Czech (捷克)
de_DE - German (德国)
dk_DK - Danish (丹麦)
el_GR - Greek (希腊)
en_AU - English (澳大利亚)
en_CA - English (加拿大)
en_GB - English (大不列颠)
en_NZ - English (新西兰)
en_US - English (美国)
es_ES - Spanish (西班牙)
es_MX - Spanish (墨西哥)
et_EE - Estonian (爱沙尼亚)
fa_IR - Persian (伊朗)
fi_FI - Finnish (芬兰)
fr_FR - French (法国)
hi_IN - Hindi (印度)
hr_HR - Croatian (克罗地亚)
hu_HU - Hungarian (匈牙利)
hy_AM - Armenian (亚美尼亚)
it_IT - Italian (意大利)
ja_JP - Japanese (日本)
ka_GE - Georgian (格鲁吉亚)
ko_KR - Korean (韩国)
lt_LT - Lithuanian (立陶宛)
lv_LV - Latvian (拉脱维亚)
ne_NP - Nepali (尼泊尔)
nl_NL - Dutch (荷兰)
no_NO - Norwegian (挪威)
pl_PL - Polish (波兰)
pt_BR - Portuguese (巴西)
pt_PT - Portuguese (葡萄牙)
ro_RO - Romanian (罗马尼亚)
ru_RU - Russian (俄罗斯)
sl_SI - Slovene (斯洛文尼亚)
sv_SE - Swedish (瑞典)
tr_TR - Turkish (土耳其)
uk_UA - Ukrainian (乌克兰)
ar_EG - Arabic (埃及)

注:个别方法具有针对性,比如province()方法适用中国,但不适用美国及其他一些国家。

数据类别

人物相关

faker.first_name() # 名字
faker.first_name_female() # 名字(女)
faker.first_name_male() # 名字(男)
faker.first_romanized_name() # 名字(罗马文)
faker.last_name() # 姓
faker.last_name_female() # 姓(女)
faker.last_name_male() # 姓(男)
faker.last_romanized_name() # 姓(罗马文)
faker.name() # 姓名
faker.name_female() # 姓名(女)
faker.name_male() # 姓名(男)
faker.prefix() # 称谓
faker.prefix_female() # 称谓(女)
faker.prefix_male() # 称谓(男)
faker.romanized_name() # 称谓(罗马文)
faker.suffix() # 姓名后缀(中文不适用)

地址相关

faker.address() # 地址
faker.building_number() # 楼名
faker.city() # 完整城市名
faker.city_name() # 城市名字(不带市县)
faker.city_suffix() # 城市后缀名
faker.country() # 国家名称
faker.district() # 地区
faker.postcode() # 邮编
faker.province() # 省
faker.street_address() # 街道地址
faker.street_name() # 街道名称
faker.street_suffix() # 街道后缀名
faker.country_code() # 国家编号

汽车相关

faker.license_plate() # 牌照

银行相关

faker.bank_country() # 银行所属国家
faker.bban() # 基本银行账号
faker.iban() # 国际银行代码

条形码相关

faker.ean(length=13) # EAN条形码
faker.ean13() # EAN13条形码
faker.ean8() # EAN8条形码

颜色相关

faker.color_name() # 颜色名称
faker.hex_color() # 颜色十六进制值
faker.rgb_color() # 颜色RGB值
faker.rgb_css_color() # CSS颜色值
faker.safe_color_name() # 安全色
faker.safe_hex_color() # 安全色十六进制值

公司相关

faker.bs() # 商业用词
faker.catch_phrase() # 妙句(口号)
faker.company() # 公司名称
faker.company_prefix() # 公司名称前缀
faker.company_suffix() # 公司名称后缀

信用卡相关

faker.credit_card_expire(start="now", end="+10y", date_format="%m/%y") # 过期年月
faker.credit_card_full(card_type=None) # 完整信用卡信息
faker.credit_card_number(card_type=None) # 信用卡卡号
faker.credit_card_provider(card_type=None) # 信用卡提供商
faker.credit_card_security_code(card_type=None) # 信用卡安全码

货币相关

faker.cryptocurrency() # 加密货币代码+名称
faker.cryptocurrency_code() # 加密货币代码
faker.cryptocurrency_name() # 加密货币名称
faker.currency() # 货币代码+名称
faker.currency_code() # 货币代码
faker.currency_name() # 货币名称

时间相关

faker.am_pm() # AM或PM
faker.century() # 世纪
faker.date(pattern="%Y-%m-%d", end_datetime=None) # 日期字符串(可设置格式和最大日期)
faker.date_between(start_date="-30y", end_date="today") # 日期(可设置限定范围)
faker.date_between_dates(date_start=None, date_end=None) # 同上
faker.date_object(end_datetime=None) # 日期(可设置最大日期)
faker.date_of_birth(tzinfo=None, minimum_age=0, maximum_age=115) # 出生日期
faker.date_this_century(before_today=True, after_today=False) # 本世纪日期
faker.date_this_decade(before_today=True, after_today=False) # 本年代中的日期
faker.date_this_month(before_today=True, after_today=False) # 本月中的日期
faker.date_this_year(before_today=True, after_today=False) # 本年中的日期
faker.date_time(tzinfo=None, end_datetime=None) # 日期和时间
faker.date_time_ad(tzinfo=None, end_datetime=None, start_datetime=None) # 日期和时间(从001年1月1日到现在)
faker.date_time_between(start_date="-30y", end_date="now", tzinfo=None) # 日期时间(可设置限定范围)
faker.date_time_between_dates(datetime_start=None, datetime_end=None, tzinfo=None) # 同上
faker.date_time_this_century(before_now=True, after_now=False, tzinfo=None) # 本世纪中的日期和时间
faker.date_time_this_decade(before_now=True, after_now=False, tzinfo=None) # 本年代中的日期和时间
faker.date_time_this_month(before_now=True, after_now=False, tzinfo=None) # 本月中的日期和时间
faker.date_time_this_year(before_now=True, after_now=False, tzinfo=None) # 本年中的日期和时间
faker.day_of_month() # 几号
faker.day_of_week() # 星期几
faker.future_date(end_date="+30d", tzinfo=None) # 未来日期
faker.future_datetime(end_date="+30d", tzinfo=None) # 未来日期和时间
faker.iso8601(tzinfo=None, end_datetime=None) # iso8601格式日期和时间
faker.month() # 第几月
faker.month_name() # 月份名称
faker.past_date(start_date="-30d", tzinfo=None) # 过去日期
faker.past_datetime(start_date="-30d", tzinfo=None) # 过去日期和时间
faker.time(pattern="%H:%M:%S", end_datetime=None) # 时间(可设置格式和最大日期时间)
faker.time_delta(end_datetime=None) # 时间间隔
faker.time_object(end_datetime=None) # 时间(可设置最大日期时间)
faker.time_series(start_date="-30d", end_date="now", precision=None, distrib=None, tzinfo=None)
faker.timezone() # 时区
faker.unix_time(end_datetime=None, start_datetime=None) # UNIX时间戳
faker.year() # 某年

文件相关

faker.file_extension(category=None) # 文件扩展名
faker.file_name(category=None, extension=None) # 文件名
faker.file_path(depth=1, category=None, extension=None) # 文件路径
faker.mime_type(category=None) # MIME类型
faker.unix_device(prefix=None) # UNIX设备
faker.unix_partition(prefix=None) # UNIX分区

坐标相关

faker.coordinate(center=None, radius=0.001) # 坐标
faker.latitude() # 纬度
faker.latlng() # 经纬度
faker.local_latlng(country_code="US", coords_only=False) # 返回某个国家某地的经纬度
faker.location_on_land(coords_only=False) # 返回地球上某个位置的经纬度
faker.longitude() # 经度

网络相关

faker.ascii_company_email(*args, **kwargs) # 企业邮箱(ascii编码)
faker.ascii_email(*args, **kwargs) # 企业邮箱+免费邮箱(ascii编码)
faker.ascii_free_email(*args, **kwargs) # 免费邮箱(ascii编码)
faker.ascii_safe_email(*args, **kwargs) # 安全邮箱(ascii编码)
faker.company_email(*args, **kwargs) # 企业邮箱
faker.domain_name(levels=1) # 域名
faker.domain_word(*args, **kwargs) # 二级域名
faker.email(*args, **kwargs) # 企业邮箱+免费邮箱
faker.free_email(*args, **kwargs) # 免费邮箱
faker.free_email_domain(*args, **kwargs) # 免费邮箱域名
faker.hostname(*args, **kwargs) # 主机名
faker.image_url(width=None, height=None) # 图片URL
faker.ipv4(network=False, address_class=None, private=None) # ipv4
faker.ipv4_network_class()
faker.ipv4_private(network=False, address_class=None) # 私有ipv4
faker.ipv4_public(network=False, address_class=None) # 公共ipv4
faker.ipv6(network=False) # ipv6
faker.mac_address() # MAC地址
faker.safe_email(*args, **kwargs) # 安全邮箱
faker.slug(*args, **kwargs) # URL中的slug
faker.tld() # 顶级域名
faker.uri() # URI
faker.uri_extension() # URI扩展
faker.uri_page() # URI页
faker.uri_path(deep=None) # URI路径
faker.url(schemes=None) # URL
faker.user_name(*args, **kwargs) # 用户名

图书相关

faker.isbn10(separator="-") # ISBN-10图书编号
faker.isbn13(separator="-") # ISBN-13图书编号

职位相关

faker.job() # 职位

文本相关

faker.paragraph(nb_sentences=3, variable_nb_sentences=True, ext_word_list=None) # 单个段落
faker.paragraphs(nb=3, ext_word_list=None) # 多个段落
faker.sentence(nb_words=6, variable_nb_words=True, ext_word_list=None) # 单个句子
faker.sentences(nb=3, ext_word_list=None) # 多个句子
faker.text(max_nb_chars=200, ext_word_list=None) # 单个文本
faker.texts(nb_texts=3, max_nb_chars=200, ext_word_list=None) # 多个文本
faker.word(ext_word_list=None) # 单个词语
faker.words(nb=3, ext_word_list=None, unique=False) # 多个词语

编码相关

faker.binary(length=1048576) # 二进制
faker.boolean(chance_of_getting_true=50) # 布尔值
faker.md5(raw_output=False) # Md5
faker.null_boolean() # NULL+布尔值
faker.password(length=10, special_chars=True, digits=True, upper_case=True, lower_case=True) # 密码
faker.sha1(raw_output=False) # SHA1
faker.sha256(raw_output=False) # SHA256
faker.uuid4(cast_to=<class 'str'>) # UUID4

电话相关

faker.msisdn() # 完整手机号码(加了国家和国内区号)
​
faker.phone_number() # 手机号
​
faker.phonenumber_prefix() # 区号

档案相关

faker.profile(fields=None, sex=None) # 档案(完整)
faker.simple_profile(sex=None) # 档案(简单)

Python相关

faker.pybool() # Python布尔值
faker.pydecimal(left_digits=None, right_digits=None, positive=False, min_value=None, max_value=None) # Python十进制数
faker.pydict(nb_elements=10, variable_nb_elements=True, *value_types) # Python字典
faker.pyfloat(left_digits=None, right_digits=None, positive=False, min_value=None, max_value=None) # Python浮点数
faker.pyint(min_value=0, max_value=9999, step=1) # Python整型值
faker.pyiterable(nb_elements=10, variable_nb_elements=True, *value_types) # Python可
faker.pylist(nb_elements=10, variable_nb_elements=True, *value_types) # Python列表
faker.pyset(nb_elements=10, variable_nb_elements=True, *value_types) # Python集合
faker.pystr(min_chars=None, max_chars=20) # Python字符串
faker.pystruct(count=10, *value_types) # Python结构
faker.pytuple(nb_elements=10, variable_nb_elements=True, *value_types) # Python元组

身份证相关

faker.ssn(min_age=18, max_age=90) # 身份证

用户代理相关

faker.android_platform_token() # 安卓
faker.chrome(version_from=13, version_to=63, build_from=800, build_to=899) # Chrome
faker.firefox() # FireFox
faker.internet_explorer() # Ie
faker.ios_platform_token() # ios
faker.linux_platform_token() # Linux
faker.linux_processor() # Linux处理器
faker.mac_platform_token() # Mac
faker.mac_processor() # Mac处理器
faker.opera() # Opera
faker.safari() # Safari
faker.user_agent() # 随机用户代理
faker.windows_platform_token() # Windows
  • 55