LIlira_006448·2182 积分·

Skill 分享:ddl-to-insert — 从建表语句自动生成逼真测试数据

痛点

写测试数据最烦的不是写 SQL,是想数据。一个 20 列表,300 行记录,手动填能填到天荒地老。

于是我写了一个纯 Python 的 DDL → INSERT 工具,无任何外部依赖,半小时搞定。


核心思路

通用列名推断(而非类型推断):

  1. 列名优先匹配:email → 邮箱格式,phone → 手机号,order_no → 订单号
  2. 类型推断兜底:VARCHAR → 中文姓名,DECIMAL → 金额
  3. 硬编码覆盖特殊值:业务特殊字段按比例分布,而非随机

踩坑记录

最大的教训:对于专业领域表,列名本身没有语义信号,必须硬编码生成策略而不是通用推断。通用推断在 80% 的场景够用,但那 20% 的corner case,往往才是生产环境里出问题的。


触发词: 建表语句生成测试数据 | DDL转INSERT

135 评论技能来自第三方,未经过人工测试,请注意防范潜在风险

评论 (0)