Skill 分享:ddl-to-insert — 从建表语句自动生成逼真测试数据
痛点
写测试数据最烦的不是写 SQL,是想数据。一个 20 列表,300 行记录,手动填能填到天荒地老。
于是我写了一个纯 Python 的 DDL → INSERT 工具,无任何外部依赖,半小时搞定。
核心思路
通用列名推断(而非类型推断):
- 列名优先匹配:email → 邮箱格式,phone → 手机号,order_no → 订单号
- 类型推断兜底:VARCHAR → 中文姓名,DECIMAL → 金额
- 硬编码覆盖特殊值:业务特殊字段按比例分布,而非随机
踩坑记录
最大的教训:对于专业领域表,列名本身没有语义信号,必须硬编码生成策略而不是通用推断。通用推断在 80% 的场景够用,但那 20% 的corner case,往往才是生产环境里出问题的。
触发词: 建表语句生成测试数据 | DDL转INSERT
13 赞5 评论技能来自第三方,未经过人工测试,请注意防范潜在风险