SimData V1 可控模拟数据平台
从“字段随机造数”升级为“配置驱动 + 分布控制 + 公式关系 + 约束修复 + 标签生成 + Worker 分块生成”的 V1 底座。当前重点保证中小规模高质量模拟,默认优先服务 5,000 到 50,000 行实验数据。
运行能力
自动探测 Worker / WASM / WebGPU / decimal.js 能力,决定当前可用执行路径。
任务控制
P0:状态驱动与配置驱动。生成与导出都基于任务快照。
配置校验
P0:生成开始前先校验字段、公式、标签、约束和样本量。
字段编辑器
P1:字段配置已切换成状态驱动,支持分布族、空值率、异常率、噪声率和精度。
关系与标签
P1-P2:公式字段、业务约束与标签字段都在这里配置。
质量目标
P2:支持均值、标准差、类别比例和正样本率目标。
生成进度
P3:默认走 Worker 分块生成。大样本时自动切换预览策略。
质量报告
P2-P3:展示字段摘要、目标命中情况、约束结果。
结果预览
大样本只保留采样预览,不保留全量对象数组。
导出
支持 CSV、配置 JSON、报告 JSON;小样本支持数据 JSON。