SimData V1 可控模拟数据平台

从“字段随机造数”升级为“配置驱动 + 分布控制 + 公式关系 + 约束修复 + 标签生成 + Worker 分块生成”的 V1 底座。当前重点保证中小规模高质量模拟,默认优先服务 5,000 到 50,000 行实验数据。

运行能力

自动探测 Worker / WASM / WebGPU / decimal.js 能力,决定当前可用执行路径。

任务控制

P0:状态驱动与配置驱动。生成与导出都基于任务快照。

配置校验

P0:生成开始前先校验字段、公式、标签、约束和样本量。

字段编辑器

P1:字段配置已切换成状态驱动,支持分布族、空值率、异常率、噪声率和精度。

关系与标签

P1-P2:公式字段、业务约束与标签字段都在这里配置。

质量目标

P2:支持均值、标准差、类别比例和正样本率目标。

生成进度

P3:默认走 Worker 分块生成。大样本时自动切换预览策略。

质量报告

P2-P3:展示字段摘要、目标命中情况、约束结果。

结果预览

大样本只保留采样预览,不保留全量对象数组。

导出

支持 CSV、配置 JSON、报告 JSON;小样本支持数据 JSON。