文件上传

支持 .csv, .xlsx, .json 格式。数据将完全在本地浏览器处理。

建议文件大小 < 50MB

数据概览

暂无数据显示部分数据

可视化分析 (EDA)

X 轴变量

Y 轴变量

图表类型

机器学习

当前演示：简单神经网络模型 (预测数值)

✅ 时序预测模式

模型使用 t 时刻的特征 预测 t+1 时刻的目标值。
例如：用今天的开盘、最高、最低、成交量等特征，预测明天的收盘价。
这是严格的时序预测，避免了数据泄露问题。

⚠️ 时序数据处理规则

1. 标签移位：使用 t 时刻特征预测 t+1 时刻标签（真实未来预测）
2. 滑动窗口（LSTM/CNN）：使用过去10期的数据作为输入 [batch, 10, features]
3. 时间顺序切分：训练集(最早) → 验证集(中间) → 测试集(最新)
4. 仅训练集打乱：训练集内部随机打乱，验证集和测试集保持时间顺序
5. 归一化基准：所有归一化参数仅从训练集计算，避免未来信息泄露

📊 模型选择建议

ANN/DNN：适合特征独立的数据，训练快速
LSTM：适合时序数据，能捕捉长期依赖（需要10期以上历史数据）
CNN-LSTM：适合复杂时序模式，结合局部特征和长期依赖

✅ 稳健归一化策略（自动检测）

价格数据：自动使用Z-score标准化，避免非平稳性问题
非价格数据：使用Min-Max归一化，保持数据分布
优势：Z-score对历史新高/新低具有鲁棒性，不会导致模型崩溃

🎯 Monte Carlo Dropout 置信度评估

技术：使用MC Dropout进行30次随机预测，计算统计量
输出：预测均值、标准差、95%置信区间
优势：提供真正的概率置信度，而非启发式估计
解释：标准差越小，模型越确定；置信区间越窄，预测越可靠

模型配置

选择训练模型 CNN-LSTM适合时序数据，需要较多特征和数据量。如遇到错误，建议先尝试LSTM模型。

特征列 (Feature X) - 可多选按住 Ctrl/Cmd 可多选

目标列 (Label Y)

训练参数

训练轮数

学习率

批次大小

测试集比例

网络结构

第一层神经元

第二层神经元

激活函数

优化器

早停策略

早停容忍度

训练监控 (Loss)

模型评估与预测

训练尚未开始...

下一期预测（真实未来预测）

预测说明：使用当前最新一期的所有特征数据，预测下一期的目标值。
这是真正的未来预测，不存在数据泄露。

基于历史数据自动预测下一期值，无需手动输入特征

预测结果

点击上方按钮进行预测

趋势分析

预测完成后显示趋势分析

SimLabs

机器学习分析工具

文件上传

数据概览

可视化分析 (EDA)

机器学习

✅ 时序预测模式

⚠️ 时序数据处理规则

📊 模型选择建议

✅ 稳健归一化策略（自动检测）

🎯 Monte Carlo Dropout 置信度评估

⚠️ CNN-LSTM 模型注意事项

模型配置

训练参数

网络结构

早停策略

训练监控 (Loss)

模型评估与预测

下一期预测（真实未来预测）

预测结果

趋势分析

预测详情

高级可视化分析

特征相关性矩阵

解读指南

实用建议

预测值 vs 实际值

残差分析

残差统计

特征重要性分析

重要性解读

特征建议