Loading...

文件上传

支持 .csv, .xlsx, .json 格式。数据将完全在本地浏览器处理。

建议文件大小 < 50MB

数据概览

暂无数据显示部分数据

可视化分析 (EDA)

机器学习

当前演示:简单神经网络模型 (预测数值)
✅ 时序预测模式
模型使用 t 时刻的特征 预测 t+1 时刻的目标值
例如:用今天的开盘、最高、最低、成交量等特征,预测明天的收盘价。
这是严格的时序预测,避免了数据泄露问题。
⚠️ 时序数据处理规则
1. 标签移位:使用 t 时刻特征预测 t+1 时刻标签(真实未来预测)
2. 滑动窗口(LSTM/CNN):使用过去10期的数据作为输入 [batch, 10, features]
3. 时间顺序切分:训练集(最早) → 验证集(中间) → 测试集(最新)
4. 仅训练集打乱:训练集内部随机打乱,验证集和测试集保持时间顺序
5. 归一化基准:所有归一化参数仅从训练集计算,避免未来信息泄露
📊 模型选择建议
ANN/DNN:适合特征独立的数据,训练快速
LSTM:适合时序数据,能捕捉长期依赖(需要10期以上历史数据)
CNN-LSTM:适合复杂时序模式,结合局部特征和长期依赖
✅ 稳健归一化策略(自动检测)
价格数据:自动使用Z-score标准化,避免非平稳性问题
非价格数据:使用Min-Max归一化,保持数据分布
优势:Z-score对历史新高/新低具有鲁棒性,不会导致模型崩溃
🎯 Monte Carlo Dropout 置信度评估
技术:使用MC Dropout进行30次随机预测,计算统计量
输出:预测均值、标准差、95%置信区间
优势:提供真正的概率置信度,而非启发式估计
解释:标准差越小,模型越确定;置信区间越窄,预测越可靠
模型配置
CNN-LSTM适合时序数据,需要较多特征和数据量。如遇到错误,建议先尝试LSTM模型。
按住 Ctrl/Cmd 可多选
训练参数
网络结构
早停策略
训练监控 (Loss)
模型评估与预测
训练尚未开始...
下一期预测(真实未来预测)
预测说明:使用当前最新一期的所有特征数据,预测下一期的目标值。
这是真正的未来预测,不存在数据泄露。
基于历史数据自动预测下一期值,无需手动输入特征
预测结果
点击上方按钮进行预测
趋势分析
预测完成后显示趋势分析

高级可视化分析

基于训练完成的模型,提供深入的数据洞察和模型解释

特征相关性矩阵

显示数值型特征之间的Pearson相关系数,帮助理解特征间的关系。 系统将自动检测数据中的数值型列。

点击矩阵单元格查看详细信息

点击上方按钮生成相关性矩阵

需要至少两个数值型列

解读指南
强正相关 (0.7~1.0)
中等正相关 (0.3~0.7)
弱相关 (0.0~0.3)
强负相关 (-1.0~-0.7)
实用建议
  • 对角线显示特征与自身的关系(始终为1)
  • 高度相关的特征(|r| > 0.8)可能存在冗余
  • 特征与目标变量强相关通常表示预测能力好
  • 检查负相关关系,可能揭示有趣的模式

预测值 vs 实际值

比较模型预测值与实际值的匹配程度,理想情况下点应落在对角线上

需要先完成模型训练
理想线: y = x (预测值 = 实际值)
R² 分数: -
完美预测: 所有点落在对角线上
平均误差: -

残差分析

检查模型的误差分布,理想情况下残差应随机分布在零线周围

残差 = 实际值 - 预测值
残差统计
均值
-
标准差
-
正态性检验
-
理想情况:
  • 残差均值为0
  • 残差呈正态分布
  • 无明显的模式或趋势

特征重要性分析

基于模型权重计算的特征重要性,帮助理解哪些特征对预测贡献最大

基于训练后的神经网络权重
重要性解读

重要性分数表示特征对模型预测的相对贡献:

  • 高重要性:特征对预测结果影响大
  • 低重要性:可考虑从模型中移除
  • 负重要性:与目标变量负相关
特征建议
点击"计算特征重要性"获取建议