文件上传
支持 .csv, .xlsx, .json 格式。数据将完全在本地浏览器处理。
建议文件大小 < 50MB
数据概览
暂无数据显示部分数据
可视化分析 (EDA)
机器学习
当前演示:简单神经网络模型 (预测数值)
✅ 时序预测模式
模型使用 t 时刻的特征 预测 t+1 时刻的目标值。例如:用今天的开盘、最高、最低、成交量等特征,预测明天的收盘价。
这是严格的时序预测,避免了数据泄露问题。
⚠️ 时序数据处理规则
1. 标签移位:使用 t 时刻特征预测 t+1 时刻标签(真实未来预测)2. 滑动窗口(LSTM/CNN):使用过去10期的数据作为输入 [batch, 10, features]
3. 时间顺序切分:训练集(最早) → 验证集(中间) → 测试集(最新)
4. 仅训练集打乱:训练集内部随机打乱,验证集和测试集保持时间顺序
5. 归一化基准:所有归一化参数仅从训练集计算,避免未来信息泄露
📊 模型选择建议
ANN/DNN:适合特征独立的数据,训练快速LSTM:适合时序数据,能捕捉长期依赖(需要10期以上历史数据)
CNN-LSTM:适合复杂时序模式,结合局部特征和长期依赖
✅ 稳健归一化策略(自动检测)
价格数据:自动使用Z-score标准化,避免非平稳性问题非价格数据:使用Min-Max归一化,保持数据分布
优势:Z-score对历史新高/新低具有鲁棒性,不会导致模型崩溃
🎯 Monte Carlo Dropout 置信度评估
技术:使用MC Dropout进行30次随机预测,计算统计量输出:预测均值、标准差、95%置信区间
优势:提供真正的概率置信度,而非启发式估计
解释:标准差越小,模型越确定;置信区间越窄,预测越可靠
模型配置
CNN-LSTM适合时序数据,需要较多特征和数据量。如遇到错误,建议先尝试LSTM模型。
按住 Ctrl/Cmd 可多选
训练参数
网络结构
早停策略
训练监控 (Loss)
模型评估与预测
训练尚未开始...
下一期预测(真实未来预测)
预测说明:使用当前最新一期的所有特征数据,预测下一期的目标值。
这是真正的未来预测,不存在数据泄露。
这是真正的未来预测,不存在数据泄露。
基于历史数据自动预测下一期值,无需手动输入特征
预测结果
点击上方按钮进行预测
趋势分析
预测完成后显示趋势分析