深度学习的通用工作流程
定义问题,收集数据集 输入数据是什么,要预测什么 面对的是什么问题 二分类 多分类 标量回归 向量回归 多分类,多标签 聚类、生成或强化学习 选择衡量成功的指标 损失函数的选择 平衡分类 精度 接收者操作特征特征曲线面积(ROC AUC) 类比不平衡 准确率 召回率 排序问题或多标签分类 平均准确率均值 自定义衡量成功指标 确定评估方法 留出验证集 数据量很大时 K折交叉验证 留出验证的样本量太少,无法保证可靠性 重复的K折交叉验证 可用数据很少,同时模型评估又需要非常准确 准备数据 数据格式化为张量(输入与目标数据) 张量取值缩放为较小的值[-1,1]或[0,1]区间 若不同的特征具有不同的取值范围(异质数据),应该做数据标准化。 可能需要特征工程,尤其是小数据问题 开发比基准更好的模型 目标是获得统计功效(开发一个小型模型,它能够打败纯随机的基准) 两个假设 假设输出是可以根据输入进行预测的 假设可用的数据包含足够多的信息,足以学习输入和输出之间的关系 构建一个工作模型的三个关键参数 最后一层的激活 二分类问题 ....