程序代写代做代考 多序列拟合,多序列时间点分类:

多序列拟合,多序列时间点分类:

40 个 sample, 每个 sample 都是一个时间序列,每个 sample 对应一个坐标序列,同时每个

sample又对应两个标签,要用 CNN+RNN的结构训练模型。

任务 1. 根据输入训练模型能够对输出 y进行拟合。输入输出的采样时间不同,只关注 y文

件中标注的时间点,y文件中未提到的时间点不关心。但是不允许对 x 进行降采样或者对 y

进行升采样。可以 bucketing或 padding. (可能他是考虑降采样 x的信息会丢,y升采样计算

量会增大)。Cost function 为 mean absolute error.

任务 2. 根据同样的输入训练模型能够进行分类。分类的 label为两组,即在某一序列的某

一时间点处存在两种分类,要求通过统一的深度神经网络进行训练(即多任务训练)

要求:

1. 结构:对于 4维数据(也可以加时间变成 5维)先做 CNN, weight 矩阵为 4*10,weight

节点为 16,CNN 为 3层,可做 pooling也可不做(我估计任务一可以做 pooling, 任务二

做不了)。 然后 8节点两层 fully connected layer。之后 3层 stacked LSTM, 然后 2层 4

节点 fully connected layer。所有 activation function都是 relu. (两个任务都是这个结构,

我猜任务 1最后接纯线性层,任务 2最后接 sigmax)

2. 用 kfold,不过每一个 group用哪个 sample要根据“group.xlsx”中指定的。

3. 采用 early stop, 即 取 validation curve的最低点处为训练停止点

4. 每一个任务,每一组都要有训练曲线,即 training curves. 包括 training set, validation set

和 testing set

5. 对于任务 1,最后训练出的模型要能够对模型预测结果和真实曲线进行对比并画图,对

所有 set的 sample都要画图。也就是说最后要有 40*10=400张图。

6. 对于任务 2的每一个分类任务都要计算每一组的 accuracy, recall, sensitivity, specificity. 每

一组只需要算 testing set的。

7. 不需要 minibatch.

Administrator
Typewriter
要求使用Tensorflow 做

Administrator
Typewriter
input文件是sample, y文件是任务一用的target,label文件是任务二的标签,group文件是分组方法
除group文件外,每一个sheet是一个sample