大家好,这里更新一下我的情况。我已经挂啦,所以恕我没有办法再加大家好友一一讨论了。
但我很愿意在这里分享我确定应该不是我挂的原因的全部经验。
第一轮OA:很简单,不用想太多。就是用profit margin估就可以。也没必要想办法估missing value,只要认真report所有data anomalies就行。. 1point3acres
【估outage】用time series和简单的平均去估outage都可以,最重要的是要注意data patterns!data patterns!data patterns!(我提醒下:有周而复始的趋势,也有上升下降的趋势,要从business的角度去想怎么解释它们,但怎么解释我就没法说了因为我不确定我的对不对)
Copyright By PowCoder代写 加微信 powcoder
所以一定一定一定一定要注意你用的方法、你选取的时间段、你的所有assumptions是不是都能fit data patterns,你也能从business的角度去解释。【最最最最重要的!】(所以你别太肯定地轻易做出assumptions,我觉得我就是挂在这里)(所以其实自己用的model高大上与否不重要,最好别直接我用了三个ML models 然后accuracy都列在那里,在model comprison一下,也没从business角度给出我为什么选这个model它解释了什么)
【查data anomalies】要进一步用一些已知数据计算新变量,看有没有异常值,描述的时候详细一些,可以举一些导致异常值的例子
【做recommendation】从投资者预期变化的角度作出推荐
就这样!祝大家能走的比我远!!
补充内容 (2021-11-12 02:08 +8:00):
最近又陆续有朋友加我微信,我补充下大家可能的疑惑吧。【所以,希望如果大家参考以下就能解决的问题,就不要加微信问我啦】
首先第一轮OA:不用想太多,我直接告诉大家就是分segment计算profit margin,然后乘一乘就行了。不用处理missing values
第二轮OA:我意识到自己描述的太抽象了。
首先我直白的告诉大家,可以不用Machine Learning Model,因为你根本无法从business的角度解释清楚为什么要用这个模型,还要做出多余的assumptions,很容易被challenge (这也间接说明真的很向往modeling的小伙伴其实不用花太多时间在这个岗位上)
也可以不用Time Series,如果你已经走到了这一步,认真理解一下数据,就会明白数据本身根本不是time series data。e.g.,yipitdata 给的数据是【10月1日发布的deals的总billing】【10月2日发布的deals的总billing】,10月1日发布的deals和10月2日发布的deals根本不是同一批deals,所以它不是一个个体在不同时间的量——不是time series。time series严格意义来说应该是同一批deals在不同时间点的billings。所以你要用了time series 会很不好解释你的assumption。.–
不过,确实有一些和time series很类似的趋势,比如以周为单位的循环。9月底到12月中发布的deals的billings都在差不多的level ——很像mean reversion in time series。——那么你就取【9月底到12月中的数据用以周为单位的平均】去估计就好啦
再从business的角度解释下你认为拥有weekly pattern和9月底到12月中数据量变化的原因。
用Price=gross billings/units sold 去看数据异常。
程序代写 CS代考 加微信: powcoder QQ: 1823890830 Email: powcoder@163.com