2017.03专题

2017.03.13回顾

星期天晚上喝了酒,没有休息好,导致昨天状态非常差,下次打死老子,老子都不会去了 1、主要处理了下knowru的一些性能问题,30s的问题进行了沟通 2、做了一些性能上的小的修改 3、继续研究GBDT如何结合LR,选出重要的组合指标,我研究的是通过牛顿迭代法计算的node value和本身的0、1分布是否有某种相关性,依靠的是实验的方式 回去的时候比较晚,玩了会儿wow,下线了就应该速度睡觉

2017.03.10回顾

星期五比较忙,主要忙系统错误的事情 1、上午复习了下ROC曲线的绘制,这个真的是非常容易混淆,一不使用,一会就记混淆了 2、复习了一下pearson相关系数,几何意义是,两个向量夹角的余弦,这两个向量是,每个分量与均值的差值构成,相当于是一种中心化 3、下午去面试了一个人,这种交流对大家都是一种提高,只是不太合适 4、下午还有很多时间在处理knowru的问题,我自己也对代码做了修改,实践证

2017.03.09回顾

1、昨天周四,一早就去把户口的事情办了,办户口的时候有个小插曲,就是旧的户口页被警察收了,我女的不开心,我后来想了下,我还是应该去争取一下,虽说是警察也不应该怂,而且户籍警察不虚火!因为不是我的东西,在我这里被收的,我还是应该维护一下的!其实倒是没什么用了! 2、来到单位已经10点过了,上午就写了下总结,心里还在想办户口的事情 3、下午处理了工作中的问题,一个是和同事对接怎么存储我的数据,第二

2017.03.07回顾 GBDT前面树权重更大 python散点图

1、确定数据传输格式 2、看了下通过率方面的问题 3、下午开始研究GBDT相关问题,我最开始的疑问,是不是前面的树的权重大,对于我实际的数据集大多数样本点是这样的,少部分比较反常,但是我后来换了一个标准数据集,由于数据集太好了,损失函数直接就收敛到0了,所以每个点的预测值也是收敛到一个非常大非常小的值,在expit函数下,大概绝对值8,数值就很接近1或0了,然后前面收敛曲线基本上接近于一条直线

2017.03.06回顾

1、下午听了博士关于fraud的相关工作介绍,看了下代码的大致结构,然后查了下大概多少人是刚放款客户重跑模型,想了下人事的应对 2、上午主要也是联系另外一边的人事,同时也开了个小会 3、昨天晚上不该WOW的,干什么都好,不要说什么上去看一下,而且应该干的一小时运动并没有干(当然也有情绪因素),最后也并没按时睡觉,咳嗽的问题也要引起重视了,差不多一个月了!11点半之前一定上床睡觉,11点就开始准

2017.03.03回顾

1、关于python中是引用传递还是值传递,对于类实例来说,都是引用传递,但是对象分为可变对象,和不可变对象,不可变对象就是用的值传递,可变对象用的是引用传递,参考http://blog.csdn.net/vernice/article/details/50832069 2、星期五一直思绪也比较混乱,头脑里老是闪现出一些离开这个城市的想法,去找这个国度最牛批的人为伍的想法 3、下午主要就是和韩

2017.03.01回顾

1、把合作方的信用分数计算单独做成了接口 2、试图弄懂gbdt论文中line search等步骤,但是最后博士给我讲解了下,我还是没弄懂,只是大概搜了下,普通的情况一般是参数空间的梯度方向,最速下降,这个函数空间的我真是有点方 3、然后跑模型提前,配合IT准备了一下 4、回到家,主要就是看一些业务知识,还是挺有帮助,准备了一下面试,其实说白了也算是一种交流沟通,对行业的了解,也是一种学习!

W3School离线手册(2017.03.11版)

点击下载 W3School离线手册(2017.03.11版)

【统计学】【2017.03】实时电力市场价格的预测估计

本文为荷兰代尔夫特理工大学(作者:I. de Hoogt)的硕士论文,共100页。 电力不能有效地储存在电网中,因此需要供需平衡。输电系统运营商运营实时电力市场以获得额外的电力供应或负荷。传统上,提前一天尽可能准确地预测用电量,并且由于这些偏差涉及财务风险,因此与该电力计划的偏差应保持在最低水平。与提交的电力计划的偏差按实时电力市场结算价格结算,这对相关方是有利的。 本项目的目标是实现对电力