关闭
您正在使用的浏览器版本较低,无法支持聚宽的某些特性。
为了获得更好的体验,推荐使用:
Google Chrome
或者
Mozilla Firefox
或者
IE9以上
。
返回主题列表
XGBoost模型多因子策略分享
439
listen
分享到:
微信
微博
雪球
评论
cgzol
@fireflytxy 我也是这么考虑的,滚动训练肯定有用,可以追踪市场的风格变化。但这样的回测耗时很长,苦于没有充足的计算资源,郁闷。
2020-02-15
fireflytxy
@cgzol 楼主那个Xgboost模型训练的代码,我研究环境一跑就崩,你是怎么跑出来的
2020-02-15
cgzol
@fireflytxy 我是花了100积分买了1G研究环境的内存,才跑得动。你可以缩短取数的起止周期,就不需要太多的内存,这样也可以训练。
2020-02-15
jesselee
@cgzol 2G内存能跑的动3年的数据么?我试过取1年数据,效果比2年的差多了。用17年的训练,18年回测,18年数据训练,19年回测,都没跑过大盘。
2020-02-15
cgzol
@jesselee 没试过是否能跑得动3年的数据,耗时太长了,我没耐性等
2020-02-15
jesselee
@cgzol 我还想要是2G能跑3年的数据,我花100积分换1G内存试试,验证下是不是数据越多,效果越好。机器学习这种方法比较适合机构,太耗资源。
2020-02-15
cgzol
@jesselee 还有一种方式,就是先把3年的因子数据取出下载下来,在本地的电脑上跑XGBoost模型训练,然后再用训练好的模型做回测。
2020-02-15
jesselee
@cgzol 考虑过这样处理,过几个月准备试试,准备数据估计要花不少时间。
2020-02-16
AlphaRookie
想问下作者,你用xbg的时候碰到过这个问题吗,怎么处理呀,百度也没搞出个结果,谢谢~ Check failed: label_correct GammaRegression: label must be positive
2020-02-28
cgzol
@AlphaRookie 没遇到过这种错误
2020-02-29
cgzol
@qqyin 谢谢,已回复
2020-02-29
AlphaRookie
@cgzol 好的谢谢,因为我之前不大了解这个算法,我想问下xgboost回归的话,y必须全是正的吗,负值可不可以,我对x和y训练集全做了归一化,把值全部映射到【0,1】区间,这个问题就解决了。
2020-02-29
cgzol
@AlphaRookie 我的理解是,如果是用XGBoost做分类,那必须是大于等于0,如果是做回归,可以是负的。
2020-02-29
AlphaRookie
@cgzol 好的,谢谢~
2020-02-29
FYX
traindf['label']=list(traindf['labetemp'].apply(lambda x:int(x*12/length))) 不知道为什么报错所以我改成了这个,应该一样吧
2020-03-02
FYX
另外问下最后模型训练 用三年的数据 可能要多久 CPU1G 内存3G,因为内存总在2.9G左右,感觉可能会崩
2020-03-02
cgzol
@FYX 你这样写更简洁了,赞,当时我写的时候有点简单粗暴。另外,没试过训练3年的数据,很期待你的训练结果!
2020-03-02
FYX
@cgzol 两年的数据训练了多久呢,因为模型训练中间没有进度提示,又怕研究环境中断
2020-03-02
cgzol
@FYX 印象中当时训练了好几个小时,我是让电脑设置不进入休眠状态,研究环境才没有中断,否则很容易中断。
2020-03-02
FYX
@cgzol 用时21小时49分钟。。。
2020-03-04
首页
上一页
1
2
3
4
5
6
7
8
下一页
尾页
您尚未登录,请
登录
或者
注册
聚宽发表回复。
取 消
提 交