kaggle竞赛宝典 | 量化竞赛第一名的网络模型

2024-08-25 21:12

本文主要是介绍kaggle竞赛宝典 | 量化竞赛第一名的网络模型,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文来源公众号“kaggle竞赛宝典”,仅用于学术分享,侵权删,干货满满。

原文链接:量化竞赛第一名的网络模型

1 简介

今天我们重温Jane Street 大赛第一名的网络模型。该次赛事数据集包含了一组匿名的特征,feature_{0...129},代表真实的股市数据。数据集中的每一行代表一个交易机会,你需要预测一个动作值:1表示进行交易,0表示放弃。每笔交易都有一个相关的权重和响应,它们一起代表交易的回报。日期列是一个整数,表示交易的日期,而ts_id表示时间顺序。

该赛事的第一名选手采用的是AutoEncoder+MLP的网络模型。一起回顾学习一下。

2 模型

2.1 模型结构

模型主要由三个模块组成:

  1. 加入高斯噪音的Autoencoder模块;

  2. Decoder之后数据的原始Loss;

  3. 原始数据+Encoder数据的原始问题的Loss;

2.2 相关细节

  1. 使用自编码器创建新特征,并与原始特征连接,作为下游MLP模型的输入

  2. 在每个交叉验证分割中一起训练自编码器和MLP,以防止数据泄漏

  3. 向自编码器添加目标信息(监督学习),迫使其生成更相关的特征,并为梯度的反向传播创建捷径

  4. 在编码器前添加高斯噪声层,以进行数据增强并防止过拟合

  5. 使用Swish激活函数代替ReLU,以防止“死亡神经元”并平滑梯度

  6. MLP使用批归一化和Dropout

  7. 使用3个不同的随机种子训练模型,并取平均值以减少预测方差

  8. 仅使用在最后两个交叉验证分割中训练的模型(具有不同种子),因为它们已经看到更多的数据

  9. 仅监控MLP的二元交叉熵损失,而不是整体损失,以便早停

  10. 使用Hyperopt找到最佳超参数集

3 核心代码

def create_ae_mlp(num_columns, num_labels, hidden_units, dropout_rates, ls = 1e-2, lr = 1e-3):inp = tf.keras.layers.Input(shape = (num_columns, ))x0 = tf.keras.layers.BatchNormalization()(inp)encoder = tf.keras.layers.GaussianNoise(dropout_rates[0])(x0)encoder = tf.keras.layers.Dense(hidden_units[0])(encoder)encoder = tf.keras.layers.BatchNormalization()(encoder)encoder = tf.keras.layers.Activation('swish')(encoder)decoder = tf.keras.layers.Dropout(dropout_rates[1])(encoder)decoder = tf.keras.layers.Dense(num_columns, name = 'decoder')(decoder)x_ae = tf.keras.layers.Dense(hidden_units[1])(decoder)x_ae = tf.keras.layers.BatchNormalization()(x_ae)x_ae = tf.keras.layers.Activation('swish')(x_ae)x_ae = tf.keras.layers.Dropout(dropout_rates[2])(x_ae)out_ae = tf.keras.layers.Dense(num_labels, activation = 'sigmoid', name = 'ae_action')(x_ae)x = tf.keras.layers.Concatenate()([x0, encoder])x = tf.keras.layers.BatchNormalization()(x)x = tf.keras.layers.Dropout(dropout_rates[3])(x)for i in range(2, len(hidden_units)):x = tf.keras.layers.Dense(hidden_units[i])(x)x = tf.keras.layers.BatchNormalization()(x)x = tf.keras.layers.Activation('swish')(x)x = tf.keras.layers.Dropout(dropout_rates[i + 2])(x)out = tf.keras.layers.Dense(num_labels, activation = 'sigmoid', name = 'action')(x)model = tf.keras.models.Model(inputs = inp, outputs = [decoder, out_ae, out])model.compile(optimizer = tf.keras.optimizers.Adam(learning_rate = lr),loss = {'decoder': tf.keras.losses.MeanSquaredError(), 'ae_action': tf.keras.losses.BinaryCrossentropy(label_smoothing = ls),'action': tf.keras.losses.BinaryCrossentropy(label_smoothing = ls), },metrics = {'decoder': tf.keras.metrics.MeanAbsoluteError(name = 'MAE'), 'ae_action': tf.keras.metrics.AUC(name = 'AUC'), 'action': tf.keras.metrics.AUC(name = 'AUC'), }, )return model

4 参考文献

  1. https://www.kaggle.com/competitions/jane-street-market-prediction/discussion/224348

  2. https://www.kaggle.com/code/gogo827jz/jane-street-supervised-autoencoder-mlp

THE END !

文章结束,感谢阅读。您的点赞,收藏,评论是我继续更新的动力。大家有推荐的公众号可以评论区留言,共同学习,一起进步。

这篇关于kaggle竞赛宝典 | 量化竞赛第一名的网络模型的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1106669

相关文章

如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解

《如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解》:本文主要介绍如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别的相关资料,描述了如何使用海康威视设备网络SD... 目录前言开发流程问题和解决方案dll库加载不到的问题老旧版本sdk不兼容的问题关键实现流程总结前言作为

0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型的操作流程

《0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeekR1模型的操作流程》DeepSeekR1模型凭借其强大的自然语言处理能力,在未来具有广阔的应用前景,有望在多个领域发... 目录0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型,3步搞定一个应

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll

Spring AI Alibaba接入大模型时的依赖问题小结

《SpringAIAlibaba接入大模型时的依赖问题小结》文章介绍了如何在pom.xml文件中配置SpringAIAlibaba依赖,并提供了一个示例pom.xml文件,同时,建议将Maven仓... 目录(一)pom.XML文件:(二)application.yml配置文件(一)pom.xml文件:首

如何在本地部署 DeepSeek Janus Pro 文生图大模型

《如何在本地部署DeepSeekJanusPro文生图大模型》DeepSeekJanusPro模型在本地成功部署,支持图片理解和文生图功能,通过Gradio界面进行交互,展示了其强大的多模态处... 目录什么是 Janus Pro1. 安装 conda2. 创建 python 虚拟环境3. 克隆 janus

本地私有化部署DeepSeek模型的详细教程

《本地私有化部署DeepSeek模型的详细教程》DeepSeek模型是一种强大的语言模型,本地私有化部署可以让用户在自己的环境中安全、高效地使用该模型,避免数据传输到外部带来的安全风险,同时也能根据自... 目录一、引言二、环境准备(一)硬件要求(二)软件要求(三)创建虚拟环境三、安装依赖库四、获取 Dee

DeepSeek模型本地部署的详细教程

《DeepSeek模型本地部署的详细教程》DeepSeek作为一款开源且性能强大的大语言模型,提供了灵活的本地部署方案,让用户能够在本地环境中高效运行模型,同时保护数据隐私,在本地成功部署DeepSe... 目录一、环境准备(一)硬件需求(二)软件依赖二、安装Ollama三、下载并部署DeepSeek模型选

Golang的CSP模型简介(最新推荐)

《Golang的CSP模型简介(最新推荐)》Golang采用了CSP(CommunicatingSequentialProcesses,通信顺序进程)并发模型,通过goroutine和channe... 目录前言一、介绍1. 什么是 CSP 模型2. Goroutine3. Channel4. Channe

SSID究竟是什么? WiFi网络名称及工作方式解析

《SSID究竟是什么?WiFi网络名称及工作方式解析》SID可以看作是无线网络的名称,类似于有线网络中的网络名称或者路由器的名称,在无线网络中,设备通过SSID来识别和连接到特定的无线网络... 当提到 Wi-Fi 网络时,就避不开「SSID」这个术语。简单来说,SSID 就是 Wi-Fi 网络的名称。比如

Java实现任务管理器性能网络监控数据的方法详解

《Java实现任务管理器性能网络监控数据的方法详解》在现代操作系统中,任务管理器是一个非常重要的工具,用于监控和管理计算机的运行状态,包括CPU使用率、内存占用等,对于开发者和系统管理员来说,了解这些... 目录引言一、背景知识二、准备工作1. Maven依赖2. Gradle依赖三、代码实现四、代码详解五