【FM-RS】真伪DeepFM:DeepFM、xDeepFM

2023-10-18 20:20
文章标签 rs fm deepfm xdeepfm 真伪

本文主要是介绍【FM-RS】真伪DeepFM:DeepFM、xDeepFM,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

DeepFM IJCAI’17

理解一:这篇文章在模型的设计上紧随Google的Wide & Deep,用FM来代替Wide & Deep的部分,从而可以避免人工设计特征工程。

理解二:分别利用线性模型、FM、DNN得到一阶特征、二阶特征、高阶特征。

模型

我们假设训练集当中一共有 n n n条样本,每一条样本可以写成 ( χ , y ) (\chi, y) (χ,y)。其中的是一个 m m m个field组成的向量,包含了用户和item等组成的特征。 y ∈ { 0 , 1 } y \in\{0,1\} y{0,1} y = 0 y=0 y=0表示用户没有点击,相反, y = 1 y=1 y=1表示用户点击。

这m维特征可以看成两部分组成,第一部分是类别特征,比如性别、地理位置、收入情况等等。第二种是连续性特征,比如平均花费、平均停留时间等等。类别特征(categorical feature)一般被表示成一个one-hot之后的向量,而一个连续特征,一般就是表示它自己,当然也可以离散化成one-hot向量。

我们把这些特征全部处理完之后,整个向量会转化成 x = [ x field  1 , x field  2 , ⋯   , x field  m ] x=\left[x_{\text {field }_{1}}, x_{\text {field }_{2}}, \cdots, x_{\text {field }_{m}}\right] x=[xfield 1,xfield 2,,xfield m]。由于这当中做了一些离散化的处理,会使得x向量变得非常稀疏。

image-20210513194210777

模型由三部分组成:

1、 线性模型,原始特征直接输入线性模型得到一个logit值。

2、 每个特征对应一个embedding,embedding互相做内积,得到 m ( m − 1 ) 2 \frac{m(m-1)}{2} 2m(m1)个logit值。

所以以上两部分其实就是FM模型:
y ^ = ∑ i = 1 n w i x i + ∑ i = 1 n − 1 ∑ j = 1 n v i T v j x i , x j \hat{y}=\sum_{i=1}^{n} w_{i} x_{i}+\sum_{i=1}^{n-1} \sum_{j=1}^{n} v_{i}^{T} v_{j} x_{i}, x_{j} y^=i=1nwixi+i=1n1j=1nvi<

这篇关于【FM-RS】真伪DeepFM:DeepFM、xDeepFM的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/234954

相关文章

RS在不同设备间同步文件

参考: 1. Resilio(BtSync)搭建 2. 使用Resilio Sync共享文件【附操作指南】 4. Linux 下挂载新硬盘方法 5. Partition 1 does not start on physical sector boundary. 6. Ubuntu 16.04添加开机启动脚本的方法 7. Ubuntu 16.04以普通用户身份开机启动 8. Ubunt

deepcross network(DCN)算法 xdeepfm是DCN的进阶

揭秘 Deep & Cross : 如何自动构造高阶交叉特征 https://zhuanlan.zhihu.com/p/55234968 Deep & Cross Network总结 Deep和Cross不得不说的秘密 [深度模型] Deep & Cross Network (DCN) https://mp.weixin.qq.com/s/Xp_xTmcx56tJqfjMhFsArA

RS FPC1500 三合一频谱分析仪

R&S FPC1500  三合一频谱分析仪 XLT 简述 R&S FPC1500 具有三位一体特点:它是市场上少有集成三种仪器功能的频谱分析仪。而且,这些仪器正是 RF 工程师在物联网设备开发等过程中较常使用的三种仪器:频谱分析仪,网络分析仪,信号发生器。 主要特性 主要特性: 出色的射频性能,德国工程设计 10.1" WXGA(136

DeepFM算法代码

以下代码均采用Tensorflow1.15版本 数据集私聊我 import tensorflow as tfimport numpy as npimport pandas as pd# 定义特征列def get_feature_columns():# 假设 Criteo 数据集有 10 个数值特征和 10 个类别特征numerical_feature_columns = [tf.feat

C++发票查验-发票验真-发票真伪查验-发票ocr识别-数电票真伪-接口

发票查验接口,是指通过特定的技术手段和服务平台,对发票的真伪进行验证和识别的一项服务。在现代商业活动中,发票作为一种重要的财务和法律凭证,其真实性对于维护税务秩序和防范财务风险至关重要。   随着技术的进步,人工智能和OCR(光学字符识别)技术也被应用于发票查验之中。通过OCR技术,可以自动识别发票上的文本信息,包括发票号码、代码、金额等关键信息,并自动完成查验。这种技术不仅提高了查验效率

推荐系统(RS)-

参考资料: 推荐系统召回四模型之:全能的FM模型

推荐模型-上下文感知-2015:FFM模型【在FM基础上引入特征域】【每个特征对应的不是唯一一个隐向量权重,而是一系列,与每个特征域都计算出一个隐向量权重】【FM:O(kn);FFM:O(knf)】

Yuchin Juan et al. “Field-aware Factorization Machines for CTR Prediction” in RecSys 2016. https://github.com/rixwew/pytorch-fm 2015年,Criteo基于FM提出的FFM在多项CTR预估大赛中夺魁,并被Criteo、美团等公司深度应用在推荐系统、CTR预估等领域。

爬虫入门--Python利用selenium下载中央广播电台FM广播节目

本文主要利用爬虫技术,来自动下载网页上音频数据 参考资料: 关于python入门,可以学习在imooc网课上搜索Python开发简单爬虫 关于如何加载下一页,参考博客python利用beautifulsoup+selenium自动翻页抓取网页内容 简单爬虫知识  主要分为爬虫调度器,URL管理器,网页下载器,网页解析器,价值数据 爬虫调度器:来开启抓取数据URL管理器:主要来

FSQ26信号分析仪RS FSU26 20HZ-26.5G频谱分析仪

罗德与施瓦茨Rohde & Schwarz FSQ26信号分析仪,20 Hz - 26.5 GHz ​R&S FSQ26 信号分析仪集两种仪器于一身。它提供高达 120 MHz 解调带宽的信号分析,并具有高端频谱分析仪的动态范围。 频率范围:20 Hz 至 26.5 GHz 高端频谱分析仪的动态范围 TOI + 25 dBm,典型值。 1 dB 压缩 +13 dBm,典型值。 84

搭建多协议的串口服务器流程:RS-232、RS-485和TCP/IP、MQTT网络协议(代码示例)

一、项目概述 在物联网(IoT)和自动化控制的快速发展中,串口通信作为一种经典的通信方式,依然发挥着重要作用。本项目旨在构建一个支持多种协议的串口服务器,能够通过串口接收和发送数据,并通过网络协议(如TCP/IP、MQTT等)与其他设备和系统进行交互。 项目的目标和用途 本项目的目标是提供一个灵活的串口服务器,支持多种串口协议(如RS-232、RS-485)以及多种网络协议,使得不同的设备能