首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
xlearn专题
【开源】北大团队大规模稀疏数据机器学习库xLearn,c++ trending 已超TensorFlow
机器学习博士马超近日在微博上介绍他和导师肖臻教授一起开发的一款专门针对大规模稀疏数据的机器学习库xLearn并开源。并称, vision 是将 xLearn 打造成和 xgboost,MXNet一样的工业事实标准。 原文链接
阅读更多...
因子分解机(libffm+xlearn)
因子分解机 一、简介 在CTR和CVR预估任务中,可能有大量的ID类特征(Categorical Feature),一般来说并不适合直接送入树模型(xgboost完全不支持,lightgbm只根据取值不同),一种常用的做法是通过Label Encoding变成离散的稀疏的高维向量(最具代表的是Onehot独热编码),然后送入LR训练。在独热编码的作用下,产生了多项式模型参数学习困难的问题。
阅读更多...
安装xlearn包 (学习FM因子分解机)
在看文献的时候发现了LibFM工具,接着看到了xlearn,是一个比Libfm和Libffmm更好的机器学习算法库,高性能且易用。 由于安装步骤找的很麻烦,现在写下来方便有缘人^.^。 简单说共有三步: 1.安装Visual Studio 2017 2.安装cmake 3.安装xlearn 官方的网址在这,安装、使用都非常详细:欢迎使用 xLearn ! — xLearn 0.4.0
阅读更多...