double operator[](int i)_Stata: 双栏模型简介 (Double-hurdle model)

2023-10-12 18:40

本文主要是介绍double operator[](int i)_Stata: 双栏模型简介 (Double-hurdle model),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1c45b5ea7b066c03f00224fe4332b8d9.png
编译:李琼琼 (山东大学)
Stata 连享会: 知乎 | 简书 | 码云 | CSDN

连享会-知乎推文列表


Note: 助教招聘信息请进入「课程主页」查看。

因果推断-内生性 专题 ⌚ 2020.11.12-15
主讲:王存同 (中央财经大学);司继春(上海对外经贸大学) 课程主页https://gitee.com/arlionn/YG | 微信版

e62c4a7f12e61d86d84b329c2a9ea94e.png
空间计量 专题 ⌚ 2020.12.10-13
主讲:杨海生 (中山大学);范巧 (兰州大学) 课程主页https://gitee.com/arlionn/SP | 微信版

997743ce8844e7ba1e0e59fb570b90d0.png

44f9c40d9531c76c497d205a4e95ee37.png
连享会最新专题直播

目录

  • 背景介绍
  • 1. 双栏模型 (Double-hurdle model) 介绍
    • 1.1 Tobit 模型
    • 1.2 Double - hurdle 模型
    • 1.3 用图形解释 double hurdle 模型
    • 1.4 Double - hurdle 模型的特殊形式
  • 2. 模型的 Stata 实现
    • 2.1 dhreg 命令介绍
    • 2.2 基于模拟分析的范例
    • 2.3 模型估计
  • 3. 面板双栏模型 (Panel-hurdle model)
    • 3.1 面板双栏模型基本原理
    • 3.2 面板双栏模型的 Stata 实现
    • 3.3 基于模拟分析的范例
  • 参考文献
  • 关于我们
本文主要翻译自如下论文,并进行了适当的补充和调整. Source: Engel C, Moffatt P G. Dhreg, xtdhreg, and bootdhreg: Commands to implement double-hurdle regression[J]. Stata Journal, 2014, 14(4):778-797. [PDF]

背景介绍

双栏模型 (Double-hurdle model) 是由 Cragg (1971) 提出的:对于一个活动的参与,个体决策是由两部分组成的。第一个门槛 (hurdle), 决定个体是否是零类型;第二个门槛 (hurdle) 是在第一个阶段是非零的条件下,决定个体对活动的参与程度。这个模型的关键特征是这里有两种类型的零观测值,一种是无周围的环境如何变化他的选择都是零,另一种是他可以有非零选择但是目前的环境导致他选择零,后者也被称为归并零 (Tobin,1958) 。因此,双栏模型除了包括自然的零类型外,还允许零的概率由观测值的个体决定的。本质上,Double-hurdle 模型 是 Tobit 模型的延续。本文主要分三部分内容进行介绍:

  • 1 双栏模型介绍
  • 2 模型的实现
  • 3 面板双栏模型

1. 双栏模型 (Double-hurdle model) 介绍

介绍双栏模型最自然的开始是先介绍 Tobit 模型,再来引入双栏模型。

1.1 Tobit 模型

Tobit 模型又被称为归并回归模型 (censored regression model), 根据 limit 的设置分为左归并 (lower censoring) 和右归并 (upper censoring),左归并指事先设置一个最小值 A,当被解释变量低于这个值时则自动等于 A。 如果最低的 limit 为 0 时,被称为零归并 (zero censoring)。

上面的公式中潜变量

(最终无法直接被看到)代表个体
希望做出的贡献 (latent contribution), 这个潜在贡献可以为负值,但是试验规则认为只要为负值最终的贡献都归为 0 (规则如下):

这里以零归并举例,采用对数似然函数,估计模型如下:

其中

为示性函数,当下标所表示的条件正确时取值为 1,否则为 0。通过使
最大化来求出

1.2 Double - hurdle 模型

Double - hurdle 模型有两个阶段,这两个阶段分别采用 probit 估计和 tobit 估计:

在第一个阶段 (hurdle),被解释变量 (

) 是二元变量,由潜变量
决定。

在第二个阶段 (hurdle), 被解释变量

是零或者正数,非常像
Tobit 模型 (Ⅰ)。
双栏模型对数似然函数为:

上式中,双栏模型的第二个阶段给

设置了最小值 0 ,当然也可以将最小值设置为其他数
, 都被称为
lower hurdle。 若最小值为
, 对数似然函数的变为:

若双栏模型是 upper hurdle 型,即第二个阶段设置一个最大值

, 所有超过
的值都等于
,小于
的值则不改变,那么此时模型变为:

1.3 用图形解释 double hurdle 模型

dacb015ef64ad5c336e1d0b8c27a4e34.png

上图中的的同心圆是

的联合分布,这个同心圆是以
,
为中心并根据解释变量的变动进行移动。在第二、三象限,由于
小于 0,
一直为 0,表现为个体永远不会 contribute;在第四象限,
大于 0, 但是
小于 0, 所以
暂时为 0,会随着
变量的变动的而可能大于 0;在第一象限,
为正数,个体实际做了 contribution。

1.4 Double - hurdle 模型的特殊形式

如果模型第一阶段,只有截距而没有解释变量,

, 则对数似然函数变为:

,此时模型就变成了
p-tobit 模型,即认为有一定比例
的样本可能会 contribute, 而永远不会 contribute 的样本占
的比例。
p-tobit 模型最先由 (Deaton and Irish, 1984) 提出。
连享会最新专题直播

2. 模型的 Stata 实现

2.1 dhreg 命令介绍

我们可以使用 dhreg 命令来实现双栏模型的估计。在 Stata 命令窗口中输入 help dhreg 命令即可查看其完整帮助文件。dhreg 命令的基本语法为:

dhreg depvar indepvars [if] [in] [, up ptobit hd(varlist) millr]

各项的含义如下:

  • depvar: 表示被解释变量,即最终的可观测的
  • indepvars:表示关键的解释变量,即决定
    (潜变量) 的解释变量
  • up: 将模型设置为右归并,并且设置
    最大值(默认为左归并)
  • ptobit: 将双栏模型设置为 p-tobit 模型
  • hd(varlist): 表示第一栏中决定
    的解释变量
  • millr: 用逆米尔斯比率来控制扰动项的相关性

2.2 基于模拟分析的范例

我们通过模拟生成的数据来对 dhreg 命令的使用进行介绍,下面是数据生成的过程 (DGP):

上面第一个公式生成的潜变量

即为第一个栏 (hurdle),是由服从均匀分布的外生变量
和扰动项
决定的。第二个公式生成潜变量
是第二个栏 (hurdle),是由外生变量
和扰动项
决定的。当前面两个栏都被跨过时,就可以观察到变量
(可观测变量)的取值 (非 0),否则
为 0。
clear all
set obs 1000
set seed 123   // 设置种子,为了使每次重复模拟过程的结果相同
gen z_i = uniform()   //  z_i 服从(0,1)均匀分布
set seed 1234
gen x_i = uniform()
set obs 1000
set seed 12345  
gen e_i2 = invnormal(uniform())  // e_i2 服从标准正态分布
set seed 12435
gen n_i = invnormal(uniform())
gen e_i1 = 0.5*e_i2 + sqrt(1-0.5*0.5)*n_i
gen d_i = 0
replace d_i = 1 if -2 + 4*z_i + e_i1 > 0
gen y_i2 = 0.5 + 0.3*x_i + e_i2
gen y_i1 = 0
replace y_i1 = y_i2 if y_i2 > 0
gen y_i = d_i*y_i1
save data_process1.dta, replace  // 保存一份模拟数据

数据效果如下:

use "data_process1.dta", clear
hist y_i if d_i == 1,title(Conditional on passing first hurdle) scheme(sj)
graph save y_i_1.gph, replace
hist y_i ,title(All Data) scheme(sj)
graph save y_i_2.gph, replace
gr combine  y_i_1.gph  y_i_2.gph
graph save y_i.png, replace

0de9e78342889301dd9612728ca72b93.png

从左图可以看出有很多观测值通过了第一栏(即

), 但是由于潜变量
为 0, 导致了最终观测值为 0。而更多的
为 0 的观测值是因为没有通过第一栏 (即
)。

2.3 模型估计

我们先进行传统的 tobit 估计, 再使用 dhreg 进行估计,然后对这两种估计结果进行比较。

. use "data_process1.dta", clear
. tobit y_i x_i, ll(0)
Tobit regression                                Number of obs     =      1,000Uncensored     =        413
Limits: lower = 0                                  Left-censored  =        587upper = +inf                               Right-censored =          0LR chi2(1)        =       3.49Prob > chi2       =     0.0619
Log likelihood = -1129.3849                     Pseudo R2         =     0.0015------------------------------------------------------------------------------y_i |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------x_i |   .3617779   .1939403     1.87   0.062    -.0187992    .7423551_cons |  -.4709888   .1194536    -3.94   0.000    -.7053975   -.2365801
-------------+----------------------------------------------------------------var(e.y_i)|    2.40666    .191884                      2.058097    2.814257
------------------------------------------------------------------------------

接着是进行 dhreg 估计:

dhreg y_i x_i, hd(z_i)(output omitted)maximum likelihood estimates of double hurdle modelN = 1000
log likelihood = -984.07209
chi square hurdle equation = 67.264411
p hurdle equation = 2.374e-16
chi square above equation = 4.8518223
p above equation = .02761694
chi square overall = 69.895304
p overall = 6.644e-16--------------------------------------------------------------------------------|      coef         se          z          p   lower CI   upper CI
-------------+------------------------------------------------------------------
hurdle       |                                                                  z_i |  3.644556   .4443773   8.201488   2.22e-16   2.773592   4.515519_cons | -1.727589   .1522467   -11.3473   7.65e-30  -2.025987  -1.429191
above        |                                                                  x_i |   .416768    .189209   2.202685   .0276169   .0459251   .7876109_cons |  .5702333   .1428997   3.990444   .0000659    .290155   .8503115
sigma        |                                                                  _cons |  1.053116   .0643765   16.35869          0   .9269402   1.179292
--------------------------------------------------------------------------------

Tobit 模型估计

的系数为 0.362 (在 10% 水平上显著) , 而 double hurdle 模型估计
的系数为 0.417 (在 5% 水平上显著), 由本次模拟结果来看 Tobit 估计似乎接近真实值 (
实际系数为 0.3), 但是双栏模型可以将决定
的变量
的系数估计出来 (估计为3.645), 非常接近真实值 4 (在 1% 水平上显著)。

[注:我们尝试通过设置不同的种子,生成不同的随机数,发现 double hurdle 模型对

的估计有时候会比 Tobit 模型估计更加准确]。

3. 面板双栏模型 (Panel-hurdle model)

3.1 面板双栏模型基本原理

Dong and Kaiser (2008) 将双栏模型发展成面板双栏模型,并使用这个模型对家庭牛奶消费做实证分析。Dong 假设并验证了家庭牛奶消费总的来说由非经济因素和经济因素决定,非经济因素包括户主年龄、教育、种族背景等,经济因素包括收入、牛奶的价格等。在一定的时间内,非经济因素一般不会发生改变,并且在家庭是否产生购买牛奶的行为中起决定性作用。

  • 第一阶段 (first hurdle)

  • 第二阶段 (second hurdle)

  • 最终观测值

在第一个阶段中,

相当于非经济因素,
表示个体家庭是否会购买牛奶,基本不随着时间变化而改变;在第二个阶段中,
相当于经济因素,决定家庭购买牛奶的数量,
表示个体家庭潜在购买牛奶的数量,
代表个体效应, 且
与解释变量
均不相关。
表示个体家庭在第
期购买牛奶的数量。
  • 似然函数模型

样本最终的似然对数函数为:

3.2 面板双栏模型的 Stata 实现

Stata 中用 xtdhregboothreg 命令对面板数据进行双栏模型的估计。首先在 Stata 命令窗口中输入 help xtdhreg 命令即可查看其完整帮助文件。xtdhreg 命令的基本语法为:

xtdhreg depvar indepvars [if] [in] [, up ptobit hd(varlist) uncorr trace ///difficult constraints(numlist)]

各项的含义如下:

  • depvar: 表示被解释变量,即最终的可观测的
  • indepvars: 表示关键的解释变量,即决定
    (潜变量) 的解释变量
  • up: 将模型设置为右归并,并且设置
    最大值(默认为左归并)
  • ptobit: 将双栏模型设置为 p-tobit 模型
  • hd(varlist): 表示第一栏中决定
    的解释变量
  • millr: 用逆米尔斯比率来控制扰动项的相关性
  • uncorr: 表示第一栏和第二栏中的扰动项不相关
  • trace: 显示每一次迭代的系数
  • difficult: 当模型不收敛时,换用其他替代的算法
  • constraints(numlist): 允许对模型进行限制

在 Stata 命令窗口中输入 help boothreg 命令即可查看其完整帮助文件。boothreg 命令的基本语法为:

bootreg depvar indepvars [if] [in] [, up ptobit hd(varlist) millr ///margins(string) seed(integer) reps(integer) strata(varlist) cluster(varlist) ///capt maxiter(integer)]

各项的含义如下:

  • depvar: 表示被解释变量,即最终的可观测的
  • indepvars:表示关键的解释变量,即决定
    (潜变量) 的解释变量
  • up: 将模型设置为右归并,并且设置
    最大值(默认为左归并)
  • ptobit: 将双栏模型设置为 p-tobit 模型
  • hd(varlist): 表示第一栏中决定
    的解释变量
  • millr: 用逆米尔斯比率来控制扰动项的相关性
  • margins(string): bootstrep 估计的边际效应
  • seed(integer): 设置种子,为了使结果可重复
  • reps(integer): boostrap 重复的次数,默认是 50 次
  • strata(varlist): 进行分层抽样
  • capt: 自动忽略不收敛的情况
  • maxiter(integer): 设置迭代的最多次数,默认为 50

3.3 基于模拟分析的范例

本小节我们先模拟生成面板数据,然后再利用生成的数据进行模型估计。

  • 数据生成过程 (DPG)

面板数据的个体为

, 一共有
期。这些个体的决策 (是否 参与) 是由第一栏
是否大于 0 和第二栏
是否大于 0 共同决定的。值得注意的是,
不会随着时间
变化而改变,如果第一期
, 那么剩下的
期都会有
即该个体一直选择不参与; 而当
时,
,个体暂时不参与但并不会影响其他几期该的决策。另外,我们设置了个体随机效应
, 并且
与 第一个公式的误差项存在相关性。用 Stata 生成数据的过程如下:
clear all
set obs 2000
set seed 10011979
gen z_i = uniform()
set seed 1111122
gen u_i = rnormal(0, 3)
set seed 1222222
gen n_i = rnormal(0,3)
gen e_i1 = 0.9*u_i + sqrt(1-0.9^2)*n_i/* 面板数据生成过程 */
gen d_i = 0
replace d_i = 1 if -2 + 4*z_i + e_i1 > 0
gen id = _n
expand 5  // 将 T 设置为 5 期
bys id: gen t = _n
xtset id t
bysort id (t): gen x_it = rnormal(0,1) + rnormal(0,1) if _n==1
bysort id (t): replace x_it = .8 * x_it[_n-1] + rnormal(0,1) if _n!=1
gen e_i2 = rnormal(0,1)
gen y_it2 = 0.5 + 0.3*x_it + u_i + e_i2
corr e_i2 u_i // 检查e_i2和u_i的相关性
gen y_it1 = 0
replace  y_it1 = y_it2 if y_it2 > 0
gen y_it = y_it1*d_i
save data_process2.dta, replace  //保存模拟数据
  • 模型估计xtdhreg 命令进行双栏估计的结果如下:
use data_process2.dta, clear
help mdraws // 进行 xtdhreg 估计前,需要装`mdraws`包
xtdhreg y_it x_it, hd(z_i)
(output omitted)
Number of obs     =     10,000
Wald chi2(1)      =      46.82
Log likelihood = -9013.4217                     Prob > chi2       =     0.0000------------------------------------------------------------------------------Coef.   Std. Err.    z    P>|z|     [95% Conf. Interval]
----------------+-------------------------------------------------------------
hurdle          z_i |  .6908215   .1009566   6.84   0.000     .4929501    .8886929_cons | -.2702063   .0611108  -4.42   0.000    -.3899812   -.1504313
----------------+-------------------------------------------------------------
above           x_it |  .2971716   .0162833  18.25   0.000     .2652569    .3290863_cons |  3.887898   .1050517  37.01   0.000     3.682001    4.093796
----------------+-------------------------------------------------------------
sigma_u         _cons |  3.249278   .0942043  34.49   0.000     3.064641    3.433915
----------------+-------------------------------------------------------------
sigma_e         _cons |  .9920639    .012312  80.58   0.000     .9679329    1.016195
----------------+-------------------------------------------------------------
transformed_rho _cons | -.9211924   .0730788 -12.61   0.000    -1.064424   -.7779606
------------------------------------------------------------------------------rho:  tanh([transformed_rho]_cons)------------------------------------------------------------------------------|      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------rho |   -.726461   .0345118   -21.05   0.000    -.7941029   -.6588192
------------------------------------------------------------------------------separate Wald tests for joint significance of all explanatory variablesnoteif you use factor variables, i.e. the i., c., # and ## notation, you must runthe Wald test by hand. For detail see help fileestimates of joint significancechi square hurdle equation = 46.823275
p hurdle equation = 7.769e-12
chi square above equation = 333.06554
p above equation = 2.066e-74
chi square overall = 376.42223
p overall = 1.824e-82

bootdreg 命令进行双栏模型估计结果如下:

bootdhreg y_it x_it, hd(z_i)  cluster(id) capt
(output omitted)
maximum likelihood estimates of double hurdle modelN = 10000
log likelihood = -14962
chi square hurdle equation = 140.17438
p hurdle equation = 2.438e-32
chi square main equation = 140.17438
p main equation = 2.438e-32
chi square overall = 442.19897
p overall = 9.500e-97
bootstrap results------------------------------------------------------------------------------|      coef     se   p     lowciz      upciz     lowcip      upcip
------------+-----------------------------------------------------------------
hurdle      |                                                                 z_i |  1.002614   .122   0   .7634344   1.241794   .7598894   1.346414_cons | -.4531903   .072   0  -.5948118  -.3115688  -.6363495  -.2646514
main        |                    0                                            x_it |  .3388443   .052   0   .2370221   .4406664   .2289405   .4781399_cons |  2.279919   .132   0   2.020481   2.539356   1.868922   2.511813
sigma       |                                                                 _cons |  2.583072   .095   0   2.396594    2.76955   2.401081   2.808727
------------------------------------------------------------------------------

从回归结果可以看出,xtdhregbootdhreg 对样本的

系数估计值 (0.297 和 0.339) 非常接近
真实系数 (0.3),且均在 1% 水平上显著。

参考文献

  1. Bruno García, 2013, Implementation of a Double-Hurdle Model, Stata Journal, 13(4): 776–794. [pdf]
  2. Christoph Engel, Peter G. Moffatt, 2014, Dhreg, Xtdhreg, and Bootdhreg: Commands to Implement Double-Hurdle Regression, Stata Journal, 14(4): 778–797. [pdf]
  3. Dong, Diansheng, and H. M. Kaiser. Studying household purchasing and nonpurchasing behaviour for a frequently consumed commodity: two models[J]. Applied Economics, 2008, 40(15):1941-1951. [PDF]
  4. Engel C, Moffatt P G. Dhreg, xtdhreg, and bootdhreg: Commands to implement double-hurdle regression[J]. Stata Journal, 2014, 14(4):778-797. [PDF]

相关课程

连享会-直播课 上线了! http://lianxh.duanshu.com 免费公开课:
  • 直击面板数据模型 - 连玉君,时长:1 小时 40 分钟
  • Stata 33 讲 - 连玉君, 每讲 15 分钟.
  • 部分直播课 课程资料下载 (PPT,dofiles 等)

90ea14b404e82cdaffc5c3c6d9393ff7.png

Note: 助教招聘信息请进入「课程主页」查看。

因果推断-内生性 专题 ⌚ 2020.11.12-15
主讲:王存同 (中央财经大学);司继春(上海对外经贸大学) 课程主页https://gitee.com/arlionn/YG | 微信版

e62c4a7f12e61d86d84b329c2a9ea94e.png
空间计量 专题 ⌚ 2020.12.10-13
主讲:杨海生 (中山大学);范巧 (兰州大学) 课程主页https://gitee.com/arlionn/SP | 微信版

997743ce8844e7ba1e0e59fb570b90d0.png

0c79468ee81c8062033b3d991debf08d.png

关于我们
  • Stata 连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。直播间 有很多视频课程,可以随时观看。
  • 连享会-主页知乎专栏,300+ 推文,实证分析不再抓狂。
  • 公众号推文分类:计量专题 | 分类推文 | 资源工具。推文分成 内生性 | 空间计量 | 时序面板 | 结果输出 | 交乘调节 五类,主流方法介绍一目了然:DID, RDD, IV, GMM, FE, Probit 等。

db702771e790ed014324ce51f6b1a5fa.png

连享会小程序:扫一扫,看推文,看视频……

73c8c5608d25bc897f1aedc6aedc4183.png

扫码加入连享会微信群,提问交流更方便

0ad1dd874a32dd1441dc422b3fb1145a.png

这篇关于double operator[](int i)_Stata: 双栏模型简介 (Double-hurdle model)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/197714

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

ASIO网络调试助手之一:简介

多年前,写过几篇《Boost.Asio C++网络编程》的学习文章,一直没机会实践。最近项目中用到了Asio,于是抽空写了个网络调试助手。 开发环境: Win10 Qt5.12.6 + Asio(standalone) + spdlog 支持协议: UDP + TCP Client + TCP Server 独立的Asio(http://www.think-async.com)只包含了头文件,不依

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者