企业数字化转型的测度难题：基于大语言模型的新方法与新发现

本文主要是介绍企业数字化转型的测度难题：基于大语言模型的新方法与新发现，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

《经济研究》新文章《企业数字化转型的测度难题：基于大语言模型的新方法与新发现》运用机器学习和大语言模型构造一套新的企业数字化转型指标。理论分析和数据交叉验证均表明，构建的指标相对已有方法更准确：

1.第一步：选择“管理层讨论与分析”和“目录、释义及重大风险提示”这两个章节作为文本数据

2.第二步：构建待预测句库和待标记句库。先将全部文本按照句号和分号分割，得到待预测句库。使用关键词抽取具有不同代表性的年报句子，并与随机抽取的句子一起构成待标记句库。其次，定义数字技术，并构建数字技术词典。综合政策口径、企业界的定义，将数字技术分为六种类型：大数据、人工智能、移动互联、云计算、物联网和区块链

3.第三步：对待标记句库的句子进行人工标注。先判断企业使用了哪种/哪几种数字技术，进而判断企业是否进行了数字化转型。

4.第四步：采用有监督的机器学习方法训练模型。使用百度开源的、内嵌ERNIE的PaddleHub框架来开展模型训练，用其内置的tokenizer函数快速将句子转为ERNIE模型训练所需要的格式。将全部被标记的句子按照8∶1∶1的比例分为训练集、测试集和验证集。同时为了比较不同模型之间的分类性能，基于PaddleHub框架训练了BERT_base_Chinese，同时基于sklearn框架训练了SVM（支持向量机）、NeuralNetworks（神经网络）、SVM与NeuralNetworks结合的Voting算法、KNN（K近邻）以及GaussianNB（朴素贝叶斯）共七类常见模型。

5.第五步：采用ERNIE模型构造数字化转型指标基于ERNIE大语言模型，对2006—2020年待预测句库中的每一句文本进行预测，判断企业是否以及使用何种数字技术，构造了企业数字化转型哑变量。

在此基础上，文章实证检验企业数字化转型对财务绩效的影响。研究发现：第一，企业数字化转型能够显著提高财务绩效，其中，大数据、人工智能、移动互联、云计算和物联网均有明显作用，但区块链并没有明显的作用；第二，只有在财务绩效较差的企业中，数字化转型才能够显著提高财务绩效；第三，企业数字化转型提高财务绩效的主要渠道包括改善效率和降低成本。