本文主要是介绍与 CV、语音识别相比,NLP 项目在业务中落地往往较慢,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
与 CV、语音识别相比,NLP 项目在业务中落地往往较慢
NLP 落地项目往往和业务强相关。不像图像识别、语音识别,通用能力在具体业务也有大量落地场景,业务和算法协作边界和指标相对好确定。而 NLP 项目在业务中落地往往会比较慢,需要上下游不断深度磨合对齐。
NLP 解决的是最难的认知智能,而人类语言的歧义性、复杂性、动态性令其挑战重重。但 NLP 商业化落地必须面对这些本质的难题,所以不太可能有通用性的“一招吃遍天”的技术方案。
“尽管现在的预训练模型一直在往这个方向努力,但我认为起码目前这种 Transformer 式的,或者更通用地说,DNN 这种蜂巢智能式的技术范式不太行。所以,大家能看到也有不少研究学者在知识图谱类的各种其他范式上在做努力”蒋宏飞说。
通用性的模型既然走不通,那垂类单一具体场景任务为什么也不能快速搭建?这个问题又涉及到数据的问题。数据标准的对齐、数据标注一致且高效、数据覆盖度和均衡度、长尾数据的处理、数据动态漂移等都是 NLP 从业者每天面对的麻烦事。而相关的方法论和基础工具还很不系统、不齐备,这是未来想达到快速商业化目的前必须打好的基础。
明年,NLP 将在哪些场景实现规模化落地?
2022 年,NLP 的大规模化应用可能会出现在以下行业出现突破:
-
教育智能化
-
场景化高标准机器辅助翻译,如专业领域文档翻译、会议实时翻译等。
-
服务运营智能化:培训、销售、营销、服务等场景的智能化。
-
外文学习 / 写作智能辅助,参考 Grammarly 和 Duolingo 的快速发展。
-
医疗智能化。文本广泛存在于电子病历、临床试验报告、医学产品说明书、医学文献中。分析、挖掘和利用这些文本,有大量且能直接使用的场景,可能会有突破式发展。
-
代码智能分析。代码 bug 识别、代码智能优化等。
2022 年,NLP 值得关注的技术点
-
基于提示的微调 (prompt-based tuning) 的技术。
-
具有逻辑推理的文本生成技术、具有良好控制性以及一致性的文本生成技术。文本生成要在严肃场景用起来就必须满足这些,否则只能应用在娱乐场景。
-
多模态技术。如 NLP+CV、 NLP + Image、 NLP+ Speech 等。
-
主动学习、数据增强等。NLP 大规模快速落地时的很多痛点需要这些技术来缓解。
-
代码智能。代码问题识别、代码翻译、自动代码优化、代码工作量评估 (如 Merico 的方案)。
这篇关于与 CV、语音识别相比,NLP 项目在业务中落地往往较慢的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!