本文主要是介绍【Coggle 】汽车领域多语种迁移学习挑战赛,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
文章目录
- 活动背景
- 一、赛题介绍
- 二、打卡任务
- 任务1:比赛报名
- 步骤1:报名比赛
- 步骤2:下载比赛数据(点击比赛页面的赛题数据)
- 步骤3:解压比赛数据,并使用pandas进行读取;
- 步骤4:查看训练集和测试集字段类型,并将数据读取代码写到博客;
活动背景
Coggle 组织了一次竞赛训练营活动,希望能够帮助大家入门数据竞赛。下载比赛数据(点击比赛页面的赛题数据)为其中的一个挑战项目,如下为本次参赛的打卡内容。
一、赛题介绍
国内车企为提升产品竞争力、更好走向海外市场,提出了海外市场智能交互的需求。但世界各国在“数据安全”上有着严格法律约束,要做好海外智能化交互,本土企业面临的最大挑战是数据缺少。本赛题要求选手通过NLP相关人工智能算法来实现汽车领域多语种迁移学习。
本次迁移学习任务中,讯飞智能汽车BU将提供较多的车内人机交互中文语料,以及少量的中英、中日、中阿平行语料作为训练集,参赛选手通过提供的数据构建模型,进行意图分类及关键信息抽取任务,最终使用英语、日语、阿拉伯语进行测试评判。
二、打卡任务
任务1:比赛报名
步骤1:报名比赛
报名地址:http://challenge.xfyun.cn/topic/info?type=car-multilingual&ch=ds22-dw-zmt05
步骤2:下载比赛数据(点击比赛页面的赛题数据)
步骤3:解压比赛数据,并使用pandas进行读取;
步骤4:查看训练集和测试集字段类型,并将数据读取代码写到博客;
import pandas as pdtrain_cn = pd.read_excel('./汽车领域多语种迁移学习挑战赛初赛公开数据_A榜/汽车领域多语种迁移学习挑战赛初赛训练集/中文_trian.xlsx')
train_ja = pd.read_excel('./汽车领域多语种迁移学习挑战赛初赛公开数据_A榜/汽车领域多语种迁移学习挑战赛初赛训练集/日语_train.xlsx')
train_en = pd.read_excel('./汽车领域多语种迁移学习挑战赛初赛公开数据_A榜/汽车领域多语种迁移学习挑战赛初赛训练集/英文_train.xlsx')
test_ja = pd.read_excel('./汽车领域多语种迁移学习挑战赛初赛公开数据_A榜/testA.xlsx', sheet_name='日语_testA')
test_en = pd.read_excel('./汽车领域多语种迁移学习挑战赛初赛公开数据_A榜/testA.xlsx', sheet_name='英文_testA')print(train_cn.shape, train_cn.shape, train_en.shape, test_ja.shape, test_en.shape )
print(train_cn.dtypes, train_cn.dtypes, train_en.dtypes, test_ja.dtypes, test_en.dtypes)
输出结果:
这篇关于【Coggle 】汽车领域多语种迁移学习挑战赛的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!