[总结] 视频广告秒级语义解析代码总结

本文主要是介绍[总结] 视频广告秒级语义解析代码总结，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

0. 目录

1. 环境配置

1.0 环境配置：

pip install tensorflow==1.14
pip install scenedetect[opencv] #分割镜头的时候用到
pip install baidu-aip

1.1 链接数据集

将 VideoStructuring/dataset 链接到主目录 /home/tione/notebook/algo-2021/dataset

!ln -s /home/tione/notebook/algo-2021/dataset /home/tione/notebook/VideoStructuring/dataset

2. 视频时序分割模型训练

对于structuring任务，训练需要分为两步，视频切分与标签预测。

对于视频切分，需要完成特征提取（./run.sh seg_extract）与数据集生成（./run.sh seg_gt）两项任务。
为了简化操作，baseline已完成了前置步骤，用户可以直接使用下列脚本进行视频切分模型的训练。
训练完成后，模型存在于VideoStructuring/SceneSeg/run/目录下。

!sudo chmod a+x ./run.sh && ./run.sh seg_train

3. 视频幕多标签分类模型预测

对于标签预测，需要完成 特征提取（./run.sh tag_extract）与 数据集生成（./run.sh tag_gt）两项任务。
为了简化操作，baseline已完成了前置步骤，用户可以直接使用下列脚本进行 视频标签模型 的训练。
训练完成后，模型存在于VideoStructuring/MultiModal-Tagging/checkpoints/目录下。

!sudo chmod a+x ./run.sh && ./run.sh tag_train

4. 模型测试

Baseline的测试可以直接使用 ./run.sh test [CHECKPOINT_DIR] 进行，成功执行后会在VideoStructuring/MultiModal-Tagging/results/目录下生成 structuring_tagging_5k.json结果文件。
提交这个文件就可以参与排名。
注意: ./run.sh test 也分为 视频切分 与 标签预测 两个步骤，视频切分的时间比较长（32小时左右），用户可以尝试进行优化，标签预测的时间在30分钟左右。

!sudo chmod a+x ./run.sh && ./run.sh test checkpoints/structuring_train5k/export/step_7000_0.7875

这篇关于[总结] 视频广告秒级语义解析代码总结的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

[总结] 视频广告秒级语义解析代码总结

0. 目录

1. 环境配置

1.0 环境配置：

1.1 链接数据集

2. 视频时序分割模型训练

3. 视频幕多标签分类模型预测

4. 模型测试

相关文章

PostgreSQL的扩展dict_int应用案例解析

深度解析Java DTO(最新推荐)

深度解析Java项目中包和包之间的联系

Java中的雪花算法Snowflake解析与实践技巧

JavaSE正则表达式用法总结大全

Java中调用数据库存储过程的示例代码

Visual Studio 2022 编译C++20代码的图文步骤

使用Python绘制3D堆叠条形图全解析

深度解析Python装饰器常见用法与进阶技巧

解析C++11 static_assert及与Boost库的关联从入门到精通

[总结] 视频广告秒级语义解析 代码总结

0. 目录

1. 环境配置

1.0 环境配置：

1.1 链接数据集

2. 视频时序分割 模型训练

3. 视频幕多标签分类 模型预测

4. 模型测试

相关文章

[总结] 视频广告秒级语义解析代码总结

2. 视频时序分割模型训练

3. 视频幕多标签分类模型预测