【2020华为云AI实战营】 基于ModelArts使用I3D模型实现视频动作识别
目标: 实现一段根据视频计算得到rgb.npy和flow.npy的代码,并跑通I3D模型对新视频的动作识别预测
视频动作识别是指对一小段视频中的内容进行分析,判断视频中的人物做了哪种动作。视频动作识别与图像领域的图像识别,既有联系又有区别,图像识别是对一张静态图片进行识别,而视频动作识别不仅要考察每张图片的静态内容,还要考察不同图片静态内容之间的时空关系。比如一个人扶着一扇半开的门,仅凭这一张图片无法判断该动作是开门动作还是关门动作。
视频分析领域的研究相比较图像分析领域的研究,发展时间更短,也更有难度。视频分析模型完成的难点首先在于,需要强大的计算资源来完成视频的分析。视频要拆解成为图像进行分析,导致模型的数据量十分庞大。视频内容有很重要的考虑因素是动作的时间顺序,需要将视频转换成的图像通过时间关系联系起来,做出判断,所以模型需要考虑时序因素,加入时间维度之后参数也会大量增加。
进入ModelArts¶
点击如下链接:https://www.huaweicloud.cn/product/modelarts.html , 进入ModelArts主页。点击“立即使用”按钮,输入用户名和密码登录,进入ModelArts使用页面。
进入ModelArts
点击如下链接:https://www.huaweicloud.cn/product/modelarts.html , 进入ModelArts主页。点击“立即使用”按钮,输入用户名和密码登录,进入ModelArts使用页面。进入控制台:
创建ModelArts Notebook
下面,我们在ModelArts中创建一个Notebook开发环境,ModelArts Notebook提供网页版的Python开发环境,可以方便的编写、运行代码,并查看运行结果。
第一步:在ModelArts服务主界面依次点击“开发环境”、“创建”
第二步:填写notebook所需的参数:
参数 | 说明 |
---|---|
计费方式 | 按需计费 |
名称 | Notebook实例名称,如 action_recognition |
工作环境 | Python3 |
资源池 | 选择"公共资源池"即可 |
类型 | GPU |
规格 | [限时免费]体验规格GPU版 |
存储配置 | EVS |
磁盘规格 | 5GB |
第三步:配置好Notebook参数后,点击下一步,进入Notebook信息预览。确认无误后,点击“立即创建”
点击右上角的"New",然后创建TensorFlow 1.13.1开发环境。
1、“根据视频计算得到rgb.npy和flow.npy”的代码提供给你,点此链接进行下载,下载完成后,回到课
程案例代码,找到"import i3d"所在的那个cell,在这个cell之后新建一个cell,复制粘贴刚下载的代码到
新建的cell中;--就是在cell21的位置后面新建一个cell,然后则会个cell把下载的代码copy进去。
with tf.Session() as sess:
...
rgb_sample = np.load(_SAMPLE_PATHS['rgb'])
tf.logging.info('RGB data loaded, shape=%s', str(rgb_sample.shape))
feed_dict[rgb_input] = rgb_sample
...
flow_sample = np.load(_SAMPLE_PATHS['flow'])
tf.logging.info('Flow data loaded, shape=%s', str(flow_sample.shape))
feed_dict[flow_input] = flow_sample
out_logits, out_predictions = sess.run(
[model_logits, model_predictions],
feed_dict=feed_dict)
2、刚复制的代码并不能直接执行,找到该块代码中带有注释 “# TODO,填写视频所在的路径” 的那一
行,这一行是需要你填写待预测视频所在的路径,课程案例dataset_subset目录中已经准备好了多个视
频,比如Bowling目录下有32个视频,本次作业请你使用Bowling目录下其中任意一个视频的路径进行
填写;
3、视频路径填写完成后,执行该代码块,耗时30秒到两分钟(原视频的总帧数越多,耗时就越长)之
后,会生成两个npy文件,接下来你需要修改下一个cell中的_SAMPLE_VIDEO_FRAMES参数值为视频总
帧数减1,SAMPLE_PATHS参数中的路径为刚才生成的两个npy路径;
4、修改完成后,执行当前cell及之后的代码,完成新视频的动作识别预测。
- 点赞
- 收藏
- 关注作者
评论(0)