本文主要是介绍用Python获取可能是全网最全的杰尼龟表情包!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
杰尼龟系列表情包在广大网友之间传递快乐,红极一时。我想是杰尼龟可爱的外表以及憨憨的形态,圆圆的脸蛋大大的眼睛,且其经常在剧中摆出各式夸张表情,因而被广大网友制成各式各样的表情包,并且深受沙雕网友的喜爱。
正好,我也是这沙雕网友大军中的一员,通过各种渠道收集了一些杰尼龟的表情包。但,我想要更多,只有拥有沙雕表情包最多的人才能在斗图中立于不败之地,于是便有了 用Python获取可能是全网最全的杰尼龟表情包 这一系列。本系列旨在获取更多更多的杰尼龟表情包,传递更多欢乐。!
全系列一共三弹,每一弹都运用Python作为编程语言,主要涉及网络爬虫、数据图像处理以及机器学习这几个应用领域,今天便是这第一弹!
爬取视频
如何获得更多的杰尼龟表情包?
这些流传的表情包无非就是截取自动画片《精灵宝可梦》,然后有选择性地缩放或是剪切图片,再对应图片加上相关的文字。因此按照这个逻辑,我们需要首先在这视频上做文章。
作为第一代御三家的一员,杰尼龟主要活跃在《精灵宝可梦》的第一部无印篇,因而我们仅需要考虑第一部的视频,而这第一部中,不乏一些杰尼龟专集。
直接下载这第一部的视频费时费力,恰好B站有up主上传了所有含杰尼龟的集数合集,这里偷个小懒,我直接采用了@Henryhaohao写得非常棒的B站视频爬虫将该专辑合集的所有视频下载到本地。
视频切割
既然已经将所有视频下载,接下来便可以利用openCV将每个视频切割为图片。这里fps便是帧率,意为每一秒刷新的图片数量,frames则是一整段视频中总的图片数量。
def vedio_to_pic(path):vedio_path=os.listdir(path)count=0for vedio in vedio_path: videoCapture=cv2.VideoCapture()videoCapture.open(os.path.join(path,vedio,vedio+'.flv'))fps=videoCapture.get(cv2.CAP_PROP_FPS)frames = videoCapture.get(cv2.CAP_PROP_FRAME_COUNT) print("fps=",fps,"frames=",frames)for i in range(int(frames)):ret,frame=videoCapture.read()if ret:if i%int(fps/5)==0: cv2.imwrite("pic/jieni{}_{}.jpg".format(count+1,i),frame)count+=1
这里每一帧仅保存1/5的图片,因为每一帧内的图片较为相似,帧内所有图片获取存在较大的冗余。
至此,我们便拥有了海量可能包含杰尼龟的图片,下一弹便来讲讲如何使用机器学习来帮助我们筛选那些包含杰尼龟的图片!
源码获取加群:850591259
这篇关于用Python获取可能是全网最全的杰尼龟表情包!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!