大家在做传统的图像处理和深度学习时经常用到对
视频的处理
,这里放上python的opencv库实现的源码,功能是
读取视频的每一帧,将每一帧进行操作后重新整合成一个新的视频
,供大家参考使用:
import cv2
cap = cv2.VideoCapture('视频路径') #读取视频
fourcc = cv2.VideoWriter_fourcc(*'XVID')#设定输出视频的编码格式
#读取帧宽帧高
frame_width = int(cap.get(3))
frame_height = int(cap.get(4))
fps = cap.get(5)
out = cv2.VideoWriter('output.avi', fourcc, fps, (frame_width,frame_height))#设定输出视频相关参数 帧尺寸必须和输入时一致才能写入输出 帧率无所谓
#检测视频是否读取成功(首帧)
if cap.isOpened():
ret,frame = cap.read()
else:
ret = False
#只要视频未读取完 就一直循环:
while ret:
ret,frame = cap.read() #读取帧
if frame is not None: #防止视频结束后读取错误
'''
这里是一系列帧操作,假设处理完后的帧名叫img
'''
# cv2.namedWindow("img", cv2.WINDOW_NORMAL)
# cv2.resizeWindow("img", 1280, 720)
# cv2.imshow("img",img)
# if cv2.waitKey(10) & 0xFF == ord('q'):
# break
out.write(img) #写入输出视频
#一系列释放
cap.release()
out.release()
# cv2.destroyAllWindows()
这一串源码,大家在
修改自己的视频路径
、
填充自己需要的帧处理操作
后可直接使用。
除了上述给出的注释外,写下一些使用时的
注意点
:
1.关于编码格式fourcc的选择,不限于这里的“XVID格式”:
cv2.VideoWriter_fourcc(‘I’, ‘4’, ‘2’, ‘0’),该参数是YUV编码类型,文件名后缀为.avi
cv2.VideoWriter_fourcc(‘P’, ‘I’, ‘M’, ‘I’),该参数是MPEG-1编码类型,文件名后缀为.avi
cv2.VideoWriter_fourcc(‘X’, ‘V’, ‘I’, ‘D’),该参数是MPEG-4编码类型,文件名后缀为.avi
cv2.VideoWriter_fourcc(‘T’, ‘H’, ‘E’, ‘O’),该参数是Ogg Vorbis,文件名后缀为.ogv
cv2.VideoWriter_fourcc(‘F’, ‘L’, ‘V’, ‘1’),该参数是Flash视频,文件名后缀为.flv
2.cv2.VideoWriter()函数,第一个参数是输出视频名称,第二个参数就是视频编码格式,第三个参数是输出视频的帧率(
可以任意选择
),输出帧的尺寸(
这个非常关键,要确保输出帧的尺寸和输入图像一致,否则输出的视频将出现错误,这里采用了cap.get方法解决
)。
3.if frame is not None
不能省去
,因为在视频读取完最后一帧后,ret的值将依旧为真,而frame值为空,如果不加这句将导致视频读取完后报错读不到frame:
‘NoneType’ object has no attribute ‘shape’
4.
注释部分
以窗口的形式呈现输出视频,大家可以自行调整窗口的尺寸和相关设置。
注意:
如果最后输出的视频
只有几KB大小,并且无法打开
,很可能是cv2.VideoWriter出了问题,主要检查
fourcc
和
帧宽帧高
的设置。