**事出有因:**我想调用科大讯飞的语音听写SDK包,但是这个包对输入音频有一定的要求,格式工厂毕竟不是个办法——网上找来找去,有用信息也是零零散散,所幸还是有所收获——请将以下代码写入
get_audio.py
文件中。
特别说明在代码后,看了还是有用的
特别说明在代码后,看了还是有用的
# -*- coding:utf-8 -*-
# -*- author:zzZ_CMing CSDN address:https://blog.csdn.net/zzZ_CMing
# -*- 2018/07/12; 15:19
# -*- python3.5
import pyaudio
import wave
input_filename = "input.wav" # 麦克风采集的语音输入
input_filepath = "音频存储位置" # 输入文件的path
in_path = input_filepath + input_filename
def get_audio(filepath):
aa = str(input("是否开始录音? (是/否)"))
if aa == str("是") :
CHUNK = 256
FORMAT = pyaudio.paInt16
CHANNELS = 1 # 声道数
RATE = 11025 # 采样率
RECORD_SECONDS = 5
WAVE_OUTPUT_FILENAME = filepath
p = pyaudio.PyAudio()
stream = p.open(format=FORMAT,
channels=CHANNELS,
rate=RATE,
input=True,
frames_per_buffer=CHUNK)
print("*"*10, "开始录音:请在5秒内输入语音")
frames = []
for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
data = stream.read(CHUNK)
frames.append(data)
print("*"*10, "录音结束\n")
stream.stop_stream()
stream.close()
p.terminate()
wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb')
wf.setnchannels(CHANNELS)
wf.setsampwidth(p.get_sample_size(FORMAT))
wf.setframerate(RATE)
wf.writeframes(b''.join(frames))
wf.close()
elif aa == str("否"):
exit()
else:
print("无效输入,请重新选择")
get_audio(in_path)
# 联合上一篇博客代码使用,就注释掉下面,单独使用就不注释
get_audio(in_path)
特别说明:
一、这是一个可循环采样的脚本,介于输出文件名都是
input.wav
,所以在你保存音频的path下永远只生成一个音频文件(后一个会覆盖前一个),你可以自己改成不循环的——但是循环的脚本用处更大,比如说做人机对话不能说一句就挂了吧,哈哈哈
二、调用的时候,也要先在你的python主程序开始处导入这个.py文件。怎么导入!!!上一篇也说了你没学会?—— 就像你导入其他外置包一样——
from get_audio import get_audio
;
三、你可以结合我上一篇博客
Python调用科大讯飞语音听写的SDK包
,把这两个代码联合使用,怎么联合使用:
- 注释掉本篇博客最后一行;
-
将两篇博客中的录音文件地址(本篇path是
in_path
,上一篇path是
filepath
)指向同一个目录下的同一个文件,两个的作用分别是:本篇博客代码用来采集音频,将音频存入path中,上篇博客代码通过path调用该音频,转为文本输出; - 主函数大致代码如下:
# 采集音频
get_audio(in_path)
sys.stdout.write("you ask>> ")
# 科大语音听写:语音转文本输出 请参考上一篇博客
input_seqs = keda_API.XF_text(in_path, audio_rate)
版权声明:本文为zzZ_CMing原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。