语音合成和语音识别

老早以前测试过微软语音合成,那个声音很难听,不清晰。此后对英语语音合成就不太注意。近来,在bing翻译界面,偶尔按一下喇叭按钮,觉得声音挺不错了。

以下例子是在网页中实现语音合成,在chrome测试通过。

<html>

<script type=”text/javascript”>
var msg = new SpeechSynthesisUtterance(‘In physics, a frame of reference (or reference frame) consists of …’);
msg.lang = ‘en’;
msg.rate=’0.3′;
msg.voice = speechSynthesis.getVoices().filter(function(voice) {
return voice.name == ‘Whisper’;
})[0];
speechSynthesis.speak(msg);

</script>

</html>

语音识别

利用 SpeechRecognition() 的网页例子,均未通过。原因是,它需要利用google服务器的api,被挡住了。测试几个国外的语音识别web应用,都未成功。原因也是api被挡住。

有一个网站由用户上传语音文件,这个可能会成功。

arctime,是个做字幕的软件,刚出来,免费。其中有语音识别功能。先生成一个空白字幕,然后右键语音识别。可行。2000次免费。后来,把空白字幕时间加长到几分钟,就一直提示“识别中”。

百度语音平台,注册以后,测试php版本rest api,报错。

微软windows 10 语音识别,是用语音控制电脑。这是作为孩子的玩具,作为双手残疾者的工具。微软另有语音识别软件,收费。

语音识别,消耗服务器资源,小公司提供不了免费服务。较大或大公司,似乎除了google,都是收费的。

借助语音识别,听英语授课,门槛降低了。