智能语音交互市场近年来发展迅速,其典型的应用之一智能音箱产品如今已走入千家万户,深受大家喜爱。智能音箱产品的核心就是语音处理,包括音频采集、语音识别(ASR)、自然语言处理(NLP)、文语合成(TTS)、音频播放五大部分。目前除了音频采集和播放必须在嵌入式端实现外,其余三部分一般都在云端处理(嵌入式端通过有线(USB)或无线(Wifi/BLE)将音频数据发送到云端)。痞子衡对语音处理一直比较感兴趣,最近在玩Python也注意到Python里有很多语音处理库,因此打算从零开始写一个基于Python的语音处理工具,这个语音处理工具我们暂且叫她pzh-speech。


  大家好,我是痞子衡,是正经搞技术的痞子。本系列痞子衡给大家介绍的是语音处理工具pzh-speech诞生。

  智能语音交互市场近年来发展迅速,其典型的应用之一智能音箱产品如今已走入千家万户,深受大家喜爱。智能音箱产品的核心就是语音处理,包括音频采集、语音识别(ASR)、自然语言处理(NLP)、文语合成(TTS)、音频播放五大部分。目前除了音频采集和播放必须在嵌入式端实现外,其余三部分一般都在云端处理(嵌入式端通过有线(USB)或无线(Wifi/BLE)将音频数据发送到云端)。痞子衡对语音处理一直比较感兴趣,最近在玩Python也注意到Python里有很多语音处理库,因此打算从零开始写一个基于Python的语音处理工具,这个语音处理工具我们暂且叫她pzh-speech,初步计划为pzh-speech设计4大功能:wav音频录制,语音识别,文语合成,音频播放,第一个稳定正式版v1.0.0效果如下:

  • pzh-speech的github: https://github.com/JayHeng/pzh-py-speech.git


©著作权归作者所有:来自51CTO博客作者Jay豹哥的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. 暴力堆数据没用!NLP和语音技术突破难在哪?
  2. 苹果AI技术新突破:Siri可识别热门单词和多语种说话者
  3. 人机语音对话技术在58同城的应用实践
  4. 基于Zynq SoC的D类音频放大器
  5. 如何在苹果Mac“语音备忘录”中播放录音?
  6. Amazon Alexa和Google Home语言系统的前驱服务者:13个MEMS 麦克风
  7. Mac电脑设置语音详细度的方法
  8. 用 WebRTC 打造一个音乐教育 App,要解决哪些音质难题?
  9. FFmpeg-kkFileView音频服务安装

随机推荐

  1. android studio更新提示网络连接失败的解
  2. ToolBar的使用
  3. android 自定义控件之折线图自己写代码,不
  4. android webview 使用
  5. Android欢迎界面实现
  6. Android Studio -- 设置字体样式
  7. android Button拖动
  8. react-native android 环境配置
  9. 转:Android联系人数据库全解析
  10. Android广播的一些事