跳转到内容

Azure 指南/语音服务

来自维基教科书,开放书籍,开放世界

在本节中,我们将探讨 Azure 的另一项服务:语音和文本识别。

它是一套工具,使开发人员能够快速轻松地将语音和文本(双向)功能添加到其应用程序(可以是各种平台)。它也可以在线工作,因此无需将任何内容与程序打包在一起。

与计算机视觉不同,它确实有一个免费层[1],但在可处理的体积方面受到很大限制。对于除最简单的应用程序之外的所有应用程序,使用付费层通常是一个更好的主意。此外,有一个专门的 30 天试用版,这可能是一个更好的选择[2]

Azure 语音服务的语音转文本,也称为语音转文本,支持将音频流实时转录为文本,您的应用程序、工具或设备可以将其用作命令输入进行使用、显示和操作。该服务由微软用于 Cortana 和 Office 产品的相同识别技术支持,并且与翻译和文本转语音无缝配合使用。

https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-to-text

它取决于使用的语言。例如,对于 Java 项目,您需要使用 Maven[3]。建议您学习示例代码,并将其用作集成到最终应用程序的起点。请注意,在文本转语音方面,Java 没有提供示例代码[4],因此您需要尝试从提供的 C# 或 Python 代码中理解它。

请记住,您需要先从 Azure 门户(portal.azure.com)获取语音 API 密钥,并创建语音 API 密钥供应用程序使用。

如果您之前使用过 Bing 语音或自定义语音服务,则需要迁移到 Azure 的语音服务[5] [6]

参考文献

[编辑 | 编辑源代码]
  1. https://azure.microsoft.com/en-us/pricing/details/cognitive-services/speech-services/
  2. https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/get-started
  3. https://docs.microsoft.com/en-in/azure/cognitive-services/speech-service/quickstart-java-jre
  4. https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/rest-text-to-speech
  5. https://docs.microsoft.com/en-in/azure/cognitive-services/speech-service/how-to-migrate-from-bing-speech
  6. https://docs.microsoft.com/en-in/azure/cognitive-services/speech-service/how-to-migrate-from-custom-speech-service
华夏公益教科书