Azure 指南/语音服务

在本节中，我们将探讨 Azure 的另一项服务：语音和文本识别。

简介

它是一套工具，使开发人员能够快速轻松地将语音和文本（双向）功能添加到其应用程序（可以是各种平台）。它也可以在线工作，因此无需将任何内容与程序打包在一起。

与计算机视觉不同，它确实有一个免费层^[1]，但在可处理的体积方面受到很大限制。对于除最简单的应用程序之外的所有应用程序，使用付费层通常是一个更好的主意。此外，有一个专门的 30 天试用版，这可能是一个更好的选择^[2]。

用法

Azure 语音服务的语音转文本，也称为语音转文本，支持将音频流实时转录为文本，您的应用程序、工具或设备可以将其用作命令输入进行使用、显示和操作。该服务由微软用于 Cortana 和 Office 产品的相同识别技术支持，并且与翻译和文本转语音无缝配合使用。
– https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-to-text

它取决于使用的语言。例如，对于 Java 项目，您需要使用 Maven^[3]。建议您学习示例代码，并将其用作集成到最终应用程序的起点。请注意，在文本转语音方面，Java 没有提供示例代码^[4]，因此您需要尝试从提供的 C# 或 Python 代码中理解它。

请记住，您需要先从 Azure 门户（portal.azure.com）获取语音 API 密钥，并创建语音 API 密钥供应用程序使用。

如果您之前使用过 Bing 语音或自定义语音服务，则需要迁移到 Azure 的语音服务^[5] ^[6]。

参考文献

[1] ttps://azure.microsoft.com/en-us/pricing/details/cognitive-services/speech-services/

[2] ttps://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/get-started

[3] ttps://docs.microsoft.com/en-in/azure/cognitive-services/speech-service/quickstart-java-jre

[4] ttps://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/rest-text-to-speech

[5] ttps://docs.microsoft.com/en-in/azure/cognitive-services/speech-service/how-to-migrate-from-bing-speech

[6] ttps://docs.microsoft.com/en-in/azure/cognitive-services/speech-service/how-to-migrate-from-custom-speech-service

[1]

[2]

[3]

[4]

[5]

[6]