ASR(Automatic Speech Recognition)
语音识别使用 Apple iOS10 SDK中的 speech.framework即可
语音识别(ASR)领域,业界还有一个leading framework: Nuance
他们主要搞语音和图像方面,卖各种商业解决方案。早年间传闻 iPhone4S 那代的Siri 语音识别使用Nuance服务器
Translator
语音识别之后,我们可以利用文本做一些翻译功能:
这里有些branchmark
不过因为,国内Google被墙了。大多数用户访问不了Google的服务。不用比较,只能选择Microsoft了。。。囧
使用Microsoft Translator服务可以实现 翻译功能
支持文本翻译文本,文本翻译成语音
Getting Started
To access the Microsoft Translator Text Translation API you will need to sign up for Microsoft Azure. Follow these steps.
- Sign up for a Microsoft Azure account at http://azure.com
- After you have an account go to http://portal.azure.com
- Select the + New option.
- Select Intelligence from the list of services.
- Select Cognitive Services APIs
- Select the API Type option.
- Select Text Translation.
- In the Pricing Tier section select the pricing tier that fits your needs.
- Fill out the rest of the form, and select the Create button.
- You are now subscribed to Microsoft Translator.
- Go to All Resources and select the Microsoft Translator API you subscribed to.
- Go to the Keys option and copy your subscription key to access the service.
Translator 文本 API
Plan | Description | Price |
---|---|---|
免费 | 限每月 2M 文字 | 免费 |
S1 标准 | 基于Azure使用量 | 每 1M 文字 $10 |
S2 标准 | 每月 250M 文字 | 每月 $2,055,超额部分每 1M 文字 $8.22 |
S3 标准 | 每月 1B 文字 | 每月 $6K,超额部分每 1M 文字 $6.00 |
S4 标准 | 每月 10B 文字 | 每月 $45K,超额部分每 1M 文字 $4.5 |
Translator 语音 API
Plan | Description | Price |
---|---|---|
免费 | 限每月 2小时 | 免费 |
S1 标准 | 基于Azure使用量 | 每小时 $12 |
S2 标准 | 每月 100 小时 | 每月 $1K,超出部分每小时 $10 |
S2 标准 | 每月 1000 小时 | 每月 $7K,超额部分每小时 $7 |
S4 标准 | 每月 10,000 小时 | 每月 $35K,超额部分每小时 $3.50 |
PS:还有face api
具体的文档地址:text-translate
坑
一个封装了Microsoft Speech Translator服务的功能库MSTranslateVendor
上面举出的Microsoft的API资料都是过期了的文档。不要花时间在这上面-,-。。。
一句话就是:最新的API 已经不需要去注册Azure DataMarket application
了,不用client_id
和client_secret
。直接使用Subscription Key
即可