易于使用,会话AI api用于语音识别,语言理解和生成,和语音。设计你的游戏和语音应用程序启用。设计基于对话人物和演讲比赛。
耳语是一个通用的语音识别模型。是在一个庞大的数据集上训练不同的音频和也是一个多任务模型,可以进行多语言语音识别以及语言翻译和语言识别。
把你读到播客。听任何文章、PDF、电子邮件等在你的播客应用。
集成实时语音和上下文理解。采用先进的深度学习模式。使生活字幕,追踪用户的意图,从非结构化的对话生成摘要和更多的数据。
美丽的声音和语音在指尖,吸引了。降低成本和简化生产过程的声音。
有声读物叙述的文本-语音AI现在可以通过苹果的书。最初只用于浪漫和小说书,他们列出两个可用数字声音:麦迪逊和杰克逊。
未来的声音。第一个平台生成长格式的演讲在任何声音和在任何语言。我们使用人工智能带来最自然的和令人信服的声音创作者和出版商寻求最终的讲故事的质量。