云极 AI 能力开放平台

企业级 AI 能力平台

提供语音、图像、文本等多种可调用能力 · 快速接入 · 高可用 · 易扩展

多样化 AI 能力

所有服务均提供 RESTful API 接口 · 详尽的开发文档 · 支持多种编程语言调用

文字转语音 (TTS)

提供稳定、高自然度的语音合成接口,支持多语言与多音色,毫秒级响应,完美适配长文本阅读场景。

  • 开箱即用: 简单文本输入即可合成,无需复杂配置
  • 技术架构: 基于微软 Azure TTS 引擎,保障音质与稳定性
  • 高并发支持: 专为企业级应用设计,轻松应对突发请求
  • 应用场景: 有声内容生成、智能客服、语音导航、在线教育

音源分离

通过 AI 算法将音频中的人声与伴奏精准分离,通过 URL 提交音频源文件,一次性获取分离结果。

  • 输入方式: 支持公网可访问的音频 URL 链接
  • 输出结果: 同时返回人声 (vocal) 和伴奏 (accompaniment) 两条音轨的 URL
  • 处理精度: 采用深度学习模型,分离效果清晰,背景残留少
  • 典型应用: 卡拉OK应用、Remix制作、视频剪辑、音频修复

证件照处理

提供一套完整的证件照处理接口,支持人像抠图、换背景、标准裁剪与排版,可按需调用组合。

  • 模块化接口: 提供人像抠图、背景色替换、证件照生成、排版照生成等多个独立接口
  • 灵活调用: 开发者可根据业务流自由组合调用各模块,实现个性化流程
  • 标准化输出: 符合公务员、教师资格、护照等各类考试报名照片规范
  • 高级定制: 可设置尺寸、背景色(RGB/色值)、裁剪框,输出排版照及水印

透明定价策略

按需付费,无隐藏费用,支持多种支付方式

按量付费

  • 文字转语音 (TTS) ¥0.15 / 万字
  • 音源分离 ¥0.09 / 分钟
  • 证件照处理 暂不支持

适合用量不稳定或初期试用的客户

永久授权

  • 文字转语音 (TTS) ¥5000
  • 音源分离 ¥5000
  • 证件照处理 ¥2999

适合长期稳定使用的大用量客户

企业用户可申请合同及发票

展示 AI 能力效果,可直接集成到企业应用中 · 支持快速测试

文字转语音

示例音色试听(仅展示部分音色)

云希(适合电影解说)

云泽(适合历史解说)

晓柔(适合短视频)

云希(四川话)

晓北(东北话)

晓双(女童音)

更多音色可在接口中选择使用

证件照处理

原始照片 / 人像抠图 / 蓝底、白底 / 排版演示

原始照片

原始证件照

人像抠图

人像抠图证件照

蓝底照片

蓝底证件照

6寸蓝底排版照片

6寸蓝底排版证件照

6寸白底排版照片

6寸白底排版证件照

6寸红底排版照片

6寸红底排版证件照

音源分离

试听原始音频与分离效果:

原始音频

人声

伴奏

联系我们

电话: 18510509294

技术咨询 · 集成支持 · 企业合作

微信二维码

微信二维码