Skip to content

AI宠物声音识别分析(通过URL)

产品介绍


AI宠物声音识别服务支持直接传入音频文件的 URL 进行声音分析,无需上传本地文件。适用于音频已存储在 OSS 或其他对象存储上的场景,与文件上传版本功能完全一致,同样采用流式响应方式实时返回分析结果。

使用场景


  • 设备端直传:宠物智能设备将录音上传至 OSS 后,直接传 URL 触发分析,避免二次上传
  • 异步分析流程:先上传音频,再按需触发分析,适合批量处理场景
  • 第三方音频接入:对接已有音频存储服务,无需迁移文件

接口调用前置步骤

调用本接口前,需先调用 session-start 获取 session_id,传参时 module_type 固定为 13(声音识别模块):

json
{
    "module_type": 13,
    "pet_profile_id": 3147
}

调用接口:

请求方式: POST(HTTPS)
请求地址: https://ms-ai.chongzhiling.com/api/v2.0/ai-b/ai-voice-recg/analysis-by-url?token=[ACCESS_TOKEN]

请求参数:[application/json]

json
{
    "session_id": "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx",
    "voice_url": "https://your-oss-bucket.oss-cn-shenzhen.aliyuncs.com/audio/xxx.mp3",
    "animal_type": 1
}
参数类型必填说明
session_idstring会话ID,由 session-start 接口获取
voice_urlstring音频文件的可访问 URL
animal_typeinteger动物类型:1-猫,2-狗,默认 1

返回结果

该接口为流式返回(SSE),响应 Content-Typetext/event-stream,数据以增量方式持续输出,直至分析完毕。

data: 这段声音

data: 是一只狗

data: 发出的急促吠叫,

data: 可能处于兴奋或警觉状态,建议关注周围环境变化。

data: [DONE]

返回参数说明

字段类型说明
datastring每次推送的文本片段,前端拼接后即为完整分析结果
[DONE]流式结束标志,收到后表示本次分析已完成

与文件上传版本的区别

对比项文件上传版(analysis)URL版(analysis-by-url)
请求格式multipart/form-dataapplication/json
音频来源本地文件已有 URL
OSS 上传由服务端自动处理调用方自行上传

错误响应

HTTP 状态码说明
400缺少必要参数(voice_urlsession_id
401未授权,token 无效或已过期