Appearance
AI宠物声音识别分析(上传文件)
产品介绍
AI宠物声音识别服务能够通过分析上传的宠物音频文件,对宠物的声音进行智能识别与解读。支持猫和狗两种动物类型,采用流式响应方式实时返回分析结果。与声音情绪识别不同,该服务基于大模型 prompt 配置进行综合声音分析,输出更丰富的声音描述与健康提示。
使用场景
- 宠物日常监护:分析宠物叫声,了解宠物当前状态,及时发现异常
- 宠物医疗辅助:辅助兽医通过宠物声音判断健康状况
- 宠物行为研究:结合声音数据分析宠物行为规律
- 智能设备集成:集成到宠物智能硬件中实现实时声音监测
接口调用前置步骤
调用本接口前,需先调用 session-start 获取 session_id,传参时 module_type 固定为 13(声音识别模块):
json
{
"module_type": 13,
"pet_profile_id": 3147
}调用接口:
请求方式: POST(HTTPS)
请求地址: https://ms-ai.chongzhiling.com/api/v2.0/ai-b/ai-voice-recg/analysis?token=[ACCESS_TOKEN]
请求参数:[multipart/form-data]
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
voice | file | 是 | 上传的音频文件(支持 wav、mp3 等常见格式) |
session_id | string | 是 | 会话ID,由 session-start 接口获取 |
animal_type | integer | 否 | 动物类型:1-猫,2-狗,默认 1 |
返回结果
该接口为流式返回(SSE),响应 Content-Type 为 text/event-stream,数据以增量方式持续输出,直至分析完毕。
data: 这段声音
data: 是一只猫
data: 发出的轻柔叫声,
data: 情绪状态较为平静,无明显不适迹象。
data: [DONE]返回参数说明
| 字段 | 类型 | 说明 |
|---|---|---|
data | string | 每次推送的文本片段,前端拼接后即为完整分析结果 |
[DONE] | — | 流式结束标志,收到后表示本次分析已完成 |
错误响应
| HTTP 状态码 | 说明 |
|---|---|
400 | 缺少必要参数(voice 或 session_id) |
401 | 未授权,token 无效或已过期 |