damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch,ModelScope模型可以添加热词吗?
damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch 是 ModelScope 上的一个语音识别模型。根据现有知识库资料,该模型本身并不直接支持热词功能,但可以通过阿里云的 Paraformer 实时语音识别服务 和相关热词管理接口来实现热词定制和应用。
以下是详细的解答和操作步骤:
热词功能主要用于提升特定词汇在语音识别中的准确率。根据知识库内容,以下模型支持热词功能: - paraformer-realtime-v1 - paraformer-realtime-v2
虽然 damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch 并未明确列出为支持热词的模型,但您可以通过阿里云的 大模型服务平台百炼 提供的热词管理接口,结合支持热词的 Paraformer 模型(如 paraformer-realtime-v2),间接实现类似功能。
要使用热词功能,您需要先创建热词表,并将其绑定到支持热词的模型上。以下是具体步骤:
通过 HTTP API 或 SDK 创建热词表。以下是一个示例请求:
curl -X POST https://dashscope.aliyuncs.com/api/v1/services/audio/asr/customization \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "speech-biasing",
"input": {
"action": "create_vocabulary",
"target_model": "paraformer-realtime-v2",
"prefix": "testpfx",
"vocabulary": [
{"text": "通义千问", "weight": 5, "lang": "zh"},
{"text": "阿里云", "weight": 5, "lang": "zh"}
]
}
}'
返回结果中会包含 vocabulary_id,这是后续绑定热词的关键标识。
您可以查询已创建的热词表,确认其状态和内容:
curl -X POST https://dashscope.aliyuncs.com/api/v1/services/audio/asr/customization \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "speech-biasing",
"input": {
"action": "query_vocabulary",
"vocabulary_id": "vocab-testpfx-6977ae49f65c4c3db054727cxxxxxxxx"
}
}'
如果需要修改热词表内容,可以使用更新接口;如果不再需要某热词表,可以删除它:
curl -X POST https://dashscope.aliyuncs.com/api/v1/services/audio/asr/customization \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "speech-biasing",
"input": {
"action": "update_vocabulary",
"vocabulary_id": "vocab-testpfx-6977ae49f65c4c3db054727cxxxxxxxx",
"vocabulary": [
{"text": "通义千问", "weight": 5, "lang": "zh"}
]
}
}'
curl -X POST https://dashscope.aliyuncs.com/api/v1/services/audio/asr/customization \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "speech-biasing",
"input": {
"action": "delete_vocabulary",
"vocabulary_id": "vocab-testpfx-6977ae49f65c4c3db054727cxxxxxxxx"
}
}'
创建并绑定热词表后,您可以在实时语音识别任务中指定热词 ID (vocabulary_id) 来启用热词功能。以下是一个 WebSocket API 示例:
{
"header": {
"action": "run-task",
"task_id": "2bf83b9a-baeb-4fda-8d9a-xxxxxxxxxxxx",
"streaming": "duplex"
},
"payload": {
"task_group": "audio",
"task": "asr",
"function": "recognition",
"model": "paraformer-realtime-v2",
"parameters": {
"format": "pcm",
"sample_rate": 16000,
"vocabulary_id": "vocab-testpfx-6977ae49f65c4c3db054727cxxxxxxxx",
"disfluency_removal_enabled": false,
"language_hints": ["zh"]
},
"resources": [],
"input": {}
}
}
注意:vocabulary_id 必须与之前创建的热词表 ID 一致。
paraformer-realtime-v1 和 paraformer-realtime-v2 支持热词功能。如果您希望在 damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch 中使用热词,建议切换到支持热词的模型。weight)越高,优先级越高,但过高的权重可能导致误识别,请合理设置。虽然 damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch 本身不直接支持热词功能,但您可以通过阿里云的 Paraformer 实时语音识别服务(如 paraformer-realtime-v2)结合热词管理接口实现类似效果。请按照上述步骤创建、管理和使用热词表,以提升特定词汇的识别准确率。
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352