Skip to content

devsapp/start-audio-extraction-auth

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

注:当前项目为 Serverless Devs 应用,由于应用中会存在需要初始化才可运行的变量(例如应用部署地区、函数名等等),所以不推荐直接 Clone 本仓库到本地进行部署或直接复制 s.yaml 使用,强烈推荐通过 s init ${模版名称} 的方法或应用中心进行初始化,详情可参考部署 & 体验

start-audio-extraction-auth 帮助文档

音频提取+鉴权

前期准备

使用该项目,您需要有开通以下服务并拥有对应权限:

服务/业务 权限 相关文档
函数计算 AliyunFCFullAccess 帮助文档 计费文档

免责声明:
本项目会将模型下载到NAS,并且使用函数计算的GPU实例,模型的大小会影响文件存储占用以及函数执行时间,需根据情况具验证模型下载及加载所产生的费用。

部署 & 体验

案例介绍

本案例基于阿里云函数计算FC,支持将提取音频中的文件,并进行请求级别鉴权,采用预先设置token方式。

本案例默认使用huggingface中openai/whisper-base模型进行提取,当然你也可以替换该模型,使用huggingface中Automatic Speech Recognition分类下的模型

通过Serverless开发平台使用本案例,您将具备以下优势: 1、自带鉴权功能,支持用户安全访问 2、一键拉起huggingface对应的模型,用户不需要关心模型的下载开箱即用

使用流程

api调用

只支持POST请求
POST /

request

header

鉴权:需要再header中添加token, header= {"token":"123456"}

body
参数 类型 是否必须 描述
input string 音频文件链接

response

参数 类型 描述
data object
data.text string 音频内容

示例

import requests
import json

url = "http://huggingface-audio-gir1.fcv3.1041759428116431.cn-shanghai.fc.devsapp.net"
headers = {"token":"123456"}
s = json.dumps({
    "input": "https://sd-api-demo.oss-cn-beijing.aliyuncs.com/public/1.flac",
})
r = requests.post(url, data=s, headers=headers)
output = r.json()
{
    "data": {
        "text": "He hoped there would be stew for dinner, turnips and carrots and bruised potatoes and fat mutton pieces to be ladled out in thick, peppered flour-fatten sauce."
    }
}

注意事项

该案例涉及到使用huggingface模型,由于国内网络不同,采用huggingface镜像站模型数据

开发者社区

您如果有关于错误的反馈或者未来的期待,您可以在 Serverless Devs repo Issues 中进行反馈和交流。如果您想要加入我们的讨论组或者了解 FC 组件的最新动态,您可以通过以下渠道进行:

微信公众号:serverless 微信小助手:xiaojiangwh 钉钉交流群:33947367