AI API BASIC

Các API cơ bản dùng để chuyển giọng nói thành văn bản hoặc chuyển văn bản thành giọng nói

API TTS (Text2Speech):

POST https://tts-api-v1-stg.omicall.com/v1/tts

Headers

NameTypeDescription

apikey*

String

Token xác thực truy cập API

Request Body

NameTypeDescription

text*

String

Nội dung văn bản

speed

Integer

Tốc độ đọc là giá trị thực trong khoảng [0.8, 1.2]. Mặc định là 1

speaker_id

String

ID giọng đọc mặc định là 'northern_female_ngocanh'.

Danh sách ID các giọng đọc:

northern_female_ngocanh

southern_female_honganh

southern_male_tienhuy

northern_male_anhkiet

southern_female_khangan

{
    "data": {
        "audioDuration": 1.55, // Thời lượng tính bằng giây của audio
        "sampleRate": 8000, // Tần số lấy mẫu 
        "url": "https://tts-api-v1-stg.omicall.com/v1/....." //URL download
    }
}

API ASR (Speech2Text): Đăng ký webhook url để nhận kết quả ASR

POST https://asr-api-v1-stg.omicall.com/api/asr/register

Headers

NameTypeDescription

apikey*

String

Token xác thực để truy cập API

Request Body

NameTypeDescription

url*

String

Đường dẫn nhận dữ liệu

API ASR (Speech2Text): Upload audio, kết quả ASR sẽ được trả về webhook url

POST https://asr-api-v1-stg.omicall.com/api/asr/upload

Headers

NameTypeDescription

apikey*

String

Token xác thực để truy cập API

Request Body

NameTypeDescription

audio*

String

audio file (định dạng .wav) muốn chuyển sang text

id*

String

String (id sẽ được đính kèm trong kết quả trả về giúp phân biệt các kết quả)

Last updated