zhaohaipeng
/
model_script


			
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126
							import logging
from io import BytesIO

import pandas as pd
import requests

logger = logging.getLogger(__name__)

from typing import Dict, Any


def build_common_header_map():
    return {
        "Authorization": "Bearer 0891f3f93a2640428f9988e267aa57e1",
        "Content-Type": "application/json"
    }


def get_model_info(reference_id: str) -> Dict[str, Any]:
    api_url = f"https://api.fish.audio/model/{reference_id}"
    headers = build_common_header_map()
    response = requests.get(
        api_url,
        headers=headers,
        timeout=(10, 1800)  # connect timeout, read timeout
    )
    return response.json()


def add_reference(
        base_url: str,
        reference_id: str,
        audio_url: str,
        text: str,
        timeout: int = 30,
        download_timeout: int = 60,
) -> Dict[str, Any]:
    """
    从 URL 下载音频并调用添加参考音频的接口

    Args:
        base_url: 服务端基础地址，例如 "http://localhost:8000"
        reference_id: 参考音频唯一标识
        audio_url: 音频文件的 URL（支持 http/https）
        text: 音频对应的文本内容
        timeout: 上传请求的超时时间（秒）
        download_timeout: 下载音频文件的超时时间（秒）

    Returns:
        服务端返回的 JSON 响应（字典）

    Raises:
        requests.RequestException: 下载或上传请求失败
        ValueError: 服务端返回错误响应或下载内容为空
    """
    # 1. 从 URL 下载音频内容
    try:
        resp = requests.get(audio_url, timeout=download_timeout)
        resp.raise_for_status()  # 检查 HTTP 错误
        audio_content = resp.content
        if not audio_content:
            raise ValueError("从 URL 下载的音频文件为空")
    except requests.exceptions.RequestException as e:
        raise requests.RequestException(f"下载音频失败: {e}") from e

    # 2. 构造请求 URL
    url = f"{base_url.rstrip('/')}/v1/references/add"

    # 3. 准备表单数据和文件（从内存中的字节构造文件）
    data = {
        "id": reference_id,
        "text": text,
    }
    # 从 URL 中提取文件名（如果 URL 没有明确文件名，可以自定义）
    file_name = audio_url.split('/')[-1] or "audio.wav"
    # 使用 BytesIO 包装音频内容
    files = {
        "audio": (file_name, BytesIO(audio_content), "audio/wav"),
    }

    headers = {
        "Accept": "application/json",
    }
    # 4. 发送上传请求
    try:
        response = requests.post(url, data=data, files=files, headers=headers, timeout=timeout)
        resp_json = response.json()
    except requests.exceptions.RequestException as e:
        raise requests.RequestException(f"上传请求失败: {e}") from e
    finally:
        # 关闭 BytesIO（可选，因为内存对象会自动回收）
        files["audio"][1].close()

    # 5. 检查响应
    if response.status_code != 200:
        raise ValueError(f"服务端返回错误 (HTTP {response.status_code}): {resp_json.get('message', '未知错误')}")

    if not resp_json.get("success", False):
        raise ValueError(f"业务失败: {resp_json.get('message', '未知错误')}")

    return resp_json


def _main():
    df = pd.read_csv("/Users/zhao/Desktop/aigc_admin_prod_ai_model_tts.csv")
    base_url = "http://192.168.245.146:8080/"
    for row in df.itertuples():
        reference_id = row.speaker_id
        audio_url = row.audio_url
        if reference_id in ['6e2d9e58b26c424db6d564ea56983f4d']:
            continue

        model_info = get_model_info(reference_id)
        text = model_info['samples'][0]['text']
        add_reference(
            base_url=base_url,
            reference_id=reference_id,
            audio_url=audio_url,
            text=text,
            timeout=30,
        )


if __name__ == '__main__':
    _main()