Dockerfile 459 B

1234567891011121314
  1. # 基础镜像
  2. FROM egs-registry.cn-hangzhou.cr.aliyuncs.com/egs/vllm:0.8.2-pytorch2.6-cu124-20250328
  3. # 设置工作目录
  4. WORKDIR /workspace
  5. # 如果需要复制宿主机上的模型,可以提前 COPY
  6. # COPY models /models
  7. # 默认用 Python 启动 vLLM API Server
  8. ENTRYPOINT ["python", "-m", "vllm.entrypoints.openai.api_server"]
  9. # 默认参数(可以在 docker run 里覆盖)
  10. CMD ["--model", "/models/Qwen3-Embedding-0.6B", "--dtype", "float16"]