field.py 1.3 KB

123456789101112131415161718192021222324252627282930313233343536373839
  1. from pymilvus import FieldSchema, DataType
  2. # milvus 向量数据库
  3. fields = [
  4. FieldSchema(name="chunk_id", dtype=DataType.INT64, is_primary=True, auto_id=False),
  5. FieldSchema(name="doc_id", dtype=DataType.VARCHAR, max_length=64),
  6. # 三种向量字段
  7. FieldSchema(name="vector_text", dtype=DataType.FLOAT_VECTOR, dim=2560),
  8. FieldSchema(name="vector_summary", dtype=DataType.FLOAT_VECTOR, dim=2560),
  9. FieldSchema(name="vector_questions", dtype=DataType.FLOAT_VECTOR, dim=2560),
  10. # metadata
  11. FieldSchema(name="topic", dtype=DataType.VARCHAR, max_length=255),
  12. FieldSchema(name="domain", dtype=DataType.VARCHAR, max_length=100),
  13. FieldSchema(name="task_type", dtype=DataType.VARCHAR, max_length=100),
  14. FieldSchema(name="summary", dtype=DataType.VARCHAR, max_length=512),
  15. FieldSchema(
  16. name="keywords",
  17. dtype=DataType.ARRAY,
  18. element_type=DataType.VARCHAR,
  19. max_length=100,
  20. ),
  21. FieldSchema(
  22. name="concepts",
  23. dtype=DataType.ARRAY,
  24. element_type=DataType.VARCHAR,
  25. max_length=100,
  26. ),
  27. FieldSchema(
  28. name="questions",
  29. dtype=DataType.ARRAY,
  30. element_type=DataType.VARCHAR,
  31. max_length=200,
  32. ),
  33. FieldSchema(name="topic_purity", dtype=DataType.FLOAT),
  34. FieldSchema(name="tokens", dtype=DataType.INT64),
  35. ]
  36. __all__ = ["fields"]