file_source.go 5.2 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213
  1. package types
  2. import (
  3. "fmt"
  4. "image"
  5. "os"
  6. "sync"
  7. )
  8. // FileSourceType 文件来源类型
  9. type FileSourceType string
  10. const (
  11. FileSourceTypeURL FileSourceType = "url" // URL 来源
  12. FileSourceTypeBase64 FileSourceType = "base64" // Base64 内联数据
  13. )
  14. // FileSource 统一的文件来源抽象
  15. // 支持 URL 和 base64 两种来源,提供懒加载和缓存机制
  16. type FileSource struct {
  17. Type FileSourceType `json:"type"` // 来源类型
  18. URL string `json:"url,omitempty"` // URL(当 Type 为 url 时)
  19. Base64Data string `json:"base64_data,omitempty"` // Base64 数据(当 Type 为 base64 时)
  20. MimeType string `json:"mime_type,omitempty"` // MIME 类型(可选,会自动检测)
  21. // 内部缓存(不导出,不序列化)
  22. cachedData *CachedFileData
  23. cacheMu sync.RWMutex
  24. cacheLoaded bool
  25. }
  26. // CachedFileData 缓存的文件数据
  27. // 支持内存缓存和磁盘缓存两种模式
  28. type CachedFileData struct {
  29. base64Data string // 内存中的 base64 数据(小文件)
  30. MimeType string // MIME 类型
  31. Size int64 // 文件大小(字节)
  32. ImageConfig *image.Config // 图片配置(如果是图片)
  33. ImageFormat string // 图片格式(如果是图片)
  34. // 磁盘缓存相关
  35. diskPath string // 磁盘缓存文件路径(大文件)
  36. isDisk bool // 是否使用磁盘缓存
  37. diskMu sync.Mutex // 磁盘操作锁
  38. diskClosed bool // 是否已关闭/清理
  39. }
  40. // NewMemoryCachedData 创建内存缓存的数据
  41. func NewMemoryCachedData(base64Data string, mimeType string, size int64) *CachedFileData {
  42. return &CachedFileData{
  43. base64Data: base64Data,
  44. MimeType: mimeType,
  45. Size: size,
  46. isDisk: false,
  47. }
  48. }
  49. // NewDiskCachedData 创建磁盘缓存的数据
  50. func NewDiskCachedData(diskPath string, mimeType string, size int64) *CachedFileData {
  51. return &CachedFileData{
  52. diskPath: diskPath,
  53. MimeType: mimeType,
  54. Size: size,
  55. isDisk: true,
  56. }
  57. }
  58. // GetBase64Data 获取 base64 数据(自动处理内存/磁盘)
  59. func (c *CachedFileData) GetBase64Data() (string, error) {
  60. if !c.isDisk {
  61. return c.base64Data, nil
  62. }
  63. c.diskMu.Lock()
  64. defer c.diskMu.Unlock()
  65. if c.diskClosed {
  66. return "", fmt.Errorf("disk cache already closed")
  67. }
  68. // 从磁盘读取
  69. data, err := os.ReadFile(c.diskPath)
  70. if err != nil {
  71. return "", fmt.Errorf("failed to read from disk cache: %w", err)
  72. }
  73. return string(data), nil
  74. }
  75. // SetBase64Data 设置 base64 数据(仅用于内存模式)
  76. func (c *CachedFileData) SetBase64Data(data string) {
  77. if !c.isDisk {
  78. c.base64Data = data
  79. }
  80. }
  81. // IsDisk 是否使用磁盘缓存
  82. func (c *CachedFileData) IsDisk() bool {
  83. return c.isDisk
  84. }
  85. // Close 关闭并清理资源
  86. func (c *CachedFileData) Close() error {
  87. if !c.isDisk {
  88. c.base64Data = "" // 释放内存
  89. return nil
  90. }
  91. c.diskMu.Lock()
  92. defer c.diskMu.Unlock()
  93. if c.diskClosed {
  94. return nil
  95. }
  96. c.diskClosed = true
  97. if c.diskPath != "" {
  98. return os.Remove(c.diskPath)
  99. }
  100. return nil
  101. }
  102. // NewURLFileSource 创建 URL 来源的 FileSource
  103. func NewURLFileSource(url string) *FileSource {
  104. return &FileSource{
  105. Type: FileSourceTypeURL,
  106. URL: url,
  107. }
  108. }
  109. // NewBase64FileSource 创建 base64 来源的 FileSource
  110. func NewBase64FileSource(base64Data string, mimeType string) *FileSource {
  111. return &FileSource{
  112. Type: FileSourceTypeBase64,
  113. Base64Data: base64Data,
  114. MimeType: mimeType,
  115. }
  116. }
  117. // IsURL 判断是否是 URL 来源
  118. func (f *FileSource) IsURL() bool {
  119. return f.Type == FileSourceTypeURL
  120. }
  121. // IsBase64 判断是否是 base64 来源
  122. func (f *FileSource) IsBase64() bool {
  123. return f.Type == FileSourceTypeBase64
  124. }
  125. // GetIdentifier 获取文件标识符(用于日志和错误追踪)
  126. func (f *FileSource) GetIdentifier() string {
  127. if f.IsURL() {
  128. if len(f.URL) > 100 {
  129. return f.URL[:100] + "..."
  130. }
  131. return f.URL
  132. }
  133. if len(f.Base64Data) > 50 {
  134. return "base64:" + f.Base64Data[:50] + "..."
  135. }
  136. return "base64:" + f.Base64Data
  137. }
  138. // GetRawData 获取原始数据(URL 或完整的 base64 字符串)
  139. func (f *FileSource) GetRawData() string {
  140. if f.IsURL() {
  141. return f.URL
  142. }
  143. return f.Base64Data
  144. }
  145. // SetCache 设置缓存数据
  146. func (f *FileSource) SetCache(data *CachedFileData) {
  147. f.cacheMu.Lock()
  148. defer f.cacheMu.Unlock()
  149. f.cachedData = data
  150. f.cacheLoaded = true
  151. }
  152. // GetCache 获取缓存数据
  153. func (f *FileSource) GetCache() *CachedFileData {
  154. f.cacheMu.RLock()
  155. defer f.cacheMu.RUnlock()
  156. return f.cachedData
  157. }
  158. // HasCache 是否有缓存
  159. func (f *FileSource) HasCache() bool {
  160. f.cacheMu.RLock()
  161. defer f.cacheMu.RUnlock()
  162. return f.cacheLoaded && f.cachedData != nil
  163. }
  164. // ClearCache 清除缓存,释放内存和磁盘文件
  165. func (f *FileSource) ClearCache() {
  166. f.cacheMu.Lock()
  167. defer f.cacheMu.Unlock()
  168. // 如果有缓存数据,先关闭它(会清理磁盘文件)
  169. if f.cachedData != nil {
  170. f.cachedData.Close()
  171. }
  172. f.cachedData = nil
  173. f.cacheLoaded = false
  174. }
  175. // ClearRawData 清除原始数据,只保留必要的元信息
  176. // 用于在处理完成后释放大文件的内存
  177. func (f *FileSource) ClearRawData() {
  178. // 保留 URL(通常很短),只清除大的 base64 数据
  179. if f.IsBase64() && len(f.Base64Data) > 1024 {
  180. f.Base64Data = ""
  181. }
  182. }