content_identify.py
脚本实现了以下功能:
在 .env
文件中设置以下环境变量:
# 飞书配置
FEISHU_APP_ID=your_app_id
FEISHU_APP_SECRET=your_app_secret
FEISHU_FILE_TOKEN=your_file_token
FEISHU_TABLE_ID=your_table_id # 可选,也可在运行时传入
# 可选:自定义字段名称
FEISHU_INPUT_FIELD=抓取结果 # 输入内容字段名
FEISHU_OUTPUT_FIELD=识别结果 # 输出结果字段名
注意:FEISHU_TABLE_ID
可以通过以下方式设置(优先级从高到低):
python content_identify.py tblNdje7z6Cf3hax
FEISHU_TABLE_ID=your_table_id
飞书表格应包含以下字段:
cd xhs
python content_identify.py
cd xhs
python content_identify.py tblNdje7z6Cf3hax
# 试运行模式(只显示会处理的记录,不实际调用API)
python content_identify.py tblNdje7z6Cf3hax --dry-run
# 从指定分页token开始处理
python content_identify.py tblNdje7z6Cf3hax --page-token VEBsbCfaWa3gF3slQILc6Rybnde
# 查看帮助信息
python content_identify.py --help
from xhs.content_identify import ContentIdentifier
# 使用环境变量中的表格ID
identifier = ContentIdentifier()
identifier.process_all_records()
# 或者动态传入表格ID
identifier = ContentIdentifier(table_id='tblNdje7z6Cf3hax')
identifier.process_all_records()
在运行主脚本之前,建议先运行测试脚本验证配置:
cd xhs
python test_content_identify.py
测试脚本会检查:
脚本运行时会输出详细的处理日志:
开始处理飞书表格 tblxxxxxxxxx 中的所有记录
获取到 10 条记录
处理记录 recxxxxxxxxx
标题: 这是一个测试标题...
内容长度: 1234 字符
图片数量: 3
正在调用Coze工作流,标题: 这是一个测试标题...
Coze工作流调用成功
已更新记录 recxxxxxxxxx
处理完成!总共处理 10 条记录,成功 10 条
环境变量未设置
.env
文件是否存在且格式正确飞书API权限问题
FEISHU_APP_ID
和 FEISHU_APP_SECRET
是否正确Coze API调用失败
字段名称不匹配
如需更详细的调试信息,可以修改脚本中的日志级别或添加更多打印语句。