连续处理模式是一个自动化执行流程,能够连续处理数据库中的记录,一条完成后自动处理下一条,直到所有记录处理完成或达到限制条件。
✅ 自动化处理:无需人工干预,自动连续处理数据库记录
✅ 智能停止:连续失败3次后自动停止,避免无限循环
✅ 进度监控:实时显示处理进度、成功率和统计信息
✅ 灵活配置:可设置最大处理数量和间隔时间
✅ 用户控制:支持 Ctrl+C 随时中断处理
✅ 错误处理:完善的异常处理和错误恢复机制
# 基本连续处理(无数量限制)
python3 indentify.py --continuous
# 设置最大处理数量
python3 indentify.py --continuous --max-records 100
# 设置处理间隔时间(秒)
python3 indentify.py --continuous --delay 5
# 组合使用
python3 indentify.py --continuous --max-records 50 --delay 3
# 运行启动脚本
./run.sh
# 选择选项 3(连续处理模式)
# 然后根据需要设置参数
参数 | 说明 | 默认值 |
---|---|---|
--continuous |
启用连续处理模式 | - |
--max-records |
最大处理记录数量 | 无限制 |
--delay |
处理间隔时间(秒) | 2秒 |
⚠️ API限制:注意第三方API的调用频率限制
⚠️ 资源消耗:长时间运行会消耗系统资源
⚠️ 数据库连接:确保数据库连接稳定
⚠️ 错误处理:关注失败记录的原因分析
连续失败过多
处理速度过慢
内存占用过高
系统会输出详细的处理日志,包括:
启动连续处理模式...
系统将自动处理数据库中的记录,一条完成后自动处理下一条
处理间隔: 2 秒
无数量限制,将处理所有可用记录
按 Ctrl+C 可以随时停止处理
------------------------------------------------------------
--- 处理第 1 条记录 ---
时间: 2024-01-15 14:30:25
开始处理记录 ID: 123, 内容ID: content_456
频道: xiaohongshu
标题: 小红书内容识别测试...
内容: 这是一个测试内容...
开始内容识别处理...
✅ 记录处理成功 (成功: 1, 失败: 0)
剩余待处理记录: 45 条
等待 2 秒后处理下一条记录...
--- 处理第 2 条记录 ---
时间: 2024-01-15 14:30:30
...
连续处理模式是一个强大的自动化工具,能够高效地处理大量数据库记录。通过合理的配置和监控,可以实现稳定、高效的批量处理流程。