投流数据文章相关服务开发

luojunhui 55742a0cab dockerfile 增加对nodejs对处理 10 tháng trước cách đây
applications c62d6233ef 修改了报警时间 10 tháng trước cách đây
routes 1ed073342f update mention status 10 tháng trước cách đây
.gitignore 18a8b26662 2025-01-03 修改gitignore文件 1 năm trước cách đây
Dockerfile 55742a0cab dockerfile 增加对nodejs对处理 10 tháng trước cách đây
LICENSE d3cfb36cda Initial commit 1 năm trước cách đây
README.md 12a3e1c038 update crawler toutiao articles 10 tháng trước cách đây
app_config.toml c62d6233ef 修改了报警时间 10 tháng trước cách đây
dev.py 022aff4dc9 dockerfile 增加对nodejs对处理 10 tháng trước cách đây
docker-compose.yaml 7aa217a476 init 10 tháng trước cách đây
requirements.txt 12a3e1c038 update crawler toutiao articles 10 tháng trước cách đây
task_app.py b40981f3c8 add get_off_videos task 10 tháng trước cách đây

README.md

LongArticleTaskServer

description: a server for long_articles project experiments and tasks

启动服务

use hypercorn

hypercorn task_app:app --config app_config.toml

use docker

docker compose up -d

项目结构

.
├── Dockerfile
├── LICENSE
├── README.md
├── app_config.toml
├── applications
│   ├── __init__.py
│   ├── ab_test
│   │   ├── __init__.py
│   │   └── get_cover.py
│   ├── api
│   │   ├── __init__.py
│   │   ├── aliyun_log_api.py
│   │   ├── async_aigc_system_api.py
│   │   ├── async_apollo_api.py
│   │   ├── async_feishu_api.py
│   │   ├── async_piaoquan_api.py
│   │   ├── deep_seek_official_api.py
│   │   └── elastic_search_api.py
│   ├── config
│   │   ├── __init__.py
│   │   ├── aliyun_log_config.py
│   │   ├── deepseek_config.py
│   │   ├── elastic_search_mappings.py
│   │   ├── es_certs.crt
│   │   └── mysql_config.py
│   ├── crawler
│   │   ├── toutiao
│   │   │   ├── __init__.py
│   │   │   ├── blogger.py
│   │   │   ├── detail_recommend.py
│   │   │   ├── main_page_recomend.py
│   │   │   ├── toutiao.js
│   │   │   └── use_js.py
│   │   └── wechat
│   │       ├── __init__.py
│   │       └── gzh_spider.py
│   ├── database
│   │   ├── __init__.py
│   │   └── mysql_pools.py
│   ├── pipeline
│   │   ├── __init__.py
│   │   ├── crawler_pipeline.py
│   │   └── data_recycle_pipeline.py
│   ├── service
│   │   ├── __init__.py
│   │   └── log_service.py
│   ├── tasks
│   │   ├── __init__.py
│   │   ├── crawler_tasks
│   │   │   ├── __init__.py
│   │   │   └── crawler_toutiao.py
│   │   ├── data_recycle_tasks
│   │   │   ├── __init__.py
│   │   │   └── recycle_daily_publish_articles.py
│   │   ├── llm_tasks
│   │   │   ├── __init__.py
│   │   │   └── process_title.py
│   │   ├── monitor_tasks
│   │   │   ├── __init__.py
│   │   │   ├── get_off_videos.py
│   │   │   ├── gzh_article_monitor.py
│   │   │   ├── kimi_balance.py
│   │   │   └── task_processing_monitor.py
│   │   ├── task_mapper.py
│   │   └── task_scheduler.py
│   └── utils
│       ├── __init__.py
│       ├── async_apollo_client.py
│       ├── async_http_client.py
│       ├── common.py
│       ├── get_cover.py
│       ├── item.py
│       └── response.py
├── docker-compose.yaml
├── myapp.log
├── requirements.txt
├── routes
│   ├── __init__.py
│   └── blueprint.py
└── task_app.py

get code strategy

tree -I "__pycache__|*.pyc"