投流数据文章相关服务开发

luojunhui 4b238580d4 dockerfile 增加对nodejs对处理 il y a 1 mois
applications c62d6233ef 修改了报警时间 il y a 1 mois
routes 1ed073342f update mention status il y a 1 mois
.gitignore 18a8b26662 2025-01-03 修改gitignore文件 il y a 8 mois
Dockerfile 4b238580d4 dockerfile 增加对nodejs对处理 il y a 1 mois
LICENSE d3cfb36cda Initial commit il y a 1 an
README.md 12a3e1c038 update crawler toutiao articles il y a 1 mois
app_config.toml c62d6233ef 修改了报警时间 il y a 1 mois
dev.py 022aff4dc9 dockerfile 增加对nodejs对处理 il y a 1 mois
docker-compose.yaml 7aa217a476 init il y a 1 mois
requirements.txt 12a3e1c038 update crawler toutiao articles il y a 1 mois
task_app.py b40981f3c8 add get_off_videos task il y a 1 mois

README.md

LongArticleTaskServer

description: a server for long_articles project experiments and tasks

启动服务

use hypercorn

hypercorn task_app:app --config app_config.toml

use docker

docker compose up -d

项目结构

.
├── Dockerfile
├── LICENSE
├── README.md
├── app_config.toml
├── applications
│   ├── __init__.py
│   ├── ab_test
│   │   ├── __init__.py
│   │   └── get_cover.py
│   ├── api
│   │   ├── __init__.py
│   │   ├── aliyun_log_api.py
│   │   ├── async_aigc_system_api.py
│   │   ├── async_apollo_api.py
│   │   ├── async_feishu_api.py
│   │   ├── async_piaoquan_api.py
│   │   ├── deep_seek_official_api.py
│   │   └── elastic_search_api.py
│   ├── config
│   │   ├── __init__.py
│   │   ├── aliyun_log_config.py
│   │   ├── deepseek_config.py
│   │   ├── elastic_search_mappings.py
│   │   ├── es_certs.crt
│   │   └── mysql_config.py
│   ├── crawler
│   │   ├── toutiao
│   │   │   ├── __init__.py
│   │   │   ├── blogger.py
│   │   │   ├── detail_recommend.py
│   │   │   ├── main_page_recomend.py
│   │   │   ├── toutiao.js
│   │   │   └── use_js.py
│   │   └── wechat
│   │       ├── __init__.py
│   │       └── gzh_spider.py
│   ├── database
│   │   ├── __init__.py
│   │   └── mysql_pools.py
│   ├── pipeline
│   │   ├── __init__.py
│   │   ├── crawler_pipeline.py
│   │   └── data_recycle_pipeline.py
│   ├── service
│   │   ├── __init__.py
│   │   └── log_service.py
│   ├── tasks
│   │   ├── __init__.py
│   │   ├── crawler_tasks
│   │   │   ├── __init__.py
│   │   │   └── crawler_toutiao.py
│   │   ├── data_recycle_tasks
│   │   │   ├── __init__.py
│   │   │   └── recycle_daily_publish_articles.py
│   │   ├── llm_tasks
│   │   │   ├── __init__.py
│   │   │   └── process_title.py
│   │   ├── monitor_tasks
│   │   │   ├── __init__.py
│   │   │   ├── get_off_videos.py
│   │   │   ├── gzh_article_monitor.py
│   │   │   ├── kimi_balance.py
│   │   │   └── task_processing_monitor.py
│   │   ├── task_mapper.py
│   │   └── task_scheduler.py
│   └── utils
│       ├── __init__.py
│       ├── async_apollo_client.py
│       ├── async_http_client.py
│       ├── common.py
│       ├── get_cover.py
│       ├── item.py
│       └── response.py
├── docker-compose.yaml
├── myapp.log
├── requirements.txt
├── routes
│   ├── __init__.py
│   └── blueprint.py
└── task_app.py

get code strategy

tree -I "__pycache__|*.pyc"