投流数据文章相关服务开发

luojunhui 275702b90b dockerfile 增加对nodejs对处理 1 개월 전
applications c62d6233ef 修改了报警时间 1 개월 전
routes 1ed073342f update mention status 1 개월 전
.gitignore 18a8b26662 2025-01-03 修改gitignore文件 8 달 전
Dockerfile 275702b90b dockerfile 增加对nodejs对处理 1 개월 전
LICENSE d3cfb36cda Initial commit 1 년 전
README.md 12a3e1c038 update crawler toutiao articles 1 개월 전
app_config.toml c62d6233ef 修改了报警时间 1 개월 전
dev.py 022aff4dc9 dockerfile 增加对nodejs对处理 1 개월 전
docker-compose.yaml 7aa217a476 init 1 개월 전
requirements.txt 12a3e1c038 update crawler toutiao articles 1 개월 전
task_app.py b40981f3c8 add get_off_videos task 1 개월 전

README.md

LongArticleTaskServer

description: a server for long_articles project experiments and tasks

启动服务

use hypercorn

hypercorn task_app:app --config app_config.toml

use docker

docker compose up -d

项目结构

.
├── Dockerfile
├── LICENSE
├── README.md
├── app_config.toml
├── applications
│   ├── __init__.py
│   ├── ab_test
│   │   ├── __init__.py
│   │   └── get_cover.py
│   ├── api
│   │   ├── __init__.py
│   │   ├── aliyun_log_api.py
│   │   ├── async_aigc_system_api.py
│   │   ├── async_apollo_api.py
│   │   ├── async_feishu_api.py
│   │   ├── async_piaoquan_api.py
│   │   ├── deep_seek_official_api.py
│   │   └── elastic_search_api.py
│   ├── config
│   │   ├── __init__.py
│   │   ├── aliyun_log_config.py
│   │   ├── deepseek_config.py
│   │   ├── elastic_search_mappings.py
│   │   ├── es_certs.crt
│   │   └── mysql_config.py
│   ├── crawler
│   │   ├── toutiao
│   │   │   ├── __init__.py
│   │   │   ├── blogger.py
│   │   │   ├── detail_recommend.py
│   │   │   ├── main_page_recomend.py
│   │   │   ├── toutiao.js
│   │   │   └── use_js.py
│   │   └── wechat
│   │       ├── __init__.py
│   │       └── gzh_spider.py
│   ├── database
│   │   ├── __init__.py
│   │   └── mysql_pools.py
│   ├── pipeline
│   │   ├── __init__.py
│   │   ├── crawler_pipeline.py
│   │   └── data_recycle_pipeline.py
│   ├── service
│   │   ├── __init__.py
│   │   └── log_service.py
│   ├── tasks
│   │   ├── __init__.py
│   │   ├── crawler_tasks
│   │   │   ├── __init__.py
│   │   │   └── crawler_toutiao.py
│   │   ├── data_recycle_tasks
│   │   │   ├── __init__.py
│   │   │   └── recycle_daily_publish_articles.py
│   │   ├── llm_tasks
│   │   │   ├── __init__.py
│   │   │   └── process_title.py
│   │   ├── monitor_tasks
│   │   │   ├── __init__.py
│   │   │   ├── get_off_videos.py
│   │   │   ├── gzh_article_monitor.py
│   │   │   ├── kimi_balance.py
│   │   │   └── task_processing_monitor.py
│   │   ├── task_mapper.py
│   │   └── task_scheduler.py
│   └── utils
│       ├── __init__.py
│       ├── async_apollo_client.py
│       ├── async_http_client.py
│       ├── common.py
│       ├── get_cover.py
│       ├── item.py
│       └── response.py
├── docker-compose.yaml
├── myapp.log
├── requirements.txt
├── routes
│   ├── __init__.py
│   └── blueprint.py
└── task_app.py

get code strategy

tree -I "__pycache__|*.pyc"