投流数据文章相关服务开发

luojunhui 12a3e1c038 update crawler toutiao articles há 10 meses atrás
applications 12a3e1c038 update crawler toutiao articles há 10 meses atrás
routes 1ed073342f update mention status há 10 meses atrás
.gitignore 18a8b26662 2025-01-03 修改gitignore文件 há 1 ano atrás
Dockerfile 7bcfa572f0 init há 10 meses atrás
LICENSE d3cfb36cda Initial commit há 1 ano atrás
README.md 12a3e1c038 update crawler toutiao articles há 10 meses atrás
app_config.toml b40981f3c8 add get_off_videos task há 10 meses atrás
docker-compose.yaml 7aa217a476 init há 10 meses atrás
requirements.txt 12a3e1c038 update crawler toutiao articles há 10 meses atrás
task_app.py b40981f3c8 add get_off_videos task há 10 meses atrás

README.md

LongArticleTaskServer

description: a server for long_articles project experiments and tasks

启动服务

use hypercorn

hypercorn task_app:app --config app_config.toml

use docker

docker compose up -d

项目结构

.
├── Dockerfile
├── LICENSE
├── README.md
├── app_config.toml
├── applications
│   ├── __init__.py
│   ├── ab_test
│   │   ├── __init__.py
│   │   └── get_cover.py
│   ├── api
│   │   ├── __init__.py
│   │   ├── aliyun_log_api.py
│   │   ├── async_aigc_system_api.py
│   │   ├── async_apollo_api.py
│   │   ├── async_feishu_api.py
│   │   ├── async_piaoquan_api.py
│   │   ├── deep_seek_official_api.py
│   │   └── elastic_search_api.py
│   ├── config
│   │   ├── __init__.py
│   │   ├── aliyun_log_config.py
│   │   ├── deepseek_config.py
│   │   ├── elastic_search_mappings.py
│   │   ├── es_certs.crt
│   │   └── mysql_config.py
│   ├── crawler
│   │   ├── toutiao
│   │   │   ├── __init__.py
│   │   │   ├── blogger.py
│   │   │   ├── detail_recommend.py
│   │   │   ├── main_page_recomend.py
│   │   │   ├── toutiao.js
│   │   │   └── use_js.py
│   │   └── wechat
│   │       ├── __init__.py
│   │       └── gzh_spider.py
│   ├── database
│   │   ├── __init__.py
│   │   └── mysql_pools.py
│   ├── pipeline
│   │   ├── __init__.py
│   │   ├── crawler_pipeline.py
│   │   └── data_recycle_pipeline.py
│   ├── service
│   │   ├── __init__.py
│   │   └── log_service.py
│   ├── tasks
│   │   ├── __init__.py
│   │   ├── crawler_tasks
│   │   │   ├── __init__.py
│   │   │   └── crawler_toutiao.py
│   │   ├── data_recycle_tasks
│   │   │   ├── __init__.py
│   │   │   └── recycle_daily_publish_articles.py
│   │   ├── llm_tasks
│   │   │   ├── __init__.py
│   │   │   └── process_title.py
│   │   ├── monitor_tasks
│   │   │   ├── __init__.py
│   │   │   ├── get_off_videos.py
│   │   │   ├── gzh_article_monitor.py
│   │   │   ├── kimi_balance.py
│   │   │   └── task_processing_monitor.py
│   │   ├── task_mapper.py
│   │   └── task_scheduler.py
│   └── utils
│       ├── __init__.py
│       ├── async_apollo_client.py
│       ├── async_http_client.py
│       ├── common.py
│       ├── get_cover.py
│       ├── item.py
│       └── response.py
├── docker-compose.yaml
├── myapp.log
├── requirements.txt
├── routes
│   ├── __init__.py
│   └── blueprint.py
└── task_app.py

get code strategy

tree -I "__pycache__|*.pyc"