heyudev %!s(int64=2) %!d(string=hai) anos
pai
achega
6ee3952410
Modificáronse 2 ficheiros con 58 adicións e 3 borrados
  1. 57 2
      crawler/config.py
  2. 1 1
      crawler/strategy.py

+ 57 - 2
crawler/config.py

@@ -1,7 +1,7 @@
 # 配置信息:环境 策略等
 # 配置信息:环境 策略等
+import os
 
 
-
-class Config:
+class BaseConfig:
     ENV = {
     ENV = {
         'dev': 'dev',  # 开发环境
         'dev': 'dev',  # 开发环境
         'test': 'test',  # 开发环境
         'test': 'test',  # 开发环境
@@ -19,3 +19,58 @@ class Config:
         'home_page': 'home_page',  # 用户主页 规则抓取
         'home_page': 'home_page',  # 用户主页 规则抓取
         'search': 'search'  # 搜索结果 规则抓取
         'search': 'search'  # 搜索结果 规则抓取
     }
     }
+
+    """
+    编辑飞书云文档
+    """
+    # 看一看爬虫数据表
+    kanyikan_url = "https://w42nne6hzg.feishu.cn/sheets/shtcngRPoDYAi24x52j2nDuHMih?"
+    # 快手爬虫数据表
+    kuaishou_url = "https://w42nne6hzg.feishu.cn/sheets/shtcnp4SaJt37q6OOOrYzPMjQkg?"
+    # 微视爬虫数据表
+    weishi_url = "https://w42nne6hzg.feishu.cn/sheets/shtcn5YSWg91JfVGzj0SFZIRRPh?"
+    # 小年糕爬虫数据表
+    xiaoniangao_url = "https://w42nne6hzg.feishu.cn/sheets/shtcnYxiyQ1wLklo1W5Kdqc9cGh?"
+    # 数据监控表
+    crawler_monitor = "https://w42nne6hzg.feishu.cn/sheets/shtcnlZWYazInhf7Z60jkbLRJyd?"
+    # 本山祝福数据表
+    crawler_benshanzhufu = "https://w42nne6hzg.feishu.cn/sheets/shtcnGh2rrsPYM4iVNEBO7OqWrb?"
+    # 公众号爬虫表
+    gzh_url = "https://w42nne6hzg.feishu.cn/sheets/shtcnexNXnpDLHhARw0QdiwbYuA?"
+    # 视频号表
+    shipinhao_url = 'https://w42nne6hzg.feishu.cn/sheets/shtcn9rOdZRAGFbRkWpn7hqEHGc?'
+    # 知青总群
+    zhiqingzongqun_url = 'https://w42nne6hzg.feishu.cn/sheets/shtcnjmhKdJOKdqnEzJcZb5xaHc?'
+    # 众妙音信
+    zmyx_url = 'https://w42nne6hzg.feishu.cn/sheets/shtcnbZIxstPeM0xshW07b26sve?'
+    # 岁岁年年迎福气
+    ssnnyfq_url = 'https://w42nne6hzg.feishu.cn/sheets/shtcnyJmJSJynHDLLbLTkySfvZe'
+
+    # TODO 飞书路径Token
+
+    # TODO OSS 配置
+
+
+class TestConfig(BaseConfig):
+    """测试环境配置"""
+    ENV_TEXT = "测试环境"
+
+    # TODO 发布 接口
+
+class ProdConfig(BaseConfig):
+    """生产环境配置"""
+    ENV_TEXT = "生产环境"
+    # TODO 发布 接口
+
+
+def set_config(env):
+    if env is None:
+        # log_.error('ENV ERROR: is None!')
+        return
+    if env == 'test':
+        return TestConfig()
+    elif env == 'prod':
+        return ProdConfig()
+    else:
+        # log_.error('ENV ERROR: is {}'.format(env))
+        return

+ 1 - 1
crawler/strategy.py

@@ -9,7 +9,7 @@ class Strategy(ABC):
     def crawl(self, data: List):
     def crawl(self, data: List):
         pass
         pass
 
 
-
+# TODO 不同平台 不同策略
 class XiaoniangaoHomePageStrategy(Strategy):
 class XiaoniangaoHomePageStrategy(Strategy):
     def crawl(self, data: List) -> List:
     def crawl(self, data: List) -> List:
         # 具体逻辑
         # 具体逻辑