před 3 roky · e924571376
--- a/README.md
+++ b/README.md
@@ -1,10 +1,11 @@
 
				-# 微群视频爬虫:https://git.yishihui.com/Server/crawler_weiqun_video.git
			
 
				+# 微群视频爬虫
			
 
				+https://git.yishihui.com/Server/crawler_weiqun_video.git
			
 
				+python==3.10
			
 
				 ffmpeg==1.4
			
 
				 loguru==0.6.0
			
 
				 oss2==2.15.0
			
 
				 requests==2.27.1
			
 
				 urllib3==1.26.9
			
 
				-python==3.10
			
 
				 
			
 
				 
			
 
				 # 执行入口
			
--- a/logs/__init__.py
+++ b/logs/__init__.py
@@ -0,0 +1,3 @@
 
				+# -*- coding: utf-8 -*-
			
 
				+# @Author: wangkun
			
 
				+# @Time: 2022/8/11
			
--- a/main/__init__.py
+++ b/main/__init__.py
@@ -0,0 +1,3 @@
 
				+# -*- coding: utf-8 -*-
			
 
				+# @Author: wangkun
			
 
				+# @Time: 2022/8/11
			
--- a/main/common.py
+++ b/main/common.py
@@ -0,0 +1,130 @@
 
				+# -*- coding: utf-8 -*-
			
 
				+# @Author: wangkun
			
 
				+# @Time: 2022/8/11
			
 
				+"""
			
 
				+公共方法，包含：生成log / 删除log / 下载方法 / 读取文件 / 统计下载数
			
 
				+"""
			
 
				+from datetime import date, timedelta
			
 
				+from loguru import logger
			
 
				+import datetime
			
 
				+import os
			
 
				+import time
			
 
				+import requests
			
 
				+import urllib3
			
 
				+proxies = {"http": None, "https": None}
			
 
				+
			
 
				+
			
 
				+class Common:
			
 
				+    # 统一获取当前时间 <class 'datetime.datetime'>  2022-04-14 20:13:51.244472
			
 
				+    now = datetime.datetime.now()
			
 
				+    # 昨天 <class 'str'>  2022-04-13
			
 
				+    yesterday = (date.today() + timedelta(days=-1)).strftime("%Y/%m/%d")
			
 
				+    # 今天 <class 'datetime.date'>  2022-04-14
			
 
				+    today = date.today()
			
 
				+    # 明天 <class 'str'>  2022-04-15
			
 
				+    tomorrow = (date.today() + timedelta(days=1)).strftime("%Y/%m/%d")
			
 
				+
			
 
				+    # 使用 logger 模块生成日志
			
 
				+    @staticmethod
			
 
				+    def logger(log_type):
			
 
				+        """
			
 
				+        使用 logger 模块生成日志
			
 
				+        """
			
 
				+        # 日志路径
			
 
				+        log_dir = r"./logs/"
			
 
				+        log_path = os.getcwd() + os.sep + log_dir
			
 
				+        if not os.path.isdir(log_path):
			
 
				+            os.makedirs(log_path)
			
 
				+
			
 
				+        # 日志文件名
			
 
				+        if log_type == "weiqun":
			
 
				+            log_name = time.strftime("%Y-%m-%d", time.localtime(time.time())) + '-weiqun.log'
			
 
				+        else:
			
 
				+            log_name = time.strftime("%Y-%m-%d", time.localtime(time.time())) + '-weiqun.log'
			
 
				+
			
 
				+        # 日志不打印到控制台
			
 
				+        logger.remove(handler_id=None)
			
 
				+
			
 
				+        # rotation="500 MB"，实现每 500MB 存储一个文件
			
 
				+        # rotation="12:00"，实现每天 12:00 创建一个文件
			
 
				+        # rotation="1 week"，每周创建一个文件
			
 
				+        # retention="10 days"，每隔10天之后就会清理旧的日志
			
 
				+        # 初始化日志
			
 
				+        logger.add(log_dir + log_name, level="INFO", rotation='00:00')
			
 
				+
			
 
				+        return logger
			
 
				+
			
 
				+    # 清除日志，保留最近 7 个文件
			
 
				+    @classmethod
			
 
				+    def del_logs(cls, log_type):
			
 
				+        """
			
 
				+        清除冗余日志文件
			
 
				+        :return: 保留最近 7 个日志
			
 
				+        """
			
 
				+        log_dir = "./logs/"
			
 
				+        all_files = sorted(os.listdir(log_dir))
			
 
				+        all_logs = []
			
 
				+        for log in all_files:
			
 
				+            name = os.path.splitext(log)[-1]
			
 
				+            if name == ".log":
			
 
				+                all_logs.append(log)
			
 
				+
			
 
				+        if len(all_logs) <= 7:
			
 
				+            pass
			
 
				+        else:
			
 
				+            for file in all_logs[:len(all_logs) - 7]:
			
 
				+                os.remove(log_dir + file)
			
 
				+        cls.logger(log_type).info("清除冗余日志成功")
			
 
				+
			
 
				+    # 封装下载视频或封面的方法
			
 
				+    @classmethod
			
 
				+    def download_method(cls, log_type, text, d_name, d_url):
			
 
				+        """
			
 
				+        下载封面：text == "cover" ； 下载视频：text == "video"
			
 
				+        需要下载的视频标题：d_title
			
 
				+        视频封面，或视频播放地址：d_url
			
 
				+        下载保存路径："./files/{d_title}/"
			
 
				+        """
			
 
				+        # 首先创建一个保存该视频相关信息的文件夹
			
 
				+        video_dir = "./videos/" + d_name + "/"
			
 
				+        if not os.path.exists(video_dir):
			
 
				+            os.mkdir(video_dir)
			
 
				+
			
 
				+        # 下载视频
			
 
				+        if text == "video":
			
 
				+            # 需要下载的视频地址
			
 
				+            video_url = d_url
			
 
				+            # 视频名
			
 
				+            video_name = "video.mp4"
			
 
				+
			
 
				+            # 下载视频
			
 
				+            urllib3.disable_warnings()
			
 
				+            response = requests.get(video_url, stream=True, proxies=proxies, verify=False)
			
 
				+            try:
			
 
				+                with open(video_dir + video_name, "wb") as f:
			
 
				+                    for chunk in response.iter_content(chunk_size=10240):
			
 
				+                        f.write(chunk)
			
 
				+                cls.logger(log_type).info("==========视频下载完成==========")
			
 
				+            except Exception as e:
			
 
				+                cls.logger(log_type).error("视频下载失败：{}", e)
			
 
				+
			
 
				+        # 下载封面
			
 
				+        elif text == "cover":
			
 
				+            # 需要下载的封面地址
			
 
				+            cover_url = d_url
			
 
				+            # 封面名
			
 
				+            cover_name = "image.jpg"
			
 
				+
			
 
				+            # 下载封面
			
 
				+            urllib3.disable_warnings()
			
 
				+            response = requests.get(cover_url, proxies=proxies, verify=False)
			
 
				+            try:
			
 
				+                with open(video_dir + cover_name, "wb") as f:
			
 
				+                    f.write(response.content)
			
 
				+                cls.logger(log_type).info("==========封面下载完成==========")
			
 
				+            except Exception as e:
			
 
				+                cls.logger(log_type).error("封面下载失败：{}", e)
			
 
				+
			
 
				+
			
 
				+if __name__ == "__main__":
			
 
				+    common = Common()
			
--- a/main/feishu_lib.py
+++ b/main/feishu_lib.py
@@ -0,0 +1,422 @@
 
				+# -*- coding: utf-8 -*-
			
 
				+# @Author: wangkun
			
 
				+# @Time: 2022/8/11
			
 
				+import json
			
 
				+import requests
			
 
				+import urllib3
			
 
				+from main.common import Common
			
 
				+proxies = {"http": None, "https": None}
			
 
				+
			
 
				+
			
 
				+class Feishu:
			
 
				+    """
			
 
				+    编辑飞书云文档
			
 
				+    """
			
 
				+    # 看一看爬虫数据表
			
 
				+    kanyikan_url = "https://w42nne6hzg.feishu.cn/sheets/shtcngRPoDYAi24x52j2nDuHMih?"
			
 
				+    # 快手爬虫数据表
			
 
				+    # kuaishou_url = "https://w42nne6hzg.feishu.cn/sheets/shtcnp4SaJt37q6OOOrYzPMjQkg?"
			
 
				+    kuaishou_url = "https://w42nne6hzg.feishu.cn/sheets/shtcnICEfaw9llDNQkKgdymM1xf?"
			
 
				+    # 微视爬虫数据表
			
 
				+    weishi_url = "https://w42nne6hzg.feishu.cn/sheets/shtcn5YSWg91JfVGzj0SFZIRRPh?"
			
 
				+    # 小年糕爬虫数据表
			
 
				+    xiaoniangao_url = "https://w42nne6hzg.feishu.cn/sheets/shtcnYxiyQ1wLklo1W5Kdqc9cGh?"
			
 
				+    # 音乐相册
			
 
				+    music_album = "https://w42nne6hzg.feishu.cn/sheets/shtcnT6zvmfsYe1g0iv4pt7855g?"
			
 
				+    # 本山祝福数据表
			
 
				+    crawler_benshanzhufu = "https://w42nne6hzg.feishu.cn/sheets/shtcnGh2rrsPYM4iVNEBO7OqWrb?"
			
 
				+    # 公众号爬虫表
			
 
				+    gzh_url = "https://w42nne6hzg.feishu.cn/sheets/shtcnexNXnpDLHhARw0QdiwbYuA?"
			
 
				+    # 数据监控表
			
 
				+    crawler_monitor = "https://w42nne6hzg.feishu.cn/sheets/shtcnlZWYazInhf7Z60jkbLRJyd?"
			
 
				+    # 微群视频爬虫表
			
 
				+    crawler_weiqun_video = "https://w42nne6hzg.feishu.cn/sheets/shtcnoKThNquYRweaylMFVyo9Hc?"
			
 
				+
			
 
				+    # 手机号
			
 
				+    wangkun = "13426262515"
			
 
				+    gaonannan = "18501180073"
			
 
				+    xinxin = "15546206651"
			
 
				+    huxinxue = "18832292015"
			
 
				+
			
 
				+    # 飞书路径token
			
 
				+    @classmethod
			
 
				+    def spreadsheettoken(cls, crawler):
			
 
				+        """
			
 
				+        :param crawler: 哪个爬虫
			
 
				+        """
			
 
				+        if crawler == "kanyikan":
			
 
				+            return "shtcngRPoDYAi24x52j2nDuHMih"
			
 
				+        elif crawler == "kuaishou":
			
 
				+            # return "shtcnp4SaJt37q6OOOrYzPMjQkg"
			
 
				+            return "shtcnICEfaw9llDNQkKgdymM1xf"
			
 
				+        elif crawler == "weishi":
			
 
				+            return "shtcn5YSWg91JfVGzj0SFZIRRPh"
			
 
				+        elif crawler == "xiaoniangao":
			
 
				+            return "shtcnYxiyQ1wLklo1W5Kdqc9cGh"
			
 
				+        elif crawler == "monitor":
			
 
				+            return "shtcnlZWYazInhf7Z60jkbLRJyd"
			
 
				+        elif crawler == "music_album":
			
 
				+            return "shtcnT6zvmfsYe1g0iv4pt7855g"
			
 
				+        elif crawler == "bszf":
			
 
				+            return "shtcnGh2rrsPYM4iVNEBO7OqWrb"
			
 
				+        elif crawler == "gzh":
			
 
				+            return "shtcnexNXnpDLHhARw0QdiwbYuA"
			
 
				+        elif crawler == "weiqun":
			
 
				+            return "shtcnoKThNquYRweaylMFVyo9Hc"
			
 
				+
			
 
				+    # 获取飞书api token
			
 
				+    @classmethod
			
 
				+    def get_token(cls, log_type):
			
 
				+        """
			
 
				+        获取飞书api token
			
 
				+        :return:
			
 
				+        """
			
 
				+        url = "https://open.feishu.cn/open-apis/auth/v3/tenant_access_token/internal/"
			
 
				+        post_data = {"app_id": "cli_a13ad2afa438d00b",  # 这里账号密码是发布应用的后台账号及密码
			
 
				+                     "app_secret": "4tK9LY9VbiQlY5umhE42dclBFo6t4p5O"}
			
 
				+
			
 
				+        try:
			
 
				+            urllib3.disable_warnings()
			
 
				+            response = requests.post(url=url, data=post_data, proxies=proxies, verify=False)
			
 
				+            tenant_access_token = response.json()["tenant_access_token"]
			
 
				+            return tenant_access_token
			
 
				+        except Exception as e:
			
 
				+            Common.logger(log_type).error("获取飞书 api token 异常:{}", e)
			
 
				+
			
 
				+    # 获取表格元数据
			
 
				+    @classmethod
			
 
				+    def get_metainfo(cls, log_type, crawler):
			
 
				+        """
			
 
				+        获取表格元数据
			
 
				+        :return:
			
 
				+        """
			
 
				+        get_metainfo_url = "https://open.feishu.cn/open-apis/sheets/v2/spreadsheets/" \
			
 
				+                           + cls.spreadsheettoken(crawler) + "/metainfo"
			
 
				+
			
 
				+        headers = {
			
 
				+            "Authorization": "Bearer " + cls.get_token(log_type),
			
 
				+            "Content-Type": "application/json; charset=utf-8"
			
 
				+        }
			
 
				+        params = {
			
 
				+            "extFields": "protectedRange",  # 额外返回的字段，extFields=protectedRange时返回保护行列信息
			
 
				+            "user_id_type": "open_id"  # 返回的用户id类型，可选open_id,union_id
			
 
				+        }
			
 
				+        try:
			
 
				+            urllib3.disable_warnings()
			
 
				+            r = requests.get(url=get_metainfo_url, headers=headers, params=params, proxies=proxies, verify=False)
			
 
				+            response = json.loads(r.content.decode("utf8"))
			
 
				+            return response
			
 
				+        except Exception as e:
			
 
				+            Common.logger(log_type).error("获取表格元数据异常:{}", e)
			
 
				+
			
 
				+    # 读取工作表中所有数据
			
 
				+    @classmethod
			
 
				+    def get_values_batch(cls, log_type, crawler, sheetid):
			
 
				+        """
			
 
				+        读取工作表中所有数据
			
 
				+        :param log_type: 启用哪个 log
			
 
				+        :param crawler: 哪个爬虫
			
 
				+        :param sheetid: 哪张表
			
 
				+        :return: 所有数据
			
 
				+        """
			
 
				+        get_values_batch_url = "https://open.feishu.cn/open-apis/sheets/v2/spreadsheets/" \
			
 
				+                               + cls.spreadsheettoken(crawler) + "/values_batch_get"
			
 
				+        headers = {
			
 
				+            "Authorization": "Bearer " + cls.get_token(log_type),
			
 
				+            "Content-Type": "application/json; charset=utf-8"
			
 
				+        }
			
 
				+        params = {
			
 
				+            # 多个查询范围 如 url?ranges=range1,range2 ，其中 range 包含 sheetId 与单元格范围两部分
			
 
				+            "ranges": sheetid,
			
 
				+
			
 
				+            # valueRenderOption=ToString 可返回纯文本的值(数值类型除外)；
			
 
				+            # valueRenderOption=FormattedValue 计算并格式化单元格；
			
 
				+            # valueRenderOption=Formula单元格中含有公式时返回公式本身；
			
 
				+            # valueRenderOption=UnformattedValue计算但不对单元格进行格式化
			
 
				+            "valueRenderOption": "ToString",
			
 
				+
			
 
				+            # dateTimeRenderOption=FormattedString 计算并将时间日期按照其格式进行格式化，但不会对数字进行格式化，返回格式化后的字符串。
			
 
				+            "dateTimeRenderOption": "",
			
 
				+
			
 
				+            # 返回的用户id类型，可选open_id,union_id
			
 
				+            "user_id_type": "open_id"
			
 
				+        }
			
 
				+        try:
			
 
				+            urllib3.disable_warnings()
			
 
				+            r = requests.get(url=get_values_batch_url, headers=headers, params=params, proxies=proxies, verify=False)
			
 
				+            # print(r.text)
			
 
				+            response = json.loads(r.content.decode("utf8"))
			
 
				+            values = response["data"]["valueRanges"][0]["values"]
			
 
				+            return values
			
 
				+        except Exception as e:
			
 
				+            Common.logger(log_type).error("读取工作表所有数据异常:{}", e)
			
 
				+
			
 
				+    # 工作表，插入行或列
			
 
				+    @classmethod
			
 
				+    def insert_columns(cls, log_type, crawler, sheetid, majordimension, startindex, endindex):
			
 
				+        """
			
 
				+        工作表插入行或列
			
 
				+        :param log_type: 日志路径
			
 
				+        :param crawler: 哪个爬虫的云文档
			
 
				+        :param sheetid:哪张工作表
			
 
				+        :param majordimension:行或者列, ROWS、COLUMNS
			
 
				+        :param startindex:开始位置
			
 
				+        :param endindex:结束位置
			
 
				+        """
			
 
				+        insert_columns_url = "https://open.feishu.cn/open-apis/sheets/v2/spreadsheets/" \
			
 
				+                             + cls.spreadsheettoken(crawler) + "/insert_dimension_range"
			
 
				+        headers = {
			
 
				+            "Authorization": "Bearer " + cls.get_token(log_type),
			
 
				+            "Content-Type": "application/json; charset=utf-8"
			
 
				+        }
			
 
				+        body = {
			
 
				+            "dimension": {
			
 
				+                "sheetId": sheetid,
			
 
				+                "majorDimension": majordimension,  # 默认 ROWS ，可选 ROWS、COLUMNS
			
 
				+                "startIndex": startindex,  # 开始的位置
			
 
				+                "endIndex": endindex  # 结束的位置
			
 
				+            },
			
 
				+            "inheritStyle": "AFTER"  # BEFORE 或 AFTER，不填为不继承 style
			
 
				+        }
			
 
				+        try:
			
 
				+            urllib3.disable_warnings()
			
 
				+            r = requests.post(url=insert_columns_url, headers=headers, json=body, proxies=proxies, verify=False)
			
 
				+            Common.logger(log_type).info("插入行或列:{}", r.json()["msg"])
			
 
				+        except Exception as e:
			
 
				+            Common.logger(log_type).error("插入行或列异常:{}", e)
			
 
				+
			
 
				+    # 写入数据
			
 
				+    @classmethod
			
 
				+    def update_values(cls, log_type, crawler, sheetid, ranges, values):
			
 
				+        """
			
 
				+        写入数据
			
 
				+        :param log_type: 日志路径
			
 
				+        :param crawler: 哪个爬虫的云文档
			
 
				+        :param sheetid:哪张工作表
			
 
				+        :param ranges:单元格范围
			
 
				+        :param values:写入的具体数据，list
			
 
				+        """
			
 
				+        update_values_url = "https://open.feishu.cn/open-apis/sheets/v2/spreadsheets/" \
			
 
				+                            + cls.spreadsheettoken(crawler) + "/values_batch_update"
			
 
				+        headers = {
			
 
				+            "Authorization": "Bearer " + cls.get_token(log_type),
			
 
				+            "Content-Type": "application/json; charset=utf-8"
			
 
				+        }
			
 
				+        body = {
			
 
				+            "valueRanges": [
			
 
				+                {
			
 
				+                    "range": sheetid + "!" + ranges,
			
 
				+                    "values": values
			
 
				+                },
			
 
				+            ],
			
 
				+        }
			
 
				+
			
 
				+        try:
			
 
				+            urllib3.disable_warnings()
			
 
				+            r = requests.post(url=update_values_url, headers=headers, json=body, proxies=proxies, verify=False)
			
 
				+            Common.logger(log_type).info("写入数据:{}", r.json()["msg"])
			
 
				+        except Exception as e:
			
 
				+            Common.logger(log_type).error("写入数据异常:{}", e)
			
 
				+
			
 
				+    # 合并单元格
			
 
				+    @classmethod
			
 
				+    def merge_cells(cls, log_type, crawler, sheetid, ranges):
			
 
				+        """
			
 
				+        合并单元格
			
 
				+        :param log_type: 日志路径
			
 
				+        :param crawler: 哪个爬虫
			
 
				+        :param sheetid:哪张工作表
			
 
				+        :param ranges:需要合并的单元格范围
			
 
				+        """
			
 
				+        merge_cells_url = "https://open.feishu.cn/open-apis/sheets/v2/spreadsheets/" \
			
 
				+                          + cls.spreadsheettoken(crawler) + "/merge_cells"
			
 
				+        headers = {
			
 
				+            "Authorization": "Bearer " + cls.get_token(log_type),
			
 
				+            "Content-Type": "application/json; charset=utf-8"
			
 
				+        }
			
 
				+
			
 
				+        body = {
			
 
				+            "range": sheetid + "!" + ranges,
			
 
				+            "mergeType": "MERGE_ROWS"
			
 
				+        }
			
 
				+
			
 
				+        try:
			
 
				+            urllib3.disable_warnings()
			
 
				+            r = requests.post(url=merge_cells_url, headers=headers, json=body, proxies=proxies, verify=False)
			
 
				+            Common.logger(log_type).info("合并单元格:{}", r.json()["msg"])
			
 
				+        except Exception as e:
			
 
				+            Common.logger(log_type).error("合并单元格异常:{}", e)
			
 
				+
			
 
				+    # 读取单元格数据
			
 
				+    @classmethod
			
 
				+    def get_range_value(cls, log_type, crawler, sheetid, cell):
			
 
				+        """
			
 
				+        读取单元格内容
			
 
				+        :param log_type: 日志路径
			
 
				+        :param crawler: 哪个爬虫
			
 
				+        :param sheetid: 哪张工作表
			
 
				+        :param cell: 哪个单元格
			
 
				+        :return: 单元格内容
			
 
				+        """
			
 
				+        get_range_value_url = "https://open.feishu.cn/open-apis/sheets/v2/spreadsheets/" \
			
 
				+                              + cls.spreadsheettoken(crawler) + "/values/" + sheetid + "!" + cell
			
 
				+        headers = {
			
 
				+            "Authorization": "Bearer " + cls.get_token(log_type),
			
 
				+            "Content-Type": "application/json; charset=utf-8"
			
 
				+        }
			
 
				+        params = {
			
 
				+            # valueRenderOption=ToString 可返回纯文本的值(数值类型除外)；
			
 
				+            # valueRenderOption=FormattedValue 计算并格式化单元格；
			
 
				+            # valueRenderOption=Formula 单元格中含有公式时返回公式本身；
			
 
				+            # valueRenderOption=UnformattedValue 计算但不对单元格进行格式化。
			
 
				+            "valueRenderOption": "FormattedValue",
			
 
				+
			
 
				+            # dateTimeRenderOption=FormattedString 计算并对时间日期按照其格式进行格式化，但不会对数字进行格式化，返回格式化后的字符串。
			
 
				+            "dateTimeRenderOption": "",
			
 
				+
			
 
				+            # 返回的用户id类型，可选open_id,union_id
			
 
				+            "user_id_type": "open_id"
			
 
				+        }
			
 
				+        try:
			
 
				+            urllib3.disable_warnings()
			
 
				+            r = requests.get(url=get_range_value_url, headers=headers, params=params, proxies=proxies, verify=False)
			
 
				+            # print(r.text)
			
 
				+            return r.json()["data"]["valueRange"]["values"][0]
			
 
				+        except Exception as e:
			
 
				+            Common.logger(log_type).error("读取单元格数据异常:{}", e)
			
 
				+
			
 
				+    # 删除行或列，可选 ROWS、COLUMNS
			
 
				+    @classmethod
			
 
				+    def dimension_range(cls, log_type, crawler, sheetid, major_dimension, startindex, endindex):
			
 
				+        """
			
 
				+        删除行或列
			
 
				+        :param log_type: 日志路径
			
 
				+        :param crawler: 哪个爬虫
			
 
				+        :param sheetid:工作表
			
 
				+        :param major_dimension:默认 ROWS ，可选 ROWS、COLUMNS
			
 
				+        :param startindex:开始的位置
			
 
				+        :param endindex:结束的位置
			
 
				+        :return:
			
 
				+        """
			
 
				+        dimension_range_url = "https://open.feishu.cn/open-apis/sheets/v2/spreadsheets/" \
			
 
				+                              + cls.spreadsheettoken(crawler) + "/dimension_range"
			
 
				+        headers = {
			
 
				+            "Authorization": "Bearer " + cls.get_token(log_type),
			
 
				+            "Content-Type": "application/json; charset=utf-8"
			
 
				+        }
			
 
				+        body = {
			
 
				+            "dimension": {
			
 
				+                "sheetId": sheetid,
			
 
				+                "majorDimension": major_dimension,
			
 
				+                "startIndex": startindex,
			
 
				+                "endIndex": endindex
			
 
				+            }
			
 
				+        }
			
 
				+        try:
			
 
				+            urllib3.disable_warnings()
			
 
				+            r = requests.delete(url=dimension_range_url, headers=headers, json=body, proxies=proxies, verify=False)
			
 
				+            Common.logger(log_type).info("删除视频数据:{}", r.json()["msg"])
			
 
				+        except Exception as e:
			
 
				+            Common.logger(log_type).error("删除视频数据异常:{}", e)
			
 
				+
			
 
				+    # 获取用户 ID
			
 
				+    @classmethod
			
 
				+    def get_userid(cls, log_type, username):
			
 
				+        try:
			
 
				+            url = "https://open.feishu.cn/open-apis/user/v1/batch_get_id?"
			
 
				+            headers = {
			
 
				+                "Authorization": "Bearer " + cls.get_token(log_type),
			
 
				+                "Content-Type": "application/json; charset=utf-8"
			
 
				+            }
			
 
				+            if username == "wangkun":
			
 
				+                username = cls.wangkun
			
 
				+            elif username == "gaonannan":
			
 
				+                username = cls.gaonannan
			
 
				+            elif username == "xinxin":
			
 
				+                username = cls.xinxin
			
 
				+            elif username == "huxinxue":
			
 
				+                username = cls.huxinxue
			
 
				+            data = {"mobiles": [username]}
			
 
				+            urllib3.disable_warnings()
			
 
				+            r = requests.get(url=url, headers=headers, params=data, verify=False, proxies=proxies)
			
 
				+            open_id = r.json()["data"]["mobile_users"][username][0]["open_id"]
			
 
				+            Common.logger(log_type).info("{}:{}", username, open_id)
			
 
				+            # print(f"{username}:{open_id}")
			
 
				+            return open_id
			
 
				+        except Exception as e:
			
 
				+            Common.logger(log_type).error("get_userid异常:{}", e)
			
 
				+
			
 
				+    # 飞书机器人
			
 
				+    @classmethod
			
 
				+    def bot(cls, log_type, crawler, text):
			
 
				+        try:
			
 
				+            url = "https://open.feishu.cn/open-apis/bot/v2/hook/96989577-50e7-4653-9ec2-308fe3f2c5fe"
			
 
				+            headers = {
			
 
				+                'Content-Type': 'application/json'
			
 
				+            }
			
 
				+            if crawler == "kanyikan":
			
 
				+                content = "看一看爬虫表"
			
 
				+                sheet_url = "https://w42nne6hzg.feishu.cn/sheets/shtcngRPoDYAi24x52j2nDuHMih?sheet=20ce0c"
			
 
				+            elif crawler == "xiaoniangao":
			
 
				+                content = "小年糕爬虫表"
			
 
				+                sheet_url = "https://w42nne6hzg.feishu.cn/sheets/shtcnYxiyQ1wLklo1W5Kdqc9cGh?sheet=yatRv2"
			
 
				+            elif crawler == "music_album":
			
 
				+                content = "音乐相册爬虫表"
			
 
				+                sheet_url = "https://w42nne6hzg.feishu.cn/sheets/shtcnT6zvmfsYe1g0iv4pt7855g?sheet=f5a76e"
			
 
				+            elif crawler == "bszf":
			
 
				+                content = "本山祝福爬虫表"
			
 
				+                sheet_url = "https://w42nne6hzg.feishu.cn/sheets/shtcnGh2rrsPYM4iVNEBO7OqWrb?sheet=440018"
			
 
				+            elif crawler == "kuaishou":
			
 
				+                content = "快手爬虫表"
			
 
				+                sheet_url = "https://w42nne6hzg.feishu.cn/sheets/shtcnICEfaw9llDNQkKgdymM1xf?sheet=3cd128"
			
 
				+            elif crawler == "gzh":
			
 
				+                content = "公众号爬虫表"
			
 
				+                sheet_url = "https://w42nne6hzg.feishu.cn/sheets/shtcnexNXnpDLHhARw0QdiwbYuA?sheet=fCs3BT"
			
 
				+            else:
			
 
				+                content = "小年糕爬虫表"
			
 
				+                sheet_url = "https://w42nne6hzg.feishu.cn/sheets/shtcnYxiyQ1wLklo1W5Kdqc9cGh?sheet=yatRv2"
			
 
				+
			
 
				+            data = json.dumps({
			
 
				+                "msg_type": "interactive",
			
 
				+                "card": {
			
 
				+                    "config": {
			
 
				+                        "wide_screen_mode": True,
			
 
				+                        "enable_forward": True
			
 
				+                    },
			
 
				+                    "elements": [{
			
 
				+                        "tag": "div",
			
 
				+                        "text": {
			
 
				+                            "content": "\n<at id=" + str(cls.get_userid(log_type, "wangkun")) + "></at>\n" + text,
			
 
				+                            "tag": "lark_md"
			
 
				+                        }
			
 
				+                    }, {
			
 
				+                        "actions": [{
			
 
				+                            "tag": "button",
			
 
				+                            "text": {
			
 
				+                                "content": content,
			
 
				+                                "tag": "lark_md"
			
 
				+                            },
			
 
				+                            "url": sheet_url,
			
 
				+                            "type": "default",
			
 
				+                            "value": {}
			
 
				+                        }],
			
 
				+                        "tag": "action"
			
 
				+                    }],
			
 
				+                    "header": {
			
 
				+                        "title": {
			
 
				+                            "content": "📣您有新的报警，请注意查收",
			
 
				+                            "tag": "plain_text"
			
 
				+                        }
			
 
				+                    }
			
 
				+                }
			
 
				+            })
			
 
				+            urllib3.disable_warnings()
			
 
				+            r = requests.post(url, headers=headers, data=data, verify=False, proxies=proxies)
			
 
				+            Common.logger(log_type).info("触发机器人消息:{}, {}", r, r.json()["StatusMessage"])
			
 
				+        except Exception as e:
			
 
				+            Common.logger(log_type).error("bot异常:{}", e)
			
 
				+
			
 
				+
			
 
				+if __name__ == "__main__":
			
 
				+    Feishu.bot("bot", "kuaishou", "我是快手测试内容，请忽略")
			
 
				+    # Feishu.get_userid("kuaishou", "huxinxue")
			
--- a/main/publish.py
+++ b/main/publish.py
@@ -0,0 +1,252 @@
 
				+# -*- coding: utf-8 -*-
			
 
				+# @Author: wangkun
			
 
				+# @Time: 2022/8/11
			
 
				+import json
			
 
				+import os
			
 
				+import random
			
 
				+import time
			
 
				+import oss2
			
 
				+import requests
			
 
				+import urllib3
			
 
				+from main.common import Common
			
 
				+proxies = {"http": None, "https": None}
			
 
				+
			
 
				+
			
 
				+class Publish:
			
 
				+    @classmethod
			
 
				+    def publish_video_dev(cls, log_type, request_data):
			
 
				+        """
			
 
				+        loginUid  站内uid (随机)
			
 
				+        appType  默认：888888
			
 
				+        crawlerSrcId   站外视频ID
			
 
				+        crawlerSrcCode   渠道（自定义 KYK）
			
 
				+        crawlerSrcPublishTimestamp  视频原发布时间
			
 
				+        crawlerTaskTimestamp   爬虫创建时间（可以是当前时间）
			
 
				+        videoPath  视频oss地址
			
 
				+        coverImgPath  视频封面oss地址
			
 
				+        title  标题
			
 
				+        totalTime  视频时长
			
 
				+        viewStatus  视频的有效状态 默认1
			
 
				+        versionCode  版本 默认1
			
 
				+        :return:
			
 
				+        """
			
 
				+        # Common.logger().info('publish request data: {}'.format(request_data))
			
 
				+        result = cls.request_post('https://videotest.yishihui.com/longvideoapi/crawler/video/send', request_data)
			
 
				+        # Common.logger(log_type).info('publish result: {}'.format(result))
			
 
				+        video_id = result["data"]["id"]
			
 
				+        # Common.logger(log_type).info('video_id: {}'.format(video_id))
			
 
				+        if result['code'] != 0:
			
 
				+            Common.logger(log_type).error('pushlish failure msg = {}'.format(result['msg']))
			
 
				+        else:
			
 
				+            Common.logger(log_type).info('publish success video_id = : {}'.format(request_data['crawlerSrcId']))
			
 
				+        return video_id
			
 
				+
			
 
				+    @classmethod
			
 
				+    def publish_video_prod(cls, log_type, request_data):
			
 
				+        """
			
 
				+        loginUid  站内uid (随机)
			
 
				+        appType  默认：888888
			
 
				+        crawlerSrcId   站外视频ID
			
 
				+        crawlerSrcCode   渠道（自定义 KYK）
			
 
				+        crawlerSrcPublishTimestamp  视频原发布时间
			
 
				+        crawlerTaskTimestamp   爬虫创建时间（可以是当前时间）
			
 
				+        videoPath  视频oss地址
			
 
				+        coverImgPath  视频封面oss地址
			
 
				+        title  标题
			
 
				+        totalTime  视频时长
			
 
				+        viewStatus  视频的有效状态 默认1
			
 
				+        versionCode  版本 默认1
			
 
				+        :return:
			
 
				+        """
			
 
				+        result = cls.request_post('https://longvideoapi.piaoquantv.com/longvideoapi/crawler/video/send', request_data)
			
 
				+        # Common.logger(log_type).info('publish result: {}'.format(result))
			
 
				+        video_id = result["data"]["id"]
			
 
				+        # Common.logger(log_type).info('video_id: {}'.format(video_id))
			
 
				+        if result['code'] != 0:
			
 
				+            Common.logger(log_type).error('pushlish failure msg = {}'.format(result['msg']))
			
 
				+        else:
			
 
				+            Common.logger(log_type).info('publish success video_id = : {}'.format(request_data['crawlerSrcId']))
			
 
				+        return video_id
			
 
				+
			
 
				+    @classmethod
			
 
				+    def request_post(cls, request_url, request_data):
			
 
				+        """
			
 
				+        post 请求 HTTP接口
			
 
				+        :param request_url: 接口URL
			
 
				+        :param request_data: 请求参数
			
 
				+        :return: res_data json格式
			
 
				+        """
			
 
				+        urllib3.disable_warnings()
			
 
				+        response = requests.post(url=request_url, data=request_data, proxies=proxies, verify=False)
			
 
				+        if response.status_code == 200:
			
 
				+            res_data = json.loads(response.text)
			
 
				+            return res_data
			
 
				+
			
 
				+    # 以下代码展示了基本的文件上传、下载、罗列、删除用法。
			
 
				+
			
 
				+    # 首先初始化AccessKeyId、AccessKeySecret、Endpoint等信息。
			
 
				+    # 通过环境变量获取，或者把诸如“<你的AccessKeyId>”替换成真实的AccessKeyId等。
			
 
				+    #
			
 
				+    # 以杭州区域为例，Endpoint可以是：
			
 
				+    #   http://oss-cn-hangzhou.aliyuncs.com
			
 
				+    #   https://oss-cn-hangzhou.aliyuncs.com
			
 
				+    # 分别以HTTP、HTTPS协议访问。
			
 
				+    access_key_id = os.getenv('OSS_TEST_ACCESS_KEY_ID', 'LTAIP6x1l3DXfSxm')
			
 
				+    access_key_secret = os.getenv('OSS_TEST_ACCESS_KEY_SECRET', 'KbTaM9ars4OX3PMS6Xm7rtxGr1FLon')
			
 
				+    bucket_name = os.getenv('OSS_TEST_BUCKET', 'art-pubbucket')
			
 
				+    # endpoint = os.getenv('OSS_TEST_ENDPOINT', 'oss-cn-hangzhou-internal.aliyuncs.com')
			
 
				+    endpoint = os.getenv('OSS_TEST_ENDPOINT', 'oss-cn-hangzhou.aliyuncs.com')
			
 
				+
			
 
				+    # 确认上面的参数都填写正确了
			
 
				+    for param in (access_key_id, access_key_secret, bucket_name, endpoint):
			
 
				+        assert '<' not in param, '请设置参数：' + param
			
 
				+
			
 
				+    # 创建Bucket对象，所有Object相关的接口都可以通过Bucket对象来进行
			
 
				+    bucket = oss2.Bucket(oss2.Auth(access_key_id, access_key_secret), endpoint, bucket_name)
			
 
				+
			
 
				+    """
			
 
				+    处理流程：
			
 
				+    1. 定时（每天凌晨1点执行一次）循环files文件下的内容 结构：files -> 视频文件夹 -> 视频文件 + 封面图 + 基本信息
			
 
				+    2. 视频文件和封面上传到oss
			
 
				+    - 视频文件oss目录  longvideo/crawler_local/video/prod/文件名
			
 
				+    - 视频封面oss目录  longvideo/crawler_local/image/prod/文件名
			
 
				+    3. 发布视频
			
 
				+    - 读取 基本信息 调用发布接口
			
 
				+    """
			
 
				+    # env 日期20220225 文件名
			
 
				+    oss_file_path_video = 'longvideo/crawler_local/video/{}/{}/{}'
			
 
				+    oss_file_path_image = 'longvideo/crawler_local/image/{}/{}/{}'
			
 
				+
			
 
				+    @classmethod
			
 
				+    def put_file(cls, log_type, oss_file, local_file):
			
 
				+        cls.bucket.put_object_from_file(oss_file, local_file)
			
 
				+        Common.logger(log_type).info("put oss file = {}, local file = {} success".format(oss_file, local_file))
			
 
				+
			
 
				+    # 清除本地文件
			
 
				+    @classmethod
			
 
				+    def remove_local_file(cls, log_type, local_file):
			
 
				+        os.remove(local_file)
			
 
				+        Common.logger(log_type).info("remove local file = {} success".format(local_file))
			
 
				+
			
 
				+    # 清除本地文件夹
			
 
				+    @classmethod
			
 
				+    def remove_local_file_dir(cls, log_type, local_file):
			
 
				+        os.rmdir(local_file)
			
 
				+        Common.logger(log_type).info("remove local file dir = {} success".format(local_file))
			
 
				+
			
 
				+    local_file_path = './videos'
			
 
				+    video_file = 'video'
			
 
				+    image_file = 'image'
			
 
				+    info_file = 'info'
			
 
				+    uids_dev_up = [6267140]
			
 
				+    uids_dev_play = [6267141]
			
 
				+    uids_prod_up = [20631278, 20631279]
			
 
				+    uids_prod_play = [20631278, 20631279]
			
 
				+
			
 
				+    @classmethod
			
 
				+    def upload_and_publish(cls, log_type, env, job):
			
 
				+        """
			
 
				+        上传视频到 oss
			
 
				+        :param log_type: 选择的 log
			
 
				+        :param env: 测试环境：dev，正式环境：prod
			
 
				+        :param job: 上升榜：up，播放量：play
			
 
				+        """
			
 
				+        Common.logger(log_type).info("upload_and_publish starting...")
			
 
				+        today = time.strftime("%Y%m%d", time.localtime())
			
 
				+        # videos 目录下的所有视频文件夹
			
 
				+        files = os.listdir(cls.local_file_path)
			
 
				+        for f in files:
			
 
				+            try:
			
 
				+                # 单个视频文件夹
			
 
				+                fi_d = os.path.join(cls.local_file_path, f)
			
 
				+                # 确认为视频文件夹
			
 
				+                if os.path.isdir(fi_d):
			
 
				+                    Common.logger(log_type).info('dir = {}'.format(fi_d))
			
 
				+                    # 列出所有视频文件夹
			
 
				+                    dir_files = os.listdir(fi_d)
			
 
				+                    data = {'appType': '888888',
			
 
				+                            'crawlerSrcCode': 'WEIQUNVIDEO',
			
 
				+                            'viewStatus': '1',
			
 
				+                            'versionCode': '1'}
			
 
				+                    now_timestamp = int(round(time.time() * 1000))
			
 
				+                    data['crawlerTaskTimestamp'] = str(now_timestamp)
			
 
				+                    global uid
			
 
				+                    if env == "dev" and job == "up":
			
 
				+                        uid = str(random.choice(cls.uids_dev_up))
			
 
				+                    elif env == "dev" and job == "play":
			
 
				+                        uid = str(random.choice(cls.uids_dev_play))
			
 
				+                    elif env == "prod" and job == "up":
			
 
				+                        uid = str(random.choice(cls.uids_prod_up))
			
 
				+                    elif env == "prod" and job == "play":
			
 
				+                        uid = str(random.choice(cls.uids_prod_play))
			
 
				+                    data['loginUid'] = uid
			
 
				+                    # 单个视频文件夹下的所有视频文件
			
 
				+                    for fi in dir_files:
			
 
				+                        # 视频文件夹下的所有文件路径
			
 
				+                        fi_path = fi_d + '/' + fi
			
 
				+                        Common.logger(log_type).info('dir fi_path = {}'.format(fi_path))
			
 
				+                        # 读取 info.txt，赋值给 data
			
 
				+                        if cls.info_file in fi:
			
 
				+                            f = open(fi_path, "r", encoding="UTF-8")
			
 
				+                            # 读取数据 数据准确性写入的时候保证 读取暂不处理
			
 
				+                            for i in range(14):
			
 
				+                                line = f.readline()
			
 
				+                                line = line.replace('\n', '')
			
 
				+                                if line is not None and len(line) != 0 and not line.isspace():
			
 
				+                                    # Common.logger(log_type).info("line = {}".format(line))
			
 
				+                                    if i == 0:
			
 
				+                                        data['crawlerSrcId'] = line
			
 
				+                                    elif i == 1:
			
 
				+                                        data['title'] = line
			
 
				+                                    elif i == 2:
			
 
				+                                        data['totalTime'] = line
			
 
				+                                    elif i == 8:
			
 
				+                                        data['crawlerSrcPublishTimestamp'] = line
			
 
				+                                else:
			
 
				+                                    Common.logger(log_type).warning("{} line is None".format(fi_path))
			
 
				+                            f.close()
			
 
				+                            # remove info.txt
			
 
				+                            cls.remove_local_file(log_type, fi_path)
			
 
				+                    # 刷新数据
			
 
				+                    dir_files = os.listdir(fi_d)
			
 
				+                    for fi in dir_files:
			
 
				+                        fi_path = fi_d + '/' + fi
			
 
				+                        # Common.logger(log_type).info('dir fi_path = {}'.format(fi_path))
			
 
				+                        # 上传oss
			
 
				+                        if cls.video_file in fi:
			
 
				+                            global oss_video_file
			
 
				+                            if env == "dev":
			
 
				+                                oss_video_file = cls.oss_file_path_video.format("dev", today, data['crawlerSrcId'])
			
 
				+                            elif env == "prod":
			
 
				+                                oss_video_file = cls.oss_file_path_video.format("prod", today, data['crawlerSrcId'])
			
 
				+                            Common.logger(log_type).info("oss_video_file = {}".format(oss_video_file))
			
 
				+                            cls.put_file(log_type, oss_video_file, fi_path)
			
 
				+                            data['videoPath'] = oss_video_file
			
 
				+                            Common.logger(log_type).info("videoPath = {}".format(oss_video_file))
			
 
				+                        elif cls.image_file in fi:
			
 
				+                            global oss_image_file
			
 
				+                            if env == "dev":
			
 
				+                                oss_image_file = cls.oss_file_path_image.format("env", today, data['crawlerSrcId'])
			
 
				+                            elif env == "prod":
			
 
				+                                oss_image_file = cls.oss_file_path_image.format("prod", today, data['crawlerSrcId'])
			
 
				+                            Common.logger(log_type).info("oss_image_file = {}".format(oss_image_file))
			
 
				+                            cls.put_file(log_type, oss_image_file, fi_path)
			
 
				+                            data['coverImgPath'] = oss_image_file
			
 
				+                            Common.logger(log_type).info("coverImgPath = {}".format(oss_image_file))
			
 
				+                        # 全部remove
			
 
				+                        cls.remove_local_file(log_type, fi_path)
			
 
				+
			
 
				+                    # 发布
			
 
				+                    if env == "dev":
			
 
				+                        video_id = cls.publish_video_dev(log_type, data)
			
 
				+                    elif env == "prod":
			
 
				+                        video_id = cls.publish_video_prod(log_type, data)
			
 
				+                    else:
			
 
				+                        video_id = cls.publish_video_dev(log_type, data)
			
 
				+                    cls.remove_local_file_dir(log_type, fi_d)
			
 
				+                    return video_id
			
 
				+
			
 
				+                else:
			
 
				+                    Common.logger(log_type).error('file not a dir = {}'.format(fi_d))
			
 
				+            except Exception as e:
			
 
				+                Common.logger(log_type).exception('upload_and_publish error', e)
			
--- a/main/run_weiqun_music.py
+++ b/main/run_weiqun_music.py
@@ -0,0 +1,36 @@
 
				+# -*- coding: utf-8 -*-
			
 
				+# @Author: wangkun
			
 
				+# @Time: 2022/8/11
			
 
				+import datetime
			
 
				+import os
			
 
				+import sys
			
 
				+import time
			
 
				+sys.path.append(os.getcwd())
			
 
				+from main.common import Common
			
 
				+from main.weiqun_music import Music
			
 
				+
			
 
				+
			
 
				+class Main:
			
 
				+    @classmethod
			
 
				+    def main(cls):
			
 
				+        while True:
			
 
				+            if 12 >= datetime.datetime.now().hour >= 9:
			
 
				+                # 抓取视频
			
 
				+                Common.logger("weiqun").info("开始抓取微群视频小程序音乐榜\n")
			
 
				+                Music.get_video_list("weiqun")
			
 
				+                # 下载/上传
			
 
				+                Common.logger("weiqun").info("开始下载/上传微群视频小程序音乐榜\n")
			
 
				+                Music.run_download_publish("weiqun", "dev")
			
 
				+                # 清除日志
			
 
				+                Common.logger("weiqun").info("开始清除日志")
			
 
				+                Common.del_logs("weiqun")
			
 
				+                # 休眠
			
 
				+                Common.logger("weiqun").info("休眠 120 分钟\n")
			
 
				+                time.sleep(7200)
			
 
				+            else:
			
 
				+                pass
			
 
				+
			
 
				+
			
 
				+if __name__ == "__main__":
			
 
				+    main = Main()
			
 
				+    main.main()
			
--- a/main/weiqun_music.py
+++ b/main/weiqun_music.py
@@ -0,0 +1,424 @@
 
				+# -*- coding: utf-8 -*-
			
 
				+# @Author: wangkun
			
 
				+# @Time: 2022/8/11
			
 
				+import os
			
 
				+import random
			
 
				+import shutil
			
 
				+import sys
			
 
				+import time
			
 
				+import ffmpeg
			
 
				+import requests
			
 
				+import urllib3
			
 
				+
			
 
				+sys.path.append(os.getcwd())
			
 
				+from main.common import Common
			
 
				+from main.feishu_lib import Feishu
			
 
				+from main.publish import Publish
			
 
				+
			
 
				+
			
 
				+class Music:
			
 
				+
			
 
				+    # 获取已下载视频宽高、时长等信息
			
 
				+    @classmethod
			
 
				+    def get_video_info_from_local(cls, video_path):
			
 
				+        probe = ffmpeg.probe(video_path)
			
 
				+        # print('video_path: {}'.format(video_path))
			
 
				+        # format1 = probe['format']
			
 
				+        # bit_rate = int(format1['bit_rate']) / 1000
			
 
				+        # duration = format['duration']
			
 
				+        # size = int(format1['size']) / 1024 / 1024
			
 
				+        video_stream = next((stream for stream in probe['streams'] if stream['codec_type'] == 'video'), None)
			
 
				+        if video_stream is None:
			
 
				+            print('No video stream found!')
			
 
				+            return
			
 
				+        width = int(video_stream['width'])
			
 
				+        height = int(video_stream['height'])
			
 
				+        # num_frames = int(video_stream['nb_frames'])
			
 
				+        # fps = int(video_stream['r_frame_rate'].split('/')[0]) / int(video_stream['r_frame_rate'].split('/')[1])
			
 
				+        duration = float(video_stream['duration'])
			
 
				+        # print('width: {}'.format(width))
			
 
				+        # print('height: {}'.format(height))
			
 
				+        # print('num_frames: {}'.format(num_frames))
			
 
				+        # print('bit_rate: {}k'.format(bit_rate))
			
 
				+        # print('fps: {}'.format(fps))
			
 
				+        # print('size: {}MB'.format(size))
			
 
				+        # print('duration: {}'.format(duration))
			
 
				+        return width, height, duration
			
 
				+
			
 
				+    # 获取视频ID
			
 
				+    @classmethod
			
 
				+    def get_video_list(cls, log_type):
			
 
				+        try:
			
 
				+            # 翻10页
			
 
				+            for num in range(1, 5):
			
 
				+                Common.logger(log_type).info("正在抓取第{}页\n", num)
			
 
				+                url = "https://ayg.818ao.com/app/index.php?"
			
 
				+                headers = {
			
 
				+                    "content-type": "application/x-www-form-urlencoded",
			
 
				+                    "user-agent": "Mozilla/5.0 (iPhone; CPU iPhone OS 14_7_1 like Mac OS X) "
			
 
				+                                  "AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/15E148 "
			
 
				+                                  "MicroMessenger/8.0.26(0x18001a2e) NetType/WIFI Language/zh_CN",
			
 
				+                    "Accept-Encoding": "gzip,compress,br,deflate",
			
 
				+                    "Referer": "https://servicewechat.com/wx06417203b6ba3e25/1/page-frame.html"
			
 
				+                }
			
 
				+                query_string = {
			
 
				+                    "i": "13",
			
 
				+                    "t": "0",
			
 
				+                    "m": "jyt_txvideo",
			
 
				+                    "v": "1.4",
			
 
				+                    "from": "wxapp",
			
 
				+                    "c": "entry",
			
 
				+                    "a": "wxapp",
			
 
				+                    "do": "videolist",
			
 
				+                    "sign": "ffccddd4e767cf98e39222026b938015",
			
 
				+                }
			
 
				+                form = {
			
 
				+                    "category": "246",
			
 
				+                    "page": num,
			
 
				+                    "israndom": "",
			
 
				+                    "type": "0",
			
 
				+                    "isview": "",
			
 
				+                    "noauth": "true"
			
 
				+                }
			
 
				+                urllib3.disable_warnings()
			
 
				+                r = requests.post(url=url, headers=headers, params=query_string, data=form, verify=False)
			
 
				+                if "data" not in r.json() or len(r.json()["data"]) == 0:
			
 
				+                    Common.logger(log_type).warning("get_video_list:response:{}", r.text)
			
 
				+                else:
			
 
				+                    data = r.json()["data"]
			
 
				+                    for i in range(len(data)):
			
 
				+                        if "vid" in data[i]:
			
 
				+                            video_id = data[i]["vid"]
			
 
				+                            cls.get_video_info(log_type, video_id)
			
 
				+                        else:
			
 
				+                            Common.logger(log_type).info("get_video_list获取到无效视频，略过")
			
 
				+        except Exception as e:
			
 
				+            Common.logger(log_type).error("get_video_list异常:{}", e)
			
 
				+
			
 
				+    # 根据 video_id 获取 video_url
			
 
				+    @classmethod
			
 
				+    def get_video_url(cls, logtype, vid):
			
 
				+        try:
			
 
				+            url = "https://ayg.818ao.com/app/index.php?"
			
 
				+            headers = {
			
 
				+                "content-type": "application/x-www-form-urlencoded",
			
 
				+                "Accept-Encoding": "gzip,compress,br,deflate",
			
 
				+                "User-Agent": "Mozilla/5.0 (iPhone; CPU iPhone OS 14_7_1 like Mac OS X) "
			
 
				+                              "AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/15E148 "
			
 
				+                              "MicroMessenger/8.0.26(0x18001a2e) NetType/WIFI Language/zh_CN",
			
 
				+                "Referer": "https://servicewechat.com/wx06417203b6ba3e25/1/page-frame.html"
			
 
				+            }
			
 
				+            query_string = {
			
 
				+                "i": "13",
			
 
				+                "t": "0",
			
 
				+                "m": "jyt_txvideo",
			
 
				+                "v": "1.4",
			
 
				+                "from": "wxapp",
			
 
				+                "c": "entry",
			
 
				+                "a": "wxapp",
			
 
				+                "do": "videoinfo",
			
 
				+                "state": "we7sid-da63afcc7fbfdeb15d94c9683f83dc1f",
			
 
				+                "sign": "a449ac59c215b8cab2fbcbb6c3a609e2",
			
 
				+                "vid": vid,
			
 
				+                "version": "1.0.3",
			
 
				+            }
			
 
				+            urllib3.disable_warnings()
			
 
				+            r = requests.get(url=url, headers=headers, params=query_string, verify=False)
			
 
				+            if "data" not in r.json():
			
 
				+                Common.logger(logtype).warning("get_video_url:response:{}", r.json())
			
 
				+            else:
			
 
				+                video_url = r.json()["data"]["res"]
			
 
				+                return video_url
			
 
				+        except Exception as e:
			
 
				+            Common.logger(logtype).error("get_video_url异常:{}", e)
			
 
				+
			
 
				+    # 获取视频详情
			
 
				+    @classmethod
			
 
				+    def get_video_info(cls, log_type, vid):
			
 
				+        try:
			
 
				+            url = "https://ayg.818ao.com/app/index.php?"
			
 
				+            headers = {
			
 
				+                "content-type": "application/x-www-form-urlencoded",
			
 
				+                "user-agent": "User-Agent	Mozilla/5.0 (iPhone; CPU iPhone OS 14_7_1 like Mac OS X) "
			
 
				+                              "AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/15E148 MicroMessenger/8.0.26(0x18001a2e)"
			
 
				+                              " NetType/WIFI Language/zh_CN",
			
 
				+                "Accept-Encoding": "gzip,compress,br,deflate",
			
 
				+                "referer": "https://servicewechat.com/wx06417203b6ba3e25/1/page-frame.html"
			
 
				+            }
			
 
				+            query_string = {
			
 
				+                "i": "13",
			
 
				+                "t": "0",
			
 
				+                "m": "jyt_txvideo",
			
 
				+                "v": "1.4",
			
 
				+                "from": "wxapp",
			
 
				+                "c": "entry",
			
 
				+                "a": "wxapp",
			
 
				+                "do": "videodetail",
			
 
				+                "state": "we7sid-da63afcc7fbfdeb15d94c9683f83dc1f",
			
 
				+                "sign": "9b5c05a00fc03363daa1a48622b03bf3",
			
 
				+            }
			
 
				+            form = {
			
 
				+                "vid": vid,
			
 
				+                "cate": "246",
			
 
				+                "userad": ""
			
 
				+            }
			
 
				+            urllib3.disable_warnings()
			
 
				+            r = requests.post(url=url, headers=headers, params=query_string, data=form, verify=False)
			
 
				+            if r.json()["message"] != "视频详情":
			
 
				+                Common.logger(log_type).warning("get_video_info:response:{}", r.text)
			
 
				+            else:
			
 
				+
			
 
				+                # video_title
			
 
				+                if "vtitle" in r.json()["data"]:
			
 
				+                    video_title = r.json()["data"]["vtitle"]
			
 
				+                else:
			
 
				+                    video_title = 0
			
 
				+
			
 
				+                # video_id
			
 
				+                video_id = vid
			
 
				+
			
 
				+                # play_cnt
			
 
				+                if "realview" not in r.json()["data"]:
			
 
				+                    play_cnt = 0
			
 
				+                else:
			
 
				+                    play_cnt = r.json()["data"]["realview"]
			
 
				+
			
 
				+                # like_cnt
			
 
				+                like_cnt = 0
			
 
				+
			
 
				+                # share_cnt
			
 
				+                share_cnt = 0
			
 
				+
			
 
				+                # comment_cnt
			
 
				+                comment_cnt = 0
			
 
				+
			
 
				+                # send_time
			
 
				+                if "create_time" in r.json()["data"]:
			
 
				+                    send_time = r.json()["data"]["create_time"]
			
 
				+                else:
			
 
				+                    send_time = 0
			
 
				+
			
 
				+                # video_duration
			
 
				+                if "vtime" not in r.json()["data"]:
			
 
				+                    video_duration = 0
			
 
				+                elif r.json()["data"]["vtime"] == "" or r.json()["data"]["vtime"] is None:
			
 
				+                    video_duration = 0
			
 
				+                else:
			
 
				+                    video_duration = r.json()["data"]["vtime"]
			
 
				+
			
 
				+                # user_id
			
 
				+                if "uid" not in r.json()["data"]:
			
 
				+                    user_id = 0
			
 
				+                else:
			
 
				+                    user_id = r.json()["data"]["uid"]
			
 
				+
			
 
				+                # user_name
			
 
				+                user_name = "微群视频"
			
 
				+
			
 
				+                # cover_url
			
 
				+                if "poster" not in r.json()["data"]:
			
 
				+                    cover_url = 0
			
 
				+                elif "http" not in r.json()["data"]["poster"]:
			
 
				+                    cover_url = "http://qiniu.818ao.com/" + r.json()["data"]["poster"]
			
 
				+                else:
			
 
				+                    cover_url = r.json()["data"]["poster"]
			
 
				+
			
 
				+                # head_url
			
 
				+                head_url = cover_url
			
 
				+
			
 
				+                # video_url
			
 
				+                if "vid" not in r.json()["data"]:
			
 
				+                    video_url = 0
			
 
				+                elif r.json()["data"]["vid"] == vid:
			
 
				+                    video_url = cls.get_video_url(log_type, vid)
			
 
				+                else:
			
 
				+                    video_url = r.json()["data"]["vid"]
			
 
				+
			
 
				+                Common.logger(log_type).info("video_title:{}", video_title)
			
 
				+                Common.logger(log_type).info("video_id:{}", video_id)
			
 
				+                # Common.logger(log_type).info("play_cnt:{}", play_cnt)
			
 
				+                # Common.logger(log_type).info("like_cnt:{}", like_cnt)
			
 
				+                # Common.logger(log_type).info("share_cnt:{}", share_cnt)
			
 
				+                # Common.logger(log_type).info("comment_cnt:{}", comment_cnt)
			
 
				+                Common.logger(log_type).info("send_time:{}",
			
 
				+                                             time.strftime("%Y/%m/%d %H:%M:%S", time.localtime(int(send_time))))
			
 
				+                Common.logger(log_type).info("video_duration:{}", video_duration)
			
 
				+                # Common.logger(log_type).info("user_name:{}", user_name)
			
 
				+                # Common.logger(log_type).info("user_id:{}", user_id)
			
 
				+                # Common.logger(log_type).info("head_url:{}", head_url)
			
 
				+                # Common.logger(log_type).info("cover_url:{}", cover_url)
			
 
				+                Common.logger(log_type).info("video_url:{}", video_url)
			
 
				+
			
 
				+                # 过滤无效视频
			
 
				+                if video_title == 0 or video_id == 0 or send_time == 0 or cover_url == 0 or video_url == 0:
			
 
				+                    Common.logger(log_type).info("无效视频\n")
			
 
				+                # 已下载视频表去重
			
 
				+                elif str(video_id) in [n for m in Feishu.get_values_batch(log_type, "weiqun", "3cd128") for n in m]:
			
 
				+                    Common.logger(log_type).info("该视频已下载\n")
			
 
				+                # music_feeds去重
			
 
				+                elif str(video_id) in [n for m in Feishu.get_values_batch(log_type, "weiqun", "JK6npf") for n in m]:
			
 
				+                    Common.logger(log_type).info("该视频已在music_feeds中\n")
			
 
				+                else:
			
 
				+                    time.sleep(1)
			
 
				+                    Feishu.insert_columns(log_type, "weiqun", "JK6npf", "ROWS", 1, 2)
			
 
				+                    get_feeds_time = int(time.time())
			
 
				+                    values = [[str(time.strftime("%Y/%m/%d %H:%M:%S", time.localtime(get_feeds_time))),
			
 
				+                               "音乐榜",
			
 
				+                               str(video_id),
			
 
				+                               video_title,
			
 
				+                               int(play_cnt),
			
 
				+                               comment_cnt,
			
 
				+                               like_cnt,
			
 
				+                               share_cnt,
			
 
				+                               int(video_duration),
			
 
				+                               time.strftime("%Y/%m/%d %H:%M:%S", time.localtime(int(send_time))),
			
 
				+                               user_name,
			
 
				+                               user_id,
			
 
				+                               head_url,
			
 
				+                               cover_url,
			
 
				+                               video_url]]
			
 
				+                    time.sleep(1)
			
 
				+                    Feishu.update_values(log_type, "weiqun", "JK6npf", "A2:Q2", values)
			
 
				+                    Common.logger(log_type).info("添加至music_feeds成功\n")
			
 
				+        except Exception as e:
			
 
				+            Common.logger(log_type).error("get_video_info异常:{}", e)
			
 
				+
			
 
				+    # 下载/上传视频
			
 
				+    @classmethod
			
 
				+    def download_publish(cls, log_type, env):
			
 
				+        try:
			
 
				+            music_feeds_sheet = Feishu.get_values_batch(log_type, "weiqun", "JK6npf")
			
 
				+            for i in range(1, len(music_feeds_sheet)):
			
 
				+                download_video_id = music_feeds_sheet[i][2]
			
 
				+                download_video_title = music_feeds_sheet[i][3]
			
 
				+                download_video_play_cnt = music_feeds_sheet[i][4]
			
 
				+                download_video_comment_cnt = music_feeds_sheet[i][5]
			
 
				+                download_video_like_cnt = music_feeds_sheet[i][6]
			
 
				+                download_video_share_cnt = music_feeds_sheet[i][7]
			
 
				+                # download_video_duration = music_feeds_sheet[i][8]
			
 
				+                download_video_send_time = music_feeds_sheet[i][9]
			
 
				+                download_user_name = music_feeds_sheet[i][10]
			
 
				+                download_user_id = music_feeds_sheet[i][11]
			
 
				+                download_head_url = music_feeds_sheet[i][12]
			
 
				+                download_cover_url = music_feeds_sheet[i][13]
			
 
				+                download_video_url = music_feeds_sheet[i][14]
			
 
				+
			
 
				+                Common.logger(log_type).info("正在判断第{}行", i + 1)
			
 
				+                Common.logger(log_type).info("download_video_title:{}", download_video_title)
			
 
				+                # Common.logger(log_type).info("download_video_play_cnt:{}", download_video_play_cnt)
			
 
				+                # Common.logger(log_type).info("download_video_id:{}", download_video_id)
			
 
				+                # Common.logger(log_type).info("download_video_comment_cnt:{}", download_video_comment_cnt)
			
 
				+                # Common.logger(log_type).info("download_video_like_cnt:{}", download_video_like_cnt)
			
 
				+                # Common.logger(log_type).info("download_video_share_cnt:{}", download_video_share_cnt)
			
 
				+                Common.logger(log_type).info("download_video_send_time:{}", download_video_send_time)
			
 
				+                # Common.logger(log_type).info("download_user_name:{}", download_user_name)
			
 
				+                # Common.logger(log_type).info("download_user_id:{}", download_user_id)
			
 
				+                # Common.logger(log_type).info("download_head_url:{}", download_head_url)
			
 
				+                # Common.logger(log_type).info("download_cover_url:{}", download_cover_url)
			
 
				+                Common.logger(log_type).info("download_video_url:{}", download_video_url)
			
 
				+
			
 
				+                # 过滤空行
			
 
				+                if download_video_id is None or download_video_title is None or download_video_play_cnt is None:
			
 
				+                    Common.logger(log_type).warning("空行，略过\n")
			
 
				+                # 已下载视频表去重
			
 
				+                elif str(download_video_id) in [n for m in Feishu.get_values_batch(log_type, "weiqun", "3cd128")
			
 
				+                                                for n in m]:
			
 
				+                    Feishu.dimension_range(log_type, "weiqun", "JK6npf", "ROWS", i + 1, i + 1)
			
 
				+                    Common.logger(log_type).info("该视频已下载，删除成功\n")
			
 
				+                    return
			
 
				+                # 满足下载规则
			
 
				+                else:
			
 
				+                    # 下载视频
			
 
				+                    Common.download_method(log_type=log_type, text="video",
			
 
				+                                           d_name=str(download_video_title), d_url=str(download_video_url))
			
 
				+                    # 下载封面
			
 
				+                    Common.download_method(log_type=log_type, text="cover",
			
 
				+                                           d_name=str(download_video_title), d_url=str(download_cover_url))
			
 
				+                    # 获取视频宽高/时长
			
 
				+                    video_info = cls.get_video_info_from_local("./videos/" + download_video_title + "/video.mp4")
			
 
				+                    download_video_resolution = str(video_info[0]) + "*" + str(video_info[1])
			
 
				+                    download_video_duration = video_info[2]
			
 
				+
			
 
				+                    # 保存视频信息至 "./videos/{download_video_title}/info.txt"
			
 
				+                    with open("./videos/" + download_video_title
			
 
				+                              + "/" + "info.txt", "a", encoding="UTF-8") as f_a:
			
 
				+                        f_a.write(str(download_video_id) + "\n" +
			
 
				+                                  str(download_video_title) + "\n" +
			
 
				+                                  str(int(download_video_duration)) + "\n" +
			
 
				+                                  str(download_video_play_cnt) + "\n" +
			
 
				+                                  str(download_video_comment_cnt) + "\n" +
			
 
				+                                  str(download_video_like_cnt) + "\n" +
			
 
				+                                  str(download_video_share_cnt) + "\n" +
			
 
				+                                  str(download_video_resolution) + "\n" +
			
 
				+                                  str(int(time.mktime(
			
 
				+                                      time.strptime(download_video_send_time, "%Y/%m/%d %H:%M:%S")))) + "\n" +
			
 
				+                                  str(download_user_name) + "\n" +
			
 
				+                                  str(download_head_url) + "\n" +
			
 
				+                                  str(download_video_url) + "\n" +
			
 
				+                                  str(download_cover_url) + "\n" +
			
 
				+                                  "weiqunvideo")
			
 
				+                    Common.logger(log_type).info("==========视频信息已保存至info.txt==========")
			
 
				+
			
 
				+                    # 上传视频
			
 
				+                    Common.logger(log_type).info("开始上传视频:{}".format(download_video_title))
			
 
				+                    our_video_id = Publish.upload_and_publish(log_type, env, "play")
			
 
				+                    our_video_link = "https://admin.piaoquantv.com/cms/post-detail/" + str(our_video_id) + "/info"
			
 
				+                    Common.logger(log_type).info("视频上传完成:{}", download_video_title)
			
 
				+
			
 
				+                    # 保存视频 ID 到云文档
			
 
				+                    Common.logger(log_type).info("保存视频ID至已下载表:{}", download_video_title)
			
 
				+                    # 视频ID工作表，插入首行
			
 
				+                    Feishu.insert_columns(log_type, "weiqun", "3cd128", "ROWS", 1, 2)
			
 
				+                    # 视频ID工作表，首行写入数据
			
 
				+                    upload_time = int(time.time())
			
 
				+                    values = [[time.strftime("%Y/%m/%d %H:%M:%S", time.localtime(upload_time)),
			
 
				+                               "音乐榜",
			
 
				+                               str(download_video_id),
			
 
				+                               str(download_video_title),
			
 
				+                               our_video_link,
			
 
				+                               download_video_play_cnt,
			
 
				+                               download_video_comment_cnt,
			
 
				+                               download_video_like_cnt,
			
 
				+                               download_video_share_cnt,
			
 
				+                               int(download_video_duration),
			
 
				+                               str(download_video_resolution),
			
 
				+                               str(download_video_send_time),
			
 
				+                               str(download_user_name),
			
 
				+                               str(download_user_id),
			
 
				+                               str(download_head_url),
			
 
				+                               str(download_cover_url),
			
 
				+                               str(download_video_url)]]
			
 
				+                    time.sleep(1)
			
 
				+                    Feishu.update_values(log_type, "weiqun", "3cd128", "F2:W2", values)
			
 
				+
			
 
				+                    # 删除行或列，可选 ROWS、COLUMNS
			
 
				+                    Feishu.dimension_range(log_type, "weiqun", "JK6npf", "ROWS", i + 1, i + 1)
			
 
				+                    Common.logger(log_type).info("视频:{}，下载/上传成功\n", download_video_title)
			
 
				+                    return
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            Feishu.dimension_range(log_type, "weiqun", "JK6npf", "ROWS", 2, 2)
			
 
				+            Common.logger(log_type).error("download_publish异常:{}，删除成功", e)
			
 
				+
			
 
				+    # 执行下载/上传
			
 
				+    @classmethod
			
 
				+    def run_download_publish(cls, log_type, env):
			
 
				+        try:
			
 
				+            while True:
			
 
				+                time.sleep(1)
			
 
				+                music_feeds_sheet = Feishu.get_values_batch(log_type, "weiqun", "JK6npf")
			
 
				+                if len(music_feeds_sheet) == 1:
			
 
				+                    Common.logger(log_type).info("下载/上传完成\n")
			
 
				+                    break
			
 
				+                else:
			
 
				+                    cls.download_publish(log_type, env)
			
 
				+                    time.sleep(random.randint(1, 3))
			
 
				+        except Exception as e:
			
 
				+            Common.logger(log_type).error("run_download_publish异常:{}", e)
			
 
				+
			
 
				+
			
 
				+if __name__ == "__main__":
			
 
				+    # Music.get_video_list("weiqun")
			
 
				+    # Music.get_video_info("weiqun", "wxv_2228210032582639621")
			
 
				+    # print(Music.get_video_url("weiqun", "w3243xgp9i1"))
			
 
				+    Music.download_publish("weiqun", "dev")
			
--- a/videos/__init__.py
+++ b/videos/__init__.py
@@ -0,0 +1,3 @@
 
				+# -*- coding: utf-8 -*-
			
 
				+# @Author: wangkun
			
 
				+# @Time: 2022/8/11