Server
/
crawler_xiaoniangao


			
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244
							"""
上传视频到阿里云 OSS
上传视频到管理后台
"""
import json
import os
import random
import time

import oss2
import requests
import urllib3
from main.common import Common

proxies = {"http": None, "https": None}


class Publish:
    @classmethod
    def publish_video_dev(cls, request_data):
        """
        loginUid  站内uid (随机)
        appType  默认：888888
        crawlerSrcId   站外视频ID
        crawlerSrcCode   渠道（自定义 KYK）
        crawlerSrcPublishTimestamp  视频原发布时间
        crawlerTaskTimestamp   爬虫创建时间（可以是当前时间）
        videoPath  视频oss地址
        coverImgPath  视频封面oss地址
        title  标题
        totalTime  视频时长
        viewStatus  视频的有效状态 默认1
        versionCode  版本 默认1
        :return:
        """
        Common.logger().info('publish request data: {}'.format(request_data))
        result = cls.request_post('https://videotest.yishihui.com/longvideoapi/crawler/video/send', request_data)
        Common.logger().info('publish result: {}'.format(result))
        if result['code'] != 0:
            Common.logger().error('pushlish failure msg = {}'.format(result['msg']))
        else:
            Common.logger().info('publish success video_id = : {}'.format(request_data['crawlerSrcId']))

    @classmethod
    def publish_video_prod(cls, request_data):
        """
        loginUid  站内uid (随机)
        appType  默认：888888
        crawlerSrcId   站外视频ID
        crawlerSrcCode   渠道（自定义 KYK）
        crawlerSrcPublishTimestamp  视频原发布时间
        crawlerTaskTimestamp   爬虫创建时间（可以是当前时间）
        videoPath  视频oss地址
        coverImgPath  视频封面oss地址
        title  标题
        totalTime  视频时长
        viewStatus  视频的有效状态 默认1
        versionCode  版本 默认1
        :return:
        """
        result = cls.request_post('https://longvideoapi.piaoquantv.com/longvideoapi/crawler/video/send', request_data)
        Common.logger().info('publish result: {}'.format(result))
        if result['code'] != 0:
            Common.logger().error('pushlish failure msg = {}'.format(result['msg']))
        else:
            Common.logger().info('publish success video_id = : {}'.format(request_data['crawlerSrcId']))

    @classmethod
    def request_post(cls, request_url, request_data):
        """
        post 请求 HTTP接口
        :param request_url: 接口URL
        :param request_data: 请求参数
        :return: res_data json格式
        """
        urllib3.disable_warnings()
        response = requests.post(url=request_url, data=request_data, proxies=proxies, verify=False)
        if response.status_code == 200:
            res_data = json.loads(response.text)
            return res_data

    # 以下代码展示了基本的文件上传、下载、罗列、删除用法。

    # 首先初始化AccessKeyId、AccessKeySecret、Endpoint等信息。
    # 通过环境变量获取，或者把诸如“<你的AccessKeyId>”替换成真实的AccessKeyId等。
    #
    # 以杭州区域为例，Endpoint可以是：
    #   http://oss-cn-hangzhou.aliyuncs.com
    #   https://oss-cn-hangzhou.aliyuncs.com
    # 分别以HTTP、HTTPS协议访问。
    access_key_id = os.getenv('OSS_TEST_ACCESS_KEY_ID', 'LTAIP6x1l3DXfSxm')
    access_key_secret = os.getenv('OSS_TEST_ACCESS_KEY_SECRET', 'KbTaM9ars4OX3PMS6Xm7rtxGr1FLon')
    bucket_name = os.getenv('OSS_TEST_BUCKET', 'art-pubbucket')
    # endpoint = os.getenv('OSS_TEST_ENDPOINT', 'oss-cn-hangzhou-internal.aliyuncs.com')
    endpoint = os.getenv('OSS_TEST_ENDPOINT', 'oss-cn-hangzhou.aliyuncs.com')

    # 确认上面的参数都填写正确了
    for param in (access_key_id, access_key_secret, bucket_name, endpoint):
        assert '<' not in param, '请设置参数：' + param

    # 创建Bucket对象，所有Object相关的接口都可以通过Bucket对象来进行
    bucket = oss2.Bucket(oss2.Auth(access_key_id, access_key_secret), endpoint, bucket_name)

    """
    处理流程：
    1. 定时（每天凌晨1点执行一次）循环files文件下的内容 结构：files -> 视频文件夹 -> 视频文件 + 封面图 + 基本信息
    2. 视频文件和封面上传到oss
    - 视频文件oss目录  longvideo/crawler_local/video/prod/文件名
    - 视频封面oss目录  longvideo/crawler_local/image/prod/文件名
    3. 发布视频
    - 读取 基本信息 调用发布接口
    """
    # env 日期20220225 文件名
    oss_file_path_video = 'longvideo/crawler_local/video/{}/{}/{}'
    oss_file_path_image = 'longvideo/crawler_local/image/{}/{}/{}'

    @classmethod
    def put_file(cls, oss_file, local_file):
        cls.bucket.put_object_from_file(oss_file, local_file)
        Common.logger().info("put oss file = {}, local file = {} success".format(oss_file, local_file))

    # 清除本地文件
    @classmethod
    def remove_local_file(cls, local_file):
        os.remove(local_file)
        Common.logger().info("remove local file = {} success".format(local_file))

    # 清除本地文件夹
    @classmethod
    def remove_local_file_dir(cls, local_file):
        os.rmdir(local_file)
        Common.logger().info("remove local file dir = {} success".format(local_file))

    local_file_path = './videos'
    video_file = 'video'
    image_file = 'image'
    info_file = 'info'
    uids_dev_up = [6267140]
    uids_dev_play = [6267141]
    uids_prod_up = [20631208, 20631209, 20631210, 20631211, 20631212,
                    20631213, 20631214, 20631215, 20631216, 20631217]
    uids_prod_play = [20631228, 20631229, 20631230, 20631231, 20631232,
                      20631233, 20631234, 20631235, 20631236, 20631237]

    @classmethod
    def upload_and_publish(cls, env, job):
        """
        上传视频到 oss
        :param env: 测试环境：dev，正式环境：prod
        :param job: 上升榜：up，播放量：play
        """
        Common.logger().info("upload_and_publish starting...")
        today = time.strftime("%Y%m%d", time.localtime())
        # videos 目录下的所有视频文件夹
        files = os.listdir(cls.local_file_path)
        for f in files:
            try:
                # 单个视频文件夹
                fi_d = os.path.join(cls.local_file_path, f)
                # 确认为视频文件夹
                if os.path.isdir(fi_d):
                    Common.logger().info('dir = {}'.format(fi_d))
                    # 列出所有视频文件夹
                    dir_files = os.listdir(fi_d)
                    data = {'appType': '888888', 'crawlerSrcCode': 'XIAONIANGAO_XCX', 'viewStatus': '1', 'versionCode': '1'}
                    now_timestamp = int(round(time.time() * 1000))
                    data['crawlerTaskTimestamp'] = str(now_timestamp)
                    global uid
                    if env == "dev" and job == "up":
                        uid = str(random.choice(cls.uids_dev_up))
                    elif env == "dev" and job == "play":
                        uid = str(random.choice(cls.uids_dev_play))
                    elif env == "prod" and job == "up":
                        uid = str(random.choice(cls.uids_prod_up))
                    elif env == "prod" and job == "play":
                        uid = str(random.choice(cls.uids_prod_play))
                    data['loginUid'] = uid
                    # 单个视频文件夹下的所有视频文件
                    for fi in dir_files:
                        # 视频文件夹下的所有文件路径
                        fi_path = fi_d + '/' + fi
                        Common.logger().info('dir fi_path = {}'.format(fi_path))
                        # 读取 info.txt，赋值给 data
                        if cls.info_file in fi:
                            f = open(fi_path, "r", encoding="UTF-8")
                            # 读取数据 数据准确性写入的时候保证 读取暂不处理
                            for i in range(14):
                                line = f.readline()
                                line = line.replace('\n', '')
                                if line is not None and len(line) != 0 and not line.isspace():
                                    Common.logger().info("line = {}".format(line))
                                    if i == 0:
                                        data['crawlerSrcId'] = line
                                    elif i == 1:
                                        data['title'] = line
                                    elif i == 2:
                                        data['totalTime'] = line
                                    elif i == 8:
                                        data['crawlerSrcPublishTimestamp'] = line
                                else:
                                    Common.logger().warning("{} line is None".format(fi_path))
                            f.close()
                            # remove info.txt
                            cls.remove_local_file(fi_path)
                    # 刷新数据
                    dir_files = os.listdir(fi_d)
                    for fi in dir_files:
                        fi_path = fi_d + '/' + fi
                        Common.logger().info('dir fi_path = {}'.format(fi_path))
                        # 上传oss
                        if cls.video_file in fi:
                            global oss_video_file
                            if env == "dev":
                                oss_video_file = cls.oss_file_path_video.format("dev", today, data['crawlerSrcId'])
                            elif env == "prod":
                                oss_video_file = cls.oss_file_path_video.format("prod", today, data['crawlerSrcId'])
                            Common.logger().info("oss_video_file = {}".format(oss_video_file))
                            cls.put_file(oss_video_file, fi_path)
                            data['videoPath'] = oss_video_file
                            Common.logger().info("videoPath = {}".format(oss_video_file))
                        elif cls.image_file in fi:
                            global oss_image_file
                            if env == "dev":
                                oss_image_file = cls.oss_file_path_image.format("env", today, data['crawlerSrcId'])
                            elif env == "prod":
                                oss_image_file = cls.oss_file_path_image.format("prod", today, data['crawlerSrcId'])
                            Common.logger().info("oss_image_file = {}".format(oss_image_file))
                            cls.put_file(oss_image_file, fi_path)
                            data['coverImgPath'] = oss_image_file
                            Common.logger().info("coverImgPath = {}".format(oss_image_file))
                        # 全部remove
                        cls.remove_local_file(fi_path)

                    # 发布
                    if env == "dev":
                        cls.publish_video_dev(data)
                    elif env == "prod":
                        cls.publish_video_prod(data)
                    cls.remove_local_file_dir(fi_d)

                else:
                    Common.logger().error('file not a dir = {}'.format(fi_d))
            except Exception as e:
                Common.logger().exception('upload_and_publish error', e)