2 years ago · f17d0a3ab0
--- a/common/db/__pycache__/mysql_help.cpython-310.pyc
+++ b/common/db/__pycache__/mysql_help.cpython-310.pyc
--- a/common/db/mysql_help.py
+++ b/common/db/mysql_help.py
@@ -11,7 +11,7 @@ import pymysql
 
				 
			
 
				 class MysqlHelper:
			
 
				     @classmethod
			
 
				-    def connect_mysql(cls, env='', machine=''):
			
 
				+    def connect_mysql(cls, env='test', machine='test'):
			
 
				         if machine == 'aliyun_hk':
			
 
				             # 创建一个 Connection 对象，代表了一个数据库连接
			
 
				             connection = pymysql.connect(
			
@@ -49,7 +49,7 @@ class MysqlHelper:
 
				         return connection
			
 
				 
			
 
				     @classmethod
			
 
				-    def get_values(cls, sql, env='', machine=''):
			
 
				+    def get_values(cls, sql, env='test', machine='test'):
			
 
				         try:
			
 
				             # 连接数据库
			
 
				             connect = cls.connect_mysql(env, machine)
			
@@ -71,7 +71,25 @@ class MysqlHelper:
 
				             logging.error(f"get_values异常:{e}\n")
			
 
				 
			
 
				     @classmethod
			
 
				-    def update_values(cls, sql, env='', machine=''):
			
 
				+    def insert_values(cls, sql, value, env='test', machine='test'):
			
 
				+        try:
			
 
				+            # 连接数据库
			
 
				+            connect = cls.connect_mysql(env, machine)
			
 
				+            # 返回一个 Cursor对象
			
 
				+            mysql = connect.cursor()
			
 
				+
			
 
				+            # 执行 sql 语句
			
 
				+            mysql.execute(sql, value)
			
 
				+            connect.commit()
			
 
				+            # 关闭数据库连接
			
 
				+            connect.close()
			
 
				+            # 返回查询结果，元组
			
 
				+            return True
			
 
				+        except Exception as e:
			
 
				+            logging.error(f"insert_values异常:{e}\n")
			
 
				+
			
 
				+    @classmethod
			
 
				+    def update_values(cls, sql, env='test', machine='test'):
			
 
				         # 连接数据库
			
 
				         connect = cls.connect_mysql(env, machine)
			
 
				         # 返回一个 Cursor对象
			
@@ -82,14 +100,15 @@ class MysqlHelper:
 
				             res = mysql.execute(sql)
			
 
				             # 注意 一定要commit，否则添加数据不生效
			
 
				             connect.commit()
			
 
				-            return res
			
 
				+            connect.close()
			
 
				+            return True
			
 
				         except Exception as e:
			
 
				             logging.error(f"update_values异常，进行回滚操作:{e}\n")
			
 
				             # 发生错误时回滚
			
 
				             connect.rollback()
			
 
				-
			
 
				+            connect.close()
			
 
				+            return False
			
 
				         # 关闭数据库连接
			
 
				-        connect.close()
			
 
				 
			
 
				 
			
 
				 if __name__ == "__main__":
			
--- a/server/conf_task.py
+++ b/server/conf_task.py
@@ -1,14 +1,16 @@
 
				 import json
			
 
				+import requests
			
 
				 from flask import Flask, request
			
 
				 from flask import jsonify
			
 
				 from common.db.mysql_help import MysqlHelper
			
 
				+from user_spider.user_info import *
			
 
				 
			
 
				 app = Flask(__name__)
			
 
				 app.config['JSON_AS_ASCII'] = False
			
 
				 
			
 
				 
			
 
				 # 只接受get方法访问
			
 
				-@app.route("/v1/source/getinfo", methods=["GET"])
			
 
				+@app.route("/v1/crawler/source/getall", methods=["GET"])
			
 
				 def getSource():
			
 
				     # 获取传入的params参数
			
 
				     get_data = request.args.to_dict()
			
@@ -30,21 +32,36 @@ def getSource():
 
				     return jsonify({'return_code': '200', 'result': source_list})
			
 
				 
			
 
				 
			
 
				-@app.route("/v1/task/insert", methods=["POST"])
			
 
				-def inerttask():
			
 
				-    pass
			
 
				-    # 获取传入的参数
			
 
				-    # get_data = request.args.to_dict()
			
 
				-    # 传入的参数为bytes类型，需要转化成json
			
 
				+@app.route("/v1/crawler/task/insert", methods=["POST"])
			
 
				+def insertTask():
			
 
				+    data = request.form
			
 
				+    outer_info = data.get(('spider_link'))
			
 
				+    source = data.get('source')
			
 
				+    exist_outer_info = list()
			
 
				+    for link in outer_info:
			
 
				+        s_sql = f'select spider_link from crawler_task where source={source}'
			
 
				+        result = MysqlHelper.get_values(s_sql)
			
 
				+        if link in eval(result[0]):
			
 
				+            exist_outer_info.append(link)
			
 
				+    if exist_outer_info:
			
 
				+        return jsonify({'code': 200, 'message': '名单重复', 'spider_link': exist_outer_info})
			
 
				+    # 获取到一个以键且为逗号分隔的字符串，返回一个字符串
			
 
				+    keys = ','.join(data.keys())
			
 
				+    values = ','.join(['%s'] * len(data))
			
 
				+    sql = 'insert into {table}({keys}) VALUES({values})'.format(table='crawler_task', keys=keys, values=values)
			
 
				+    MysqlHelper.insert_values(sql, tuple(data.values()))
			
 
				 
			
 
				-    # return json.dumps(return_dict, ensure_ascii=False)
			
 
				+    return jsonify({'code': 200, 'message': 'task create success'})
			
 
				 
			
 
				 
			
 
				-@app.route("/v1/task/gettask", methods=["GET"])
			
 
				-def getTask():
			
 
				+@app.route("/v1/crawler/task/gettask", methods=["GET"])
			
 
				+def getAllTask():
			
 
				     get_data = request.args.to_dict()
			
 
				-
			
 
				-    sql = 'select task_id, task_name from crawler_task'
			
 
				+    page = get_data.get('page', 1)
			
 
				+    offset = get_data.get('offset', 10)
			
 
				+    start_count = (page * offset) - offset
			
 
				+    end_count = page * offset
			
 
				+    sql = f"""select task_id, task_name from crawler_task limit {start_count}, {end_count}"""
			
 
				     result = MysqlHelper.get_values(sql)
			
 
				     if not result:
			
 
				         return jsonify({'return_code': '200', 'result': [], 'message': 'no data'})
			
@@ -55,16 +72,71 @@ def getTask():
 
				             task_name=task_name,
			
 
				         )
			
 
				         source_list.append(data)
			
 
				-    return jsonify({'return_code': '200', 'result': source_list})
			
 
				+    return jsonify({'code': '200', 'result': source_list})
			
 
				+
			
 
				+
			
 
				+# @app.route("/v1/crawler/task/getone", methods=["GET"])
			
 
				+# def getOneTask():
			
 
				+#     get_data = request.args.to_dict()
			
 
				+#     task_id = get_data['task_id']
			
 
				+#     sql = f'select task_id, spider_link from crawler_task where task_id={task_id}'
			
 
				+#     result = MysqlHelper.get_values(sql)
			
 
				+#     if not result:
			
 
				+#         return jsonify({'code': '200', 'result': [], 'message': 'no data'})
			
 
				+#     for task_id, spider_link in result:
			
 
				+#         data = dict(
			
 
				+#             task_id=task_id,
			
 
				+#             spider_link=spider_link,
			
 
				+#         )
			
 
				+#     return jsonify({'code': '200', 'result': data})
			
 
				+
			
 
				+
			
 
				+@app.route("/v1/crawler/task/update", methods=["POST"])
			
 
				+def updateTask():
			
 
				+    task_id = request.form.get('task_id')
			
 
				+    spider_link = request.form.get('spider_link')
			
 
				+    print(spider_link, task_id)
			
 
				 
			
 
				+    sql = f"""UPDATE crawler_task SET spider_link='{spider_link}' where task_id = {task_id}"""
			
 
				+    print(sql)
			
 
				+    result = MysqlHelper.update_values(sql)
			
 
				+    if result:
			
 
				+        return jsonify({'code': 200, 'message': 'task update success'})
			
 
				+    else:
			
 
				+        return jsonify({'code': 400, 'message': 'task update faild'})
			
 
				 
			
 
				-@app.route("/v1/author/getuser", methods=["POST"])
			
 
				+
			
 
				+def get_user_info(source):
			
 
				+    source_spider = {
			
 
				+        'xigua': xigua_user_info
			
 
				+    }
			
 
				+    return source_spider.get(source)
			
 
				+
			
 
				+
			
 
				+@app.route("/v1/crawler/author/create", methods=["POST"])
			
 
				 def createUser():
			
 
				-    data = request.form.get('author')
			
 
				-    print(eval(data))
			
 
				-    for i in eval(data):
			
 
				-        print(i)
			
 
				-    return jsonify({'data':data})
			
 
				+    get_media_url = 'http://videotest-internal.yishihui.com/longvideoapi/user/virtual/crawler/registerVirtualUser'
			
 
				+    data = request.form.get('spider_link')
			
 
				+    source = request.form.get('source')
			
 
				+    user_tag = request.form.get('user_tag')
			
 
				+    for author_url in eval(data):
			
 
				+        # crawler = get_user_info(source)
			
 
				+        # user_info = crawler(author_url)
			
 
				+        post_data = {
			
 
				+            # 'count': 1,     # （必须）账号个数：传1
			
 
				+            # 'accountType': 4,   # （必须）账号类型 ：传 4 app虚拟账号
			
 
				+            'pwd': '',  # 密码 默认 12346
			
 
				+            'nickName': '',  # 昵称  默认 vuser......
			
 
				+            'avatarUrl': '',
			
 
				+            # 头像Url  默认 http://weapppiccdn.yishihui.com/resources/images/pic_normal.png
			
 
				+            'tagName': user_tag,  # 多条数据用英文逗号分割
			
 
				+        }
			
 
				+        response = requests.post(url=get_media_url, params=post_data)
			
 
				+        # print(response.text)
			
 
				+        media_id = response.json()['data']
			
 
				+
			
 
				+    return jsonify({'data': data})
			
 
				+
			
 
				 
			
 
				 if __name__ == "__main__":
			
 
				-    app.run(debug=True)
			
 
				+    app.run(debug=True,port=5050)
			
--- a/user_spider/__init__.py
+++ b/user_spider/__init__.py
--- a/user_spider/__pycache__/__init__.cpython-310.pyc
+++ b/user_spider/__pycache__/__init__.cpython-310.pyc
--- a/user_spider/__pycache__/user_info.cpython-310.pyc
+++ b/user_spider/__pycache__/user_info.cpython-310.pyc
--- a/user_spider/user_info.py
+++ b/user_spider/user_info.py
@@ -0,0 +1,2 @@
 
				+def xigua_user_info(author_url):
			
 
				+    pass