浏览代码

gzh抓取优化

luojunhui 3 月之前
父节点
当前提交
b8ecb6347d
共有 1 个文件被更改,包括 1 次插入1 次删除
  1. 1 1
      applications/tasks/crawler_tasks/crawler_gzh.py

+ 1 - 1
applications/tasks/crawler_tasks/crawler_gzh.py

@@ -289,7 +289,7 @@ class CrawlerGzhSearchArticles(CrawlerGzhBaseStrategy):
         @description: 对于搜索到的文章list,获取文章详情, 并且存储到meta表中
         """
         for article in tqdm(article_list, desc="获取搜索结果详情"):
-            print(f"{datetime.now()}: start crawling article: {article}")
+            print(f"{datetime.now()}: start crawling article: {article['title']}")
             url = article["url"]
             detail_response = await get_article_detail(url, is_count=True, is_cache=False)
             if not detail_response: