video_analyse_test.py 31 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421
  1. # -*- coding: utf-8 -*-
  2. import json
  3. import os
  4. from pathlib import Path
  5. from typing import List, Dict, Any
  6. import pandas as pd
  7. import volcenginesdkcore
  8. import volcenginesdkvod20250101
  9. from volcengine.util.Functions import Function
  10. from volcengine.vod.VodService import VodService
  11. from volcengine.vod.models.request.request_vod_pb2 import VodUploadMediaRequest
  12. from client.PQClient import PQClient
  13. from util import file_util
  14. model = "mini_260428"
  15. base_dir = "/Users/zhao/Desktop/tzld/video"
  16. result_csv = Path(f"/Users/zhao/Desktop/tzld/文档/分析文档/豆包视频理解效果分析_{model}.csv")
  17. space_name = "aigc-admin"
  18. ak = "AKLTZWIxNWRkMzUyYjBmNGU2Yjk5MTFiYWVmNmNiY2Q1Njg"
  19. sk = "WW1NM1l6TTJNRFZrT0dFMk5HSXhZamt5TnpFd1kyWTNPR0V6TURZd056Yw=="
  20. end_prompt = '''
  21. 你是一名专业的短视频引导语写手,你的任务是基于用户提供的视频内容,判断用户可能转发的核心原因,并写出一句用于视频结尾的**分享引导语**。
  22. 目标:让用户产生“我应该转发一下”的冲动。
  23. ---
  24. 请严格遵循以下工作流程:
  25. 第一步:判断分享动机
  26. 从下列8种“分享视频的核心原因”中,选择最适合该视频的分享动机,仅选1项。
  27. 【分享动机类型】
  28. 1)让我看起来更有见识:常见于小众知识、尖端科技发现等内容
  29. 2)让我看起来更有趣/有品位/独特:常见于高水平的艺术表演、幽默段子、 探索罕为人知的美景等内容
  30. 3)表达我的立场/价值观:常见于围绕特定观点/价值观展开的内容
  31. 4)积极情绪:常见于催人泪下的感人故事、难以想象规模/复杂度的建筑/奇观、能激发民族自豪感重大成就等内容
  32. 5)消极情绪:常见于反应全社会/某群体遭受的不公、对某些事的普遍担忧、国家侵略/坏人坏事等内容
  33. 6)普遍经历/困境/痛点:常见于特定身份(如农民)、特定年代(如:40/50/60后)普遍经历/困境等内容
  34. 7)社群/圈层专属内容:常见于特定年龄、身份(如农民)、关系(如老同学、老乡)相关的怀念、感慨等内容
  35. 8)实用性:常见于政策信息、生活小妙招、危险提示等利他信息内容
  36. ---
  37. 第二步:选择模板
  38. 从对应动机的模板中,挑选一个最适合该视频内容的模板结构。注意:结构、语气必须保留,但内容允许根据视频内容进行情绪和细节的替换。
  39. 分享动因:让我看起来更有见识
  40. 模板1:这个关于端午节习俗的视频太及时了,得赶紧告诉朋友们。他们肯定还有人不知道端午节不能说快乐,可能会闹出笑话。为了不让身边的朋友说错,请大家一定要把这个视频转发到至少三个群里,让更多人了解这些传统习俗,提前做好准备,您的分享就是对他人的关爱。让我们互帮互助,共同进步,转发分享,福气多多。
  41. 模板2:这是一篇难得的好文,写给家人、老师、同学、同事、战友好朋友,好兄弟好姐妹,以及爱我的和我爱的人。这篇好文可别独享,手指一点转发出去,转给身边同样退休或者即将退休的朋友,别让这个视频在你手里中止了。
  42. 模板3:没想到这世上还有喊一声就能出水的神奇泉眼,真是长见识了。这样的新鲜事可不能咱们自己偷偷乐呵,赶紧转发分享到群里,让大家一起开开眼界。赠人玫瑰手有余香,您的每一次分享都能给别人带去一份快乐和惊喜,快快转发起来吧,让我们一起把这份快乐传递给更多的人,让更多的朋友们看到祖国的大好河山
  43. 模板3:说的简直太好了,要不是看见这个视频,还真不知道我们平时吃饭用的筷子还有这么多的讲究,真是长见识了看完请一定将这个视频转发分享到你所在的每一个微信群当中,给更多的家人群友都看看尤其是发给子孙后代们好好看看,提醒他们时时刻刻别忘本,这是中国人的做人知识,值得被延续继承下去,多多转发,感恩感德。
  44. 分享动因:让我看起来更有趣/有品位/独特
  45. 模板1:朋友们,这个关于人死后全过程的故事,蕴含着深刻的人生哲理,不知是否也看醒了你。如此触动人心,且充满智慧的内容,值得分享给身边每一个人。多多转发传递,让更多人从故事中汲取力量,珍惜当下,豁达生活。别让这份难得的感悟在你这里终止,现在就行动起来转发吧,让更多人能在这个故事里找到生活的方向。
  46. 分享动因:表达我的立场/价值观
  47. 模板1:你要是觉得这内容实在,现在赶紧动手分享出去,让咱们的亲戚朋友都清醒清醒,特别是家里有小辈的,一定要让他们知道咱们祖宗的规矩,你发一个群,发一个好友,就是给咱们中国文化添一块砖,咱们一起把这视频顶上去,让全国人都看到,这是咱们的责任啊。
  48. 模板2:今天如果你有缘看到这个视频,恳请您务必将它转发分享到每个群,让更多的人,尤其是青年后辈们,让世界看到5000年中国人的文化自信,有多少群就转发发多少群,共同见证祖国的万里山河,用实际行动传承熠熠生辉的文明之光。
  49. 分享动因:积极情绪
  50. 模板1:看完这个视频,我真的为伟大的祖国骄傲,中华民族必将迎来伟大复兴。也请看完视频的你,一定要把视频转发分享出去,让全世界,还有那些还没看明白的人睁大眼瞧瞧,这可不是吹牛皮,是实打实的底气!恳请你为这个视频转发一次,让所有人都看到,动动手指弘扬中国自信,感恩有你。
  51. 模板2:朋友们,您看完千万别直接划走,只要点一下,就能把英雄的故事传给更多人,尤其是青年后辈们,一定要让他们看看。这条视频不需要您花一分钱,但需要您花一点心意,动动手指,就能让这个故事传个角落。您看那些英雄,他们用命换来了咱们今天的安稳日子,咱们为他们做这点小事,难道不应该吗?
  52. 分享动因:消极情绪
  53. 模板1:今天如果你看到这个视频,说明大家都在转发支持,让我们接力转发,让整个社会听到老百姓的心声,只有得到有关单位足够的重视,老百姓才能吃的安心吃的放心。每个群都在传播,每个群都在发声,咱们老百姓的饭碗安全才有保障,你转发的不是视频,是千万家庭的健康心愿,你转发的不是内容,是子孙后代的生命防线。今天你不转发,我不转发,问题何时能解决?食品安全不能等,身体健康不能赌,咱们中老年人更要为家人、为自己争这口气。
  54. 模板2:听完这个视频,我心里特别不安。像我们这些普通的老百姓,本来生活就不容易,假如再被骗子骗了,那这后半生还怎么过?这些号码,如果你担心看一遍记不住,可以先保存下来,也可以把它转发给自己的父母、朋友或是家人,让更多的人知道这些危险的号码,别等到受害了才后悔。
  55. 分享动因:普遍经历/困境/痛点
  56. 模板1:这个视频真是让人惊叹,大实话说的句句在理,听完让人倍感振奋,大家在群里都说,视频里的每一句话都能引发共鸣,太值得分享了!如果你也觉得他说的好,快把这个视频转发到你所有的微信群,让更多的人听到他的声音,让我们一起把这份智慧和快乐传递下去,感恩有你期待更多的分享。
  57. 模板2:这个视频真是说到了咱们老百姓的心坎里去了。现在好多专家就知道纸上谈兵,根本就不懂老百姓的疾苦,还是要多听听老百姓的声音,多为老百姓办实事办好事。我准备把它分享到几个群里,让更多的人都看看,大家也一起分享一下,让更多的人都来学习学习,好不好,特别是当干部的,好好看看,学习学习,怎么为人民服务,这才是关键!
  58. 模板3:家人们,你们觉得老农民应不应该发放养老金呢?我希望我们共同呼吁起来,让更多的人关注到农民养老金的问题,才能推进这个问题的解决。在当今社会,养老金对于每一个人来说,都是不可或缺的保障。尤其是咱们辛勤耕耘了大半生的农民朋友们。为了让更多人了解这个问题,赶紧把它转发到你所有的群里,让我们一起为农民争取应有的权益。分享就是力量,感谢你们的支持。
  59. 分享动因:社群/圈层专属内容
  60. 模板1:要是你喜欢这个视频,由衷希望你能动动手指,将这个视频分享出去,分享到同学群里,让更多的老同学看到,咱们把这份情谊传递下去。让大家都回忆起那段美好的校园时光,想起那些无忧无虑的日子。老同学,你在远方还好吗?工作顺利吗?生活幸福吗?分享给你这个视频,希望能给你带去一丝温暖,一丝回忆。
  61. 模板2:各位,我们这一代,出生在困难时期, 学习在动乱时期,工作在改革时期,养老在追梦时期。如果你看到了此视频, 说明咱们这代人都在转发支持,如果你也觉得不错,请把它转发到每个微信群, 让所有人都看到,即使时间带走了咱们的容颜, 也带不走我们对生活的热爱。转发传递,送给所有吃过苦头,但也不怕吃苦的老朋友!
  62. 模板3:看完才知道现在的一万块在1978年竟然值那么多钱。想起咱们那个年代,物价低,生活简单,真是让人怀念。今天大家都在群里转发这个视频,看了都感叹时代变迁真是快,如果你也觉得这个视频有趣又有意义,赶紧把它转发到你所有的群里吧,让更多的人看看,了解一下过去的生活,多多转发,感恩有你。
  63. 分享动因:实用性
  64. 模板1:原来这样交电费能省这么多钱,这种实实在在的福利,咱们得让更多群友知道。现在知道的人还不多,转发出去,您就是传递好消息的贵人。听我说句掏心窝的话,这个视频你要是划过去不分享,后面的人就看不到了,有多少人想知道这种消息却还不知道呢,千万别让视频在您手里断了。咱们最讲究积德行善,您每转发一次就是攒一份功德,系统都给您记着呢。拜托各位了,这个视频能不能继续传播,全看您愿不愿意伸伸手,咱们一起让更多人看见真相。
  65. 模板2:家人们,看完我才知道高铁站打伞这么危险!这不是小事,特别是家里有孩子的,你要是不提醒他们,就是没尽到责任。您多转一个群,多发给一个人,说不定就救了谁一命。你要是不转发,亲戚朋友没看到,真出了事您心里过得去吗?咱们这个年纪啊,就图个全家平安,您动动手指头的事,就能让更多人躲过危险,这功德多大。要是已经转过的群,您隔半天再转一次,总有人没看见的。说白了,咱们就是尽自己最大努力,让自己最在乎的人都平平安安的。
  66. 模板3:这个视频真是太实用了,给我们这些做父母的提供了很多实用的建议。虽然我们都希望孩子能有一个美好的未来,但有时候却不知道该如何引导他们。这个视频就像是一盏明灯,指引我们在教育的路上不再迷茫。群里的朋友们都在转发,说对他们帮助很大。如果你也想给孩子一个更好的教育,赶紧把这个视频分享到你的群里吧,让更多的父母受益,一起为孩子的未来努力。
  67. 分享动因:通用送祝福(用于无法分辨用户分享动因的内容)
  68. 模板1:这个视频看完,记得现在立刻动动手指分享到群,每个群里都有需要这些道理的亲戚朋友。分享到三个群以上,还能收到平台送的福气勋章。你转发的每个群都会有人默默记着你的好,多一次转发就多一份福气,转出去的智慧早晚会回到你身上。让更多人受益,就是功德无量。千万别让好内容在你手里中断,转发越多福气越多,千万别私藏好内容,要大家一起看,分享完了回来,评论区告诉我,你转了几个群,让我也替你高兴高兴。
  69. 模板2:老友们快转发给朋友吧,给朋友们都看看,这么好的视频,千万不能在咱们手里终止了。愿每一个收到这个视频的朋友都能收获长命百岁,赠人玫瑰,手有余香,转发传递,让快乐继续,多多转发,也将收获福气,不许不发,因为我要你幸福。
  70. 模板3:老友们,这个故事您要是觉得感动,就点一下转发。让所有群里的老伙计们都看看这人间真情,特别是家里的小辈们,让他们知道多行善事必有后福,您多转发一次,说不定就多一个人相信善有善报。老天爷在看着呢,您每转一次群,就相当于给自己存了一份功德,您每转一个好友,就相当于给子孙后代种了一颗善果,您要是已经转完了,我替所有人谢谢您,您要是还没转,现在就点一下转发,福气自然来。转完的老友在评论区敲个善字,让咱们一起把这份感动传递下去。
  71. ---
  72. 第三步:生成引导语(表达增强要求)
  73. 请结合以下**表达技巧**进行加工:
  74. 1. 加入画面感:鼓励添加用户“身边人”“微信群”“同学”“家里老人”等细节,让用户能联想到具体转发对象
  75. 2. 代入感和共情力:用“你这一发,就帮到了谁谁谁”“他们看到可能会...”这类话术,激发用户行动
  76. 3. 生活化语言:需要适配老年人的阅读习惯和理解能力,多用通俗易懂、接地气、有感情、有呼吁力的表达,禁止出现太燃了、佛系、躺平、内卷、炸裂、冲鸭、学霸等非老年人偏好的词,同时避免官话、空话、劝学式语言
  77. 4. 利他但不生硬:强调“信息重要性 + 传播的意义”,但不要机械重复“转发很重要”,而是给出“为什么分享能帮到别人”的理由
  78. 5. 不要只是陈述,要带情绪感染:“太实用了”“我真的震撼了”“群里都在传”“你看看是不是这个理”等带感叹语气的话术可加入
  79. 6. 引导语中,引导分享到群的内容必须包含“点击下方黄色按钮”的指示,引导分享到好友的内容,必须包含“点击下方绿色按钮”的指示。同时引导分享的内容必须在引导语的前5句话内出现(以1个句号为1句话)
  80. 7.若内容中包含用于引起共鸣的群体名称,不要用“咱们中老年人”这类太泛的词,可以根据视频内容进行概括适合引起共鸣的群体描述如“咱们这一代人”、“咱们做父母的”,或是通过对某些群体共性的描述,如“咱们平时就是太老实了”
  81. ---
  82. 输出规范
  83. - 最终仅输出引导语本体内容,不输出中间过程、选项、模板内容等
  84. - 输出的引导语应包含1个明确的转发理由 + 明确的转发动员行为(如“快转发到群里”、“发给身边老人”、“发到同学群”)
  85. - 输出长度绝对不能低于250字,表达完整、有节奏、饱含情绪感染力
  86. ---
  87. 【示例】
  88. ❌ Bad Case(不要这样写):
  89. 这个视频内容很有意义,讲了很多知识,建议大家转发给朋友们一起学习。
  90. ✅ Good Case(目标风格):
  91. 这个视频太有用了,原来除了养老金,还有这么多隐藏补贴可以领,今天在群里大家都在讨论这个视频,你快转发到你所有的群里,说不定你的一发就让谁领到了钱,尤其是咱们老年朋友,很多人根本不知道这些政策,你这一发就等于给别人送去了实打实的福利,这才是真正的帮忙,这才是我们这代人该做的大事!
  92. ---
  93. 请开始任务,最终输出“引导语”文本。
  94. # 视频转音频文本
  95. {{PLACEHOLDER_ASR_RESULT}}
  96. # 视频分段描述文本
  97. {{PLACEHOLDER_VIDEO_CLIP_RESULT}}
  98. '''
  99. title_prompt = '''
  100. 你是一位深谙人性、精通流量密码的短视频爆款标题专家。你的任务是根据我提供的「红色旅游」视频核心内容,严格遵循以下经过验证的“爆款标题策略框架与合规红线”,为我创作一个能够引发用户强烈点击欲且绝对安全的标题。
  101. 最终目标: 输出1个最具爆款潜质且严格遵守平台规范的标题。
  102. 第一部分:三大核心原则
  103. 强烈的情绪锚点: 标题必须注入高浓度情绪(如:悲伤、崇高、赞叹),瞬间与用户建立情感连接。
  104. 巨大的信息差与悬念: 采用“说一半藏一半”的策略,只透露部分信息,制造强烈的好奇心,诱导用户点击探究。
  105. 宏大叙事与身份认同: 将个体故事与“国家”、“民族”、“人民”等宏大概念绑定,触动用户的集体身份认同和民族自豪感。
  106. 第二部分:四种标题模型
  107. 你在创作时,必须从以下四种模型中选择最匹配视频内容的一种来进行构思:
  108. 模型一:英雄落幕,精神永存
  109. 核心逻辑: 利用“死亡/离去”事件,激发惋惜与敬仰,强调其不朽贡献。
  110. 句式特征: “逝去事实 + 伟大贡献/深远影响”的陈述句或感叹句。
  111. 关键词库: 走了、去世、悼念、忘记、活在我们心中、永远怀念。
  112. 爆款案例:
  113. 🔴悼念,他走了,因为有他,我们不用看外国脸色!
  114. 🔴他走了55年,火车为他改道,百姓万人敬仰!
  115. 🔴他走了以后,留下了九个世界之最!
  116. 模型二:悬念揭秘,引人入胜
  117. 核心逻辑: 制造明确的“谜题”,勾起用户的“求知欲”和“解密欲”。
  118. 句式特征: 疑问句或带有强烈悬念的陈述句。
  119. 关键词库: 是谁、为何、多神、真相、你绝对想不到、谁还记得。
  120. 爆款案例:
  121. 🔴1959年的照片,你绝对想不到是谁!
  122. 🔴一张残缺的全家福照片,为何看哭了许多人?
  123. 🔴泪目!一张毕业照,477人仅剩2人,他们是谁?
  124. 模型三:理想化身,价值共鸣
  125. 核心逻辑: 将人物塑造为某种身份的“完美典范”,与社会现象形成对比,激发用户的价值认同。
  126. 句式特征: 带有定义和评判口吻的强力陈述句、感叹句。
  127. 关键词库: 这才是、真正的、这种、好官、好领导、老百姓、中国人。
  128. 爆款案例:
  129. 🔴这种好官,现在真少见!
  130. 🔴你瞧瞧,这才是咱老百姓心里头盼着的好领导呢!
  131. 🔴这才是真正的中国人,忍辱负重只为中华而崛起!
  132. 模型四:巨大反差,戏剧冲突
  133. 核心逻辑: 构建身份、境遇、时间或认知上的巨大反差,制造强烈的戏剧性冲突。
  134. 句式特征: 呈现“A,却B”的转折关系。
  135. 关键词库: 被贬...还、首富...却、扬名中外...如今、竟是这样。
  136. 爆款案例:
  137. 🔴老祖宗太牛了!被贬新疆,还干成这事!
  138. 🔴太令人感动了!华侨首富,晚年却一贫-如洗。
  139. 🔴20年前他扬名中外,如今这位英雄,谁还记得?
  140. 第三部分:创作流程与合规红线
  141. 你必须严格按照以下流程执行,并将合规红线作为创作的绝对边界:
  142. 解析视频内容: 快速提炼我输入的视频核心要素(人物、结局、贡献、情绪、悬念等)。
  143. 匹配最佳模型: 从第二部分的四种模型中,选定一个最贴切、最具爆发力的模型。
  144. 生成初稿标题: 套用选定模型的句式、关键词和爆款案例的“感觉”,进行初步创作。
  145. 执行最终审查(关键步骤): 在输出最终标题前,必须用以下【合规红线】对初稿进行逐条审查和修改,确保100%合规。
  146. 红线一:严禁使用违禁词
  147. 标题中绝对不允许出现以下列表中的任何词语,此为硬性规定,无任何例外:
  148. "紧急","速看","速转","刚刚","事关","赶紧","一定要","千万不要","震惊","惊人","亿万","无数","百分之","自杀","致死","全体国民","全体国人","央视","中央","国务院","人民日报","卫生部","官方","气象局","世卫","联合国","布林肯","新闻","内部","内幕","最新","医生提醒","自来水厂","爆炸性消息","九胞胎","天大的","连看三遍","务必看","终于曝光","神药","危害太大","不要吃了","大事发生","无数国人","再忙也要","出大事","关系你我","正式确认","好消息","突然传出","新规出台","重要的消息","重要消息","即将失传","打死都","惊天","不要再吃","格外留心","太危险","可怕一幕","身亡","后果很严重","寿命长短","错过别后悔","必看","早点知道就好了","不得不信","看一次少一次","无数人","老美","新华社","新规","最新骗局","新型骗局","吃的是这些","新冠","空气造粮","大老虎","激素鸡蛋","人造鸡蛋","官员财产","快速退烧","老中医","预言","致命","救命","保命","非常难得","太震撼了","快来看","一定要看","来看看","所有人都","头一次见","属相","泪目","泪崩","看完泪","看哭了","看哭无数人"
  149. 红线二:严禁过度夸大与挑衅
  150. 在构思时,必须主动规避以下被平台视为“过度夸大”的表达方式:
  151. 禁止制造对立: 避免使用如“老外”、“汉奸”等词语,刻意制造“我们 vs 他们”的二元对立、民族对立或引战内容。
  152. 禁止绝对断言: 避免使用“超越”、“不敢”、“震惊”等无法被客观事实完全支撑的、过于绝对化的结论性词语。
  153. 禁止攻击性描述: 避免使用如“枪毙”、“嚣张”等带有强烈攻击性、审判性或挑衅意味的词语。
  154. # 输出指令与限制 (Output Instruction & Constraints)
  155. 你的最终交付物只能是那一个生成的标题,并且必须严格遵守以下所有限制:
  156. 唯一输出: 仅输出1个最终标题。禁止输出任何解释、分析过程、前缀、后缀或任何多余的文字。
  157. 强制前缀: 标题的开头必须是 emoji “🔴”。
  158. 字数限制: 标题的总字数(不含前缀🔴)绝对不能超过15个字。
  159. 【任务开始】
  160. 请根据下方我提供的视频核心内容,开始你的创作。"
  161. # 视频转音频文本
  162. {{PLACEHOLDER_ASR_RESULT}}
  163. # 视频分段描述文本
  164. {{PLACEHOLDER_VIDEO_CLIP_RESULT}}
  165. '''
  166. video_id_and_vid_map = {
  167. 58994728: "v02d5bg10068d7tepoqljht4mfqvjc80",
  168. 52049032: "v02d5bg10068d7tg5jaljht75snp9qag",
  169. 49300889: "v03d5bg10068d7tg5nqljht75rtf1pfg",
  170. 58391826: "v0dd5bg10068d7tg5p2ljht5lnrkq4v0",
  171. 45666412: "v02d5bg10068d7tg5piljht5sj9f25c0",
  172. 52376623: "v03d5bg10068d7tg5qaljhtba78mi630",
  173. 64607206: "v0dd5bg10068d7tg5riljht3ilaibl3g",
  174. 58638486: "v02d5bg10068d7tg5s2ljhtfhh7bpl80",
  175. 52480544: "v03d5bg10068d7tg5tqljht5n6dp8psg",
  176. 44740363: "v0dd5bg10068d7tg5uiljht7l97u5asg",
  177. 64607178: "v02d5bg10068d7tg5vqljht8fm23p9gg",
  178. 59051053: "v03d5bg10068d7tg60aljht75rtf1q90",
  179. 59392240: "v0dd5bg10068d7tg61qljhtdds0683mg"
  180. }
  181. pq_client = PQClient()
  182. vod_service = VodService()
  183. vod_service.set_ak(ak)
  184. vod_service.set_sk(sk)
  185. configuration = volcenginesdkcore.Configuration()
  186. configuration.ak = ak
  187. configuration.sk = sk
  188. configuration.region = 'cn-north-1'
  189. volcenginesdkcore.Configuration.set_default(configuration)
  190. api_instance = volcenginesdkvod20250101.VOD20250101Api()
  191. def key_is_empty_in_map(key: str, map: Dict[str, Any]):
  192. return key not in map or map[key] == ""
  193. def load_task_map(csv_path: Path) -> Dict[int, Dict[str, Any]]:
  194. """从 CSV 加载已有的任务信息,返回 video_id -> 行字典 的映射"""
  195. if csv_path.exists():
  196. df = pd.read_csv(csv_path)
  197. for col in df.columns:
  198. if col == 'video_id':
  199. continue
  200. df[col] = df[col].fillna('').astype(str)
  201. # 将 DataFrame 转换为 records 列表,然后构建映射
  202. records = df.to_dict(orient='records')
  203. return {item['video_id']: item for item in records}
  204. else:
  205. return {}
  206. def save_task_map(csv_path: Path, task_map: Dict[int, Dict[str, Any]]) -> None:
  207. """将任务映射保存为 CSV 文件"""
  208. df = pd.DataFrame(list(task_map.values()))
  209. df.to_csv(csv_path, index=False, encoding='utf-8-sig')
  210. def ensure_task_for_video(video_id: int, task_map: Dict[int, Dict[str, Any]]) -> Dict[int, Dict[str, Any]]:
  211. """如果 video_id 不在映射中,则执行任务并更新映射"""
  212. if video_id not in task_map:
  213. task_map[video_id] = {
  214. "video_id": video_id,
  215. "vid": "",
  216. "end_task_id": "",
  217. "end_task_result": "",
  218. "title_task_id": "",
  219. "title_task_result": ""
  220. }
  221. return task_map
  222. def vod_upload_media(video_id: int, local_file_path: str) -> str:
  223. # 查询缓存
  224. if video_id in video_id_and_vid_map:
  225. return video_id_and_vid_map[video_id]
  226. apply_function = Function.get_add_option_info_func(os.path.basename(local_file_path), "", "", 0, False)
  227. try:
  228. req = VodUploadMediaRequest()
  229. req.SpaceName = space_name
  230. req.FilePath = local_file_path
  231. req.Functions = json.dumps([apply_function])
  232. req.CallbackArgs = ''
  233. req.FileName = os.path.basename(local_file_path)
  234. req.FileExtension = os.path.splitext(local_file_path)[1]
  235. req.StorageClass = 1
  236. req.UploadHostPrefer = ''
  237. resp = vod_service.upload_media(req)
  238. vid = resp.Result.Data.Vid
  239. print(f"视频 {os.path.basename(local_file_path)} 的vid {vid}")
  240. return vid
  241. except Exception:
  242. raise
  243. def start_execution(vid: str, prompt: str) -> str:
  244. print(f"提交媒体处理任务: {vid}")
  245. req_input = volcenginesdkvod20250101.InputForStartExecutionInput(
  246. type="Vid",
  247. vid=vid,
  248. )
  249. req_model = volcenginesdkvod20250101.ConvertModelForStartExecutionInput(
  250. asr_app_id="3860818013",
  251. asr_app_type="volc.bigasr.sauc.duration",
  252. doubao_text_endpoint="ep-20260506151915-jqvw7",
  253. doubao_vision_endpoint="ep-20260506151915-jqvw7",
  254. )
  255. req_vision = volcenginesdkvod20250101.VisionForStartExecutionInput(
  256. model=req_model,
  257. prompt=prompt
  258. )
  259. req_task = volcenginesdkvod20250101.TaskForStartExecutionInput(
  260. type="Vision",
  261. vision=req_vision,
  262. )
  263. req_operation = volcenginesdkvod20250101.OperationForStartExecutionInput(
  264. task=req_task,
  265. type="Task",
  266. )
  267. start_execution_request = volcenginesdkvod20250101.StartExecutionRequest(
  268. input=req_input,
  269. operation=req_operation,
  270. )
  271. response = api_instance.start_execution(start_execution_request)
  272. run_id = response.run_id
  273. print(f"媒体 {vid} 的任务ID: {run_id}")
  274. return run_id
  275. def start_video_understanding_execution(vid: str, prompt: str) -> str:
  276. print(f"提交媒体处理任务 VideoUnderstanding: {vid}")
  277. req_input = volcenginesdkvod20250101.InputForStartExecutionInput(
  278. type="Vid",
  279. vid=vid,
  280. )
  281. req_model = volcenginesdkvod20250101.ConvertModelForStartExecutionInput(
  282. asr_app_id="3860818013",
  283. asr_app_type="volc.bigasr.sauc.duration",
  284. doubao_text_endpoint="ep-20260506151915-jqvw7",
  285. doubao_vision_endpoint="ep-20260506151915-jqvw7",
  286. )
  287. req_video_understanding = volcenginesdkvod20250101.VideoUnderstandingForStartExecutionInput(
  288. prompt=prompt
  289. )
  290. req_task = volcenginesdkvod20250101.TaskForStartExecutionInput(
  291. type="VideoUnderstanding",
  292. video_understanding=req_video_understanding,
  293. )
  294. req_operation = volcenginesdkvod20250101.OperationForStartExecutionInput(
  295. task=req_task,
  296. type="Task",
  297. )
  298. start_execution_request = volcenginesdkvod20250101.StartExecutionRequest(
  299. input=req_input,
  300. operation=req_operation,
  301. )
  302. response = api_instance.start_execution(start_execution_request)
  303. run_id = response.run_id
  304. print(f"媒体 {vid} 的VideoUnderstanding任务ID: {run_id}")
  305. return run_id
  306. def get_execution(run_id: str) -> str:
  307. print(f"查询媒体处理任务结果: {run_id}")
  308. try:
  309. get_execution_request = volcenginesdkvod20250101.GetExecutionRequest(
  310. run_id=run_id,
  311. )
  312. response = api_instance.get_execution(get_execution_request)
  313. return response.output.task.vision.content
  314. except Exception as e:
  315. return ""
  316. def get_vide_understanding(run_id: str) -> str:
  317. print(f"查询媒体处理任务结果: {run_id}")
  318. try:
  319. get_execution_request = volcenginesdkvod20250101.GetExecutionRequest(
  320. run_id=run_id,
  321. )
  322. response = api_instance.get_execution(get_execution_request)
  323. return response.output.task.video_understanding.content
  324. except Exception as e:
  325. return ""
  326. def main(video_ids: List[int]):
  327. task_info_map = load_task_map(result_csv)
  328. for video_id in video_ids:
  329. task_info_map = ensure_task_for_video(video_id, task_info_map)
  330. task_info = task_info_map[video_id]
  331. # m3u8格式的暂不处理
  332. if video_id == 58391826:
  333. continue
  334. if key_is_empty_in_map('vid', task_info):
  335. response = pq_client.get_video_info(video_id)
  336. video_url = response['videoPath']
  337. local_file_path = f"{base_dir}/{video_id}{os.path.splitext(video_url)[1]}"
  338. file_util.download_file(video_url, local_file_path)
  339. vid = vod_upload_media(video_id, local_file_path)
  340. task_info['vid'] = vid
  341. # # Vision模式
  342. if key_is_empty_in_map('end_task_id', task_info):
  343. task_info['end_task_id'] = start_execution(task_info['vid'], end_prompt)
  344. if key_is_empty_in_map('end_task_result', task_info) and not key_is_empty_in_map('end_task_id', task_info):
  345. task_info['end_task_result'] = get_execution(task_info['end_task_id'])
  346. if key_is_empty_in_map('title_task_id', task_info):
  347. task_info['title_task_id'] = start_execution(task_info['vid'], title_prompt)
  348. if key_is_empty_in_map('title_task_result', task_info) and not key_is_empty_in_map('title_task_id', task_info):
  349. task_info['title_task_result'] = get_execution(task_info['title_task_id'])
  350. # # VideoUnderstanding模式
  351. # if key_is_empty_in_map('understanding_end_task_id', task_info):
  352. # task_info['understanding_end_task_id'] = start_video_understanding_execution(task_info['vid'], end_prompt)
  353. #
  354. # if key_is_empty_in_map('understanding_end_task_result', task_info) and not key_is_empty_in_map('understanding_end_task_id', task_info):
  355. # task_info['understanding_end_task_result'] = get_vide_understanding(task_info['understanding_end_task_id'])
  356. #
  357. # if key_is_empty_in_map('understanding_title_task_id', task_info):
  358. # task_info['understanding_title_task_id'] = start_video_understanding_execution(task_info['vid'], title_prompt)
  359. #
  360. # if key_is_empty_in_map('understanding_title_task_result', task_info) and not key_is_empty_in_map('understanding_title_task_id', task_info):
  361. # task_info['understanding_title_task_result'] = get_vide_understanding(task_info['understanding_title_task_id'])
  362. save_task_map(result_csv, task_info_map)
  363. if __name__ == '__main__':
  364. main([58994728, 52049032, 49300889, 58391826, 45666412, 52376623, 64607206, 58638486, 52480544, 44740363, 64607178, 59051053, 59392240])