zhangyong
/
comprehensive_video_rewriting


			
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210
							import json
import random
import re
import time

import requests


class GPT4o:
    @classmethod
    def extract_title(cls, data):
        if isinstance(data, str):
            try:
                data = json.loads(data)  # 尝试解析 JSON 字符串
            except json.JSONDecodeError:
                pass  # 如果无法解析成 JSON，保留原始字符串

            # Step 2: 确保我们在正确的地方查找 content 字段
        content = None
        if isinstance(data, dict):
            if 'data' in data and 'choices' in data['data']:
                choices = data['data']['choices']
                if choices and 'message' in choices[0]:
                    content = choices[0]['message'].get('content', '')
            elif isinstance(data, str):  # 如果是直接的 JSON 字符串
                content = data

        # Step 3: 使用正则表达式提取 title 内容
        if content:
            # 正则表达式匹配 `title` 字段
            match = re.search(r'title[：:]"(.*?)"', content)
            if match:
                return match.group(1)
        return None

    @classmethod
    def get_ai_title(cls, old_title):

        content = '''
                    CONTEXT
                    你是一名短视频标题优化专家，任务是为短视频生成吸引力高且符合规范的标题。
                    OBJECTIVE
                    基于优秀标题要求及示例，生成新的、吸引用户注意的标题。
                    SCALE
                    如果原标题无法按照规则生成新标题则重新尝试5次，失败后返回None
                    TIME
                    在标题生成请求提出后的1分钟内生成。
                    ACTOR
                    短视频标题优化专家
                    RESOURCES
                    - 原标题列表
                    - 优秀标题示例
                    - 标题生成规范和约束条件
                    RESPONSE
                    为每个原标题生成符合规范的新标题。
                    生成示例标题案例及要求
                    1. 标题开头包含醒目emoji🔴，整体字符长度必须控制在10-25个字
                    2. 识别需要修改的标题中可能感兴趣的人群，并在标题中表现出来。人群示例如：群友们、退休人员、50~70后等
                    3. 标题中可增加一些对内容的观点/态度，用人格化的方式表达，示例：太香了、老外至今难以相信
                    4. 标题结尾可以根据标题内容增加一些引导语，格式参考示例但不必局限于示例。示例：你们见过吗、你听对不对、说的太好了、请听、太神奇了
                    5. 对于包含#话题和@人的标题，若标题中包含其他元素，则去除#话题和@人元素后利用其他元素生成标题。若标题去除#话题和@人外无其他元素，则仅利用#话题的内容生成标题
                    Goodcase示例：
                    ⭕老外至今难以相信，中国人竟能把大桥建到天上，穿入云中
                    🔴未来酒店体验，群友们，请看！
                    ⭕六七十年代的《忠字舞》，你们见过吗？
                    🔴哈哈哈！大哥说的太好了！太真实了
                    🔴今天，请记住那1700个集体赴死的年轻人，平均23岁！
                    🔴这才叫老同学聚会，到了这个年纪，还能聚在一起真不容易！
                    🔴百善孝为先，心凉了捂不热了
                    🔴养儿不如养狗，一件真实的事！
                    🔴让人受益的一段话，写得真好!
                    🔴“处暑三劝”！发给最好的朋友劝一劝！
                    🔴世间公道自在人心，善恶有报，人生智慧建议收藏！
                    🔴坐着电梯登上山顶！这怕是只有中国人敢想敢做！
                    🔴人老了！就应该这样去活！
                    生成约束
                    1. 标题不能包含#话题标签和@人名。
                    2. 如果原标题无法按照规则生成新标题则重新尝试5次，失败后返回None。
                    3. 不能编造：不能加入原标题没有的实体信息，如原标题没有养老金，不能在生成的标题中出现养老金。
                    4. 标题内不能使用强引导分享点击的词句，如：快来看看、大家都听一听、值得一看、都看看吧、你也来看看吧、大家注意、都听听等。
                    5. 不能使用无实质信息和强烈诱导点击、紧急、夸张、震惊的描述，避免使用“震惊国人”、“速看”、“太震撼了”等类似描述。
                    6. 标题需要简洁、清晰，不要使用网络流行语，如：太燃了、佛系、躺平、内卷等。
                    badcase示例：
                    🌸绝对不能错过，快打开看看，越快越好
                            所有老年人一定要看
                            天大的好消息，5月开始实施❗
                            就在刚刚，中国突然传出重磅消息，所有人都不敢相信！ 🚩
                            丧尽天良！为什么生病的人越来越多，原来吃的是这些 🎈
                            今年的端午节太特殊，一辈子难遇一次!一定要看!错过别后悔
                            好消息来了，千万别划走！
                            紧急！已爆发，错过就晚了😱 
                输出格式：{title：""}
        '''
        url = "http://aigc.piaoquantv.com/aigc-server/aigc/conversation"
        headers = {
            "Content-Type": "application/json"
        }
        payload = {
            "auth": "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",
            "openAiGptParam": {
                "model": "gpt-4o",
                "temperature": 0.5,
                "messages": [
                    {
                        "role": "system",
                        "content": content
                    },
                    {
                        "role": "user",
                        "content": old_title
                    }
                ]
            }
        }
        wait_time = random.uniform(1, 2)
        time.sleep(wait_time)
        response = requests.post(url, headers=headers, json=payload, timeout=30)
        text = response.text
        title = cls.extract_title(text)
        if title:
            return title
        else:
            return "这个视频，分享给我的老友，祝愿您能幸福安康"


    @classmethod
    def get_ai_pw(cls, title):
        max_retries = 3
        for attempt in range(max_retries):

            content = '''
                        请针对微信平台视频类小程序场景，面向人群是中国中老年人，在单聊、群聊场景，对不同类型的内容，生成结尾引导分享的脚本。引导用户发生更多的分享行为。要求优化过程综合考虑下面的要求：  
                        第一.根据下面的示例case，总结分享引导脚本特点，生成分享引导脚本  
                        示例case1： 
                        标题:几十年前的老歌，现在很少听到了！
                        返回分享引导脚本: 
                        这个视频真是难得，太美太好听了，看完真是回忆满满，让人怀念那个时代，多么淳朴多么美好，今天大家都在群里转发这个视频，看了都说，那时候虽然手里不宽裕，但心里都满怀希望，那股子拼劲，真是让人热血沸腾，老朋友你还记得吗？如果你也跟我一样深深的怀念，赶紧把这个视频转发到你所有群里去吧，让大家伙都看看吧，多多转发，感恩有你！
                        示例case2： 
                        标题:🔺令人尊敬的老人❗❗这才是我们应该追的明星❗
                        返回分享引导脚本: 
                        这个视频发出来5天了，转发的人却寥寥无几，试想一次明星出轨就全民皆知，这样中国真正的正能量却无人关注，真是太讽刺了！如果你看到了这个视频，请分享到你加入的每个群，向杨老这种无私奉献的大爱致敬！千万别让那些低调做好事的人心寒！转发传递下去，让世界都看到，中华民族的正能量！
                        第二：生成过程有如下的规范、约束和建议： 
                        1.不能编造：不能加入原标题没有的实体信息，如原标题没有养老金，不能在生成的标题中出现养老金； 
                        2.不能使用强烈的诱导、夸张词汇：在提高分享吸引力的同时，严格落实不使用“必做”、“错过悔恨终生”类描述； 
                        3.分享引导阅读总字数控制在150个字以内，总时长控制30秒到1分钟，20-30句话，每句话字符长度控制在4-10字；
                        4.分享引导如果无法生成文字描述，直接返回None
                        输出格式：要求输出格式为符合RFC8259标准的JSON格式的字符串，不要以代码块形式返回，返回一个string类型的分享引导脚本内容。
                        '''

            url = "http://aigc.piaoquantv.com/aigc-server/aigc/conversation"
            headers = {
                "Content-Type": "application/json"
            }
            payload = {
                "auth": "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",
                "openAiGptParam": {
                    "model": "gpt-4o",
                    "temperature": 0.5,
                    "messages": [
                        {
                            "role": "system",
                            "content": content
                        },
                        {
                            "role": "user",
                            "content": title
                        }
                    ]
                }
            }
            wait_time = random.uniform(5, 20)
            time.sleep(wait_time)
            response = requests.post(url, headers=headers, json=payload, timeout=30)
            pw_srt_text = '老友们，这个视频说的太好了,请你在看完之后,不要私藏,分享给身边的亲人朋友,转发传递这份美好,这不仅是分享一个好视频,更是在传递一份深厚的祝福和好运,愿每个看到这消息的人,都能收获健康长寿和平安,希望您在看完后能够回传给我,并且把这条视频再传给3个群和3个好友,祝愿你我,健健康康,平平安安,因为3个数字代表着健康和平安,这么好的视频,千万不要在你的手里终止了,分享给群友们,他们看到以后一定会感谢你的,感谢分享,感谢传递'

            try:
                response = response.json()
                content = response['data']['choices'][0]['message']['content']
                pattern = re.compile(r'"分享引导脚本":\s*"(.*?)"')
                match = pattern.search(content)
                if match:
                    pw = match.group(1)
                    # 检查文本中是否包含英文字母
                    if re.search(r'[a-zA-Z]', pw):
                        pw = re.sub(r'[a-zA-Z]', '', pw)
                    if pw == '"None"' or len(pw) <= 10:
                        return pw_srt_text
                    return pw
                else:
                    if content:
                        if re.search(r'[a-zA-Z]', content):
                            content = re.sub(r'[a-zA-Z]', '', content)
                        if "分享引导脚本" in content:
                            parsed_data = json.loads(content.strip('"'))
                            content = parsed_data["分享引导脚本"]
                        if content == '"None"' or len(content) <= 10:
                            return pw_srt_text
                        return content
                    if attempt == max_retries - 1:
                        return pw_srt_text
            except Exception:
                if attempt == max_retries - 1:
                    return pw_srt_text


if __name__ == '__main__':
    title = '新加坡的退休金，全国统一！！'
    newtitle = GPT4o.get_ai_pw(title)
    print(newtitle)