Server
/
title_with_video


			
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328
							"""
@author: luojunhui
"""
import os
import json
from openai import OpenAI

from applications.functions.chatgpt import OpenAIServer
from applications.config import moon_shot
from applications.config import deep_seek
from applications.log import logging


class KimiServer(object):
    """
    Kimi Server
    """

    @classmethod
    async def search_kimi_schedule(cls, params, safe_score):
        """
        搜索阶段 kimi 操作
        :param params:
        :param safe_score:
        :return:
        """
        title = params['article_title'].split("@@")[-1]
        contents = params['article_text']
        trace_id = params['content_id']
        try:
            kimi_title = await cls.kimi_title(title, ai_model=moon_shot)
            # 判断kimi 标题是否安全
            title_score = await cls.get_kimi_title_safe_score(kimi_title, ai_model=moon_shot)
            kimi_green_title = None
            if int(title_score) > safe_score:
                kimi_green_title = await cls.make_kimi_title_safer(title, ai_model=moon_shot)
                
            logging(
                code="1005",
                info="generate_title",
                data={
                    "ori_title": title,
                    "kimi_title": kimi_title,
                    "title_score": title_score,
                    "new_kimi_title": kimi_green_title
                },
                trace_id=trace_id
            )
            kimi_title = kimi_green_title if kimi_green_title else kimi_title

        except Exception as e:
            logging(
                code="4002",
                info="kimi 挖掘失败--{}, 采用 gpt".format(e),
                trace_id=trace_id
            )
            gpt = OpenAIServer()
            kimi_title = gpt.gpt_mining(
                text=title,
                prompt=gpt.prompt_generate(
                    prompt_type="title"
                )
            )

        kimi_title = kimi_title.replace("'", "").replace('"', "").replace("\\", "")
        try:
            kimi_info = await cls.kimi_mining(contents, ai_model=moon_shot)
        except Exception as e:
            logging(
                code="4002",
                info="kimi 挖掘失败--{}, 采用 gpt".format(e),
                trace_id=trace_id
            )
            gpt = OpenAIServer()
            kimi_info = gpt.gpt_mining(
                text=contents,
                prompt=gpt.prompt_generate(
                    prompt_type="text"
                )
            )
            kimi_info = kimi_info.replace('```json', '').replace('```', '')
            kimi_info = json.loads(kimi_info)
        kimi_info['k_title'] = kimi_title
        kimi_info['ori_title'] = title
        logging(
            code="1005",
            info="kimi_mining",
            data=kimi_info,
            trace_id=trace_id
        )
        return kimi_info

    @classmethod
    async def ask_kimi(cls, question):
        """
        Ask Kimi for information
        :param question: tiny text
        :return: "{}"
        """
        single_title_prompt = """
            我会给你一个视频标题，需要你帮我用你所学的知识来帮我分析出以下信息，信息我都写到 json 里面了
            {
                "key_words": [],  # 返回三个关键词
                "search_keys": [], # 标题可能的搜索关键词，返回 3 个
                "extra_keys": [], # 关心这个视频的用户还会关心哪些关键词， 返回 3 个
                "theme": 标题的主题， 用一个词概括
            }
            只需要返回一个 json，key 和上面的一样，
            我给你的标题是: 
            """
        client = OpenAI(
            api_key='sk-5DqYCa88kche6nwIWjLE1p4oMm8nXrR9kQMKbBolNAWERu7q',
            base_url="https://api.moonshot.cn/v1"
        )
        chat_completion = client.chat.completions.create(
            messages=[
                {
                    "role": "user",
                    "content": single_title_prompt + question,
                }
            ],
            model="moonshot-v1-8k",
        )
        response = chat_completion.choices[0].message.content.replace('```json', '').replace('```', '')
        try:
            response = json.loads(response)
            return response
        except:
            return {}

    @classmethod
    async def ask_kimi_and_save_to_local(cls, info_tuple):
        """
        save file to local
        :return:
        """
        title, trace_id, save_path = info_tuple[0], info_tuple[1], info_tuple[2]
        if os.path.exists(save_path):
            logging(
                code="2001",
                info="该 video 信息已经挖掘完成---{}".format(title),
                function="ask_kimi_and_save_to_local",
                trace_id=trace_id,
            )
        else:
            os.makedirs(os.path.dirname(save_path), exist_ok=True)
            if not title:
                result = {}
            else:
                result = await cls.ask_kimi(title)
            logging(
                code="2001",
                info="kimi-result",
                data=result,
                trace_id=trace_id,
                function="ask_kimi_and_save_to_local"
            )
            with open(save_path, "w", encoding="utf-8") as f:
                f.write(json.dumps(result, ensure_ascii=False))

    @classmethod
    async def kimi_title(cls, ori_title, ai_model):
        """
        prompt + kimi + ori_title generate new title
        :param ori_title:
        :param ai_model:
        :return:
        """
        single_title_prompt = """
        请将以上标题改写成适合小程序点击和传播的小程序标题，小程序标题的写作规范如下，请学习后进行小程序标题的编写。直接输出最终的小程序标题
        小程序标题写作规范：
        1.要点前置：将最重要的信息放在标题的最前面，以快速吸引读者的注意力。例如，“5月一辈子同学，三辈子亲，送给我的老同学，听哭无数人！”中的“5月”和“一辈子同学，三辈子亲”都是重要的信息点。
        2.激发情绪：使用能够触动人心的语言，激发读者的情感共鸣。如“只剩两人同学聚会，看后感动落泪。”使用“感动落泪”激发读者的同情和怀旧情绪。
        3.使用数字和特殊符号：数字可以提供具体性，而特殊符号如“🔴”、“😄”、“🔥”等可以吸引视觉注意力，增加点击率。
        4.悬念和好奇心：创建悬念或提出问题，激发读者的好奇心。例如，“太神奇了!长江水位下降，重庆出现惊奇一幕!”中的“惊奇一幕”就是一个悬念。
        5.名人效应：如果内容与知名人士相关，提及他们的名字可以增加标题的吸引力。
        6.社会价值观：触及读者的文化和社会价值观，如家庭、友情、国家荣誉等。
        7.标点符号的运用：使用感叹号、问号等标点来增强语气和情感表达。
        8.直接的语言：使用直白、口语化的语言，易于理解，如“狗屁股，笑死我了!”。
        9.热点人物或事件：提及当前的热点人物或事件，利用热点效应吸引读者。
        10.字数适中：保持标题在10-20个字之间，既不过长也不过短，确保信息的完整性和吸引力。
        11.适当的紧迫感：使用“最新”、“首次”、“紧急”等词汇，创造一种紧迫感，促使读者立即行动。
        12.情感或价值诉求：使用如“感动”、“泪目”、“经典”等词汇，直接与读者的情感或价值观产生共鸣。
        避免误导：确保标题准确反映内容，避免夸大或误导读者。
        """
        client = OpenAI(
            api_key=ai_model['api_key'],
            base_url=ai_model['base_url']
        )
        chat_completion = client.chat.completions.create(
            messages=[
                {
                    "role": "user",
                    "content": ori_title + "\n" + single_title_prompt,
                }
            ],
            model=ai_model['model'],
        )
        response = chat_completion.choices[0].message.content
        return response.split("\n")[0]

    @classmethod
    async def kimi_mining(cls, text, ai_model):
        """
        通过文章来挖掘出有效的信息
        :param text:
        :param ai_model:
        :return:
        """
        text_prompt = """
        请从我给你的文章中挖掘出以下信息并且返回如下结果。
        你返回的结果是一个 json, 格式如下:
        {
            "content_keys": [] # 同时提供三个与文章内容高度相关的关键词，这些关键词将用于网络上搜索相关视频内容,
            "content_title": 一个总结性的标题，该标题应简洁并能够反映文章的主要内容
        }
        你需要处理的文本是：
        """
        client = OpenAI(
            api_key=ai_model['api_key'],
            base_url=ai_model['base_url']
        )
        chat_completion = client.chat.completions.create(
            messages=[
                {
                    "role": "user",
                    "content": text_prompt + text,
                }
            ],
            model=ai_model['model'],
            response_format={"type": "json_object"}
        )
        content = json.loads(chat_completion.choices[0].message.content)
        return content

    @classmethod
    async def get_kimi_title_safe_score(cls, kimi_title, ai_model):
        """
        获取kimi_title的安全分数
        """
        prompt = f"""
        请你学习一下内容规范，以下标题可能会违反了某条内容规范。请你对标题做一个内容风险评级，1-10分，等级越高内容违规风险越大。 
        请直接输出内容风险评级的分数，不要输出你的理由、分析等内容。 
        输出:
            只需要输出危险分级分数，不要输出任何其他内容。
        内容规范为： 
        4.2 色俗内容 
            4.2.1 散布淫秽、色情内容，包括但不限于招嫖、寻找一夜情、性伴侣等。 
            4.2.2 发布有色情意味的情色文字、情色视频、情色漫画等内容。 
            4.2.3 以投稿/爆料等形式描述约炮经历、性交体验、偷情、涉隐私部位偷拍等伤风败俗的话题内容。 
            4.2.4 以低俗的配图引诱用户阅读文章、关注微信公众号。包含性撩拨、性挑逗画面；疑似女性性高潮/性虐场面；偷拍的沐浴/更衣/如厕/亲热等私密画面；女性故意露出敏感部位 (纯裸露的胸、生殖器官)以及敏感部位未打码的真人写真/艺术摄影等。 
            4.2.5 文内以低俗类的动图或引导图，诱导用户点击进而跳转至另一篇图文页或关注某个公众号。 
            4.2.6 文章主要描述PUA撩妹、撩汉等相关话题，且引导用户关注公众号/加个人微信号/加群。 
        4.11 煽动、夸大、误导类内容 平台鼓励创作者提供准确、清晰、能体现文章内容主旨的标题，不允许通过标题噱头诱导用户点击或误导用户。
            包括但不限于以下情况： 
            4.11.1 标题含有危害人身安全、恐吓侮辱、惊悚、极端内容，或者以命令式语气强迫用户阅读。 
            4.11.2 标题无依据夸大事件严重程度、紧急程度、受影响面以及事件引发的情绪。 
            4.11.3 标题以浮夸的描述，反常识强调某种食物/行为对人体健康的影响，煽动人群要/不要去做某行为。 
            4.11.4 非官方通知或者公告，但标题假借官方名义煽动获取流量，或以信息来源机密、看完即删来诱导用户。 
            4.11.5 标题故意隐藏关键信息，或无中生有部分信息，给用户造成误导。 
            4.12 违反国家法律法规禁止的内容 
                （1）违反宪法确定的基本原则的； 
                （2）危害国家安全，泄露国家秘密，颠覆国家政权，破坏国家统一的； 
                （3）损害国家荣誉和利益的； 
                （4）煽动民族仇恨、民族歧视，破坏民族团结的； 
                （5）破坏国家宗教政策，宣扬邪教和封建迷信的； 
                （6）散布不实信息，扰乱社会秩序，破坏社会稳定的； 
                （7）散布淫秽、色情、赌博、暴力、恐怖或者教唆犯罪的； 
                （8）侮辱或者诽谤他人，侵害他人合法权益的； 
                （9）煽动非法集会、结社、游行、示威、聚众扰乱社会秩序； 
                （10）以非法民间组织名义活动的； 
                （11）不符合《即时通信工具公众信息服务发展管理暂行规定》及遵守法律法规、社会主义制度、国家利益、公民合法利益、公共秩序、社会道德风尚和信息真实性等“七条底线”要求的； 
                （12）含有法律、行政法规禁止的其他内容的。
        输入的标题是： {kimi_title}
        """
        client = OpenAI(
            api_key=ai_model['api_key'],
            base_url=ai_model['base_url']
        )
        chat_completion = client.chat.completions.create(
            messages=[
                {
                    "role": "user",
                    "content": prompt
                }
            ],
            model=ai_model['model']
        )
        response = chat_completion.choices[0].message.content
        return response

    @classmethod
    async def make_kimi_title_safer(cls, ori_title, ai_model):
        """
        安全化 kimi title
        """
        prompt = """
            以下每行为一个文章的标题，请用尽量平实的语言对以上标题进行改写，保持在10～15字左右，请注意：
            1. 不要虚构或改变标题的含义。
            2. 不要用笃定的语气描述存疑的可能性，不要将表述可能性的问句改为肯定句。
            直接输出改写后的标题列表。
            在改写完成后，再输出一次，在改写的标题前增加和标题情感、语气匹配的特殊符号，如：“🔴”、“😄”、“🔥”、“😨”等等
            输出：
                输出结果是Dict, 格式为: 
                {
                "title_v1": 请填写第一次输出的标题,
                "title_v2": 请填写第二次输出的标题
                }
            输入的标题是: 
        """
        client = OpenAI(
            api_key=ai_model['api_key'],
            base_url=ai_model['base_url']
        )
        chat_completion = client.chat.completions.create(
            messages=[
                {
                    "role": "user",
                    "content": prompt + ori_title,
                }
            ],
            model=ai_model['model'],
            response_format={"type": "json_object"}
        )
        response = chat_completion.choices[0].message.content
        response_json = json.loads(response)
        safer_title = response_json["title_v2"]
        return safer_title