123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328 |
- """
- @author: luojunhui
- """
- import os
- import json
- from openai import OpenAI
- from applications.functions.chatgpt import OpenAIServer
- from applications.config import moon_shot
- from applications.config import deep_seek
- from applications.log import logging
- class KimiServer(object):
- """
- Kimi Server
- """
- @classmethod
- async def search_kimi_schedule(cls, params, safe_score):
- """
- 搜索阶段 kimi 操作
- :param params:
- :param safe_score:
- :return:
- """
- title = params['article_title'].split("@@")[-1]
- contents = params['article_text']
- trace_id = params['content_id']
- try:
- kimi_title = await cls.kimi_title(title, ai_model=moon_shot)
- # 判断kimi 标题是否安全
- title_score = await cls.get_kimi_title_safe_score(kimi_title, ai_model=moon_shot)
- kimi_green_title = None
- if int(title_score) > safe_score:
- kimi_green_title = await cls.make_kimi_title_safer(title, ai_model=moon_shot)
-
- logging(
- code="1005",
- info="generate_title",
- data={
- "ori_title": title,
- "kimi_title": kimi_title,
- "title_score": title_score,
- "new_kimi_title": kimi_green_title
- },
- trace_id=trace_id
- )
- kimi_title = kimi_green_title if kimi_green_title else kimi_title
- except Exception as e:
- logging(
- code="4002",
- info="kimi 挖掘失败--{}, 采用 gpt".format(e),
- trace_id=trace_id
- )
- gpt = OpenAIServer()
- kimi_title = gpt.gpt_mining(
- text=title,
- prompt=gpt.prompt_generate(
- prompt_type="title"
- )
- )
- kimi_title = kimi_title.replace("'", "").replace('"', "").replace("\\", "")
- try:
- kimi_info = await cls.kimi_mining(contents, ai_model=moon_shot)
- except Exception as e:
- logging(
- code="4002",
- info="kimi 挖掘失败--{}, 采用 gpt".format(e),
- trace_id=trace_id
- )
- gpt = OpenAIServer()
- kimi_info = gpt.gpt_mining(
- text=contents,
- prompt=gpt.prompt_generate(
- prompt_type="text"
- )
- )
- kimi_info = kimi_info.replace('```json', '').replace('```', '')
- kimi_info = json.loads(kimi_info)
- kimi_info['k_title'] = kimi_title
- kimi_info['ori_title'] = title
- logging(
- code="1005",
- info="kimi_mining",
- data=kimi_info,
- trace_id=trace_id
- )
- return kimi_info
- @classmethod
- async def ask_kimi(cls, question):
- """
- Ask Kimi for information
- :param question: tiny text
- :return: "{}"
- """
- single_title_prompt = """
- 我会给你一个视频标题,需要你帮我用你所学的知识来帮我分析出以下信息,信息我都写到 json 里面了
- {
- "key_words": [], # 返回三个关键词
- "search_keys": [], # 标题可能的搜索关键词,返回 3 个
- "extra_keys": [], # 关心这个视频的用户还会关心哪些关键词, 返回 3 个
- "theme": 标题的主题, 用一个词概括
- }
- 只需要返回一个 json,key 和上面的一样,
- 我给你的标题是:
- """
- client = OpenAI(
- api_key='sk-5DqYCa88kche6nwIWjLE1p4oMm8nXrR9kQMKbBolNAWERu7q',
- base_url="https://api.moonshot.cn/v1"
- )
- chat_completion = client.chat.completions.create(
- messages=[
- {
- "role": "user",
- "content": single_title_prompt + question,
- }
- ],
- model="moonshot-v1-8k",
- )
- response = chat_completion.choices[0].message.content.replace('```json', '').replace('```', '')
- try:
- response = json.loads(response)
- return response
- except:
- return {}
- @classmethod
- async def ask_kimi_and_save_to_local(cls, info_tuple):
- """
- save file to local
- :return:
- """
- title, trace_id, save_path = info_tuple[0], info_tuple[1], info_tuple[2]
- if os.path.exists(save_path):
- logging(
- code="2001",
- info="该 video 信息已经挖掘完成---{}".format(title),
- function="ask_kimi_and_save_to_local",
- trace_id=trace_id,
- )
- else:
- os.makedirs(os.path.dirname(save_path), exist_ok=True)
- if not title:
- result = {}
- else:
- result = await cls.ask_kimi(title)
- logging(
- code="2001",
- info="kimi-result",
- data=result,
- trace_id=trace_id,
- function="ask_kimi_and_save_to_local"
- )
- with open(save_path, "w", encoding="utf-8") as f:
- f.write(json.dumps(result, ensure_ascii=False))
- @classmethod
- async def kimi_title(cls, ori_title, ai_model):
- """
- prompt + kimi + ori_title generate new title
- :param ori_title:
- :param ai_model:
- :return:
- """
- single_title_prompt = """
- 请将以上标题改写成适合小程序点击和传播的小程序标题,小程序标题的写作规范如下,请学习后进行小程序标题的编写。直接输出最终的小程序标题
- 小程序标题写作规范:
- 1.要点前置:将最重要的信息放在标题的最前面,以快速吸引读者的注意力。例如,“5月一辈子同学,三辈子亲,送给我的老同学,听哭无数人!”中的“5月”和“一辈子同学,三辈子亲”都是重要的信息点。
- 2.激发情绪:使用能够触动人心的语言,激发读者的情感共鸣。如“只剩两人同学聚会,看后感动落泪。”使用“感动落泪”激发读者的同情和怀旧情绪。
- 3.使用数字和特殊符号:数字可以提供具体性,而特殊符号如“🔴”、“😄”、“🔥”等可以吸引视觉注意力,增加点击率。
- 4.悬念和好奇心:创建悬念或提出问题,激发读者的好奇心。例如,“太神奇了!长江水位下降,重庆出现惊奇一幕!”中的“惊奇一幕”就是一个悬念。
- 5.名人效应:如果内容与知名人士相关,提及他们的名字可以增加标题的吸引力。
- 6.社会价值观:触及读者的文化和社会价值观,如家庭、友情、国家荣誉等。
- 7.标点符号的运用:使用感叹号、问号等标点来增强语气和情感表达。
- 8.直接的语言:使用直白、口语化的语言,易于理解,如“狗屁股,笑死我了!”。
- 9.热点人物或事件:提及当前的热点人物或事件,利用热点效应吸引读者。
- 10.字数适中:保持标题在10-20个字之间,既不过长也不过短,确保信息的完整性和吸引力。
- 11.适当的紧迫感:使用“最新”、“首次”、“紧急”等词汇,创造一种紧迫感,促使读者立即行动。
- 12.情感或价值诉求:使用如“感动”、“泪目”、“经典”等词汇,直接与读者的情感或价值观产生共鸣。
- 避免误导:确保标题准确反映内容,避免夸大或误导读者。
- """
- client = OpenAI(
- api_key=ai_model['api_key'],
- base_url=ai_model['base_url']
- )
- chat_completion = client.chat.completions.create(
- messages=[
- {
- "role": "user",
- "content": ori_title + "\n" + single_title_prompt,
- }
- ],
- model=ai_model['model'],
- )
- response = chat_completion.choices[0].message.content
- return response.split("\n")[0]
- @classmethod
- async def kimi_mining(cls, text, ai_model):
- """
- 通过文章来挖掘出有效的信息
- :param text:
- :param ai_model:
- :return:
- """
- text_prompt = """
- 请从我给你的文章中挖掘出以下信息并且返回如下结果。
- 你返回的结果是一个 json, 格式如下:
- {
- "content_keys": [] # 同时提供三个与文章内容高度相关的关键词,这些关键词将用于网络上搜索相关视频内容,
- "content_title": 一个总结性的标题,该标题应简洁并能够反映文章的主要内容
- }
- 你需要处理的文本是:
- """
- client = OpenAI(
- api_key=ai_model['api_key'],
- base_url=ai_model['base_url']
- )
- chat_completion = client.chat.completions.create(
- messages=[
- {
- "role": "user",
- "content": text_prompt + text,
- }
- ],
- model=ai_model['model'],
- response_format={"type": "json_object"}
- )
- content = json.loads(chat_completion.choices[0].message.content)
- return content
- @classmethod
- async def get_kimi_title_safe_score(cls, kimi_title, ai_model):
- """
- 获取kimi_title的安全分数
- """
- prompt = f"""
- 请你学习一下内容规范,以下标题可能会违反了某条内容规范。请你对标题做一个内容风险评级,1-10分,等级越高内容违规风险越大。
- 请直接输出内容风险评级的分数,不要输出你的理由、分析等内容。
- 输出:
- 只需要输出危险分级分数,不要输出任何其他内容。
- 内容规范为:
- 4.2 色俗内容
- 4.2.1 散布淫秽、色情内容,包括但不限于招嫖、寻找一夜情、性伴侣等。
- 4.2.2 发布有色情意味的情色文字、情色视频、情色漫画等内容。
- 4.2.3 以投稿/爆料等形式描述约炮经历、性交体验、偷情、涉隐私部位偷拍等伤风败俗的话题内容。
- 4.2.4 以低俗的配图引诱用户阅读文章、关注微信公众号。包含性撩拨、性挑逗画面;疑似女性性高潮/性虐场面;偷拍的沐浴/更衣/如厕/亲热等私密画面;女性故意露出敏感部位 (纯裸露的胸、生殖器官)以及敏感部位未打码的真人写真/艺术摄影等。
- 4.2.5 文内以低俗类的动图或引导图,诱导用户点击进而跳转至另一篇图文页或关注某个公众号。
- 4.2.6 文章主要描述PUA撩妹、撩汉等相关话题,且引导用户关注公众号/加个人微信号/加群。
- 4.11 煽动、夸大、误导类内容 平台鼓励创作者提供准确、清晰、能体现文章内容主旨的标题,不允许通过标题噱头诱导用户点击或误导用户。
- 包括但不限于以下情况:
- 4.11.1 标题含有危害人身安全、恐吓侮辱、惊悚、极端内容,或者以命令式语气强迫用户阅读。
- 4.11.2 标题无依据夸大事件严重程度、紧急程度、受影响面以及事件引发的情绪。
- 4.11.3 标题以浮夸的描述,反常识强调某种食物/行为对人体健康的影响,煽动人群要/不要去做某行为。
- 4.11.4 非官方通知或者公告,但标题假借官方名义煽动获取流量,或以信息来源机密、看完即删来诱导用户。
- 4.11.5 标题故意隐藏关键信息,或无中生有部分信息,给用户造成误导。
- 4.12 违反国家法律法规禁止的内容
- (1)违反宪法确定的基本原则的;
- (2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一的;
- (3)损害国家荣誉和利益的;
- (4)煽动民族仇恨、民族歧视,破坏民族团结的;
- (5)破坏国家宗教政策,宣扬邪教和封建迷信的;
- (6)散布不实信息,扰乱社会秩序,破坏社会稳定的;
- (7)散布淫秽、色情、赌博、暴力、恐怖或者教唆犯罪的;
- (8)侮辱或者诽谤他人,侵害他人合法权益的;
- (9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
- (10)以非法民间组织名义活动的;
- (11)不符合《即时通信工具公众信息服务发展管理暂行规定》及遵守法律法规、社会主义制度、国家利益、公民合法利益、公共秩序、社会道德风尚和信息真实性等“七条底线”要求的;
- (12)含有法律、行政法规禁止的其他内容的。
- 输入的标题是: {kimi_title}
- """
- client = OpenAI(
- api_key=ai_model['api_key'],
- base_url=ai_model['base_url']
- )
- chat_completion = client.chat.completions.create(
- messages=[
- {
- "role": "user",
- "content": prompt
- }
- ],
- model=ai_model['model']
- )
- response = chat_completion.choices[0].message.content
- return response
- @classmethod
- async def make_kimi_title_safer(cls, ori_title, ai_model):
- """
- 安全化 kimi title
- """
- prompt = """
- 以下每行为一个文章的标题,请用尽量平实的语言对以上标题进行改写,保持在10~15字左右,请注意:
- 1. 不要虚构或改变标题的含义。
- 2. 不要用笃定的语气描述存疑的可能性,不要将表述可能性的问句改为肯定句。
- 直接输出改写后的标题列表。
- 在改写完成后,再输出一次,在改写的标题前增加和标题情感、语气匹配的特殊符号,如:“🔴”、“😄”、“🔥”、“😨”等等
- 输出:
- 输出结果是Dict, 格式为:
- {
- "title_v1": 请填写第一次输出的标题,
- "title_v2": 请填写第二次输出的标题
- }
- 输入的标题是:
- """
- client = OpenAI(
- api_key=ai_model['api_key'],
- base_url=ai_model['base_url']
- )
- chat_completion = client.chat.completions.create(
- messages=[
- {
- "role": "user",
- "content": prompt + ori_title,
- }
- ],
- model=ai_model['model'],
- response_format={"type": "json_object"}
- )
- response = chat_completion.choices[0].message.content
- response_json = json.loads(response)
- safer_title = response_json["title_v2"]
- return safer_title
|