2 years ago · fa78e38c3c
--- a/asr_task.py
+++ b/asr_task.py
@@ -11,6 +11,7 @@ from threading import Timer
 
															 from whisper_asr import get_whisper_asr
														
 
															 from gpt_tag import request_gpt
														
 
															 from config import set_config
														
 
															+from audio_process import get_wav
														
 
															 from log import Log
														
 
															 config_ = set_config()
														
 
															 log_ = Log()
														
@@ -23,15 +24,16 @@ def get_asr(video_id, download_folder, asr_folder):
 
															         video_type = filename.split('.')[-1]
														
 
															         if video_type in ['mp4', 'm3u8']:
														
 
															             video_file = os.path.join(video_folder, filename)
														
 
															+            audio_path = get_wav(video_file)
														
 
															             # 1. asr识别
														
 
															-            asr_res_initial = get_whisper_asr(video=video_file)
														
 
															+            asr_res_initial = get_whisper_asr(audio=audio_path)
														
 
															             print(video_id, asr_res_initial)
														
 
															             # 2. 识别结果写入文件
														
 
															             asr_path = os.path.join(asr_folder, f"{video_id}.txt")
														
 
															             with open(asr_path, 'w', encoding='utf-8') as wf:
														
 
															                 wf.write(asr_res_initial)
														
 
															             # 将处理过的视频进行删除
														
 
															-            shutil.rmtree(os.path.join(download_folder, video_id))
														
 
															+            # shutil.rmtree(os.path.join(download_folder, video_id))
														
 
															             break
														
--- a/asr_task.sh
+++ b/asr_task.sh
@@ -2,7 +2,7 @@ ps -ef | grep asr_task.py | grep -v grep | awk '{print $2}' | xargs kill -9
 
															 rm -r asr_res/
														
 
															-source activate whisper
														
 
															+source activate aigc-test
														
 
															 CUDA_VISIBLE_DEVICES=0 python asr_task.py 0 > logs/asr_task_0.log &
														
 
															 CUDA_VISIBLE_DEVICES=1 python asr_task.py 1 > logs/asr_task_1.log
														
--- a/requirements.txt
+++ b/requirements.txt
@@ -1,10 +1,10 @@
 
															-pyodps==0.10.7
														
 
															-moviepy==1.0.3
														
 
															-requests==2.31.0
														
 
															-openai_whisper==20230314
														
 
															-zhconv==1.4.3
														
 
															-oss2==2.14.0
														
 
															-pandas==1.1.3
														
 
															-aliyun_python_sdk==2.2.0
														
 
															-odps==3.5.1
														
 
															-whisper==1.1.10
														
 
															+pyodps
														
 
															+moviepy
														
 
															+requests
														
 
															+openai_whisper
														
 
															+zhconv
														
 
															+oss2
														
 
															+pandas
														
 
															+aliyun_python_sdk
														
 
															+odps
														
 
															+git+https://github.com/openai/whisper.git
														
--- a/whisper_asr.py
+++ b/whisper_asr.py
@@ -2,13 +2,14 @@ import whisper
 
															 from zhconv import convert
														
 
															-def get_whisper_asr(video, model='medium'):
														
 
															+def get_whisper_asr(audio, model='medium'):
														
 
															     try:
														
 
															         model = whisper.load_model(model)
														
 
															-        result = model.transcribe(video, language='Chinese')
														
 
															+        result = model.transcribe(audio, language='Chinese')
														
 
															         # 简繁转换
														
 
															         # zh-cn 大陆简体
														
 
															         # zh-hant 繁体
														
 
															         return convert(result['text'], 'zh-cn')
														
 
															-    except:
														
 
															+    except Exception as e:
														
 
															+        print(f'asr error: {audio}. e: {e}')
														
 
															         return ''