소스 검색

fix data format

often 5 달 전
부모
커밋
976542ed7e
1개의 변경된 파일1개의 추가작업 그리고 1개의 파일을 삭제
  1. 1 1
      recommend-model-produce/src/main/python/models/dssm/bq_reader_train_ps.py

+ 1 - 1
recommend-model-produce/src/main/python/models/dssm/bq_reader_train_ps.py

@@ -12,7 +12,7 @@ class DSSMReader(MultiSlotDataGenerator):
     def line_process(self, line):
         try:
             # 按tab分割样本的各个字段
-            sample_id, label, left_features, right_features = line.rstrip('\n').split('\t')
+            sample_id, label, left_features, right_features = line.rstrip('\n').split('    ')
             
             # 转换label为整数
             label = int(label)