瀏覽代碼

fix data format

often 5 月之前
父節點
當前提交
976542ed7e
共有 1 個文件被更改,包括 1 次插入1 次删除
  1. 1 1
      recommend-model-produce/src/main/python/models/dssm/bq_reader_train_ps.py

+ 1 - 1
recommend-model-produce/src/main/python/models/dssm/bq_reader_train_ps.py

@@ -12,7 +12,7 @@ class DSSMReader(MultiSlotDataGenerator):
     def line_process(self, line):
     def line_process(self, line):
         try:
         try:
             # 按tab分割样本的各个字段
             # 按tab分割样本的各个字段
-            sample_id, label, left_features, right_features = line.rstrip('\n').split('\t')
+            sample_id, label, left_features, right_features = line.rstrip('\n').split('    ')
             
             
             # 转换label为整数
             # 转换label为整数
             label = int(label)
             label = int(label)