浏览代码

dssm train

丁云鹏 4 月之前
父节点
当前提交
3338cea34f
共有 1 个文件被更改,包括 4 次插入1 次删除
  1. 4 1
      recommend-model-produce/src/main/python/tools/utils/static_ps/reader_helper_hdfs.py

+ 4 - 1
recommend-model-produce/src/main/python/tools/utils/static_ps/reader_helper_hdfs.py

@@ -262,7 +262,10 @@ class QueueDatset(object):
             use_var=self.input_var,
             use_var=self.input_var,
             pipe_command=self.pipe_command,
             pipe_command=self.pipe_command,
             batch_size=self.infer_batch_size,
             batch_size=self.infer_batch_size,
-            thread_num=self.infer_thread_num)
+            thread_num=self.infer_thread_num,
+            fs_name=configs["fs.default.name"],  # 设置 HDFS 名称
+            fs_ugi=configs["hadoop.job.ugi"],  # 设置 HDFS 用户组信息
+            download_cmd="")
         print("dataset get_infer_reader thread_num:", self.infer_thread_num)
         print("dataset get_infer_reader thread_num:", self.infer_thread_num)
         dataset.set_filelist(self.file_list)
         dataset.set_filelist(self.file_list)
         return dataset
         return dataset