mergekit gpu 1226 #9702

Mangodadada · 2024-12-26T06:48:03Z

PR types

PR changes

Description

mergekit gpu

paddle-bot · 2024-12-26T06:48:08Z

Thanks for your contribution!

lugimzzz · 2024-12-30T11:34:41Z

paddlenlp/mergekit/merge_method.py

@@ -30,7 +31,7 @@ def merge(self, tensor_list):
        elif self.merge_config.merge_type == "ties":
            return self.ties(tensor_list)
        else:
-            raise NotImplementedError(f"{self.merge_config.merge_type} is not supported yet.")
+            raise NotImplementedError("Unsupported tensor type.")


????为啥要修改所有的NotImplementedError("Unsupported tensor type.")

lugimzzz · 2024-12-30T11:36:40Z

paddlenlp/mergekit/merge_method.py

        else:
-            raise NotImplementedError("Paddle Tensor is not supported yet.")
+            raise NotImplementedError(f"Tensor type {self.merge_config.tensor_type} is not supported yet.")


raise NotImplementedError(f"Tensor type {self.merge_config.tensor_type} is not supported yet.") 改成 raise raise ValueError(f"Unkonwn tensor type {self.merge_config.tensor_type}")

其他地方类似问题也做同样的修改！

lugimzzz · 2024-12-30T11:55:07Z

paddlenlp/mergekit/merge_method.py

+                stacked_signs = paddle.sign(stacked_tensors).astype(mask_dtype)
+                majority_sign = (paddle.sum(stacked_signs, axis=0) >= 0).astype(mask_dtype) * 2 - 1
+            else:
+                raise NotImplementedError("Unsupported tensor type.")


lugimzzz · 2024-12-30T12:02:07Z

paddlenlp/mergekit/sparsify_method.py

+        elif self.merge_config.tensor_type == "pd":
+            mask = paddle.cast(
+                paddle.bernoulli(paddle.full(tensor.shape, self.merge_config.reserve_p, dtype=tensor.dtype)),
+                tensor.dtype,


不用再cast了，输出tensor和输入tensor形状和数据类型相同https://www.paddlepaddle.org.cn/documentation/docs/zh/2.6/api/paddle/bernoulli_cn.html#bernoulli

lugimzzz · 2024-12-30T12:24:51Z

paddlenlp/mergekit/merge_config.py

-            raise ValueError(f"Unsupported tensor type: {self.tensor_type}. Support 'np' only.")
-        if self.device != "cpu":
-            logger.warning(f"Currently only support cpu device, but got {self.device}. Setting `device` to `cpu`.")
+        if self.tensor_type not in ["np", "pd"]:


https://github.com/PaddlePaddle/PaddleNLP/blob/develop/tests/llm/test_mergekit.py 测试mergekit包括cpu numpy、cpu paddle tensor、gpu paddle tensor三种case

lugimzzz · 2024-12-30T12:32:32Z