Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

9950x-指定ccd0 4080 速度大概300it/s #1905

Open
kawae0709 opened this issue Dec 27, 2024 · 7 comments
Open

9950x-指定ccd0 4080 速度大概300it/s #1905

kawae0709 opened this issue Dec 27, 2024 · 7 comments

Comments

@kawae0709
Copy link

9950x-指定ccd0 4080 速度大概300it/s,不指定全核260it/s,有更快速度的吗???9800x3d速度会更快??

@kawae0709
Copy link
Author

关键是显卡跑不满,显卡tdp才1/4占用,这东西非常吃内存交换性能

@AkebiKomichi
Copy link

吃一点TDP很正常,我的4060移动端,TDP120W,可以超到140W,7945HX只是降频版的9950X,96G内存。显卡拉核心频率250,显存频率拉1400,显卡也只能吃到30-40W的TDP。显存不够会用共享显存,详见GPT说明书

@femis
Copy link

femis commented Dec 31, 2024

9950x-指定ccd0 4080 速度大概300it/s,不指定全核260it/s,有更快速度的吗???9800x3d速度会更快??

你们咋搞的这么厉害, 我是 4090 的在 docker 里测试, 不超过 80it/s, 使用的 cuda, 开了半精度

@kawae0709
Copy link
Author

9950x-指定ccd0 4080 速度大概300it/s,不指定全核260it/s,有更快速度的吗???9800x3d速度会更快??

你们咋搞的这么厉害, 我是 4090 的在 docker 里测试, 不超过 80it/s, 使用的 cuda, 开了半精度

这东西不怎么吃显卡,吃的是高频u和内存交换性能,首先我的内存超频延迟在60ns以下,同系统同显卡,7950x--170it/s,换了9950x,不指定260it/s,指定ccd0,就是避免跨ccd延迟,直接到300it/s+,所以非常怀疑换9800x3d,性能会更好,这东西就是吃缓存的,内存敏感新应用

@kawae0709
Copy link
Author

9950x-指定ccd0 4080 速度大概300it/s,不指定全核260it/s,有更快速度的吗???9800x3d速度会更快??

你们咋搞的这么厉害, 我是 4090 的在 docker 里测试, 不超过 80it/s, 使用的 cuda, 开了半精度

我以前cpu推理也有50it/s,你4090!!!80it/s,就是u拖后腿了,我是win11 conda环境的,你docker不知道效率损失又有多少!

@femis
Copy link

femis commented Jan 1, 2025

9950x-指定ccd0 4080速度大概300it/s,不指定全核260it/s,有更快速度的吗???9800x3d速度会更快??

你们咋搞的这么厉害,我是4090的在docker里测试,不超过80it/s,使用的cuda,开了半精度

我以前cpu推理也有50it/s,你4090!!!80it/s,就是你拖后腿了,我是win11 conda环境的,你docker不知道效率又损失多少!

9950x-指定ccd0 4080速度大概300it/s,不指定全核260it/s,有更快速度的吗???9800x3d速度会更快??

你们咋搞的这么厉害,我是4090的在docker里测试,不超过80it/s,使用的cuda,开了半精度

这东西怎么吃显卡,吃的是高u和内存交换性能,首先我的内存频率超延迟在60ns以下,同系统同显卡,7950x--170it/s,换了9950x,不指定260it/s,指定ccd0,就是避免跨ccd延迟,直接到300it/s+,所以非常换怀疑9800x3d,性能会更好,这东西就是吃缓存的,内存敏感的新应用

有可能是我开了三个服务的原因, 我今天只留一个, 速度起来了

0% 0/1500 [00:00<?, ?it/s]
0% 6/1500 [00:00<00:24, 59.85it/s]
1% 20/1500 [00:00<00:14, 105.50it/s]
2% 36/1500 [00:00<00:11, 127.21it/s]
4% 53/1500 [00:00<00:10, 142.76it/s]
5% 71/1500 [00:00<00:09, 154.61it/s]
6% 88/1500 [00:00<00:08, 158.87it/s]
T2S Decoding EOS [155 -> 251]

@femis
Copy link

femis commented Jan 1, 2025

9950x-指定ccd0 4080速度大概300it/s,不指定全核260it/s,有更快速度的吗???9800x3d速度会更快??

你们咋搞的这么厉害,我在docker里测试的是4090的,不超过80it/s,使用的cuda,开了半精度

我之前cpu推理也有50it/s,你4090!!!80it/s,就是你拖后腿了,我是win11 conda环境的,你docker不知道效率又损失多少!

我试了 cpu 确实 60左右 ! 我是 i9 - 14900 - 32

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants