GitHub 中文社区
回车: Github搜索
Shift+回车: Google搜索
论坛
排行榜
趋势
集合
主题
趋势
排行榜
#
opt
Organization
Website
Wikipedia
FlexLLMGen
存档
@FMInference
#计算机科学#
Running large language models on a single GPU for throughput-oriented scenarios.
深度学习
gpt-3
high-throughput
large-language-models
machine-learning
offloading
opt
Python
9.24 k
2 个月前