GitHub 中文社区
回车: Github搜索
Shift+回车: Google搜索
论坛
排行榜
趋势
集合
主题
趋势
排行榜
#
inferentia
Organization
Website
Wikipedia
vllm
@vllm-project
#大语言模型#
A high-throughput and memory-efficient inference and serving engine for LLMs
gpt
llm
PyTorch
llmops
mlops
model-serving
transformer
llm-serving
inference
llama
amd
rocm
CUDA
inferentia
trainium
tpu
xpu
hpu
Python
32.35 k
8 小时前