LLM Servingを支える技術

2025.07.22 13:34
Zenn.dev

ワシントン大学/Kotoba Technologiesの釜堀です。専門は機械学習システムで、LLMなどの推論を効率化する技術を研究・開発しています。 現代のLLMは莫大な計算・メモリを要するため、LLMを使ったサービスを提供する際には推論の効率性が非常に重要です。この分野はここ数年活発に研究されていて、vLLMやSGLangなど非常に...

検索

人気記事

2025.07.23 16:01
2025.07.23 14:47
2025.07.24 6:15
2025.07.23 14:35
2025.07.23 23:43

コメント一覧

まだコメントはありません。

コメント