LLM Servingを支える技術

2025.07.22 13:34
Zenn.dev

ワシントン大学/Kotoba Technologiesの釜堀です。専門は機械学習システムで、LLMなどの推論を効率化する技術を研究・開発しています。 現代のLLMは莫大な計算・メモリを要するため、LLMを使ったサービスを提供する際には推論の効率性が非常に重要です。この分野はここ数年活発に研究されていて、vLLMやSGLangなど非常に...

検索

人気記事

2026.05.05 11:04
2026.06.17 1:59
2026.06.17 0:00
2026.06.17 1:19
2026.06.17 2:27

コメント一覧

まだコメントはありません。

コメント