情報検索モデルで最高性能(512トークン以下)・日本語版SPLADE v2をリリース - A Day in the Life
2024.12.24 6:13
Secon.dev
2024年は情報検索技術に興味を持ち、情報検索関連のモデル作りを趣味で行っている @hotchpotch (セコン)です。Transfomer は割と適当にやっても、いい感じに学習してくれるので、楽しいですね。 というわけで、日々部屋でご家庭用GPUを回し、以前公開した情報検索に特化したモデル・日本語版SPLADE v1をさらに良い感じに...