日本語TTS用の学習データの精度を上げる「ふりがなWhisper」を作った話

2025.06.24 0:36
Zenn.dev

この記事の内容はどこかに投稿する予定でしたが、この記事ほぼ同じアイデアを持つ論文が先日arXivに2本も立て続けに発表されたため([1, 2]、ともにINTERSPEECH2025採択)、供養のために公開しています。 この記事の最後でそれらの論文も軽く紹介します。 はじめに Parakeet株式会社リサーチャーの榎本 (X: @henomoto102...

検索

人気記事

2026.04.08 0:50
2026.04.07 19:05
2026.04.07 11:13
2026.04.07 16:14
2026.04.07 20:05

コメント一覧

まだコメントはありません。

コメント