日本語TTS用の学習データの精度を上げる「ふりがなWhisper」を作った話

2025.06.24 0:36
Zenn.dev

この記事の内容はどこかに投稿する予定でしたが、この記事ほぼ同じアイデアを持つ論文が先日arXivに2本も立て続けに発表されたため([1, 2]、ともにINTERSPEECH2025採択)、供養のために公開しています。 この記事の最後でそれらの論文も軽く紹介します。 はじめに Parakeet株式会社リサーチャーの榎本 (X: @henomoto102...

検索

人気記事

2026.05.05 11:04
2026.06.22 10:49
2026.06.22 22:24
2026.06.23 6:45
2026.06.22 23:14

コメント一覧

まだコメントはありません。

コメント