日本語TTS用の学習データの精度を上げる「ふりがなWhisper」を作った話

2025.06.24 0:36
Zenn.dev

この記事の内容はどこかに投稿する予定でしたが、この記事ほぼ同じアイデアを持つ論文が先日arXivに2本も立て続けに発表されたため([1, 2]、ともにINTERSPEECH2025採択)、供養のために公開しています。 この記事の最後でそれらの論文も軽く紹介します。 はじめに Parakeet株式会社リサーチャーの榎本 (X: @henomoto102...

検索

人気記事

2025.01.10 19:00
2025.07.14 13:00
2025.01.11 14:51
2025.07.12 9:06
2025.07.14 19:40

コメント一覧

まだコメントはありません。

コメント