日本語TTS用の学習データの精度を上げる「ふりがなWhisper」を作った話

2025.06.24 0:36
Zenn.dev

この記事の内容はどこかに投稿する予定でしたが、この記事ほぼ同じアイデアを持つ論文が先日arXivに2本も立て続けに発表されたため([1, 2]、ともにINTERSPEECH2025採択)、供養のために公開しています。 この記事の最後でそれらの論文も軽く紹介します。 はじめに Parakeet株式会社リサーチャーの榎本 (X: @henomoto102...

検索

人気記事

2025.11.22 10:57
2025.11.23 1:06
2025.11.23 0:04
2025.08.18 13:01
2025.11.22 23:10

コメント一覧

まだコメントはありません。

コメント