公開日:
更新日:
大規模言語モデルで感情音声を自動アノテーション
株式会社RevCommの研究部門であるRevComm Researchが開発した「大規模言語モデルを活用した音声への感情のアノテーション」に関する論文が、世界最大規模の音声・音響信号処理に関する国際学会「ICASSP 2024」にて採択されました。
この研究は、音声の書き起こしと音声的特徴から感情情報を自動的にアノテーションする手法を提案しており、従来は人手で行われていた作業を大規模言語モデルがほぼ同等の精度で自動化することに成功しました。
これにより、大規模な音声感情データの作成が容易になり、音声感情認識の技術向上が期待されます。
引用元
この記事は役に立ちましたか?
記事ランキング
- 週間
- 月間
新着ニュース