Registration info |
オンライン参加 (定員数は目安、上限は未定) Free
FCFS
|
---|---|
参加者への情報 |
(参加者と発表者のみに公開されます)
|
Description
開催概要
Tokyo BISH Bashは、東京における、音声・音響・信号処理に関するエンジニア・研究者のためのミートアップです。San Franciscoで開催されている BISH Bash と連携しています。音声・音響・信号処理に関する各種トークを中心に、エンジニア・研究者・企業を結ぶネットワーキングイベントを年数回開催していくことを予定しています。
第4回となる今回のTokyo BISH Bashは、本家のBISH Bashよりオーガナイザーの一人であるZafar Rafiiさんをゲストスピーカーとして招待し、スライド離散フーリエ変換(SDFT)について講演いただきます。
さらに、LINEの橘さんより音声合成における表現手法、日立製作所の川口さんより異音検知コンペティション「DCASE 2021 Challenge Task 2」についてお話しいただきます。 音声・音響・信号処理にご興味のある方はどなたでも参加可能です。是非ご参加ください!
日時
2021/3/30 (水) Open 15:00 Start 15:30 End 17:10 (JST)
参加される方への事前のお願い
- 本イベントは、Zoom Webinarを利用し、オンラインにて開催します。
- インターネットが良好に繋がる環境にてご視聴ください。
- 視聴端末 (PC/iPad/iPhone/Android) にZoomをインストールの上、サインアップ/サインインして下さい。
- Zoomのダウンロードはこちらから: https://zoom.us/support/download
- 参加登録いただいた方には、当日の視聴URL (および参加後アンケートのURL) を開催前日にメッセージでお送りします。また、参加登録後、本ページでも表示されますのでご確認可能です。
- 15:15頃から入室が可能です。
- 質問がある方は、セッション中に「Q&A」のところにテキストで入力してください。セッションの終了時点で、登壇者が質問を読み上げて回答します。
- 参加後は、アンケートへの回答にご協力をお願いします(無記名):https://forms.gle/p5ViRsy8AXAtfb3d6
タイムテーブル
※今回、Zafar Rafiiさんは英語での講演となります。日本語通訳を用意します。Zoomの通訳機能をご利用ください。
※進行によって各セッションの開始時間が前後する可能性があります。予めご了承ください。
時間 | 所属 | 講演者 | タイトル | 言語 |
---|---|---|---|---|
15:15 | (Open) | |||
15:30 | LINE | 戸上真人 | Tokyo BISH Bashに関して | JP |
15:35 | Bay Innovative Signal Hackers Bash (BISH Bash) |
Zafar Rafii | Sliding DFT with Kernel Windowing | EN 通訳あり |
16:05 | LINE | 橘 健太郎 | 音声合成における話者・スタイル表現手法の調査 | JP |
16:35 | 日立製作所 | 川口 洋平 | ドメインシフト発生下での異音検知コンペティション「DCASE 2021 Challenge Task 2」のご紹介 | JP |
17:05 | アンケート記入のお願い | |||
17:10 | (Close) |
セッション概要
Sliding DFT with Kernel Windowing / カーネル窓を用いたスライディングDFT
Zafar Rafii (Bay Innovative Signal Hackers Bash (BISH Bash) )
The sliding discrete Fourier transform (SDFT) is an efficient method for computing the N-point DFT of a given signal starting at a given sample from the N-point DFT of the same signal starting at the previous sample. However, the SDFT does not allow the use of a window function, generally incorporated in the computation of the DFT to reduce spectral leakage, as it would break its sliding property. We will show how windowing can be included in the SDFT by using a kernel derived from the window function, while keeping the process computationally efficient. In addition, this approach allows for turning other transforms, such as the modified discrete cosine transform (MDCT), into efficient sliding versions of themselves.
(訳) スライド離散フーリエ変換(SDFT)は、あるサンプルから始まる信号のN点DFTを、前のサンプルから始まる同じ信号のN点DFTから計算する効率的な方法です。しかしSDFTでは、スペクトルの漏れを低減するためにDFTの計算に一般的に組み込まれている窓関数を使用すると、そのスライディング特性が崩れてしまうため、使用することができません。本発表では、窓関数から派生したカーネルを用いることで、SDFTに窓関数を組み込むことができ、かつ計算効率を維持できることを示します。さらに、このアプローチは、修正離散コサイン変換(MDCT)などの他の変換を、効率的なスライディングバージョンに変えることを可能にします。
音声合成における話者・スタイル表現手法の調査
橘 健太郎 (LINE株式会社)
2016年WaveNetの登場以来、音声合成の分野では急速に品質が向上しており、単一話者の読み上げ音声であれば、人間の音声と大差ない水準まで達している。しかし、感情に代表されるスタイルや複数の話者を表現するといったタスクにおいては、まだ品質として不十分な点も多い。
今後更に、音声合成の利用が見込める音声対話、e-book、ゲームやライブ配信といったユースケースでは、表現の自由度が高く、様々な声質を生成できる音声合成システムが求められることが予想される。
そこで、音声合成において、様々な話者やスタイルを表現するための手法について調査した結果を紹介する。
ドメインシフト発生下での異音検知コンペティション「DCASE 2021 Challenge Task 2」のご紹介
川口 洋平 (株式会社日立製作所)
3月から開催中の異音検知の国際コンペティション「DCASE 2021 Challenge Task 2」を紹介します。
稼働音に基づいて機械の異常を検知する「異音検知」技術が求められており、近年はその検知性能も目覚ましく向上しています。
しかし、実用にあたっては今も「ドメインシフト」(訓練とテストの間での条件変化) の問題が残されています。
そこで、本タスクでは、ドメインシフト発生下での異音検知の性能を評価します。
異音検知技術に自信がある方は、学生/非学生問わず、ぜひともこのコンペティションにご参加ください!