Registration info |
オンライン参加 (定員数は目安、上限は未定) Free
FCFS
|
---|---|
参加者への情報 |
(参加者と発表者のみに公開されます)
|
Description
開催概要
Tokyo BISH Bashは、東京における、音声・音響・信号処理に関するエンジニア・研究者のためのミートアップです。San Franciscoで開催されている BISH Bash と連携しています。音声・音響・信号処理に関する各種トークを中心に、エンジニア・研究者・企業を結ぶネットワーキングイベントを年数回開催していくことを予定しています。
第5回となる今回のTokyo BISH Bashは、リオン/都立大の春田様、Googleの久保様、HRIの周藤様、東大の高道先生にご登壇いただきます。 音声・音響・信号処理にご興味のある方はどなたでも参加可能です。是非ご参加ください!
日時
2021/6/23 (水) Open 15:30 Start 16:00 End 18:30 (JST)
参加される方への事前のお願い
- 本イベントは、Zoomを利用し、オンラインにて開催します。
- インターネットが良好に繋がる環境にてご視聴ください。
- 視聴端末 (PC/iPad/iPhone/Android) にZoomをインストールの上、サインアップ/サインインして下さい。
- Zoomのダウンロードはこちらから: https://zoom.us/support/download
- 参加登録いただいた方には、当日の視聴URL (および参加後アンケートのURL) を開催前日にメッセージでお送りします。また、参加登録後、本ページでも表示されますのでご確認可能です。
- 15:30頃から入室が可能です。
- 質問がある方は、セッション中にチャット欄に記入をお願いします。
- 参加後は、アンケートへの回答にご協力をお願いします(無記名)
タイムテーブル
※進行によって各講演の開始時間が前後する可能性があります。予めご了承ください。
時間 | 所属 | 講演者 | タイトル | 言語 |
---|---|---|---|---|
15:30 | (Open) | |||
16:00 | 日立製作所 | 川口 洋平 | Tokyo BISH Bashに関して | JP |
16:05 | リオン/都立大 | 春田 智穂 様 | 要素選択を用いた次元削減によるDNN音声強調の低演算量化の検討 | JP |
16:40 | 久保 陽太郎 様 | End-to-end音声認識の適材適所を考える(仮題) | JP | |
17:15 | ホンダ・リサーチ・インスティチュート・ジャパン | 周藤 唯 様 | 深層学習を用いた音源定位、音源分離、クラス分類の統合 〜環境音セグメンテーション手法の紹介〜 | JP |
17:50 | 東京大学 | 高道 慎之介 先生 | 音声合成のコーパスをつくろう | JP |
18:25 | アンケート記入のお願い | JP | ||
18:30 | (Close) |
概要
要素選択を用いた次元削減によるDNN音声強調の低演算量化の検討
春田 智穂 様 (リオン/都立大)
難聴者の多くは、雑音下での言葉の聞き取りに困難を抱えている。2010年代以降、DNNを用いた時間周波数マスクによる音声強調処理が、難聴者での雑音下での言葉の聞き取りを改善したことが報告され、その補聴器等への応用が期待されている。一方、補聴器に搭載する音処理は低演算量で行える必要がある。本発表では、同処理の低演算量化に向けた取り組みの1つとして、要素選択による次元削減を用いた手法を紹介する。
End-to-end音声認識の適材適所を考える(仮題)
久保 陽太郎 様 (Google)
講演者は今年4月に音声認識の教科書「機械学習による音声認識」を上梓した。この教科書は音響モデルと言語モデルに基づく音声認識について深く解説しているが,執筆時期の都合上,近年急速に進展しているEnd-to-endモデルを用いた音声認識の技術については浅い解説のみに留まった。本講演は「機械学習による音声認識」の簡単な紹介からスタートし,End-to-end音声認識器の利点と欠点をこれまでの音声認識器と比較する。また,特にEnd-to-end音声認識器が劣ると考えられている,そのカスタマイズ性に焦点をあて,音声認識サービスの開発にどのようなカスタマイズが必要となるかを紹介する。その上で,こうしたカスタマイズの要請に対して,End-to-endモデルとこれまでのモデルとが,どのように融合されてきたかを紹介する。
深層学習を用いた音源定位、音源分離、クラス分類の統合 〜環境音セグメンテーション手法の紹介〜
周藤 唯 様 (ホンダ・リサーチ・インスティチュート・ジャパン)
音の情報から周囲の環境を理解するためには、「いつ、どこから、何の音が鳴っているか」という情報を推定する必要がある。従来、音源定位や音源分離、分類といった手法が個別に研究されてきたのに対し、深層学習を用いた統合的なアプローチが提案されている。本発表では、音源定位、音源分離、クラス分類を深層学習で同時に扱う際に生じる問題とその回避策に関する研究を紹介する。
音声合成のコーパスをつくろう
高道 慎之介 先生 (東京大学)
「自分の音声コピーを作りたい」「自分の音声キャラを残したい」などの欲求はあるだろうか.本講演は,これらを実現する音声合成技術のためのコーパス作りを指南するとともに,最近の音声合成研究の潮流を紹介する.