〔2015年8月31日リリース〕オフィス環境において発話者を無拘束で自動推定する知的情報空間システムを開発

オフィス環境において発話者を無拘束で自動推定する
知的情報空間システムを開発


国立大学法人東京農工大学大学院工学研究院先端情報科学部門が中心となって推進する知的情報空間プロジェクト(注1)では、オフィスの天井部分に取り付けた複数のマイクや3次元カメラを用いて、いつどこで誰がどれだけ話したかを長期間連続して推定するシステムを8研究室共同で開発しました。このシステムの特徴は、在室者の体に何もセンサをつけないことと、会話内容を記録することなくマイクで検出した音の大きさから発話者を推定する点です。将来的には、会話や仕事を邪魔しないサービスロボットや、組織マネージメントなどへの応用が期待されます。


本研究成果は、UbiComp2015(会場:グランフロント大阪)で9月9日に発表予定です。

現状:従来の会話を記録・分析するシステムは、ユーザ全員がそれぞれマイクの前に座って会話するか、マイクを身につける必要がありました。そのため短期間の会話しか分析できず、オフィスでの日常的なコミュニケーションと生産性の関連を検証する手段はありませんでした。他には、勤務者それぞれがICタグなどのセンサを身につけることで、組織全体の行動データを長期的に記録・分析するシステムがありますが、会話を反映した分析はできませんでした。

研究体制:情報工学を専門とする8研究室が協力してプロジェクト研究室を新たに設置し、システム工学や心理学を専門とする専任スタッフ2名が中心となって、オフィスにおける活動を丸ごとモニタするシステムの開発とデータ分析を推進しています。

研究成果:開発したシステムは、図1,2のように天井部に16個の指向性マイクと13個の3次元カメラ、さらに広角カメラや電力センサ、温度センサ等を持ち、オフィスにおける活動を丸ごとモニタする能力を有しています。このシステムは、複数の3次元カメラを組み合わせることで、図3のように部屋全体をリアルタイムに3Dスキャンする能力を持ち、センサを装着することなく複数の在室者を検出することが可能です。
中でも、今回新たに開発した、指向性マイク群で検出した音の強度比から図4のように音源位置を推定する技術は、部屋の中で発話した人を図5のように約90%の精度で推定できることが確認されました。さらに、このシステムを定常的に運用し、日常的なオフィス活動場面において、図6のような発話パターンやその変化を、会話内容を記録することなくモニタリング可能であることが示されました。

今後の展開:開発したシステムを使ってオフィスでの活動を1年間まるごと記録・分析することで、組織内のコミュニケーション(会話の多寡や在室者の会話参加パターンなど)と生産性の関連性を明らかにしていく計画です。得られた知見は、組織マネージメントに有益な知見を与えるものと期待されます。また、会話や作業の切れ目を狙うことで、話の腰を折ったり作業を邪魔したりしない情報提供サービス(電子メールの着信通知など)も試みる予定です。さらに、コミュニケーションやコンピュータを使った作業など、オフィスにおける活動のリズムを長期的に分析することで、オフィスワーカの活動を予測する技術の開発を予定しています。これらの技術を産学連携して社会展開することによって、需要を見越したオフィス機器の運転制御なども可能になるものと期待されます。

注1)知的情報空間:在室者の体には何も付けずに、個々の在室者の作業や集団の会話などオフィスにおける多様な活動の状況を、人のように知的に察知するオフィス空間の実現を目指して、知的情報空間プロジェクトと名付けました。

図1 システム概要

図2 システム概観

図3 部屋内の3次元位置計測結果
(色は床からの高さを示す)

図4 音源位置の推定結果(緑色の濃さが
音源の可能性を示す。赤は人の検出結果)

図5 発話者推定の結果(約3分)

図6 在室者3人の発話交替回数の自動推定結果(例えば、
AからBへ発話が移った回数が62回であることを示す)

CONTACT

お問い合わせ一覧はこちら