ボイス・インタラクション:マイクアレイからのスタート

アマゾンのスピーカー(Echo)が誕生した瞬間から、音声対話は徐々に人々の視野に入り、より多くの人々が音声対話デバイスに接触するようになりました。

我々は音を拾っている音声情報の相互作用の最初のステップは、ロボットが最初に学生の耳を持っている必要があります、彼らは音が相互作用はおろか、いくつかのフィードバックを持つことができません聞くことができないので、マイクアレイは、中国のロボットの耳に相当しています。

マイクロホンアレイとは?

マイクは誰もが見たことがあると思いますが、一般的なマイクです。マイクアレイは、基本的にはマイクと変わりませんが、受信機の単位が多く、基本的には2つ以上の受信機の穴があればマイクアレイと言えます。 マイクロフォンはマイクロフォン、複数のマイクロフォンはマイクロフォンアレイと単純に理解されています。

マイクロホンアレイとは、一定数の音響変換器(マイクロホン)を一定の規則に従って配置し、音場の空間特性をサンプリングしてフィルタリングすることで構成されたマルチマイクロホンシステムです。

マイクロホンアレイには、目に見えるマイクの数に加えて、一連のフロントエンドのアルゴリズムがあり、その2つを組み合わせたシステムがコンプリートマイクロホンアレイです。 マイクアレイも物理的な世界での音声信号処理を完了するだけで、音声認識を完了するためには、クラウド上のASRモデルが必要であり、2つのシステムを組み合わせることで最高の認識効果を得ることができます。

次に、マイクロホンアレイをどのように分類するか。

アルゴリズムを介して企業のフロントエンドが見ることができないため、触れることができない、このマイクアレイの分類のための私たちの国は、しばしばマイクのレイアウトと数への参照として。 現時点では、私たちの国の一般的な分類は、基本的に区別するためにマイクのレイアウトの形状は、点線表面体についての私たちの生活の中等学校の言語の教科書を参照して、マイクアレイ構造に分けることができます:リニアアレイ、平面アレイ、3次元アレイ(ポイントは、このようなマイクロフォンベースの)です。

wireless microphone

もちろん、言葉、十字、平面、螺旋、球体、不規則な配列など、形による分類もあります。

1.リニアアレイ

通常は2つのマイクを備えたリニアアレイを使用します。

2個のマイクを使ったリニアアレイの最大のメリットは、複数のマイクを使った場合に比べて、低コストで消費電力が少ないことです。 欠点も比較的明らかで、ノイズリダクションの効果は限られており、つまり遠景でのインタラクションには向いていません。

2.プラナーアレイ

平面アレイはより多様で、通常の4-wheatアレイや6-wheatアレイのほか、アップグレードされた4+1-wheatアレイや6+1-wheatアレイ、さらには8+1-wheatアレイもあります。 平面アレイは、スマートスピーカーや音声対話ロボットなどによく使われています。

リニアアレイ技術のプラナーアレイは、中国の平面360度等価試聴を実現することで実現でき、マイクの数が多いほど微細な空間分割が可能で、遠方のシーン認識にも有効な手法です。 デメリットは、主に消費電力が大きいことと、IDの設計プロセスが複雑なことです。

3.ステレオアレイ

ステレオアレイは、ほとんどが球体であり、または円筒を介して、その真のフルスペース360度ロスレスピックアップを達成するために実施することができ、平面アレイの高ピッチ角信号システムの応答不良の問題を解決し、その効果は最高であり、コスト管理も中国で最も高いです。 しかし、私たちは、専門技術の分野では一般的な、より少ない環境で生活しています。