Cover Story:情報の分類:量子コンピューターによってより強力になる機械学習 | Just One of Those Things

Just One of Those Things

Let's call the whole thing off

2019年度のネイチャー11号目のカバーストーリーより。
 

----------------------------------------------------------
Cover Story:情報の分類:量子コンピューターによってより強力になる機械学習
Nature 567, 7747
2019年3月14日
 

機械学習と量子コンピューティングには、これまで扱えなかった問題を解決できる可能性がある。機械学習では、パターン識別などの手法は、例えば写真画像の分類などに適しているが、データの構造が複雑になりすぎると、問題に直面することがある。そうした複雑なデータを高次元空間に写像し、その最も基本的な特徴に基づいてデータ点を分析する一般的な方法は、古典的なコンピューターでは達成が困難なレベルの計算能力を必要とする。今回K Temmeたちは、分類対象を量子状態空間に写像して特徴分析を行うことが、この限界の克服に役立つ可能性があることを示している。著者たちは、2つの量子アルゴリズムを実験的に実行することで、量子コンピューターの処理能力を利用すれば、大規模分類タスクが関与する機械学習が正味で優位になる可能性を示している。

News & Views p.179
Letter p.209
----------------------------------------------------------
 
この論文は、カバーストーリになっただけでなく、ニュースにも取り上げられました。
 
日本語版本誌では、「情報科学:量子空間における機械学習」と題されています。
 
見出しにおいては、「通常のコンピューターは、データの数学的表現を比較することによって機械学習を実行できる。今回、量子コンピューティングが数学的表現の代わりに量子力学的表現を用い得る方法が、実験的に示された。」と取り上げられました。
 
フルテキストを直訳しますと・・・
 
量子空間での機械学習
 
となります。
 
見出しを直訳しますと・・・
 
通常のコンピューターは、データの数学的表現を比較することで機械学習を実行できます。実験は、量子コンピューティングが量子力学表現を代わりに使用する方法を示しています。
 
となります。
 
本文を直訳しますと・・・
 
機械学習と量子コンピューティングには、驚異的なレベルのテクノロジー誇大広告が共通しています。しかし、数学的基盤の特定の側面も驚くほど似ています。 Natureの論文で、Havlíčeket al.[1]はこのリンクを活用して、量子状態のみが存在する空間にデータをマッピングすることにより、今日の量子コンピューターを原則としてデータから学習する方法を示しています。
 
量子コンピューターについて最初に学ぶことの1つは、これらのマシンをデスクトップPCなどの古典的なコンピューターでシミュレートするのが非常に難しいことです。つまり、古典的なコンピューターを使用して、量子計算の結果を取得することはできません。その理由は、計算の各内部ステップを記述するために多くの数字が必要だからです。多くの人々が多数を分割するために学校で学ぶ多段階の手順を検討してください。これが古典的なコンピューターでシミュレートされる量子計算である場合、すべての中間ステップは、観測可能な宇宙にある原子よりも多くの数字を簡単に記述する必要があります。
 
数値のコレクションで記述された場合の量子システムの状態は、量子状態と呼ばれます。また、量子状態が多くの値に関連付けられている場合、大きな空間で「生きている」と言われます。連続変数に基づく特定の量子コンピューターでは、そのようなスペースは無限に大きくなることさえあります。
 
これに対して、機械学習では、はるかに小さいスペースに存在するデータを分析します。つまり、データははるかに少ない値で記述されます。たとえば、100万個のピクセルを含む写真は、各ピクセルの赤、緑、青の量を表す300万個の数字を記録します。機械学習の顕著なタスクは、画像の内容を推測すること、または同様の画像を作成することです。ただし、カーネルメソッドと呼ばれる機械学習の定評のある理論[2]は、量子理論がデータを処理する方法と同様の感覚を持つ方法でデータを扱います。
 
一言で言えば、カーネルメソッドは、どのデータポイントが互いに類似しており、どのデータポイントが類似していないかを定義することにより、機械学習を実行します。数学的に言えば、類似性はデータ空間の距離、つまり、数値としてのデータポイントの表現間の距離です。類似した画像は類似したコンテンツを持っていると想定され、データポイント間の距離は機械学習で重要になります。しかし、類似性を定義することは、思ったほど簡単ではありません。たとえば、各画像の赤の量に基づいて導出された場合、2つの画像間のデータ空間の距離はどのくらいになるでしょうか?
 
カーネル理論は、データ空間における類似性の多くの定義が、はるかに大きい、おそらく無限に大きい空間における類似性の単純な尺度と数学的に同等であることを示しました(図1)。その結果、2つの画像が比較されるたびに、画像は巨大な空間の表現に暗黙的にマッピングされ、単純な類似性が計算されます。通常のコンピューターは、この大きな表現を明示的に計算できません。しかし、おそらく量子コンピューターはできえうでしょうか?量子コンピューターは非常に大きな空間で計算を実行するため、量子状態が存在する空間にデータがマッピングされるとどうなるでしょうか?
 
Havlíčeket他私の研究チーム[3]は、機械学習と量子コンピューティングの間のこの潜在的に強力なリンクをほぼ同時に認識しました。驚くべきことに、両方のグループは、機械学習用の量子アルゴリズムを設計するためにこのアイデアを使用するための本質的に同じ2つの戦略を提案しました。最初の戦略は、従来の機械学習システムへの単なるハードウェア追加として、量子コンピューターを最小限にしか使用しません。2つのデータポイントが与えられると、量子デバイスは類似性を返します。 2番目の戦略は、量子コンピューターで実際の学習を実行し、古典的なコンピューターの助けを借ります。
 
Havlíčekらの重要な貢献。実際の量子コンピューターでの原理実証実験で、IBMの量子チップの1つである2つの戦略を実装したということです。いくつかのニュースレポートの膨らんだ主張にもかかわらず、クラウドで量子コンピューティングを試みた人は誰でも、これらのデバイスから意味のあるデータを収集することは、計算における高レベルの実験ノイズのために困難であることを知っています。これはおそらく、著者の実験がむき出しの骨に剥ぎ取られる理由であり、一部の人々の見解では、多すぎるかもしれません。 IBMクラウドサービスがすでに20キュービットデバイスへのアクセスを提供している時点で、セットアップではIBMの最小5キュービットチップの2つのクォンタムビット(キュービット)を使用するため、クォンタム空間は4次元のみです。データセットも同様に、この4次元空間で簡単に分析できるように手作業で設計されています。
 
それにもかかわらず、Havlíčekと同僚の研究は、機械学習に量子コンピューターを使用する潜在的に革命的な方法の興味深い原理実証を示しています。はるかに人気のある人工ニューラルネットワークを量子コンピューティングに成形するためのさまざまな試みを提供する多くの研究の後、カーネルメソッドは、機械学習と量子理論の間のさわやかな自然な橋渡しを提供します。ただし、このブリッジを認識することは始まりにすぎません。
 
たとえば、Havlíčekらが量子空間でデータを表現することは、実際の機械学習アプリケーションに実際に役立ちます。すなわち、このアプローチが、例えば動物の画像を分類する際に、猫の写真を猫の写真の近くに配置するが犬の写真の近くに配置しない意味のある類似性の尺度に関連するかどうかは不明です。さらに、より効果的な他の戦略があるかどうかは不明です。そして、これらの手法は、ほぼ30年間の古典的な手法を打ち負かすのに十分でしょうか?もしそうなら、量子コンピューターの「キラーアプリケーション」の必死の検索は終わります。しかし、この質問に対する答えはおそらくもっと複雑です。
 
となります。
 
フルテキストは下記です。
 
Full Text:News & Views p.179
 
 
本論文においては、日本語版本誌では、「情報科学:量子技術によって改善された特徴空間を用いる教師あり学習」と題されています。
 
フルテキストを直訳しますと・・・
 
量子強化された特徴空間による教師あり学習
 
となり、Abstractを直訳しますと・・・
 
機械学習と量子コンピューティングは2つのテクノロジーであり、それぞれが以前は受け入れられなかった問題に対処するための計算方法を変更する可能性があります。機械学習のためのカーネルメソッドは、パターン認識で広く使用されており、サポートベクトルマシン(SVM)が分類問題の最もよく知られた方法です。ただし、特徴空間が大きくなり、カーネル関数の推定に計算コストがかかる場合、このような分類の問題をうまく解決するには限界があります。量子アルゴリズムによって可能になる計算の高速化のコア要素は、制御可能なエンタングルメントと干渉による指数関数的に大きな量子状態空間の活用です。ここでは、2つの量子アルゴリズムを提案し、実験的に実装します。両方の方法の重要なコンポーネントは、特徴空間としての量子状態空間の使用です。量子コンピューターでのみ効率的にアクセスできる量子拡張機能空間を使用すると、量子の優位性への道が開かれます。アルゴリズムは、教師あり学習の問題、つまり分類器の構築を解決します。 1つの方法である量子変分分類器は、変分量子回路[1,2]を使用して、従来のSVMの方法と同様の方法でデータを分類します。もう1つの方法である量子カーネル推定器は、量子コンピューターのカーネル関数を推定し、古典的なSVMを最適化します。この2つの方法は、ノイズの多い中規模の量子コンピューター[3]の機械学習への応用を探求するツールを提供します。
 
となります。
 
フルテキストは下記です。詳細が必要な方はご購入をお願いいたします。
 
Full Text:Letter p.209
 
Data availabilityによりますと・・・
 
この調査中に生成または分析されたすべてのデータは、このレター(およびその補足情報)に含まれています。
 
 
究極に溜まりに溜まったネイチャー。次回よりハイライトに入ります。次回は、「微生物学:細菌の重要なシグナル伝達分子を合成する大きな酵素ファミリーが見つかった」を取り上げます。
 
 
※今まで寝込んでおりました。巡回等ブログ活動が大変遅れており、本当に申し訳ございません。
 

ペタしてね