先日、都内で古い友人と久しぶりに会い、これからのITについて
少し議論してきた。流石に我々はもう40代後半で現役世代でもな
い老いぼれ組に入っているわけだが、今のIT技術なんぞまだ入口
の入口で、しかも原始的でしかない。
100年後を想像してみるとコンピュータはどんな姿になっているのか
個人的には凄く興味がある。
既にNTTドコモがアンドロイド(Google mobile OS)採用した携帯電
話を発表し始めましたね。この機種は今後、研究が進み新たな市場拡
大につなげるような製品が続々と登場するだろうね。
ミニパソコンと携帯電話を見比べるとやっぱり携帯が一歩リードとい
うところでしょうか。
そもそもコンピュータの夢ともうしましょうか、コンピュータがコン
ピュータと思えるのは、人間を超えたデータの抽出方法を持ち出した
時かな…と思うのです。
今、街を歩けば様々な場所でカメラが設置され、いつどこで自分の映
像が記録されているか分からない。しかし、こうしたデータは膨大な
量となり、その膨大な量のデータから、ある条件を示し素早く抽出す
るにはまだ色々な角度から研究を必要としている。
いわゆる映像検索であるが、その前に音声検索などデータを保存し検
索する作業に今後移行していくでしょうね。
で、ちとここに訪れて頂いている人は、こうした話はあまり面白くな
いと思っていると思いますので、更に進めます。(笑)
今はまだ文字検索が主流ですが、その文字検索でも大変な量を検索して
いるわけです。どんな検索方法があるか少し説明してみましょう。
まずもっとも基本的なことから…。(100年後は原始的手法って紹介されるでしょうね)
よくある話ですが、学生の学籍番号で少し考えてみましょう。
302980
309821
309652
432154
なんて数字が以下もずーっとあって、こうした番号をどうやって蓄積して
いくか?っと考えてみてください。
単純に入力された順に蓄えていきますか?
それとも、ある法則に従いデータを蓄えますか?
みなさんはどうやってデータを蓄積すべきか考えてみてください。
上述の学籍番号をそれぞれ10で割ると余りがでるものがありますね。この余りに注目
するのがハッシュ法というやつです。
もっと簡単にいいますとインデックスをつけるんですね…汗。
309652を10で割ると、余りは2ですね。よって、このデータはインデックスの
2番に格納しましょう。
逆にあるデータ「456781」という番号を検索するときは、この数字を10で割り
余りが1なので、1のインデックスを見に行くことになります。もちろん数が多くなれば
衝突が発生しますので、それはまたさらに空いている場所を探すことになるのですが…。
線形走査法などで解決していきます。
どうでしょうか?
数字なら簡単ですよね。でも文字となると文字には意味が発生し、同じ文字でも意味が
異なる同音異義語も数多くありますもんね。
って、文字検索だけでもこんな手間取っていたらなら音声検索や画像検索、さらに映像
検索となると、そのボリュームは凄いことがお分かり頂ける。
でも今、映像検索の分野が熱くなっているんですね。
たとえばGoogleの画像検索ってありますよね。キーワード「いぬ イラスト」などと入力
すると可愛い犬の画像やイラストが検索されてきますよね。これは写真やイラストのファ
イル名など画像を紹介する前後の文章を拾って検索結果を表示しています。
でもこれは文字の分野なんですね。
たとえば、家で飼っている犬が家出して、家族が心配し探しているとしましょう。
犬の画像をスキャンし、検索にかけると街にあるいろいろなカメラで拾った映像から目的
の犬を探し当て、今どこどこ付近にいるなんてこともできるようになるのです。
もちろん、公共のカメラを一般人がネットワークを通して使うことは無理でしょうけどね。
100年後には当然のように使っていると思いますね。
さらにコンピュータは医学と接続していくでしょうね。
つくばではもう研究が盛んに始まっていますけど、人間の脳から発する様々脳波を利用する
ことができる。
生体学を利用しコンピュータと人間を接続させる、いわいる攻殻機動隊のような事がどんどん
研究が進むと思います。
非常に楽しみっす。
あぁ~これから生まれてくるならばもっともっと最先端な技術を見ることができるのになぁ。