アメリカのDARPA(高等研究計画局)が公募していたシュレッダー文書の解読コンテストでカリフォルニア州のチームが解読に成功し賞金5万ドルを獲得したとのことです。
コンテストのお題は、シュレッダーにかけた5枚の文書を復元し、書かれている質問に答えるというものでした。
それぞれの破片を組み合わせるのはコンピュータによる処理でザクザク進めるとして、意味の通る組み合わせをどう判断させるのか興味ありました。
カリフォルニア州のチームは、シュレッダー片の組み合わせ案を作るステップまでコンピュータで行い、示された案を人間が評価するという2段構えで復元に成功しました。
最終的な意味判断のステップは人間が行った方が、現状では効率がいいということなんでしょうね。
今回は文書が5種類と明示されていますが、実戦ではシュレッダー片の山に何種類の文書が入っているのかわからないでしょうから難易度が上がりそうです。また元文書が暗号表記されていたりすると人力による意味評価の前に組み合わせ候補の提示すら難しくなりそうです。
アルファベットが2つの裁断片に分かれていればジグソーパズル的な組み合わせでいけるか。でもそんなケースばかりじゃないだろうし。文字列を組み合わせる前に各辺の形状を比較して組み合わせていくんでしょうか。
課題に使われた単純なシュレッダー片では一部力仕事になりますが、機密情報をゲットするといった明確な目的と相応のコストを容認できるのであれば月単位のオーダーで元文書を復元できることが示されました。
シュレッダー片が入手できてしまうと状態による難易度はあっても元に戻せる可能性が示されたのですから、どうにも困る書類は融解・焼却などで物理的に消滅させろということなんでしょうね。