政治資金センターによる政治資金収支報告書検索システム | 渾沌から湧きあがるもの

 

 

 

 

全ての政治資金収支報告書を収集・OCR結果を検索できるWebシステムの提供を開始

 

 

 

 

公益財団法人政治資金センター(代表:佐藤哲也)は5月21日から、Web公開している全ての政治資金収支報告書をアーカイブ化し、いつでも閲覧・検索できる「政治資金収支報告書検索システム」無料版・有料版の提供を開始します。

 

自民党の「裏金」問題など政治とカネの問題が再燃する一方、政治資金の流れを明記した政治資金収支報告書の収集・公開は進んでおらず、政治資金の流れがブラックボックス化しています。そこで、政治資金の透明化を目指し、本システムの公開に至りました。

 

本システムにはアーカイブ化した政治資金収支報告書の閲覧ができる無料版と、政治資金収支報告書上の詳細検索・データ利用ができる有料版があります。有料版はジャーナリストや研究者を対象として12万円/年でご提供します。

 

 

政治資金収支報告書の閲覧・検索が可能

 

「政治資金収支報告書検索システム」は、Web公開されている政治資金収支報告書を自動で収集・アーカイブ化し、報告書の検索を可能にしています。

 

本システムでは、政治資金収支報告書をWebで公開している総務省及び46の都道府県選管(2024年4月現在)の政治資金収支報告書を自動でアーカイブしています(唯一Web公開を行っていない新潟県選管は主要な団体を情報公開請求によりアーカイブ化)。そのため、従来の弊センターの収集対象は国会議員関係団体でしたが、今後は日本全国の政治家・政治団体の政治資金収支報告書を閲覧することができるようになります。2024年4月時点で7万件の政治資金収支報告書をアーカイブ化しています。

 

さらに、従来より政治資金収支報告書の公開PDFは、紙で提出された原本を画像保存した形で公開されていたため、寄付者や使途、金額といった内容のデータについては検索ができない状態でした。そこで、今回GoogleNewsInitiativeから支援された資金を活用し、政治資金報告書専用のOCR(光学式画像認識技術:PDFや画像データの文字を認識し、テキスト形式に変換する技術)システムを開発しました。それにより、有料版では政治資金収支報告書上の任意のテキスト(例:資金の使途や寄付者など)を高い精度で検索することができます。

 

 

続きは上記リンクへ

 

 

◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆

 

 

 

 

 

 

◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆