前回は、movie scraperをアレコレ試した事を記した。

そもそもの取っ掛りは、使っていたyahoo映画scraperに問題が生じたため。
と言っても大した事ではない。
yahoo映画がリニューアルされたタイミングで俳優の画像が取れなくなっただけである。

ただ、前々からyahoo映画に登録されているデータの少なさに不満があったのだが。
ならば、この機に一念発起して作り直すことにするか...。
そんな事で選んだのが映画.com。
登録データは豊富なのだが、唯一の欠点はジャンル情報が無いこと。
それならデフォルトで使えるtmdb scraperが最強なのか?

ここまでが前回の流れ。

では、tmdb scraperはどこまで使えるのだろうか。
実際、使う気満々で試してみたがのだが...。
以外にも日本語タイトルだと検索に引っ掛らないものが、それなりにある。
ちなみに、原題で検索すると漏れなくヒットする。

ただし、取得する情報の殆んどが英語になる。
邦画もしかりである。
当然だが、ポスターも英語圏向けのもの。
日本語で取得できる情報はプロットとジャンル。

全然良いのだが、これまで取得したデータが日本語なので揃えたい気持もある。

ちなみに映画.comは、どんな具合なのか。
色々な映画を検索してみるが、ヒット率はとても優秀である。
また取得できるデータとして、ジャンル以外の必要なものは取得できる。
当然だが、ポスターは日本向けであり俳優名もカタカナに置き換えて記されている。
くどいようだが、ジャンルがなぁ〜。

んっ!?
そうであるなら...。

閃いた!

「映画.com + tmdb」のハイブリッドにしてみてはどうだろうか。
それぞれの良い所取りすれば完璧なものが出来るはず。
ベースを映画.comとして、ジャンル情報だけをtmdbから取得すれば問題解決である。

早速、作りかけの 映画.com scraper にジャンル情報を追加してみた。
苦労はしたが、出来栄えはなかなか良い。

流れとしては次のようになる。

┌ 映画.com検索にヒットした場合、登録データを取得。
│├ 映画.comにポスターが有る場合、ポスター取得。
│├ tmdb検索にヒットした場合、ジャンル情報を取得。
││├ 取得ポスターが無い場合、tmdbよりポスター取得。
││└ 終了。
││
│├ tmdb検索に失敗した場合、ジャンルをドラマに設定。
│└ 終了。

├ 映画.com検索に失敗した場合、データ登録無し。
└ 終了。

これで十分だろ。
そう思ったのだが、日本語タイトルだけだとtmdbの検索ヒット率が落ちてしまう。
そして、付け加えたのが原題検索。
日本語検索でジャンル取得に失敗した場合の対策として追加した。

原題だとtmdbに間違いなく登録されているので、ジャンル、ポスターを漏れなく取得できるはず。
使い方は簡単。

データをファイル名からスキャンする際、マニュアルで原題を入れ直すだけ。

これで隙はないだろう。

試しに、様々な映画名でテストしてみた。
思い通りである。

んっ...。

よくよく登録したデータを確認すると変なジャンルが紛れ込んでいる。
「履歴」とはなんぞや?
何か、やらかしたか。

ははぁーん。
「歴史」のことか。

kodi本体でもあったな。
いつまで経っても「録画」→「録音」のままだし...。