• 18 Mar
    • 2017/03/18 立ち読みbook 復旧しました

      2017/2/10より上記状態が続いておりました。 Amazonランキングページのデータ が取得できなかったわけですが、3/18にはほぼ完全回復しました。   2016年から取得する情報の位置にタグが入るようになっています。 今回それが変わっていました。 それを除去して必要な情報にアクセスするようにしました。   Amazonランキングページのタグはデザインの都合で頻繁に変わるようなので 一段階はタグの種類を選ばずに処理。 CSSの構造が大きく変わらなければ、一段階の対応でタグが変更になっても 今後は修正しなくてよいということになります。 返ってくるhtmlは二種類ありますが、一パターンのみの現象で、そちらしか返って きていない。

      テーマ:
  • 10 Feb
  • 01 Feb
  • 28 Jan
  • 21 Jan
  • 30 Nov
    • 2016/11/30  立ち読みbook 復旧しましたです

      AmazonのAPIで一部のデータを取得、あとはスクレイピング が「立ち読みbook」 もともとAmazonは探した商品データを取得する機能がAPIにあるが、ランキングデータ取得部分には工夫が必要。 しかも、これがphpで取得してきたが今回 javascriptにAmazon側が変更。修復に時間がかかりました。そんなわけで直りましたが、これからはスクレイピングのサイト開発はひかえます。 これ、検証に時間(かね)がかかるわけですし、本来、市場価格の半分以下で開発してきたのにこれじゃあ うちのカカク優位性という強みがなくなるわけですしね

      テーマ:
  • 19 Nov
  • 23 Sep
    • tachiyomibook.com復旧

      9月23日15時 tachiyomibook.com 復旧しました。とはいっても、何もやっていません。今回はAmazonでも立ち読みbookでもなく、サーバ側の要因のようです。データベースにログインできなくなっていました。DB容量は問題ないのですがサーバ側の不具合のようです。障害情報はでていなかったので、サーバのさくらさんにメールしておきました。

      テーマ:
  • 22 Sep
  • 24 Aug
    • 立ち読みbookは個別ページのURLが正規化されているって? どういうこと

      立ち読みbookは個別ページのURLが正規化されているって? どういうこと というわけで、 今回は この本の URLで説明します。 クリスマスの3つの物語 Three Touching Tales for Christmas【.../IBCパブリッシング¥1,620Amazon.co.jp この本の立ち読みbookのUrlは下記です。 http://tachiyomibook.com/disp.php?asin=4794603142&dt=20151220&tm=23&genre=Books ほら 検索した日時がはいってるので 同じ商品でもURLが無数につくられます。 これじゃ、Googleはこの商品の正しいURLがわからず、 上位表示もできないのです。 そこで、メタタグに link rel= canonical を自動で組み込むように phpをいじります。 そうすると URLは見た目は複数あるものの、一つのみに統一されて上位表示もできるようになります。  運用上はURLはそのまんまですが、Googleが正規化して一つのURLとしてくれます。ただし、GOOGLE記載URLはなぜかそのままです。

      テーマ:
  • 01 Aug
    • パラメータに日時を含め動的URLにすることによるSEOの弊害を避けるためにしたこと

         「パラメータに日時を含め動的URLにすることによるSEOの弊害を避けるためにしたこと」 なんて書くとわかりずらいので、 簡単に書きます。前回書いた「立ち読みbookのパラメータによって、パラメータ記載日を起点としたランキングが表示されます」  といっやりかたでURLが自動で作られるとこんなふうに 同じ商品なのに無数にURLができてしまう。http://tachiyomibook.com/disp.php?asin=B00ZYCLIKK&dt=20150807&tm=12&genre=Musichttp://tachiyomibook.com/disp.php?asin=B00ZYCLIKK&dt=20150807&tm=11&genre=Musichttp://tachiyomibook.com/disp.php?asin=B00ZYCLIKK&dt=20150806&tm=11&genre=Musichttp://tachiyomibook.com/disp.php?asin=B00ZYCLIKK&dt=20150805&tm=10&genre=Musichttp://tachiyomibook.com/disp.php?asin=B00ZYCLIKK&dt=20150803&tm=11&genre=Musicそうすると、Googleなどの検索エンジンはどのページのurlを検索結果に反映させればよいのだろうか? と迷うわけです。そこでメタタグに最適化のタグを自動で埋め込む工夫をしています。それがこのキャプチャー下から二行目です。link rel= canonicalです。いわゆるURL正規化ねここ↓ を参考にしてくださいcanonical属性とは/link rel="canonical"によるURL正規化タグ——SEOにとって非常に重要な進歩(前編)

      テーマ:

プロフィール

AD
立ち読みbookはこちらから
立ち読みbook

ランキング

このブログはランキングに参加していません。

AD

Ameba人気のブログ

Amebaトピックス

      ランキング

      • 総合
      • 新登場
      • 急上昇
      • トレンド

      ブログをはじめる

      たくさんの芸能人・有名人が
      書いているAmebaブログを
      無料で簡単にはじめることができます。

      公式トップブロガーへ応募

      多くの方にご紹介したいブログを
      執筆する方を「公式トップブロガー」
      として認定しております。

      芸能人・有名人ブログを開設

      Amebaブログでは、芸能人・有名人ブログを
      ご希望される著名人の方/事務所様を
      随時募集しております。