- 前ページ
- 次ページ
- 21Jul
Amazon側で提供しているランキングのホームページ形式のデータについて
Amazon側で提供しているランキングのホームページ形式のデータについて ですが、複数の書式が混在して出力、表示されています。そのために、ボットを使うとかのスクレイピングでデータを取得する場合、ひとつの書式でエラーが出た場合、別の対応をする仕組みがないとうまくいきません。そしてそれを、タイトル、ASIN、リンクで行うわけです。AmazonAPIでやればいいじゃないかと思うのがふつうですが、残念ながら ランキングデータに関してはAmazonAPIは使えません。主にAPIは個々の商品データについて使うものとして、AMAZON側は考えているようです。
- 20Jul
タイトル未定、画像なしの商品の表示修正
タイトル未定、画像なしの商品の表示修正は管理者ログインで 修正モードにすると再取得ボタンが現れるので クリックします。 下は、15位の「忍物語」が修正するとデータを再取得して画像が表示されるようになりました例です。スクレイピングでランキングからデータを取得しているわけです。ちなみに、AmazonAPIでランキングを取得するのは難しいです。 ↓
- 01Jul
Wordpress設置の順序、要点についての覚書
Wordpress設置の順序、要点1、サーバにWordpress設置2、外観でテーマを選び有効化します3、設定→パーマリンクの設定(注意要、このやりかたでSEOに影響があります)4、(最重要)プラグインインストールし有効化、設定●Crazy Bone (狂骨)●Edit Author Slug必ず「ブログ上の表示名」 を 登録名と違ったものにして登録しますこれをしないと不正ログインされる危険性がでてきます●SiteGuard WP Plugin必ず画像認証は「ひらがな」選択●Google Analytics Dashboard for WP (GADWP)必ずgoogle アナリティクスのアカウントからトラッキング IDで連携させます上記の●は必須で設定も絶対に間違いないように緻密に行うことが重要ですGoogle Analytics Dashboard for WP 以外はブルートフォースアタックなどのサイト攻撃でWordpressじたいを乗っ取られないためのセキュリティ対策です。これらは絶対に緻密な設定を行うことです。欲を言えば.htaccessでログインページのアクセス制限を行うといいです5、プラグインインストール→有効化〇は設定しないと無意味ですAkismet Anti-Spam (アンチスパム)〇All In One SEO Pack〇Category Order and Taxonomy Terms Order〇Child Pages ShortcodePuSHPress〇Trust Form〇WP to TwitterYet Another Related Posts PluginWPtouch Mobile PluginWP Social Bookmarking LightWP Multibyte PatchGoogle XML Sitemapsこれにキュレーションサイトの場合は〇FeedWordPress6、設定→一般、投稿設定、表示設定、ディスカッションの設定7、外観→ウィジェット設定8、投稿上記4はセキュリティー上とても重要これが完璧でないとたいへんな事態になるので注意してね。下記のような攻撃を受けてサイトが乗っ取られることも多いので。この後にブログ村などとの連携が始まります。RSS先の選定も必要ですFeedをFacebookに流すのは集客上すごい効果ありですが、Wordpress→Facebookは困難ですWordpress→twitter→faccebookです。これにamebaブログを連携させたければamebaブログ→Wordpressは可能です★プラグインのインストール、設定はそのプラグイン名でGoogle検索し信頼性のある最近のページで確認してください。★初めてのWordpressの場合、プラグイン設定も含め何か作業をするたびに必ずID、パスワード、どのメールを登録したかなど記録をノートにとっておきましょう。あとで必ず必要になります。これをしないと、後でたいへん苦労しますよ。
- 18Mar
2017/03/18 立ち読みbook 復旧しました
2017/2/10より上記状態が続いておりました。Amazonランキングページのデータが取得できなかったわけですが、3/18にはほぼ完全回復しました。2016年から取得する情報の位置にタグが入るようになっています。今回それが変わっていました。それを除去して必要な情報にアクセスするようにしました。Amazonランキングページのタグはデザインの都合で頻繁に変わるようなので一段階はタグの種類を選ばずに処理。CSSの構造が大きく変わらなければ、一段階の対応でタグが変更になっても今後は修正しなくてよいということになります。返ってくるhtmlは二種類ありますが、一パターンのみの現象で、そちらしか返ってきていないためそれに対応。
- 10Feb
2017/02/10、8:00からの立ち読みbook 表示
2017/02/10、8:00からの立ち読みbook 表示ですが、 本、音楽、DVDとも「この時間帯は変動が激しく正しい順位が取得できませんでした」と表示されています。Amazon側の動きがあるかもなので、しばらくようすを見ます
- 01Feb
立ち読みBOOKの表示異常について、1月31日復旧しました。
立ち読みBOOKの表示異常について、1月31日復旧しました。Amazon側で提供しているランキングのホームページデータ複数の書式が混在して出力されるようになり、その変化が不規則なためランキング取得ができなくなりましたが、1月31日修復しました。
- 28Jan
2017/01/28、立ち読みbook表示異常 DVD
2017/01/28、5時 立ち読みbook表示異常 DVD1ページ目41位から表示される2017/01/28、5時 立ち読みbook表示異常 DVD3ページ目
2017/01/28、立ち読みbook表示異常 音楽
2017/01/28、5時 立ち読みbook 音楽 表示正常2017/01/28、5時 立ち読みbook 音楽 2ページ目81位から始まる
2017/01/28、立ち読みbook表示異常 書籍
2017/01/28、17時 立ち読みbook表示異常 書籍書籍1ページ目が21位から始まる2017/01/28、9時 立ち読みbook表示異常 書籍書籍1ページ目61位から始まる2017/01/28、5時 立ち読みbook表示異常 書籍書籍1ページ目正常
- 21Jan
2017年1月21日16時45分 立ち読みBOOK表示異常 について
2017年1月21日16時45分 立ち読みBOOK表示異常 について書籍正常音楽 1ページ目41位から表示DVD1ページ目正常、2ページ目41位から表示
2017年1月21日15時 立ち読みBOOK表示異常 について(DVD)
2017年1月21日15時 立ち読みBOOK表示異常 について(DVD)1ページ目41から60位が表示2ページ目61~80位が表示される3ページ目81~100位が表示される4ページ目
2017年1月21日15時 立ち読みBOOK表示異常 について(音楽)
2017年1月21日15時 立ち読みBOOK表示異常 について(音楽) ランキング正しいが1-21位、1ページ目のみ表示されるランキング順位は正しい
2017年1月21日15時 立ち読みBOOK表示異常 について( 書籍)
2017年1月21日15時 立ち読みBOOK表示異異常 状について( 書籍)Amazon側の変更途中につきAmazonサイドが落ち着いてから修正予定表示されているランキング順位は正しい1ページ目異常3ページ目も異常4,5ページ表示なし書籍1ページ目21位~40位が表示される書籍2ページ目41位~60位が表示される書籍3ページ目81位~100位が表示される書籍4ページ目
2017年1月14日ころからの立ち読みBOOK表示異常 について(データ取得)
2017年1月14日ころからの立ち読みBOOK表示異常 について(データ取得)データ取得についてデータのないページは「データが取得できません」ではなく、「データがありません」と表示
2017年1月14日ころからの立ち読みBOOK表示異常 について(3 DVD)
2017年1月14日ころからの立ち読みBOOK表示異常 について(3 DVD)2017/01/211ページ目、2ページ目 正常3ページ目61~80位表示4ページ目81~100位表示以降データなし1p2p3p4p5p
2017年1月14日ころからの立ち読みBOOK表示異常 について(2 音楽)
2017年1月14日ころからの立ち読みBOOK表示異常 について(2 音楽)2017/01/211ページ目に1~20位が表示される・・・ここは正常2ページ目に81~100位が表示その後は「データが取得できません」1ページ目2ページ目3ページ目
2017年1月14日ころからの立ち読みBOOK表示異常 について(1 書籍)
2017年1月14日ころからの立ち読みBOOK表示異常 についてですが、すいません、検査中です。2017/01/21異常 は1ページ目に1~20位が表示されるべき本のランキングが下記のように41位から始まる。2ページ目が61~80位3ページ目が81~100位その後は「データが取得できません」1ページ目2ページ目3ページ目
- 30Nov
2016/11/30 立ち読みbook 復旧しましたです
AmazonのAPIで一部のデータを取得、あとはスクレイピング が「立ち読みbook」もともとAmazonは探した商品データを取得する機能がAPIにあるが、ランキングデータ取得部分には工夫が必要。しかも、これがphpで取得してきたが今回 javascriptにAmazon側が変更。修復に時間がかかりました。そんなわけで直りましたが、これからはスクレイピングのサイト開発はひかえます。これ、検証に時間(かね)がかかるわけですし、本来、市場価格の半分以下で開発してきたのにこれじゃあ うちのカカク優位性という強みがなくなるわけですしね
- 19Nov
2016/11/19 立ち読みbook障害のため閲覧できません。すいません。
2016/11/19 立ち読みbook障害のため閲覧できません。すいません。11/18、5時くらいから障害のようです。Amazonのデータがうまくとれておりません。Amazon側の問題か、負荷の問題かなど調べますが、休日のためお時間ください。
- 23Sep
tachiyomibook.com復旧
9月23日15時 tachiyomibook.com 復旧しました。とはいっても、何もやっていません。今回はAmazonでも立ち読みbookでもなく、サーバ側の要因のようです。データベースにログインできなくなっていました。DB容量は問題ないのですがサーバ側の不具合のようです。障害情報はでていなかったので、サーバのさくらさんにメールしておきました。