PubSubHubbub
読み : パブサブハバブ/パブサブハブバブ
PubSubHubbubとは?
PubSubHubbubとはWEBサイトの更新情報をGoogleにほぼリアルタイムで通知する仕組みを持つプロトコルで、略してPuSH(プッシュ)とも呼ばれる。
コンテンツの更新をGoogleにこちらから知らせる仕組みがPubSubHubbubで、本来ならフィードリーダー(RSSリーダー)からの更新問い合わせを待たなければならないところをWEBサイト側から通知することにより、いち早く更新情報をフィードリーダーに届けることができる。
PubSubHubbubはスクレイピング対策にも有効であるとされる(後述)
PubSubHubbubはPublisher(パブリッシャー)、Subscriber(サブスクライバー)、Hub(ハブ)によって構成されている。
Publisherはコンテンツやフィードを配信するサーバ、Subscriberはそれ受け取るクライアント(フィードリーダー/RSSリーダー)で、PubSubHubbubはPublisherとSubscriberの間に新しくHubという仕組みを導入している。
PublisherがHubにコンテンツを更新した旨を伝え、Hubを介して随時Subscriberに更新情報が配信されるという仕組みになっている。
Hubが介在することで更新情報がリアルタイムでRSSリーダーに伝えられ、RSS購読者にいち早く最新情報を届けることができるようになる。
Hubの負荷が増えてもHubの数を増やせばよいため、Publisher(サーバ)に負担がかからない。
Subscriberから直接Publisherに更新情報を問い合わせする仕組みだと、Subscriberからの問い合わせが増えるとサーバであるPublisherの負担が増えてしまうが、PubSubHubbubではHubがSubscriberの間にあるためPublisher(サーバ)の負担が軽減される。
Livedoorブログ、Blogger、WordPress.comなどのブログサービスがPubSubHubbubを導入しており、WordPressではPubSubHubbubやPuSHPressなどのプラグインを導入することでPubSubHubbubが利用可能になる。
PubSubHubbubはスクレイピング対策に有効
RSSを利用して自動で記事をスクレイピング(他のサイトのコンテンツを無断でコピーすること)しているサイトがオリジナルである自分の記事よりも検索結果で上位表示されたり、コンテンツ重複でオリジナルであるはずの自分のサイトがパンダアップデートによって順位を下げられてしまうことがある。
PubSubHubbubでGoogleに記事更新をリアルタイムで伝えてスクレイピングサイトより先にインデックスさせることで、Googleにオリジナル記事であると認識してもらえる。
どちらがオリジナル記事であるかをGoogleに認識させることでスクレイピングを防ぐ効果が期待できる。