このページの本文へ移動
  1. ホーム >
  2. 企業情報 >
  3. 富士通キッズ >
  4. 日本の教育情報 >
  5. このページの仕組み

日本の教育情報 ベータ版
トップページ便利なリンク集

 日本の教育情報 |  バックナンバー |  このページについて |  このページの仕組み |

このページの仕組み

日本の教育情報(ベータ版)の掲載記事の抽出・生成は、富士通研究所が開発したウェブ集約技術を使用しています。

収集できるページのデータ形式

富士通研究所のウェブ集約技術によりウェブ上に掲載されている次の3つの形態の情報を収集することが出来ます。

  1. 企業サイト上のニュースやトピックスなど、静的なHTML/XHTMLで掲載されているページ
  2. RSSやブログ
  3. 掲示板など動的に生成されるページ

従って、本技術によりウェブサイト上に日々掲載される様々な形式の更新情報を収集することが出来ます。
収集した情報は、RSSと呼ばれるXMLベースの汎用的なフォーマットに変換され管理されます。RSSを基礎データとして、XSLTにて変換され、日本の教育情報(ベータ版)のHTMLが生成されています。

富士通研究所のウェブ集約技術のメリット

一般にRSSは取得/解析が容易ですが、HTMLで掲載されているページから特定の部分を抜き出すことは困難です。
富士通研究所はHTMLから特定情報のみを抜き出しRSSに変換する技術を開発しました。
この技術によって、多くのウェブサイトから更新情報を抽出することが出来ています。