日本の教育情報 | バックナンバー | このページについて | このページの仕組み |
![]()
日本の教育情報(ベータ版)の掲載記事の抽出・生成は、富士通研究所が開発したウェブ集約技術を使用しています。
富士通研究所のウェブ集約技術によりウェブ上に掲載されている次の3つの形態の情報を収集することが出来ます。
従って、本技術によりウェブサイト上に日々掲載される様々な形式の更新情報を収集することが出来ます。
収集した情報は、RSSと呼ばれるXMLベースの汎用的なフォーマットに変換され管理されます。RSSを基礎データとして、XSLTにて変換され、日本の教育情報(ベータ版)のHTMLが生成されています。
一般にRSSは取得/解析が容易ですが、HTMLで掲載されているページから特定の部分を抜き出すことは困難です。
富士通研究所はHTMLから特定情報のみを抜き出しRSSに変換する技術を開発しました。
この技術によって、多くのウェブサイトから更新情報を抽出することが出来ています。