Skip to Content Java Solaris コミュニティ パートナー 開発者 マイ・アカウント ご購入について (0120-33-9096) Japan Worldwide

国立情報学研究所

概要

汎用連想計算エンジンGETAをキーテクノロジーに、私たちが発想し、考えをまとめていくプロセスに近い情報検索を可能にする図書館情報検索サービス『Webcat Plus』をはじめ、さまざまな取り組みを推進する国立情報学研究所 連想情報学研究開発センター。Sunでは、同研究開発センターを、ハードウェア/ソフトウェアの導入だけでなく、教育・研究機関やコンソーシアム、サードパーティから形成される戦略的提携プログラム"GLOBAL EDUCATION AND RESEARCH Center of Excellence(COE)"などにより、総合的にサポートしている。今回は、キーテクノロジーであるGETAをはじめ、連想情報学研究開発センターのさまざまな取り組みを、Sunの教育・研究機関支援の一例として紹介する。
主な課題
得られた結果
  • 海外展開を視野に入れたハードウェア/OSワンストップ・サポート
  • 複数データベース運用時のパフォーマンス維持
  • 海外を含めた多様な展開の可能性拡大

「連想計算エンジンという言葉にこだわりたいんです」というのは、2006年4月から国立情報学研究所 連想情報学研究開発センターで、センター長を勤める高野明彦教授。連想計算、連想の情報学といった分野の第一人者として、西岡真吾特任教授、小池勇治研究員等とともに、汎用連想計算エンジン(GETA:Generic Engine for Transposable Association)をコアテクノロジーとする、さまざまな研究開発に取り組んでいる。

もともとGETAは、1996年、高野教授が民間企業の研究所で開発に携わっていた検索アプリケーションから発展。情報処理振興事業協会(IPA)が実施した独創的情報技術育成事業として採択され、2002年7月にオープンソース・ソフトウェアとして公開されたものだ。「開発に携わっていた検索アプリケーションが、世の中に普及する道をつくるための判断でした。明確なロードマップを描くことで開発チームのモチベーションを維持すること、会社組織という枠組みに縛られることなく開発を続けたいということもあって、オープンソースのソフトウェアとして開発を行ったのです」と、高野教授。「具体的なアプリケーションの本質的な部分をミドルウェアとして抜き出したので、最初からミドルウェアとして開発するより、こなれた技術になっていると考えています」。

ページ先頭へ


GETAによる連想検索の威力を広く世に知らしめたのは、2002年10月に国立情報学研究所が公開した『Webcat Plus』である。これは同研究所が『Webcat』として、1998年から提供していた全国大学図書館所蔵の図書・雑誌情報を対象に、連想検索機能を実現したもので、『Webcat Plus』では、現在、和書・洋書970万冊を対象に、自由な文章を質問文として関連書籍の検索が行える連想検索が提供されている。一般的な書誌検索とは異なり、質問文と各図書の目次・概要を逐一比較して共通する単語の頻度や確率を計算。関連する図書を関連度の高い順にリストアップする。質問文としては新聞記事全文など、かなりの長文も使うことができ、検索結果の上位40冊を要約する関連ワードが常時表示されるため、それを使ってさらに連想を広げたり、トピックを絞り込んでいくことが可能になっている。

高野教授は、「人間が柔軟に自分の考えをまとめていくという作業に近づけることで、インタラクションのなかで発想を鍛えるというということが可能になると考えています」と、連想検索の特徴を語る。「例えば、辞書に、AはBという単語の言い換えと記載されている場合でも、その言い換えそのものに意味があると思うのです。ですから、それを同一の検索キーワードとして扱ってしまうと、操作する人の意図から離れていってしまう。GETAは、それぞれの単語そのものが検索対象の文中に何度現れるかということを計算することで、そうしたユーザのこだわりを大切にしています」。記憶や、発想、連想といった、人間が考えをまとめていくプロセスにより近い検索が、そこでは行われているのだ。

ページ先頭へ

国立情報学研究所
連想情報学研究開発センター長・教授
東京大学大学院情報理工学系研究科 教授
理学博士
高野 明彦 氏
国立情報学研究所
連想情報学研究開発センター
特任教授
博士(工学)
西岡 真吾 氏
国立情報学研究所
連想情報学研究開発センター
研究員
小池 勇治 氏

戦略的提携で世界展開を支援するCOEプラン

国立情報学研究所 連想情報学研究開発センターでは、「連想の情報学」というコンセプトに基づくさまざまな研究の多様な展開を図るために、特定非営利活動法人 連想出版を設立。8,000冊以上の新書・選書を収録したテーマ別読書案内システムである『新書マップ』、神田古書店連盟の協力による神田神保町オフィシャル・サイト『BOOK TOWN じんぼう』などのサービスを構築・運用。文化庁・総務省の連携プロジェクトである『文化遺産オンライン』にも携わるなど、連想検索の特徴を活かした取り組みは、Webの世界に新しい流れを産み出そうとしている。

「図書館の蔵書を対象とした『Webcat Plus』、現代という時代を捉える『新書マップ』、そして評価の定まった書籍を対象とした『BOOK TOWN じんぼう』と、それぞれ特徴の異なる情報源をうまく連携させることで、バランスのよい"知の探索空間"を提供できると考えています」と、高野教授。現在は、これらに加え、新聞社による写真・記事のデータベースなどとも自在に連携し、多数のデータベースを一つの情報源として連想検索できる新しいサービスの公開に向けて開発を進めている。

ページ先頭へ


新書・選書を対象に、1,000テーマを抽出。各テーマそれぞれに、関連する本のリスト/概要/目次/読書ガイドを添付。
キーワードや文章を丸ごと質問文にできる「連想検索機能」により、漠然としたリクエストであっても10の関連テーマを選び出し、星座表のような関連図(新書マップ)を作成することができる。

2003年、『Webcat Plus』の多言語化プロジェクトに際して始まったSunとのパートナーシップは、『Webcat Plus』のWebサービス化、連想検索技術の世界展開を視野に入れ、教育・研究機関やコンソーシアム、サードパーティから形成される戦略的提携プログラム"GLOBAL EDUCATION AND RESEARCH Center of Excellence(COE)"締結なども含め、より強固なものになろうとしている。「GETAによって、データベース間、コンテンツホルダー間の連携が生まれる。互いのサービスが相互に連携していく。そこにSunのWebサービス技術が有用だと考えています」と高野教授。同時に、「連想検索という技術を国際的に発信するには、やはり、日本語だけでなく英語圏や中国語圏を重要視せざるをえません。世界への発信を想定したパートナーシップを構築できるのは、Sunしかないと考えています。COEなどに見られる『技術をシェアしよう、いいものはブランドにこだわらずに使っていこう』という考え方も、私たちのポリシーに合致すると思います」と、Sunの企業姿勢を評価する。

アプリケーションの制作に携わる西岡特任教授は、「研究所内で研究するだけならSunにこだわる必要はないと思いますが、完全に外部に委託してしまうといった場合、ハードウェアやOSも含めたトータルなサポートが必要になるということです」と、Sunとのパートナーシップのメリットをユーザ・サポート面から検討したという。

ページ先頭へ


システム概要

もちろん、ハードウェアとしてのパフォーマンス、技術的な優位性もSunを採用した理由の一つだ。現在、連想情報研究開発センターで手掛けている公共図書館におけるRFIDを利用した連想検索システムには、来館者の共有端末としてSun Rayの採用を検討している。これは不特定多数の来場者が利用する環境における、セキュリティや安定性、保守管理の容易さなどを考慮した結果だ。

また、複数のデータベースを連携させるためには、メモリ領域をはじめハードウェアそのもののパフォーマンスが課題となる。西岡特任教授は、「たとえば、新聞記事などのデータベースの場合、10年分で数ギガバイトものデータ容量になります。データベースごとにサーバを用意する、複数のスレッドを並列で処理するなど、さまざまなアプローチを検討する上で、Sunのプロダクトに期待しています」と、将来的な展開におけるSunへの期待を語ってくれた。

ページ先頭へ


小池研究員が「Webサービス部分は、Javaアーキテクチャで構築しています」というように、連想検索の世界展開においては、プラットフォームや環境に依存しないということが条件となる。連想情報学研究開発センターの取り組みには、さまざまなコンテンツホルダーが、ユーザの発想や連想のプロセスに添った検索サービスによって情報を公開していくことが基本となるためだ。「Webサービス部分は、今後も、汎用性の高いJavaアーキテクチャを使うことになると思います」と、小池研究員は、国際化環境も含めたJavaアーキテクチャのメリットについて評価している。

「情報サービスは、高速道路とか、公園等と同様の公共インフラだと思っています」という高野教授。オープン化というトレンドの共有、世界規模のサポート体制、そして、ハードウェアとしての信頼性・パフォーマンス...。データベースという「知」を連携し、横断的・縦断的に自在に連想を広げながら検索する。連想計算という従来にない仕組みで、情報検索に新しいスタンダードを構築しようとする連想情報学研究開発センターのパートナーとして、Sunへの期待は大きい。


GETAによる連想検索サイトのご紹介
新書マップ
http://shinshomap.info/
文化遺産オンライン
http://bunka.nii.ac.jp/
想竏棚MAGINE Book Search
http://imagine.bookmap.info/

本誌の全部または一部をサン・マイクロシステムズ株式会社の許可なく、無断で転用することは禁止します。

© 2006 Sun Microsystems, Inc. All rights reserved. ●Sun、Sun Microsystems、サンのロゴマーク、Java、Java Coffee Cupのロゴマーク、Solaris、Solarisのロゴマーク、Sun Fire、Sun StorageTekは、米国Sun Microsystems, Inc.の米国およびその他の国における商標または登録商標です。●AMD、AMD Arrowロゴ、AMD Opteronならびにその組み合わせは、Advanced Micro Devices, Inc.の商標です。●本文中に記載の各社の社名、製品名は、各社の商標または登録商標です。

ご意見・ご感想をお聞かせください
この記事は参考になりましたか?
     

コメントがございましたらご記入ください


PDF 782KB

製品/ソリューション

 

お問い合わせ 会社情報 ニュース 採用情報 プライバシー 利用規定 商標 Copyright  Sun Microsystems, Inc.