「PSKB」の導入事例 朝日新聞社様

お問い合わせ受付窓口 お問い合わせ受付窓口

約500万件の記事数、集中する検索要求
厳しい運用環境下に約0.01秒の高速検索を実現

『高価』、『扱いづらい』・・・。そんな検索エンジンに対するイメージが変わりました。
朝日新聞社 デジタルメディア本部 次長 山本和人氏(プロジェクトリーダー)/朝日新聞社 デジタルメディア本部 システムチーム 岩本和樹氏(構築担当主任)

朝日新聞社(本社:東京都中央区)は、2007年9月に小・中・高など学校向けオンライン記事データベースサービス「朝日けんさくくん」のリニューアルを行った。リニューアルの主眼であった「検索機能の性能強化」を、パナソニックの高速全文検索エンジン「Pana Search/KB(現商品名:PSKB)」※1によって実現。
500万件という膨大な記事数、そして「検索要求の集中」という厳しい運用環境を克服し、サイトのさらなる利便性向上に貢献している。

※1 「Pana Search/KB(パナサーチケービー)」は、2011年7月1日より商品名を「PSKB(ピーエスケービー)」に変更しました。

【導入の背景】 「検索要求の集中」に強いサイトを目指し、リニューアルに着手

「朝日けんさくくん」は、朝日新聞・AERA・週刊朝日の記事検索、天声人語をはじめとする朝日新聞のコラム、漢字や英語の日替わり学習素材、大学入試セ ンター試験対策ページなど、授業や受験対策に役立つコンテンツを揃えた、小・中・高など学校向けのオンライン記事データベースサービスだ。学校向けという 性質上、コンテンツ内容やページデザインなどの点で、一般の個人・法人向けページと差別化が図られているのは言うまでもない。しかし、より根本的にサイト の構築方法に影響を及ぼす違いが両者にはある。プロジェクトリーダーの山本和人氏は次のように説明してくれた。

「両者の大きな違いは、検索の要求率です。『朝日けんさくくん』は授業でも活用されますから、クラスの生徒全員が同時に使用するなど、一般の個人・法人向けページに比べて検索要求が集中しやすいのです」

そこで、2007年3月より着手された「朝日けんさくくん」のリニューアルプロジェクトでは、検索要求の集中による高負荷下でもスピーディーに必要な記事を探し出せる、高性能の検索機能を実現することが主要な課題となった。さらに、山本氏が検索エンジンにこだわる理由はシステム的な観点にとどまらない。

「学生たちの新聞離れが叫ばれる中、『新聞を通して社会を知る』ことを『朝日けんさくくん』で体験してもらうことが私たちの願いです。その入口として重要なのは、押し付けられたものではなく、自分自身のキーワードで記事を探すことだと思います。学校向けのサイトだからこそ、なおのこと検索機能にこだわりたかったのです」

山本和人氏

【導入決定の要因】 圧倒的な検索スピードとインデックス登録のスピードも決め手

検索エンジンの選定で、候補に上がったのは3社の商品。3カ月にわたる入念な検討の結果、選ばれたのは「Pana Search/KB」シリーズだった。構築担当主任の岩本和樹氏は、おもな評価のポイントとして以下の3点をあげる。

1. 検索スピード

「『朝日けんさくくん』の収録記事数は、過去20年以上の朝日新聞に、AERA、週刊朝日の記事を加えた500万件を超える非常に大規模なものです。しかも先述のとおり、検索要求の集中によって負荷が大きくなる傾向があります。このような環境下でも圧倒的に高速な検索レスポンスを確保できたのが、『Pana Search/KB』シリーズでした」

2. 開発のしやすさ

岩本和樹氏

「リニューアルプロジェクトを共に進めるウェブプログラミング会社の意向も踏まえながら、開発、機能カスタマイズ、性能チューニングのしやすさという点でも検討を重ねました。その結果、一つの設定ファイルのハンドリングで開発要件やシステム環境に合わせたデータベースや検索仕様の設計・変更が可能である、その設定ファイルを元にクライアントAPIを用いて検索アプリケーションの作り込みも可能である点などから、『Pana Search/KB』シリーズは開発難易度の低減が図られていると判断しました。また、開発にあたりパナソニックのPana Search/KB開発チームに通じた方から、直接、開発サポートを受けられる点も助かりました」

3. インデックスの登録・追加スピード

「『Pana Search/KB』シリーズは、インデックスの登録および追加スピードの点でも優れていました。約500万件の初回インデックス登録は1時間弱で行えましたし、ごと日約1,500件のペースで行われる追加登録も5分とかからずにできます」

【お客様の検討メモ】

  • 「Pana Search/KB」シリーズは、ヒット件数が多いキーワードでも性能劣化が小さい。また、属性指定や期間指定と組み合わせた検索クエリーでも性能劣化がない。

  • 2~15単語のAND/OR/NOT検索で性能測定したところ、「Pana Search/KB」シリーズはキーワードの個数による性能劣化が小さいことが確認された。

  • 100件超~1,000件超ヒットするキーワードでの検索を標準とするならば、「Pana Search/KB」シリーズは1秒間につき40件の検索クエリー処理(※評価時)が期待できる。

【システム構築】 応答秒数約0.01のさらなる高速化を実現

システム構築では、パナソニックのスタッフも開発・設計に参画し、サポートを行った。パナソニックのサポート部隊に期待されたのは、検索要求が集中した時のさらなるレスポンス向上。そこで、約2カ月間をかけてデータベースの構成やハードスペックの検討を重ね、応答秒数約0.01という、さらなる高速化を実現した。

記事検索画面
検索結果画面例

【導入効果と今後の展望】 優れた検索機能の実現によって、営業活動にもさらなる自信

「Pana Search/KB」シリーズを用いて、約500万件という記事数、検索要求の集中という高負荷下でも応答秒数約0.01の高速検索機能を実現した新生「朝日けんさくくん」。その検索スピードは、利用者からも好評を博しているという。 最後に、山本・岩本両氏に、リニューアルプロジェクトを終えての感想と今後の展望について、それぞれ伺った。

「このプロジェクトに携わるまで、検索エンジンというと『高価』とか『扱いづらい』というイメージがあったのですが、『Pana Search/KB』シリーズに接してみてイメージが変わりました。むしろ、今後の仕事を考える上で有効なノウハウを得られたと思います。やはり、優れたコンテンツを持っているサイトであれば、それを人に知ってもらうためにも検索機能をサイトの中心に据えた方が良いですからね。優れた検索機能を実現し、ますます自信を持って『朝日けんさくくん』をお勧めできるようになると思います」(山本氏)

岩本和樹氏/山本和人氏

「学生が興味を持った1つのキーワードが、検索を通してさらに広がり、発想を膨らませる契機となる。これが私たちの目指している検索機能です。既に概念検索を用いて、検索結果に関連したキーワードを表示するようにしていますが、今後も『(記事を)絞り込む』だけではなく、『(発想を)膨らませる』検索機能を目指して、引き続きナビゲーションの充実を図っていきたいですね」(岩本氏)

新聞、そして社会へと学生をいざなう入口として、ますます魅力的なサイトを実現するために、「Pana Search/KB」シリーズの挑戦はこれからも続く。

【お客様プロフィール】 朝日新聞社様

朝日新聞社

1879年(明治12年)に設立された朝日新聞社は、日刊紙「朝日新聞」の発行を中心に、雑誌、書籍、年鑑などの出版事業や、文化・スポーツ・環境・福祉といった多岐にわたる分野での事業活動を展開。定評のある確かな情報、鋭い調査・検証、わかりやすい論説を通し、日本を代表する言論・報道機関として着実な取り組みを続けられています。 また、デジタルメディア部門ではニュースサイト「アサヒ・コム」を中心に携帯サイトや記事データベース事業などネット分野でのサービス開発にも積極的に取り組まれています。

所在地:東京都中央区築地5-3-2
URL:http://www.asahi.com
URL:http://www.asahi.com/information/db/kensaku.html(朝日けんさくくん)