« ねぎ・雛人形・砲丸 | トップページ | ノンステップ連節バス »

バイドゥ・ドット・コム

----------引用
中国のネット検索最大手「百度」日本へ本格進出[読売新聞社:2008年01月13日 13時25分]
 中国のインターネット検索最大手、百度(バイドゥ・ドット・コム)が23日、日本で本格サービスを開始する。
 世界3位の利用者数を誇る検索サイトの本格上陸は、ヤフーとグーグルの2強が圧倒的シェア(市場占有率)を占める国内ネット検索市場の勢力図に影響を与える可能性がある。
 百度は、日本を海外進出の足がかりと位置づけ、2007年3月にテスト版を開設してホームページや画像の検索からサービスを始めた。今後は、中国市場で人気を集めている地図や音楽の日本語による検索など新サービスを順次、投入するとみられる。
 百度は、米国留学から帰国した李彦宏・最高経営責任者(CEO)が北京で2000年に設立した。米調査会社コムスコアによると、07年8月の世界のネット検索シェアはグーグル、ヤフーに次ぐ3位。
----------------
◆Baidu について(同社日本語HPより)
Baiduは、中国でNo.1のシェアを持つインターネットサーチエンジンテクノロジー会社です。また、Baiduは、世界138ヶ国の国と地域からアクセスがあり、世界で4番目のトラフィック量(Alexaより)を誇り、米国NASDAQへ上場しているグローバルカンパニーでもあります。 Webページ検索のほかにも、「ユーザの事を1番に考える」という理念のもと、コミュニティサービスを始め、様々なサービスをユーザへ提供しています。 Baidu.jpは、そのBaidu.comの日本市場向けの日本語サービスです。
― Baidu (百度) 検索エンジンの特徴 ―
・漢字の検索に強い
アルファベットによる検索エンジンのたくさん存在する中、漢字に強い検索エンジンをユーザーに提供していることが特徴です。
・ユーザーフレンドリーなサービス
既存の検索エンジンに代わる「ユーザーフレンドリー」なサービスとして、ユーザーに百度の強力な日本語検索技術を認めていただけることを目標に、より充実したサービス提供を行っていきます。中国では後発ながら同業を抑え、最新データによれば、中国国内において約75%強のネットユーザーに支持されています。
------------------
じつはこのところ、ここの検索サイト(β版)からのアクセスが時々あります。名前だけは聞いていたのですが、始めは中国本土かららしく中国語からの検索でした。(漢字群がひっかかる)ところが最近は日本語のベータ版からのアクセスに変わってきていましたのです。
ブログランキング・にほんブログ村へ
中国本土でのエンジンとしては最大級、米国出身の若い社長の開発によるもので、世界展開は日本が最初のようですね。(創業者がインターンシップで米国松下にいたこともあるらしい。また社外取締役として元ソニー社長の出井氏を迎えている)相当力が入ってるそうです。

BLOGの作動に問題があったわけではないですが、どうゆうエンジンなのかなと言う興味はありました。売りは映像の検索と言うことらしいですね。ただ中国で使ってるエンジンのロジックとは替えるみたいです。
私は検索エンジンの論理構成の違いから「概略で当る場合はGoogle。広く当る場合はYahoo」という使い分けをしていましたが、映像などの検索と言う意味ではここを使うのもよさそうですね。もっとも映像検索ということで有害画像の検索が生じ易いことを考えなければなりません。(現在のところ、アダルトフィルタ機能を使って、成人向けコンテンツの表示を制限することが出来るようなオプションで対応するようですね)
但し、成人向けコンテンツを完全に制限することを保証するものではありません。
その検討もしてるようです。
今のところ私なりに複数のデータをぶち込んで見ました。まだ古いデータを集めきってないようです。そこを割り引いても多少データの絞込みが甘い傾向が見えることから、Google<Yohoo<Baiduと言う形で使えるように感じます。画像検索は便利ですね。
--------引用---------
Baidu.jp、Baidu Spiderに関する御詫びと対処法について(同社HPより)
日本の皆様、始めまして。検索ポータルサイト『Badu.com』を運営している百度の日本法人代表取締役の陳海騰です。
弊社は現在、日本語版検索サービスを開始に向けて準備を進めておりますが、それにあたり、現在日本語サイトのウェブページの収集Spider(クローラ)を実施しております。それに際し、現在、Baiduspiderが日本の各サイトにご迷惑をおかけしてしまったことに対してまして、百度株式会社の代表として心よりお詫びを申し上げます。
今後は、この問題について弊社全体が真摯に受け止め、日本のインターネット業界におけるルールに従い、このようなことが二度とないように努めていく所存でございます。

弊社はこれまで現れた問題について以下のように対処致しました:
1. 総合的な方法で、サイトの限界を評価し、サイトに対してページクローリングの頻度をコントロールします。
2. 自動的にサイトのフィードバックを探知し、サイトへのクローリングの頻度が大きすぎた場合、自動的に下げます。
3. 各種ページへのクローリング方法に対し、クローリングの頻度管理を統一します。
4. 時間帯により異なるページへのクローリングの頻度を調整する方法に対応し、なるべくサイトのアクセスピーク時を避けます。
5. Robotsプロトコルの対応を強化:Crawl-delayに対応し、Baiduspiderのページクローリング頻度の制限を調整しやすいようにします。Robots.txtが有効までの期限を1~2日まで短縮します。
6. URLのフィルター方法および重複識別アルゴリズムを強化し、検索に対し無価値のページおよび重複のページへのクローリングを減らします。
7. 異なる種類のサイトに対し、ページへのクローリングの方式を変えます。
8.「新しいページへのクローリング」及び「古いページへの更新状況のチェック」の更新頻度に応じてより高効率の更新メカニズムを採用します。
----------------------------------

|

« ねぎ・雛人形・砲丸 | トップページ | ノンステップ連節バス »

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/100146/17679674

この記事へのトラックバック一覧です: バイドゥ・ドット・コム:

« ねぎ・雛人形・砲丸 | トップページ | ノンステップ連節バス »