Etechで語られた、気になるキーワードをやさしく語ってみる
まだ作業中です。
僕自身、半年くらい前まではWeb2.0がなんのか、さっぱりわかってなかった。半年前に思い立って、キャッチアップし始めた情報と、Etec2006で話されている用語を、なるべくわかりやすく説明してみる。
予想もいっぱいあるし、思い違いもあるかもしれまえんので、気になるところは、ぜひ、コメントお願いします。
1.マッシュアップ
一言でいうと
既存のネットのサービスを組み合わせて、あたらしいサービスを、独自に作り上げること。
もう少し詳しくいうと
具体例でまず考えてみる。自分の住んでいる地域の情報が詰まったサイトを作るとしよう。サイトの基本は、自分が日々書き込む、自分の町で見つけた情報を書き綴るブログだとしよう。しかし、ブログに書く情報だけじゃなく、もっといろいろ付加情報をつけたくなる。たとえば、天気予報を表示したり、紹介している地域の地図を表示したり、ほかのブログ記事から関連性のある記事を見つけて、リンクやサマリをつけたりできたらいいなあとおもう。
ついでに、その地域のお店のクーポン一覧とかもあると便利。渋滞情報に、マンションやアパートの情報、その地域と関連する小説やガイドブックを紹介したくなったりもする。
こんなことがしたくなったとき、従来であれば、がんばって自分で検索してリンク先をしらべ、日々の天気予報を調べて、アップし、住宅情報のサイトから、紹介したい物件をみつけてはリンクをはるなんてことをすれば、できなくもなかった。
しかし、それらのリンクは、全部手動で更新する必要があったし、実際の詳細情報はリンク先のほかの人のページなので、デザインの統一なんてのも無理であった。
もし、なにか、ちょっとした設定をすると、自分のホームページの左上にに天気予報が表示されて、日々特に更新しなくても最新情報がとれたら、うれしい。ほかのブログ記事から、関連する記事をリアルタイムでタイトル一覧表示してくれればそれもまたうれしい。そんなことを実現してくれるのがWebサービスやRSSといった、連携(シンジケーション)の技術である。
RSSはブログを書くと、自動的に書き出される。ブログを書いている多くのユーザーは気づいていないかもしれないが、XMLという、コンピュータが解析可能なフォーマットで日々書き出されているのである。また、そのブログの更新データは、gooブログ検索やテクノラティといったブログ専門の検索サービスが、ほぼリアルタイムで情報収集している。ブログを書き込むと更新したよということが、ブログ専門の検索サービスには伝わる仕組み(ping)が備わっているため、最新の情報が取得できる。
一方、Webサービスという形で、特定の領域に特化した情報を取得できたり、書き込んだりできるサービスもある。AmazonWebサービスや、Yahoo! Serch、Google Map、 Livedoor Weather API、はてなフォトライフとかが有名。各社いろんな情報を提供しているが、たとえば、天気予報と 地図では得られる情報はもちろん異なるので、どんな情報がとれるのかが規約としてまとめられている。Yahoo! Serchでは検索結果が得られるし、 Weather APIなら、天気予報の情報が得られる。
RSS、Webサービス(API)で提供されるデータは、素材データなのでそのままでは、ページに表示できない。HTMLのタグを付加したり、自分のページにそのHTMLを付加したりする必要があるが、その一連の作業では、PHPやPerlといったスクリプト言語を使うことが多少必要になる。こうしてできあがったサイト(サービス)がマッシュアップしたサイトということになる。
オリジナリティのある、高付加価値のページをマッシュアップすることで実現できる。そのためにはプログラミングのスキルが必要なのだが、プログラム以上に大切なスキルは、なにを組み合わせるか?価値は、売りは?といったことを洗練させることである。
ただし、そこまで、がんばらなくても、すでにあるのもを組見合すわけだから、短期間で開発はできる。ぜひ、大小こだわらずに、思いついたものからマッシュアップをするのがいいと思.う。
さらに、もうすこし、複雑なテクニックではあるが、APIが用意されていないサービス(サイト)の情報を取り込みたいときはどうすればいいのだろう。その場合はHTMLベースのCGIで取得したページデータから必要な情報を抜き出したり(アグリゲイト)、バリューコマースで配布されているMyList用のようなデータを使うことで、ほしい情報を組み合わせることができるようになる。アグリゲイトできるのは規則性のある場合だけだが、パターンを見つけて抜き出すことで、あるていどは情報を取得できる。ただ、この場合、サイト側のHTMLのデザインがかわると、それにあわせて修正も必要になるのがちょっと面倒。
APIについても補足すると、同じサービスでもAPIの規約は同じとは限らない。Yahooが生成する検索結果とGoogleが生成する検索結果とも、似たような内容であはあるが、APIは統一されていない。URLと概要を一覧するということで、同じようなデータ構造にはなるが、タグ名は統一されているわけではない。将来的にはなんらかの、サービス種別ごとのAPI規約が必要になってくるかもしれない。
どんなWebサービス(素材)があるのか
ブログのサマリ:RSS(広義のWebサービスといえる)
ブログ検索:テクノラティ、gooブログ検索
サイト検索:Yahoo! Search ,google Search
本:Amazon Web Service
オークション:eBay,YahooオークションRSS
地図:YahooMap,ドコイク
写真:Flikr
ブックマーク共有:はてなブックマーク
マッシュアップのサンプルサイト
すぐBiz じゃらん(宿データ)+ドコイク(地域情報+経度取得)+Yahoo Search(ぐるなび情報+画像)
※じゃらんはAPI提供されていないので、バリューコマースのデータ利用
YahooAPIギャラリー
変化と影響
組み合わせることで、サービスが作れるためアイデア次第では、非常に少ない労力で、人気サービスを立ち上げることができる可能性がある。マッシュアップしていて足らないWebサービスを見つけたら、それを自分で作ることで、APIの提供者側になることもできる。
課題は、APIを公開することのメリットが何なのかを見極めること。
YahooSearchAPIの場合は、マッシュアップサイトであっても、そのサイトのユーザーがサーチ結果をクリックした情報をYahoo!にフィードバックするようなつくりになっている。
「どういう嗜好を持った人が、どういうキーワードで検索して、検索結果から何をさらにクリックすするのか?」という情報をYahoo!はAPIを提供することで、マッシュアップされたサイトと検索キーワードの関連性も含めて蓄積することができる。予想だが、これにより、Yahoo!は検索結果連動広告の精度をあげようという戦略ではないだろうか。
YahooWebサービス今のところは商用利用は規約で制限されているが、商用利用の開放とともにまた将来的にはAPIに課金することもあるかもしれない。APIに課金するのが、一般化すれば、質のよい情報を持つサイトはAPI課金という形で公開することも可能になるかもしれない。
マッシュアップサイト自体の運営者の立場でかんがえると、マッシュアップすることで価値を生み出してはいるものの、課金の仕組みは今のところ、コンテンツ連動型の広告(アフェリエイト、アドセンス)がほとんどである。広告主からだけではなくて、ユーザーからマッシュアップサイトの運営者へのお金の流れをどう作るのかはまだ試行錯誤中である
素材があって、それを組み合わせるということで価値を生むようなことは、従来雑誌や、本の編集者がやっていたことだった。本の制作費や流通コストを考えると集約型にしないことには実現できなかったのだ。それが、編集のセンスがあれば、マッシュアップすることで圧倒的な低コストで、情報発信&流通できてしまうのである。これは、そこに経済が発生するということとともに、企業でも個人でもこれまでやりたくてもできなかった、ことができるようになるということである。やりたくてもできなかったアイデアがなんだったのか、この機会に思い出してみるとマッシュアップでできてしまうかもしれない。チャンスである。
2.マイクロフォーマット
一言で言うと
人に優しい、ちょっとしたマークアップのルール。
もう少し詳しくいうと
情報を自動的に整理するためには何らかのルール化が必要になる。全文検索でキーワードを抽出するだけなら問題ないが、あるページから住所の部分を取り出すとか、口コミ情報の部分だけを取り出そうとしたら、どこが、住所でどこが口コミなのかをルール化しておくと処理がやりやすい。
発信側も、それがどういう意味かを明示的にすることで、自動的に口コミサイトに登録されるなんてことになったら、うれしい。わざわざ、口コミサイトに行って記入(だいたいは、コピーペーストだろう)しなくても、口コミサイトがわから、必要な部分を自動的に取り出してくれる。
この仕組みがうまくいくには、同じルールで、みんなが書き込めばいい。しかし、書くほうは、ブログだったり、掲示板だったり、するが、基本的に人の手が書く。そうなると、ルール化したところで、入力が簡単でないと、誰も書いてくれない。RSSやWebサービスではXMLをつかって、データを意味づけしたままやとりするが、XMLはとてもじゃないけど、簡単じゃない。ではどのようルールが考えられるのか?口コミならこんな感じはどうだろう。
ルール:divタグで囲み、type="口コミ"というアトリビュートを付加する。口コミの対象はtargetで指定する。
<div type="口コミ" target="Panasonic CF-W4">
eteck参加中、1週間持ち歩きましたが、軽くてよかったです。バッテリーの持ちがいいのもGood。何人かに声をかけられましたが、みなさん軽さに驚いてました。iBookでこのかるさのがあるといいのだけどなあ。
</div>
<div>タグという、フレンドリーでないといえば、あまりフレンドリーでもないんですが、こう書いておくことで、Panasonic CF-W4の口コミだと自動的に解釈されるようになります。
<div type="口コミ" target="Panasonic CF-W4"></dev>
このルールがマイクロフォーマットということになります。ちなみに、このtype="口コミ"は僕の思いつきなので、この書き方をしても、誰も、理解してくれません。つまり、こういうルールで行きましょうということを規約化し、広めていく、もちろん、そのルール(フォーマット)を活用するサービスも必要です。
現状は、いろんな、マイクローフォーマットが乱立して、ちょっと混乱気味のようですが、もうすこしすれば、各分野で淘汰されて、デファクトスタンダードとして整理されてゆくでしょう。
マイクロフォーマットの例
一行広告
変化と影響
人手による、意味づけを簡単なルールをつけてやってくということが習慣になれば、情報の精度は上がり、これまで埋もれていたような情報でも流れ始める(見つけられる、見つかる)ことになる。人々は仲間を見つけやすくなり、実は同じような人がいることで自信をもち、多様な価値観のままでもくらしやすい社会になる。また、これまでは、商売として成り立たないような小さな分野でも、ある程度人があつまるということで、いったんコミュニティができれば、そこにマーケットも出現する。
全文検索機能(Yhaoo Google)がネット環境で実現されたおかげで、調べる、見つけるためのコストは大幅に低減した。とはいえ、キーワードだけでは絞りきれないことも多く、必要な情報にたどりつくまでに、なんどもキーワードを変えて試行錯誤するような必要があることも事実だ。「検索の達人」なんてことばがあるくらいだから、まだまだ、簡単にはいかない。マイクロフォーマットによって、多くの人がちょっとしたルールで書き込みすることで書き手は、意図したとおりの意味を付加し、受け取り側も意図した検索結果の一部として受け取れるようになる。
フォーマットの統一や、ルールのシンプルさや、実行するためのインセンティブとか課題もあるが、インターネットが全体的に賢くなるための手段として活用してほしいと思う。
ただ、将来、人間を越えるような人工知能がでてくれば、そのときは、人工知能検索ということになるのかもしれないが。そもそも、アルゴリズムの限界(=2006年の人工知能検索)を超えるための手段としての人力作業を反映するためにマイクロフォーマットが提唱されているわけで、人力、人の知とコンピュータの共同作業をしましょうという現実的な提案なのだ。
3.タギング
一言で言うと
タグをつけることで、内容の意味づけをする。
もう少し詳しくいうと
タグというのは荷札のこと。ある商品が箱にはいっているとき、その中身がなにかによって分類するためには、荷札に、「大根」「東京産」「高級」なんてことを書いておくと、大根だけあつめたり、東京産をあつめたりなんていいうことが比較的簡単にできるようになる。
これを、ネットの世界で行うのがタギング。(タグ付け)
マイクロフォーマットにも関連するが、コンピュータのアルゴリズムのパワーだけだと、分類の精度に限界がある。文章を解析すれば、頻出する単語とかから、分類することも可能ではある。しかし、人によって、感じる点はさまざまだったり、記事を書いている人にとっては、頻出単語じゃなくて、一回しか書いてないけど、それが一番いいたいことかもしれない。文章中には一回もできてないけど、つけたいタグがあるかもしてません。(たとえば、どこで書いているか[自宅]or[オフィス]とか、今の気分は[まあまあ]or[すごくいい]とか、文章に関係ないことも含めて)自動解析の限界を人力で保管する、とてもシンプルな方法がタギング(タグ付け)である。
日々、読んでいる大量のブログやページを自分の趣向でタグ付けし、あとから、特定の特定のタグだけで、絞り込めれば、とてもたすかる。
じゃあ、どうやってタグ付けするのかであるが、現状のサービスでは、
・ブックマークサービスで既存のページにタグを付加する はてなブックマーク
・マイクロフォーマットで記入時にタグを埋め込む テクノラティの検索エンジンはこのタグを取り込んでくれる
・コンテンツ登録時にタグも入力する Flikr
という方法がある。
ともに、自分のためつけたタグであっても、他の人と共有することができるため、 人力でつけたタグで検索すれば、自動収集される全文検索エンジン(googleやYahoo検索)とは、また異なった視点で精度の高い検索ができます。もちろん、自分の興味ある分野のタグをつけてくれる人がいなければ、自分のページ以外は見れないということになってしまいます。多様な興味を持つ人がそれぞれの得意分野でタグ付けをしてゆけば、それぞれの個人の知の提供が、大きな集合知として、あたらな価値をうみだすことになります。
タギングの例
・ブックマークサービスを利用する はてなブックマーク
・マイクロフォーマットでタグを埋め込む テクノラティの検索エンジンはこのタグを取り込んでくれる
・登録時にタグも入力する Flikr
変化と影響
コンテンツに意味を付加するための、一番シンプルな方法かもしれない。
タグクラウドという標準UIができてきたり ブックマークにつけたタグを共有したりと効果を発揮しつつある。またソーシャルブックマークや写真共有がタギングが広まるもとになったが、これらのサービスは最初からWebサービスによる、データの取出しができたため、タグをキーにして、複数サイトの情報を取得し、マッシュアップすることがである。タグというシンプルなキーでつながっていくのはシンプルのなで、すべてのコンテンツにタグ付けされるのは、そう遠くない将来だと思う。
人がつけるため、同じ意味でも若干異なる場合がある。どの程度マージすべきなのかとか、タグ同士の関連度合いをチャートするような作業を行うことで人力のゆらぎを吸収した、高精度のタグ活用ができるようになるかもしれない。
また心配事しては、タグの 響度が増すにつてSEO対策的なノイズ情報が引っかかってくるかもしれない。タグスパムも考えられる。まあ、これはいつもいたちごっこなので、デファクトの宿命かもしれない。ほんとうは、インターネットであるいは、タグ付けが回りまわって、人々を豊かにして、スパムを送るような行為をするよりも、もっと楽しくて、進化につながるようなことにつながれたらいいのですが。
4.ソーシャルネットワーク
5.人力
6.リコメンド
評価の仕組み
7.アテンションエコノミー
次点だけど、気になるワード
・Ajax
・チープ
・スケーラブル
・API
・リンキング・サーチング・ランキング
・Windows Live Copy &Paste