ブログ解析「kizasi」の会社が設立

ITmediaより、「ブログ解析「kizasi」専門の新会社設立」。以前にどこかで聞いたことはあったのですが、使ったことありませんでした(汗)。

kizasiとは何か、kizasi.jpから引用してみます。

kizasi.jpで使われている最も重要な技術は、株式会社シーエーシー 技術研究センターにて研究開発された 『時系列共起パターン解析エンジン(Kizasi Search Engine)』です。この解析エンジンが、ブログデータを収集、言語処理、解析し、ある時間におけるブログの話題をkizasi語として抽出しています。この解析エンジンには次のような特徴があります。

* 関連性解析
時間情報をもつテキスト集合を対象として検索語の周辺文脈を解析し、語の関連性を時系列分析できます。
* 準実時間のインデクシング
クローリングからインデクシングまでの処理をパイプライン化し、時間とともに増加するテキストデータを準実時間で解析できます。その結果、話題の傾向を遅延なく捉えることができます。
* 概念辞書(オントロジー)の内蔵
語の分類属性を利用して、ジャンルによるランキングや関連性検索を可能としています。確率的アルゴリズムを使用し、同形異義語の判定も可能です。

簡単に言ってしまえば、ブログ上でのトレンド解析システム、とでも言えるでしょうか。今朝、一度見たときには、「洋菓子販売休止」が一位でした(不二家の件です)。1週間、1ヶ月という長期スパンでのトレンドを見ることもできるため、一時的な話題だったのか、長期的に盛り上がりそうな話題だったのかを確認することにも使えます。

今回、独立した会社としてビジネスを運用していく中で、口コミビジネス、集合知の生成、という部分に影響力を持ってきそうな気がします。

なお、技術的なところに注目すると、概念辞書(オントロジー)の内蔵というところに目がいきます。今取り組んでいる修論でも、このオントロジーというものを使っているので、どんな構造になっているかが興味津々。

おまけ

SimpleAPIという、サイトのサムネイル画像を生成するサービス使い始めてみました。これ、生成した画像をダウンロードするのはOKなんだろうか…?