2005年08月29日

やばい

研究。

研究の評価実験、資料作成、そしてパワポ。

重要な部分、終わってません。

うん。気合だー!!

投稿者 Take : 02:20 | コメント (0)

2005年08月23日

換言処理: ブックマーク

ブックマーク。


研究の進捗、かなりヤバめ(ーー;



投稿者 Take : 17:34 | コメント (0) | トラックバック

2004年09月12日

分散分析とt検定

メモ。

分散分析とは、分散を要因別に分解して比較する分析手法のことである。
つまり、母集団から要因別に分類された複数の要因郡間に平均の差の検定である。

2つの要因郡の平均の差を検定する手法としてt検定がある。
t検定を複数回用いることで検定可能のように思える。
しかし、3つ以上の要因郡の平均の差を検定する場合にt検定を用いる問題点として、
精度的な問題、つまり検定の多重性の問題が存在するために分散分析を用いる必要がある。

t検定を複数回用いることで検定を行う場合、
帰無仮説を「全ての平均に差がない」であり、この時の対立仮説は「少なくとも1つの要因間には平均の差がないとはいえない」である。
このときの検定の多重化とは、検定毎に複数回検定すると危険率が高まる問題である。

例えば、100円を一回投げて表が出る確率は0.5である。
これを二回投げたときに少なくとも一回表がでる確率はどうだろうか?
少なくとも一回表がでる確率 = 1 - (二回とも裏が出る確率) = 1 - (0.5 * 0.5) = 0.75 > 0.5
0.5より大きくなったことが分かると思います。

投稿者 Take : 23:47 | コメント (0) | トラックバック

2004年06月26日

Ecosystem

WeblogのNetworkについてのメモ。

Mayfieldは政治経済学の視点からWeblogspaceに3種類のネットワークが存在すると主張している。

Political Networkとは、Webのようなネットワークのことを意味しています。つまり、Power-lawに従うようなネットワークのこと。

Social Networkとは、釣り鐘型の分布に従うようなネットワークのことを意味しています。このような分布に従うネットワークは、ランダム・ランダムネットワークのようです。ランダムネットワークとは、相手と関係を結ぶ際の基準がランダムで結び合っているネットワークのこと。例えば、ネットワークの辺となる部分を道路、そして点となる部分を都市とした高速道路のネットワークもランダムネットワーク。

Creative Networkとは、少数の人たちの中で濃密にコミュニケーションするようなネットワークのこと。

実際に、WeblogspaceがPower-lawに従っていることはShirkyによってデータが示されている。しかし、Social Network、Creative NetworkがWeblogspaceに存在するかどうかのデータは示されていない?(もしくは見つけられていない。もしデータがあるなら教えてください。)

投稿者 Take : 14:31 | コメント (1) | トラックバック

2004年06月14日

Making a schedule

スケジューリングについて書かれていた本のメモ。

人間は誰でも嫌いなことより好きなことを、知らないことより知っていることを優先して物事を行う癖があると思います。少なくとも、私はTaskの期限が短いモノから順に実行するタイプでした。しかし最重要なTaskと重要でないTaskでは、求められるTaskの要求レベルが異なります。このような問題に対して、TaskをスケジューリングすることでTaskに費やす時間を最適化することが今回のテーマです。

スケジューリングとは…
Taskを実行する際に障壁となる感情を取り除くで目標に適合した順序で実行するための手法。


  1. 目標設定
  2. 資源配分
  3. 実行

目標設定
行動の意味を明確化するためには必ず目標を設定する必要がある。

資源配分
目標を実現するために最適となるようにTaskに配分する必要がある。

実行
Taskに対する予想処理時間、実績処理時間、そして問題点等の記録。

投稿者 Take : 22:45 | コメント (0) | トラックバック

2004年06月01日

The 80/20 Rule

http://www.shirkycom/writings/powerlaw_weblog.html のメモ。

経済学者Vilfredo Pareto は、20対80の法則を説明している。

20対80の法則とは、「富の80%を人口の20%の人たちが持っている」という法則。

Power law distributions, the shape that has spawned a number of catch-phrases like the 80/20 Rule and the Winner-Take-All Society, are finally being understood clearly enough to be useful. For much of the last century, investigators have been finding power law distributions in human systems. The economist Vilfredo Pareto observed that wealth follows a "predictable imbalance", with 20% of the population holding 80% of the wealth.

言語学者George Zipf は、英語での語の頻度はpower law規則になると説明している。
要は語の出現頻度が


であるということ。

The linguist George Zipf observed that word frequency falls in a power law pattern, with a small number of high frequency words (I, of, the), a moderate number of common words (book, cat cup), and a huge number of low frequency words (peripatetic, hypognathous).

同様な現象がWeb site pageの閲覧等にも適用できると、 Jacob Nielsenは説明している。

Jacob Nielsen observed power law distributions in web site page views, and so on.

被リンク数によってランキング付けされた

Figure #1は大雑把であるけれどpower law分布に従っていることを示している。
上位 2位: 5%(該当Blogの外部からのリンク数の全体に占める割合)
上位12位: 20 %
上位50位: 50%

We are all so used to bell curve distributions that power law distributions can seem odd. The shape of Figure #1, several hundred blogs ranked by number of inbound links, is roughly a power law distribution. Of the 433 listed blogs, the top two sites accounted for fully 5% of the inbound links between them. (They were InstaPundit and Andrew Sullivan, unsurprisingly.) The top dozen (less than 3% of the total) accounted for 20% of the inbound links, and the top 50 blogs (not quite 12%) accounted for 50% of such links.

投稿者 Take : 13:03 | コメント (0) | トラックバック

2004年05月03日

NDPM

Normalized Performance Measure(NDPM) is how to measure comparing with some information retrieval system. The measuring compare the order which is ranked by the system. I’m reading the thesis about the details of the measuring.

投稿者 Take : 00:08 | コメント (0) | トラックバック