大規模データストリームとは
データストリームを対象とするデータストリームマイニングは、
(1)属性値に関する平均やかたより、値の総和と言った簡単な統計量をきわめて小さなメモリと処理時間だけを使って計算する。
(2)結合規則や、決定木、クラスタリング、データマイニングにおける規則やパターンの発見アルゴリズムを連続したデータストリームへの拡張。
データストリーム・アルゴリズムの目標
・非常に少ない計算資源を用いて
・長期間安定して動き続け
・利用者の要求に即応して
・近似的な解を返す
マイニングアルゴリズムの基本的な技法
・確率的計算
・データの粗視化
・適応的計算
DataSource from 情報処理46巻1号