◎データと情報の違い
■データとは
電話帳や株式、天気、売上など、混沌とした情報(データの素材)を集めて、それを整理したもの。
将来使う事を前提として集められ、体系付けて整理している。
例:電話帳→友人の電話番号を集めて、電話帳の形で整理して登録したもの。
■情報とは
データは蓄積するだけでは役に立たない。データを分析し、目的に役立つようにしたのが情報。
例:天候データ→単に日々の天気として保存しただけでは役にたたず、過去の気温や天気などを分析することによって、天気予報などに活用できる。
■データと情報の境界線
データと情報は現実的に使い分けているわけではなく、見る人によってはデータが情報となったり、その逆となったりする。
→特にデータと情報を区別する必要がない場合は「データ」と呼ぶことにする。
◎データの性質
■人間社会におけるデータの性質
データは人によって様々な分析目的があり、活用するものである。
例:売上データの分析目的
・1時間ごとに毎日の売上を集計したい。
・曜日別に売上を集計したい。
・品目別に売上を集計したい。
・年齢別に売上を集計したい。
など
以下の観点でデータを分類できる。
□事実データと加工データ(作られ方の分類)
□未来データと過去データ(時間による分類)
□生存データと死亡データ(ライフサイクルによる分類)
□実体データと事象データ(性質による分類)
■事実データと加工データ
□事実データ(発生データ)
活動によって発生した事実をそのまま記録したもの。時系列に生まれてくる。
例
・商品を100個仕入(活動)→在庫が100個増える(事実)
・代金を100万円現金で支払った(活動)→現金が100万円減る(事実)
事実データはいずれ目的に応じて集計され、活用される。多方面で利用するために、できるだけ加工せずにそのままの形で記録しておくのが望ましい。
□加工データ
利用目的に応じて事実データを集計したもの。
例
・1ヶ月の仕入の数と金額の商品別集計一覧
・曜日別の売上高集計一覧
1日ごとの集計、月ごとの集計など包括関係にある場合を除いて、集計結果を他の目的で使用することはできない。
■未来データと過去データ
データには予定や計画段階のものと、完了した段階のものがある。
□未来データ(予定データ)
将来の見込みに関するデータ。
例
・×月×日入荷予定
・×月×日入金予定
欠品や入金不足など、見込みは日々変わるので、いつ時点を基点とした未来データなのかが重要。
□過去データ(実績データ)
未来データは刻々と変化するが、予定日が到来して完了すれば1つに定まり、確定したデータとなる。
特に会計データで確定した過去データを修正する場合は、修正伝票(赤伝)によって過去データと差し引きゼロになるように計上し、新たに正しい伝票(黒伝)を発行するのが一般的である。
□タイムスタンプ
未来データと過去データを時系列にとらえると、各データに様々な日時が必要となる。
例
・登録日時
・入金予定日
・承認日
・確定日時
・更新日時
※シリアル番号なども広い意味では時系列に管理することを目的としたタイムスタンプと解釈できる。
■生存データと死亡データ
データは誕生し、活用されてから不要になるまでのライフサイクルの流れがある。
□生存データ
活用されているか、活用される可能性のあるデータ
□死亡データ
利用価値のなくなったデータ
例
決算後の前期のデータ
※昨年の実績と今期の実績を比較するなどに使用すれば生存データとなる。データの利用方法で生死の判定は異なる。
■実体データと事象データ
データは世の中にあるものの性質によっても分類できる。
□実体データ
人、商品など世の中にある実体をあらわす。
□事象データ
売買、契約締結、配送など人間社会の活動をあらわす。人が何か行為を起こして発生する。
□実体と事象の関係
「1月1日に太郎さんという男性の顧客に斧という商品を10本売り上げた」という取引を実体と事象に分解すると
実体…顧客、商品
事象…売り上げた
□属性
実体と事象を修飾する付加情報を属性という。
・顧客の属性…太郎、男性
・商品の属性…斧
・売り上げたことの属性…1月1日、10本