しやすいデータ分析

Accessで作成されたデータベースからデータを引張り出しエクセルでデータ分析を行っているのですが、半角、全角が入り乱れていたり、数字が文字と認識されてしまったりと四苦八苦しています。

以前書かせていただいたブログ記事、神エクセルで、エクセルを方眼紙のように利用し、紙での見た目の体裁を整えたエクセルは、データ分析がしづらくDXの妨げになっている事を書かせていただきました。

その後も色々と調べていると、2020年に12月に総務省からエクセルの使い方についてルールが出ていたようです。

統計表における機械判読可能なデータの表記方法の統一ルールの策定

総務省では、各府省が政府統計の総合窓口(e-Stat)に掲載する統計表における機械判読可能なデータの表記方法の統一ルールを策定いたしましたので、お知らせいたします。

総務省HPより

という事で、政府が使うシステムに使用する二次利用を前提としたエクセルのルールなのでが、我々中小企業の会社内でも活用できるルールとなっていました。

  • 1セル1データとなっているか
  • 数値データは数値属性とし、⽂字列を含まないこと
  • セルの結合をしていないか
  • スペースや改⾏等で体裁を整えていないか
  • 項⽬名等を省略していないか
  • 数式を使⽤している場合は、数値データに修正しているか
  • オブジェクトを使⽤していないか
  • データの単位を記載しているか
  • 機種依存⽂字を使⽤していないか
  • データが分断されていないか
  • 1シートに複数の表が掲載されていないか

そこには悪い使用例と良い使用例が記載されて非常に分かりやすくなっています。こちらからPDFが見れます。

会社でも上記の事を守るだけで綺麗なエクセルデータとなり、データを加工する作業などの二次利用が非常に利用しやすいデータとなります。一つ一つはさほど難しくないのですが、ちょっと気を抜くとやってしまいがちな項目もあります。

今後のビッグデータ社会において、社内でもデータの利用が増えてきます。二次利用しやすいデータ作りが重要となってきましので、最低でも上記はマスターできるよう社内のエクセルリテラシーを上げていければと思います。

関連記事一覧