データの話 基礎編第2回 1


20140218

プログラミングとは「データとその処理」に過ぎません。もちろん極論です。この基本編では、私の独断と偏見により、理解する上で不要と思われる部分はバッサリと切り捨てます。情報処理試験などに必要な知識は、各人が参考書等で学んでください。

第1回でプログラミングの概念を次のように図式化しました。

【入力】→【処理】→【出力】

入力も出力もデータですから、さらに単純化すると次のようになります。

【データ】⇔【処理】

つまり、プログラミングとは「ひたすらデータを処理していく作業」と考えることができます。したがって、「データとは何か」をしっかり理解することが大切です。

データとは何か

まずデータとは何かを定義しておきます。

data: Factual information such as text, numbers, sounds, and images, in form that can be processed by a computer. Although data is the plural of the Latin word datum, data is commonly used to represent both singular and plural.

”data.” Que's Comuputer & internet Dictionary, 6th Edition, 1995

あまり良い定義が見当たらなかったため、日本語での定義の引用は省略します。ここでは単純化して、「コンピューターで処理されるものすべてがデータである」と定義しておきます。

NOTE:ITでの英訳の際、データの複数形単数形「datum」を使用する場合に注意が必要になります。絶対ではありませんが、多くの場合複数でも「data」を使用します(MS社など)。

データ型

「Wordマクロ その3 – 変数と定数の話」の記事でWordマクロ(VBA)に使用されるデータ型について説明しましたが、ここではもう少し一般的な話をしたいと思います。

プログラム言語には、データ型の宣言(declaration)が必要なものがあります。宣言をすることによって、そのデータが使用するメモリサイズを確保します。Wordマクロ、秀丸マクロ、C/C++、Javaといった言語はデータ型を明示的に宣言する必要があり、型の異なるデータ同士で演算を行うとエラーになります。データの型を間違って宣言したり、型違いの演算を行ったり、初心者にはありがちなエラーです。

たとえば、「5+5」。もちろん、普通はどちらも数字であり、答が「10」になります。しかし、コンピューターはこの「5」が文字か数値かを区別できないため、明確に指定しなければなりません。もしどちらも文字であった場合、結果は「55」になりますし、別々の型であった場合はエラーになります。

使用できるデータ型はプログラム言語によって異なりますが、大体次のようなものがあります。

  • 文字型(文字列型)
  • 数値型
  • ブール型(ブーリアン型)
  • 日付型
  • 配列型
  • その他…

さらに細かく分かれますが、現時点で覚える必要はありません。型というものがあるということだけを覚えておいてください。また、Perl言語のようにデータ型を宣言する必要がない言語もあります。これはプログラムの実行時に実際のデータの値に基づいて決められます(動的型付け)。詳細は、プログラム言語を説明する際に触れたいと思います。

今回は、データについて軽く話しました。なんだかんだ言ってますが、ここで覚えて欲しいのは「コンピューターで処理されるものすべてがデータである」「データには型がある」の2つだけです。記憶するのではなく、感覚として覚えておいてください。

データの中でも、文字型が私たちに最も関連があります。次回は文字(特に文字コード)について説明します。いよいよ実用的な話に入ります。

 

ご意見ご感想をお待ちしております。

訂正:「datum」を複数形としていましたが、単数形の誤りです。

 

 


コメントしてみる

One thought on “データの話 基礎編第2回