04 상수와 자료형
자료형과 상수
-
자료형
자료형은 데이터를 표현하는 기준이고, 변수와 상수는 이 자료형에 근거하여 선언된다.
변수를 선언하기에 앞서 자료형을 결정하는 방법
-
어떤 정보를 저장할지 정보의 타입을 결정
EX) 정수를, 문자열을, 실수를 저장 -
어느 정도의 크기를 저장할 것인지 적절한 크기를 결정
EX) (정수) 4바이트 정도, (문자열) 20바이트 길이 정도
예를 들어, 정수를 저장할 것이고, 크기는 4바이트 정도로 할께요 -> int
다음은 자료형의 저장 가능한 타입과 크기, 표현 범위를 나타낸 표이다.
이토록 다양한 자료형을 제공하는 이유는?
-
데이터의 표현 방식이 정수와 실수로 나뉘므로 최소 두 개의 종류가 보장되어야 한다.
-
메모리 공간의 효율적인 사용을 위해 같은 데이터 방식(정수 혹은 실수)이더라도, 다양한 크기로 제공되어야 한다.
sizeof 연산자를 이용한 자료형의 크기 확인
다른 자료형에도 마찬가지로 똑같이 적용되고, 10번 라인의 경우처럼 변수의 이름이 전달될 경우 해당 변수의 전체 크기를 계산한 결과를 반환한다. 즉, 배열의 경우 자료형 x 배열의 개수를 구하고, 반환한다는 의미.
-
정수 표현에서의 일반적인 자료형의 선택
short, char 형으로 선언한 변수를 이용하여 계산을 하였는데도 불구하고(10라인) 덧셈을 한 결과가(11라인) 1바이트, 2바이트가 아닌 4바이트 형태로 계산되었다.
-> CPU가 정수 연산을 할 때 가장 적합한 크기의 정수 자료형을 int 로 정의하였고, 그로 인해 다른 자료형의 연산 속도보다 같거나 빠르기 때문에 int 형 연산으로 변환하면서까지 연산을 진행한다.
-> 연산의 속도는 int형이 효율적이고 빠르지만, 데이터의 크기를 중요시하는 곳에서는 char, short를 사용하는 것이 중요하다.
-
실수 표현에서의 일반적인 자료형의 선택
실수에서 중요한 요소는 ‘정밀도’이다. 실수에서는 부동 소수점 오차가 발생하기 때문에 정확하게 값을 표현해낼 수 있는 소수점 이하의 자릿수가 존재하는데 이것이 바로 ‘정밀도’ 이다.
다음은 실수 자료형에서 정밀도를 나타내는 표이다.
실수 자료형에서는 double이 int와 같은 역할로 선택되어진다.
Double과 float 자료형 변수를 선언한 후, 값을 각각 입력 받고 출력하는 예제인데 float와 double 자료형의 출력 시 서식 문자는 같음을 알 수 있지만 입력 시 서식 문자는 다름을 확인할 수 있다.
-
문자의 표현 방식
문자를 표현할 때는 아스키(ASCII) 코드를 이용한다. 즉, 정수 값과 문자를 매칭하여 내부적으로는 정수로 연산하지만 이를 표현할 때에는 해당 정수 값에 맵핑 되어 있는 문자를 출력 및 표현을 한다.
8번 라인을 봤을 때 문자는 작은 따옴표( ‘ )로 감싸져 표현이 되고, 이 때 ch 변수에 값이 저장될 때에는 ‘a’라는 문자 형태의 값이 들어가는 것이 아니라 ‘a’의 아스키 코드 맵핑 값이 저장됨을 10번 라인을 통해 알 수 있다.
-
unsigned 0과 양의 정수 표현
- 정수 자료형의 이름 앞에만 unsigned를 붙일 수 있다.
- Unsigned 키워드가 붙을 시에는 부호 비트(MSB) 도 데이터를 표현하는데 사용이 된다. (부호가 사라짐)
- 표현할 수 있는 값이 0 이상의 범위로 두 배가 된다. -
상수
상수는 이 자료형에 근거하여 선언되며, 리터럴(literal) 상수와 심볼릭(symbolic) 상수로 나뉘어진다. 자료형에 근거 되어 선언되는 이유는 CPU의 연산 대상이 되려면 메모리 상에 적재되어 CPU가 접근할 수 있는 주소를 할당 받아야 하기 때문이다. -> 모든 상수는 메모리에 할당된다.
먼저 이름을 지니지 않는 리터럴 상수이다.
위와 같은 예가 리터럴 상수의 예이다. 8번 라인에서는 10과 20이 int형, 10.1과 20.2는 double형으로 메모리에 적재된다.
앞서 일반적으로 연산 효율이 좋고, 넓은 정밀도로 인해 선택되어 지는 int형과 double형으로 상수의 자료형이 될 수 있고 자료형이 결정되는 요인은 대입 연산자 왼편의 자료형에 따른 것이 아니라 상수 자체의 종류에 따라서 결정되는 것이다.
두 자료형 이외의 값을 이용하여 자료형을 할당하기 위해서는 형 변환 혹은 접미사를 이용한다. 다음은 접미사를 활용하여 상수 자료형을 할당하는 예이다.
다음은 이름을 지니는 심볼릭 상수이다.
심볼릭 상수는 이름이 존재하는 상수이기 때문에 상수가 존재하는 해당 라인을 넘기더라도, 재 사용이 가능하며 이름을 활용하여 대입 연산자를 통해서 값의 변경을 방지하여 값을 변경하면 에러가 발생하도록 하는 특징을 지니고 있다.
심볼릭 상수 선언의 첫 번째 방법은 const 키워드를 이용한 변수의 상수화다.
위와 같이 const 키워드를 이용하여 변수를 상수화 하게 될 경우에는 선언과 동시에 초기화를 해야 하고, 이름을 통한(혹은 그 외의 어떤 방법으로도) 값의 변경은 금지된다.
두 번째 방법은 매크로를 이용한 방법이다.
-
자료형의 변환
자료형에서 가장 중요한 것은 모든 연산은 완벽하게 같은 자료형끼리 연산이 가능하다는 점이다. 특히 대입 연산 시에도 대입 연산자를 기준으로 왼편(l-value)과 오른편(r-value)의 형(type)이 일치해야 한다. 다른 연산자의 경우에도 마찬가지이다. 자료형이 다름에도 불구하고 오류 없이 연산이 가능한 이유는 자료형의 형 변환(자동, 묵시적)이 이루어졌기 때문이다.
자동 형 변환(묵시적 형 변환)
먼저, 대입 연산 시 값을 전달하는 과정에서 자동으로 발생하는 형의 변환이 존재한다.
10번 라인에서 실수형 변수에 정수형 값을 넣었고, 11번 라인에서 정수형 변수에 실수형 값을 넣었다. 다음은 이에 대한 출력 결과이다.
결과에서 알 수 있듯이 11번 라인에서의 대입은 0.14에 해당하는 값이 모두 손실되었다. 정수형 자료형은 실수를 표현할 수 없기 때문이다.
또한, 바이트 크기가 큰 변수를 바이트 크기가 작은 변수로 형 변환하는 경우에는 상위 바이트의 손실로 인해 부호가 변경되거나, 값이 훼손될 수 있다.
다음은 정수의 승격에 의한 자동 형 변환이다.
정수형 연산에서 일반적인 자료형의 선택 시 int형으로 변환되어 연산이 진행되기 때문에 short나 char 등의 자료형으로 연산을 진행하더라도 int 형으로 변환 되어 연산이 진행된 후 다시 원래 자료형으로 다시 변환이 이루어 진다.
다음은 연산 시 피연산자의 자료형 불일치로 발생하는 자동 형 변환이다.
이와 같은 경우에서 double <- int + double의 형태인데 연산을 진행함에 있어서 두 피연산자의 자료형이 서로 다를 때에는 자료형을 통일시켜주어야 하는데 이 경우에 강제적으로 형 변환을 하지 않는 이상 피연산자의 자동 형 변환이 발생한다.
이 때, 어느 자료형을 어떤 자료형으로 변환시켜줄 것인지를 정해야 한다. 변환할 자료형, 변환될 자료형의 선택은 다음과 같은 규칙으로 진행하면 된다.
데이터의 손실을 최소화하는 방향으로 자료형을 선택
int형과 double형이 피연산자로 오는 경우에는 int형을 double형으로 변경하는 것이 데이터의 손실이 최소화하는 방향이다.
그리고 다음은 최소화하는 방향의 우선 순위를 나타낸 것이다.
우선 순위의 기준은 단순히 바이트 크기가 아니라, 정수와 실수 즉 ‘소수부의 손실’을 고려한 순위 기준이다. long long형과 float형을 보면 알 수 있다.
강제 형 변환(명시적 형 변환)
명시적인 형 변환은 형 변환 연산자를 이용하여 강제로 자료형을 변환하는 방법이다.
위와 같은 예에서 num1과 num2의 자료형은 서로 같기 때문에 정수형으로써 나눗셈이 진행되므로 결과 값은 0이 되고 대입 시 일어나는 자동 형 변환으로 인해 실수형 0이 num에 저장된다. 이러한 경우에 강제 형 변환을 이용하게 되면 다음과 같다.
위와 같이 num1을 강제로 double형으로 형 변환시키면 피연산자 불일치와 연산자 변환 우선 순위에 의거하여 num2 또한 double형으로 자동 형 변환이 이루어져 실수 연산이 이루어지고 그 값이 그대로 num으로 대입된다.
즉, 강제 형 변환 연산은 다음과 같은 형태로 이루어진다.
(자료형) 형 변환할 변수 혹은 상수