쉽게풀어쓴 C 언어 Express 제 12 장문자와문자열 이번장에서학습할내용 문자표현방법 문자열표현방법 문자열이란무엇인가? 문자열의입출력 문자처리라이브러리함수 표준입출력라이브러리함수 인간은문자를사용하여정보를표현하므로문자열은프로그램에서중요한위치를차지하고있다. 이번장에서는 C 에서의문자열처리방법에대하여자세히살펴볼것이다. 문자의중요성 인간한테텍스트는대단히중요하다. 많은컴퓨터작업이텍스트를사용하여서이루어진다. 문자표현방법 컴퓨터에서는각각의문자에숫자코드를붙여서표시한다. 아스키코드 (ASCII code): 표준적인 8 비트문자코드 0 에서 127 까지의숫자를이용하여문자표현 유니코드 (unicode): 표준적인 16 비트문자코드 전세계의모든문자를일관되게표현하고다룰수있도록설계 65 69 71 74 78 C 에서문자는숫자로표현됩니다. 컴퓨터 사용자 1
문자열표현방법 문자열 (string): 문자들이여러개모인것 "A" "Hello World!" " 변수 score 의값은 %d 입니다 문자열변수 변경가능한문자열을저장할수있는변수 어디에저장하면좋은가? H 문자열상수 하나의문자는 char 형변수로저장 NULL 문자 NULL 문자 : 문자열의끝을나타낸다. S E O U 문자열은어디서종료되는지알수가없으므로표시를해주어야한다. seou, seoul, seoul#, seoul#%,...??? L 끝 \0 NULL 문자는문자열의끝을나타냅니다. 쓰레기값 H E L L o \0 s e o u l # %? & $ str[0] str[1] str[2] str[3] str[4] str[5] str[6] str[7] str[8] str[9] 문자열은 char 형배열로저장 // 문자상수 char code1 = 'A'; char code2 = 65; 문자변수와문자상수 printf("code1=%c, code1=%d\n", code1,code1); printf("code2=%c, code2=%d\n", code2,code2); code1=a, code1=65 code2=a, code2=65 문자변수 문자상수 65 // 아스키코드출력 unsigned char code; 아스키코드출력 32 : ( 공백 ) 부터 127 : 까지출력 for(code = 32; code < 128; code++) printf(" 아스키코드 %d 은 %c 입니다.\n", code, code); 아스키코드 32 은입니다. 아스키코드 33 은! 입니다.... 아스키코드 65 은 A 입니다. 아스키코드 66 은 B 입니다.... 아스키코드 97 은 a 입니다. 아스키코드 98 은 b 입니다.... 아스키코드 126 은 ~ 입니다. 아스키코드 127 은입니다. 2
int i; char str[4]; str[0] = 'a'; str[1] = 'b'; str[2] = 'c'; str[3] = '\0'; i = 0; while(str[i]!= '\0') printf("%c", str[i]); i++; 예제 #1 문자배열에들어있는문자들을하나씩출력하여보자. 문자배열에저장된문자열을출력할때는 %s 를사용하면되지만여기서는문자열처리의기본적인방법을실감하기위하여문자배열에들어있는문자들을하나씩화면에출력하다가 NULL 문자가나오면반복을종료하도록하였다. abc char str[4] = 'a', 'b', 'c', '\0' ; char str[4] = "abc ; char str[4] = "abcdef"; char str[6] = "abc"; char str[4] = ""; char str[] = "abc"; 문자배열의초기화 문자열의출력 예제 #2 char str[] = abc ; printf( %s, str); abc char str1[6] = "Seoul ; char str2[3] = 'i', 's, \0 ; char str3[] = "the capital city of Korea. ; Seoul is the capital city of Korea. char str[] = abc ; printf(str); printf("%s %s %s\n", str1, str2, str3); S e o u l \0 str1[0] str1[1] str1[2] str1[3] str1[4] str1[5] str1 i s \0 str2[0] str2[1] str2[2] str2 t h e... K o r e a \0 str3[ ] str3[ ] str3[ ] str3[ ].... str3[ ] str3[ ] str3[ ] str3[ ] str3[ ] str3[ ] str3 3
예제 #3 char src[] = "The worst things to eat before you sleep"; char dst[100]; int i; printf(" 원본문자열 =%s\n", src); for(i=0 ; src[i]!= NULL ; i++) NUL 문자가나올때까지반복하면서각각의문자들을새로운배열로복사한다. dst[i] = src[i]; dst[i] = NULL; printf(" 복사된문자열 =%s\n", dst); 문자열길이계산예제 // 문자열의길이를구하는프로그램 char str[30] = "C language is easy"; int i = 0; while(str[i]!= 0) i++; printf(" 문자열 \"%s\" 의길이는 %d 입니다.\n", str, i); 문자열 "C language is easy" 의길이는 18 입니다. 원본문자열 =The worst things to eat before you sleep 복사된문자열 =The worst things to eat before you sleep 문자배열을실행시간에변경 문자열상수 1. 문자배열의각각의원소를개별적으로변경 str[0] = 'W'; str[1] = 'o'; str[2] = 'r'; str[3] = 'l'; str[4] = 'd'; str[5] = '\0'; 실행도중에문자열을변경하는방법이죠 문자열상수 : HelloWorld 와같이프로그램소스안에포함된문자열 문자열상수는메모리영역중에서텍스트세그먼트 (text segment) 에저장 char *p = "HelloWorld"; 위문장의정확한의미는무엇일까요? 2. strcpy() 를사용하여문자열을문자배열에복사 strcpy(str, "World"); // 추후에학습 4
문자열상수 문자열상수 char *p = "HelloWorld"; char *p = "HelloWorld"; p[0] = A ; // 또는 strcpy(p, Goodbye ); p 를통하여텍스트세그먼트에문자를저장하려면오류가발생한다. 문자열상수 중간점검 char *p = "HelloWorld"; p = "Goodbye"; OK! C 에서문자열은어떻게정의되는가? 문자열에서 NULL 문자의역할은무엇인가? NULL 문자의아스키코드값은얼마인가? NULL 문자로끝나지않는문자열을출력하면어떻게되는가? 5
중간점검 B, 'B', "B" 의차이점을설명하라. 변경가능한문자열은어디에저장되는가? 문자열의크기보다문자배열의크기를하나더크게하는이유는무엇인가? 문자배열을문자열로초기화하는방법을아는대로설명하라. 문자입출력라이브러리 입출력함수 설명 int getchar(void) 하나의문자를읽어서반환한다. void putchar(int c) 변수 c에저장된문자를출력한다. int getch(void) 하나의문자를읽어서반환한다 ( 버퍼를사용하지않음 ). void putch(int c) 변수 c에저장된문자를출력한다 ( 버퍼를사용하지않음 ). scanf("%c", &c) 하나의문자를읽어서변수 c에저장한다. printf("%c", c); 변수 c에저장된문자를출력한다. A B C... 프로그램 getchar(), putchar() 버퍼링 // getchar() 의사용 int ch; // 정수형에주의 while( (ch = getchar())!= EOF ) putchar(ch); End Of File 을나타내는문자, EOF 는정수형이다. 엔터키를쳐야만입력을받는이유 모든문자는일단버퍼로간다. 엔터키 (\n) 가입력되면모두프로그램으로간다. char ch; A A B B q getchar() 출력 putchar() 출력 키보드 버퍼 ch = getchar();...... 프로그램 6
_getch(), _putch() _getch(), _getche(), getchar() #include <conio.h> int ch; while( (ch = _getch())!= 'q' ) _putch(ch); ABCDEFGH 버퍼를사용하지않는다, 에코도없음! getchar() 헤더파일버퍼사용여부에코여부응답성문자수정여부 <stdio.h> 사용함 ( 엔터키를눌러입력됨 ) _getch() <conio.h> 사용하지않음 에코줄단위가능 에코하지않음 문자단위 불가능 _getche() <conio.h> 사용하지않음에코문자단위불가능 용도에맞는것을골라사용하세요! 버퍼가없이바로받으려면 getch() 를사용합니다. 중간점검 문자열입출력라이브러리함수 getchar() 와 _getch() 가다른점은무엇인가? 하나의문자를입력받는방법에는몇가지나있는가? 입출력함수 설명 int scanf("%s", s) 문자열을읽어서문자배열 s[] 에저장 int printf("%s", s) 배열 s[] 에저장되어있는문자열을출력한다. char *gets(char *s) 한줄의문자열을읽어서문자배열 s[] 에저장한다. int puts(const char *s) 배열 s[] 에저장되어있는한줄의문자열을출력한다. Hello World!... 프로그램 7
gets() 와 puts() 문자열입출력 char *gets(char *buffer); int puts(const char *str); gets() 표준입력으로부터엔터키가나올때까지한줄의라인을입력 문자열에줄바꿈문자 ('\n') 는포함되지않으며대신에자동으로 NULL 문자 ('\0') 를추가한다. 입력받은문자열은 buffer 가가리키는주소에저장된다. gets() 와 puts() 문자열입출력 char *gets(char *buffer); int puts(const char *str); puts() str 이가리키는문자열을받아서화면에출력 NULL 문자 ('\0') 는줄바꿈문자 ('\n') 로변경 char *menu = " 파일열기 : open, 파일닫기 : close"; puts(str); 예제 중간점검 char name[100]; char address[100]; printf(" 이름을입력하시오 : "); gets(name); printf(" 현재거주하는주소를입력하시오 : "); gets(address); puts(name); puts(address); 한단어이상을입력받을때에사용한다. 한줄의텍스트를입력받는문장을작성하라. 사용자로부터하나의단어를입력받는문장을작성하라. 이름을입력하시오 : 홍길동현재거주하는주소를입력하시오 : 서울시종로구 100 번지홍길동서울시종로구 100 번지 8
문자처리라이브러리함수 문자를검사하거나문자를변환한다. 함수 설명 isalpha(c) c가영문자인가?(a-z, A-Z) isupper(c) c가대문자인가?(a-z) islower(c) c가소문자인가?(a-z) isdigit(c) c가숫자인가?(0-9) isalnum(c) c가영문자이나숫자인가?(a-z, A-Z, 0-9) isxdigit(c) c가 16진수의숫자인가?(0-9, A-F, a-f) isspace(c) c가공백문자인가?(, \n', '\t', '\v', '\r') ispunct(c) c가구두점문자인가? isprint(c) C가출력가능한문자인가? iscntrl(c) c가제어문자인가? isascii(c) c가아스키코드인가? 문자처리라이브러리함수 문자를검사하거나문자를변환한다. 함수 설명 toupper(c) c를대문자로바꾼다. tolower(c) c를소문자로바꾼다. toascii(c) c를아스키코드로바꾼다. #include <ctype.h> int c; while((c = getchar())!= EOF) if( islower(c) ) c = toupper(c); putchar(c); abcdef ABCDEF ^Z EOF 를키보드에서입력하려면 ^Z 예제 소문자인지검사 대문자로변환 #include <conio.h> #include <ctype.h> int c; 예제 while((c = getch())!= 'z') printf("------------------------\n"); printf("isdigit(%c) = %d\n", c, isdigit(c)); printf("isalpha(%c) = %d\n", c, isalpha(c)); printf("islower(%c) = %d\n", c, islower(c)); printf("ispunct(%c) = %d\n", c, ispunct(c)); printf("isxdigit(%c) = %d\n", c, isxdigit(c)); printf("isprint(%c) = %d\n", c, isprint(c)); printf("------------------------\n\n"); 숫자인지검사 알파벳인지검사 소문자인지검사 구두점문자인지검사 16 진수인지검사 출력가능한지검사 ------------------------ isdigit(') = 0 isalpha(') = 0 islower(') = 0 ispunct(') = 16 isxdigit(') = 0 isprint(') = 16 ------------------------... 9
중간점검 문자처리라이브러리함수를사용하려면포함시켜야하는헤더파일은무엇인가? getchar() 와 getch() 가다른점은무엇인가? ispunct('.') 의반환값은무엇인가? toupper('a') 의반환값은무엇인가? 문자열처리라이브러리 함수 설명 strlen(s) 문자열 s의길이를구한다. strcpy(s1, s2) s2를 s1에복사한다. strcat(s1, s2) s2를 s1의끝에붙여넣는다. strcmp(s1, s2) s1과 s2를비교한다. strncpy(s1, s2, n) s2의최대 n개의문자를 s1에복사한다. strncat(s1, s2, n) s2의최대 n개의문자를 s1의끝에붙여넣는다. strncmp(s1, s2, n) 최대 n개의문자까지 s1과 s2를비교한다. strchr(s, c) 문자열 s안에서문자 c를찾는다. strstr(s1, s2) 문자열 s1에서문자열 s2를찾는다. W o r l d H e l l o 문자열의길이 strlen( Hello ) 는 5 를반환 문자열길이 문자열복사 char dst[6]; char src[6] = Hello"; strcpy(dst, src); 문자열복사 src H e l l o \0 dst H e l l o \0 10
문자열연결 예제 문자열연결 char dst[12] = "Hello"; char src[6] = "World"; strcat(dst, src); // strcpy 와 strcat #include <string.h> char string[80]; dst H e l l o \0 src W o r l d \0 strcpy( string, "Hello world from " ); strcat( string, "strcpy " ); strcat( string, "and " ); strcat( string, "strcat!" ); printf( "string = %s\n", string ); string = Hello world from strcpy and strcat! 문자열비교 int strcmp( const char *s1, const char *s2 ); // strcmp() 함수 #include <string.h> 예제 반환값 s1과 s2의관계 <0 s1이 s2보다앞에있다. 0 s1이 s2와같다. >0 s1이 s2보다뒤에있다. char s1[80]; char s2[80]; int result; // 첫번째단어를저장할문자배열 // 두번째단어를저장할문자배열 문자열이같으면 strcmp() 는 0 을반환합니다. 주의하세요! printf(" 첫번째단어를입력하시오 :"); scanf("%s", s1); printf(" 두번째단어를입력하시오 :"); scanf("%s", s2); 11
예제 result = strcmp(s1, s2); if( result < 0 ) printf("%s 가 %s 보다앞에있읍니다.\n", s1, s2); else if( result == 0 ) printf("%s 가 %s 와같습니다.\n", s1, s2); else printf("%s 가 %s 보다뒤에있습니다.\n", s1, s2); 첫번째단어를입력하시오 :Hello 두번째단어를입력하시오 :World Hello 가 World 보다앞에있읍니다. 알파벳순으로즉사전에서앞에있다는의미 #include <string.h> char s[] = "language"; char c = 'g'; char *p; int loc; 문자검색 s 안에서문자 c 를찾는다. p = strchr(s, c); loc = (int)(p - s); if ( p!= NULL ) printf( " 첫번째 %c 가 %d 에서발견되었음 \n", c, loc ); else printf( "%c 가발견되지않았음 \n", c ); 첫번째 g 가 3 에서발견되었음 문자열검색 #include <string.h> char s[] = "A joy that's shared is a joy made double"; char sub[] = "joy"; char *p; s 안에서문자열 sub를찾는다. int loc; p = strstr(s, sub); loc = (int)(p - s); if ( p!= NULL ) printf( " 첫번째 %s가 %d에서발견되었음 \n", sub, loc ); else printf( "%s가발견되지않았음 \n", sub ); strtok() 형식 char *strtok( char *s, const char *delimit ); 설명 strtok 함수는문자열 s을토큰으로분리한다. 만약분리자가 일경우, 토큰을얻으려면다음과같이호출한다. t1 = strtok(s, " "); // 첫번째토큰 t2 = strtok(null, " "); // 두번째토큰 t3 = strtok(null, " "); // 세번째토큰 t4 = strtok(null, " "); // 네번째토큰 첫번째 joy 가 2 에서발견되었음 12
문자열토큰분리 중간점검 // strtok 함수의사용예 #include <string.h> char s[] = "Man is immortal, because he has a soul"; char seps[] = ",\t\n"; char *token; // 문자열을전달하고다음토큰을얻는다. token = strtok( s, seps ); while( token!= NULL ) // 문자열 s 에토큰이있는동안반복한다. printf( " 토큰 : %s\n", token ); // 다음토큰을얻는다. token = strtok( NULL, seps ); // 분리자 토큰 : Man 토큰 : is 토큰 : immortal 토큰 : because 토큰 : he 토큰 : has 토큰 : a 토큰 : soul 문자열 s1 를문자열 s2 로복사하는문장을써라. String" 을저장하려면최소한어떤크기이상의문자배열이필요한가? 문자열을서로비교하는함수는? strcpy() 와 strncpy() 의차이점은무엇인가? s1[] 에저장된문자열뒤에 s2[] 를붙이고싶으면어떤라이브러리함수를어떻게사용하여야하는가? strcmp("dog", "dog") 의반환값은얼마인가? 문자열수치변환 문자열 36.5 와수치값 36.5 는컴퓨터안에서상당히다르게저장된다. sprintf() 와 sscanf() 앞에붙은 s 는 string 을의미한다. sscanf(str, %f, &v); 3 6. 5 \0 36.5 src[0] src[1] src[2] src[3] src[4] src[5] 문자열 v 수치 3 6. 5 \0 src[0] src[1] src[2] src[3] src[4] src[5] 36.5 v 문자열 sprintf(str, %f, v); 수치 13
예제 예제 char s1[] = "100 200 300"; char s2[30]; int value; 100 100 sscanf(s1, "%d", &value); printf("%d\n", value); sprintf(s2, "%d", value); printf("%s\n", s2); 문자열에서값을추출한다. 문자열에값을출력한다. #include <string.h> char filename[100]; char s[100]; int i; for(i=0; i < 6; i++) strcpy(filename, "image"); sprintf(s, "%d", i); strcat(filename, s); strcat(filename, ".jpg"); printf("%s \n", filename); 순차적인파일이름을만든다. image0.jpg image1.jpg image2.jpg image3.jpg image4.jpg image5.jpg 문자열을수치로변환하는전용함수 전용함수는 scanf() 보다크기가작다. stdlib.h 에원형정의 - 반드시포함 함수 설명 int atoi( const char *str ); str 을 int 형으로변환한다. long atoi( const char *str ); str 을 long 형으로변환한다. double atof( const char *str ); str 을 double 형으로변환한다. #include <stdlib.h> char s1[] = "100"; char s2[] = "12.93"; char buffer[100]; int i; double d, result; 문자열수치변환 연산결과는 112.930000 입니다. 3 6. 5 \0 src[0] src[1] src[2] src[3] src[4] src[5] 문자열 36.5 v 수치 i = atoi(s1); d = atof(s2); result = i + d; sprintf(buffer, "%f", result); printf(" 연산결과는 %s 입니다.\n", buffer); 14
중간점검 실수값 3.141592 와문자열 3.141592 가차지하는메모리공간을비교하라. 문자열 3.141592 를실수값을변환하고자할때사용할수있는함수는어떤것들이있는가? printf() 와 sprintf() 가다른점은무엇인가? 문자열의배열 (Q) 문자열이여러개있는경우에는어떤구조를사용하여저장하면제일좋을까? ( 예 ) init, open, close, (A) 여러개의문자배열을각각만들어도되지만문자열의배열을만드는것이여러모로간편하다. char s[3][6] = "init", "open", "close" ; 열 i n i t \0 s[0][0] s[0][1] s[0][2] s[0][3] s[0][4] s[0][5] o p e n \0 s[1][0] s[1][1] s[1][2] s[1][3] s[1][4] s[1][5] 행 c l o s e \0 s[2][0] s[2][1] s[2][2] s[2][3] s[2][4] s[2][5] 2 차원배열로입력 앞에 & 을붙이면안됨! int i; char fruits[3][20]; for(i = 0; i < 3; i++) printf(" 과일이름을입력하시오 : ", fruits[i]); scanf("%s", fruits[i]); for(i = 0; i < 3; i++) printf("%d번째과일 : %s\n", i, fruits[i]); #include <ctype.h> int count_word(const char *s); 단어카운팅 printf("%d\n", count_word("the c book...")); 과일이름을입력하시오 : 사과과일이름을입력하시오 : 배과일이름을입력하시오 : 포도 0번째과일 : 사과 1번째과일 : 배 2번째과일 : 포도 15
단어카운팅 #define ENTRIES 5 한영사전구현 int count_word ( const char * s ) int i, wc = 0, waiting = 1; for( i = 0; s[i]!= NULL; ++i) // s의각글자조사 if( isalpha(s[i]) ) // s의글자가알파벳이면 if( waiting ) // 워드를기다리고있으면 wc++; // 카운터를증가 waiting = 0; // 워드를처리하는중 else return wc; // 알파벳이아니면 waiting = 1; // 워드를기다린다. 3 int i, index; char dic[entries][2][30] = "book", " 책 ", "boy", " 소년 ", "computer", " 컴퓨터 ", "lanuguage", " 언어 ", "rain", " 비 ", ; char word[30]; 한영사전구현 중간점검 printf(" 단어를입력하시오 :"); scanf("%s", word); index = 0; for(i = 0; i < ENTRIES; i++) if( strcmp(dic[index][0], word) == 0 ) printf("%s: %s\n", word, dic[index][1]); index++; printf(" 사전에서발견되지않았습니다.\n"); C", "JAVA", "C++", "BASIC" 등을저장하는문장을작성하라. 2 차원문자배열 s 에저장된 0 번째문자열을 printf() 를이용하여화면에출력하는문장을작성하라. 단어를입력하시오 :book book: 책 16
실습 : 메시지암호화 실행결과 메시지를암호화하는간단한기법중의하나는줄리어스시저가사용한암호화기법 평문에단순히더하기 ( 즉, 영어의알파벳을왼쪽으로이동하던지오른쪽으로이동하는것 ) 문자열을입력하시오 : meet at midnight 암호화된문자열 : phhw dw plgqjkw void encrypt(char cipher[], int shift); 실습코드 void encrypt (char cipher[], int shift) int i = 0; while (cipher[i]!= '\0') 실습코드 아스키코드값을이동한다. int main (void) char cipher[50]; int shift=3; printf(" 문자열을입력하시오 : "); gets(cipher); // 한줄전체입력 encrypt (cipher, shift); if( cipher[i] >= a' && cipher[i] <= 'z') cipher[i] += shift; if( cipher[i] > 'z' ) cipher[i] -= 26; i++; printf(" 암호화된문자열 : %s", cipher); 17
도전문제 실습 : 행맨게임 복호화하는함수 decrypt() 도작성하여테스트하라. 메뉴를만들어서사용자로하여금암호화와복호화중에서선택하게하라. 1 암호화 2 복호화 빈칸으로구성된문자열이주어지고사용자는문자열에들어갈글자들을하나씩추측해서맞추는게임 사용자가문자열에들어있는글자를정확하게입력했으면화면에그글자를출력한다. 일정한횟수만시도할수있게하라. 실행결과 문자열을입력하시오 : 글자를추측하시오 : a 문자열을입력하시오 : a 글자를추측하시오 : e 문자열을입력하시오 : _ee_ a... 소스 int check(char s[], char a[], char ch); int main (void) char solution[100] = "meet at midnight" char answer[100] = " " char ch; while(1) printf(" 문자열을입력하시오 : %s \n", answer); printf(" 글자를추측하시오 : "); ch = getchar(); if( check(solution, answer, ch) == 1 ) break; fflush(stdin); // 줄바꿈문자제거 18
소스 int check(char s[], char a[], char ch) int i; for(i=0; s[i]!= NULL; i++) if( s[i] == ch ) a[i] = ch; if( strcmp(s, a)==0 ) return 1; // 정답과일치하는지를검사 else 도전문제 "meet at midnight" 에서 을자동으로생성할수있는가? 여러개의단어들이들어있는 2 차원배열을생성하여서랜덤하게하나의정답을고르도록프로그램을업그레이드하라. 일정한횟수만시도할수있게하라. Q & A 19