제 12 장문자와문자열 유준범 (JUNBEOM YOO) Ver. 2.0 jbyoo@konkuk.ac.kr http://dslab.konkuk.ac.kr 본강의자료는생능출판사의 PPT 강의자료 를기반으로제작되었습니다.
이번장에서학습할내용 문자표현방법 문자열표현방법 문자열이란무엇인가? 문자열의입출력 문자처리라이브러리함수 표준입출력라이브러리함수 인간은문자를사용하여정보를표현하므로문자열은프로그램에서중요한위치를차지하고있다. 이번장에서는 C 에서의문자열처리방법에대하여자세히살펴볼것입니다. 2
문자표현방법 컴퓨터에서는각각의문자에숫자코드를붙여서표시한다. 아스키코드 (ASCII code): 표준적인 8비트문자코드 0에서 127까지의숫자를이용하여문자표현 유니코드 (unicode): 표준적인 16비트문자코드 전세계의모든문자를일관되게표현하고다룰수있도록설계 65 69 71 74 78 C 에서문자는숫자로표현됩니다. 3
문자변수와문자상수 문자변수 문자상수 // 문자상수 #include <stdio.h> int main(void) char code1 = 'A'; char code2 = 65; printf("code1=%c, code1=%d\n", code1,code1); printf("code2=%c, code2=%d\n", code2,code2); return 0; code1=a, code1=65 code2=a, code2=65 4
// 아스키코드출력 #include <stdio.h> int main(void) unsigned char code; 아스키코드출력 for(code = 32; code < 128; code++) printf(" 아스키코드 %d은 %c입니다.\n", code, code); return 0; 아스키코드 32은입니다. 아스키코드 33은! 입니다.... 아스키코드 65은 A입니다. 아스키코드 66은 B입니다.... 아스키코드 97은 a입니다. 아스키코드 98은 b입니다.... 아스키코드 126은 ~ 입니다. 아스키코드 127은 입니다. 5
문자열표현방법 문자열 (string): 문자들이여러개모인것 "A" "Hello World!" " 변수 score의값은 %d입니다 문자열상수 "Hello World" "Hong" "string!#$" "guest123" "ascii code = %d 문자열변수 char 형배열 6
NULL 문자 NULL 문자는문자열의끝을나타냅니다.. 끝 NULL 문자 : 문자열의끝을나타낸다. S E O U L \0 \0 문자열은어디서종료되는지알수가없으므로표시를해주어야한다. Seou, Seoul, Seoul#, Seoul#%,...??? 쓰레기값 S str[0] e o u l # %? & $ str[1] str[2] str[3] str[4] str[5] str[6] str[7] str[8] str[9] 7
문자배열의초기화 1. 문자배열원소들을중괄호안에넣어주는방법 char str[6] = 'H', 'e', 'l', 'l', 'o', '\0' ; 2. 문자열상수를사용하여초기화하는방법 char str[6] = "Hello"; 3. 만약배열을크기를지정하지않으면컴파일러가자동으로배열의크기를초기화값에맞추어설정 char str[] = "C Bible"; // 배열의크기는 7 이된다. 8
문자배열에문자를저장 1. 각각의문자배열원소에원하는문자를개별적으로대입하는방법이다. str[0] = 'W'; str[1] = 'o'; str[2] = 'r'; str[3] = 'l'; str[4] = 'd'; str[5] = '\0'; 2. strcpy() 를사용하여문자열을문자배열에복사 strcpy(str, "World"); 9
예제 #1 #include <stdio.h> int main(void) char str1[6] = "Seoul" char str2[3] = 'i', 's' ; char str3[] = "the capital city of Korea." printf("%s %s %s\n", str1, str2, str3); Seoul is the capital city of Korea. 10
예제 #2 #include <stdio.h> int main(void) char str[] = "komputer"; int i; for(i=0;i<8;i++) printf("%c ", str[i]); str[0] = 'c'; printf("\n"); for(i=0;i<8;i++) printf("%c ", str[i]); return 0 komputer computer 11
문자열역순예제 #include <stdio.h> int main(void) char src[] = "Seoul"; char dst[6]; int i; printf(" 원래문자열 =%s\n", src); i = 0; while(src[i]!= '\0') dst[i] = src[4 - i]; i++; dst[i] = '\0'; printf(" 역순문자열 =%s\n", dst); return 0; 원래문자열 =Seoul 역순문자열 =luoes 12
문자열길이계산예제 // 문자열의길이를구하는프로그램 #include <stdio.h> int main(void) char str[30] = "C language is easy"; int i= 0; while(str[i]!= 0) i++; printf(" 문자열 \"%s\" 의길이는 %d 입니다.\n", str, i); return 0; 문자열 "C language is easy" 의길이는 18 입니다. 13
문자입출력라이브러리 입출력함수 설명 int getchar(void) 하나의문자를읽어서반환한다. void putchar(int c) 변수 c에저장된문자를출력한다. int getch(void) 하나의문자를읽어서반환한다 ( 버퍼를사용하지않음 ). void putch(int c) 변수 c에저장된문자를출력한다 ( 버퍼를사용하지않음 ). scanf("%c", &c) 하나의문자를읽어서변수 c에저장한다. printf("%c", c); 변수 c에저장된문자를출력한다. 14
getchar(), putchar() // getchar() 의사용 #include <stdio.h> int main(void) int ch; // 정수형에주의 while(1) ch = getchar(); // 문자를입력받는다. if( ch == 'q' ) break; putchar(ch); return 0; A A B B q 15
getch(), putch() // getch() 의사용 #include <conio.h> int main(void) int ch; // 정수형에주의 버퍼를사용하지않는다 while(1) ch = getch(); // 문자를입력받는다. if( ch == 'q' ) break; putch(ch); return 0; ABCDEFGH 16
getch(), getche(), getchar() getchar() 헤더파일버퍼사용여부에코여부응답성문자수정여부 <stdio.h> 사용함 ( 엔터키를눌러입력됨 ) 에코줄단위가능 getch() <conio.h> 사용하지않음 에코하지않음 문자단위 불가능 getche() <conio.h> 사용하지않음 에코 문자단위 불가능 용도에맞는것을골라사용하세요! 버퍼가없이바로받으려면 getch() 를사용합니다. 17
문자열입출력라이브러리함수 입출력함수 설명 int scanf("%s", s) 문자열을읽어서문자배열 s[] 에저장 int printf("%s", s) 배열 s[] 에저장되어있는문자열을출력한다. char *gets(char *s) 한줄의문자열을읽어서문자배열 s[] 에저장한다. int puts(const char *s) 배열 s[] 에저장되어있는한줄의문자열을출력한다. Hello World!... 프로그램 18
scanf(), printf() 문자열입출력 scanf() 의사용법 char str[10]; scanf("%s", str); scanf() 는한번에두개이상의문자열도받아들일수있다. char s1[10]; char s2[10]; char s3[10]; scanf("%s%s%s", s1,s2,s3); // 사용자가 one two three와같이입력하면 s1에는 one이, s2에는 two가, s3에는 three가할당된다. 19
gets() 와 puts() 문자열입출력 gets() 표준입력으로부터엔터키가나올때까지한줄의라인을입력 문자열에줄바꿈문자 ('\n') 는포함되지않으며대신에자동으로 NULL 문자 ('\0') 를추가한다. 입력받은문자열은 buffer가가리키는주소에저장된다. char *gets(char *buffer); int puts(const char *str); puts() str이가리키는문자열을받아서화면에출력 NULL 문자 ('\0') 는줄바꿈문자 ('\n') 로변경 char *menu = " 파일열기 : open, 파일닫기 : close"; puts(" 메뉴에서하나를선택하시오."); puts(str); 20
예제 #include <stdio.h> int main( void ) char buffer[21]; // 20 개의문자와 '\0' 을저장할수있다. printf(" 문자열을입력하시오.\n"); gets( buffer ); printf(" 입력된라인은다음과같습니다.\n"); puts(buffer); return 0; 문자열을입력하시오. Hello! 입력된라인은다음과같습니다. Hello! 21
문자처리라이브러리함수 문자를검사하거나문자를변환한다. 함수 설명 isalpha(c) c가영문자인가?(a-z, A-Z) isupper(c) c가대문자인가?(a-z) islower(c) c가소문자인가?(a-z) isdigit(c) c가숫자인가?(0-9) isalnum(c) c가영문자이나숫자인가?(a-z, A-Z, 0-9) isxdigit(c) c가 16진수의숫자인가?(0-9, A-F, a-f) isspace(c) c가공백문자인가?(, \n', '\t', '\v', '\r') ispunct(c) c가구두점문자인가? isprint(c) C가출력가능한문자인가? iscntrl(c) c가제어문자인가? 함수 isascii(c) c설명가아스키코드인가? toupper(c) c를대문자로바꾼다. tolower(c) c를소문자로바꾼다. toascii(c) c를아스키코드로 Konkuk 바꾼다 University. 22
예제 #include <stdio.h> #include <ctype.h> int main( void ) int c; 소문자인지검사대문자로변환 while((c = getchar())!= EOF) if( islower(c) ) c = toupper(c); putchar(c); return 0; abcdef ABCDEF ^Z 23
예제 #include <stdio.h> #include <conio.h> #include <ctype.h> int main( void ) int c; while((c = getch())!= 'z') printf("------------------------\n"); printf("isdigit(%c) = %d\n", c, isdigit(c)); printf("isalpha(%c) = %d\n", c, isalpha(c)); printf("islower(%c) = %d\n", c, islower(c)); printf("ispunct(%c) = %d\n", c, ispunct(c)); printf("isxdigit(%c) = %d\n", c, isxdigit(c)); printf("isprint(%c) = %d\n", c, isprint(c)); printf("------------------------\n\n"); ------------------------ isdigit(') = 0 isalpha(') = 0 islower(') = 0 ispunct(') = 16 isxdigit(') = 0 isprint(') = 16 ------------------------... return 0; 24
문자열처리라이브러리 함수 설명 strlen(s) 문자열 s의길이를구한다. strcpy(s1, s2) s2를 s1에복사한다. strcat(s1, s2) s2를 s1의끝에붙여넣는다. strcmp(s1, s2) s1과 s2를비교한다. strncpy(s1, s2, n) s2의최대 n개의문자를 s1에복사한다. strncat(s1, s2, n) s2의최대 n개의문자를 s1의끝에붙여넣는다. strncmp(s1, s2, n) 최대 n개의문자까지 s1과 s2를비교한다. strchr(s, c) 문자열 s안에서문자 c를찾는다. strstr(s1, s2) 문자열 s1에서문자열 s2를찾는다. H e l l o W o r l d 25
문자열길이, 복사 문자열의길이 strlen( Hello ) 는 5를반환 문자열복사 char dst[6]; char src[6] = Hello"; strcpy(dst, src); 26
문자열연결 문자열연결 char dst[12] = "Hello"; char src[6] = "World"; strcat(dst, src); 27
예제 // strcpy 와 strcat #include <string.h> #include <stdio.h> int main( void ) char string[80]; strcpy( string, "Hello world from " ); strcat( string, "strcpy " ); strcat( string, "and " ); strcat( string, "strcat!" ); printf( "string = %s\n", string); return 0; string = Hello world from strcpy and strcat! 28
문자열비교 int strcmp( const char *s1, const char *s2 ); 반환값 s1과 s2의관계 <0 s1이s2보다작다 0 s1이 s2와같다. >0 s1이s2보다크다. 29
// strcmp() 함수 #include <string.h> #include <stdio.h> int main( void ) char s1[80]; char s2[80]; int result; 예제 // 첫번째단어를저장할문자배열 // 두번째단어를저장할문자배열 printf(" 첫번째단어를입력하시오 :"); scanf("%s", s1); printf(" 두번째단어를입력하시오 :"); scanf("%s", s2); result = strcmp(s1, s2); if( result < 0 ) printf("%s 가 %s 보다앞에있읍니다.\n", s1, s2); else if( result == 0 ) printf("%s 가 %s 와같습니다.\n", s1, s2); else printf("%s 가 %s 보다뒤에있습니다.\n", s1, s2); return 0; 첫번째단어를입력하시오 :Hello 두번째단어를입력하시오 :World Hello가 World보다앞에있읍니다. 30
문자검색, 문자열검색 문자열에서문자검색 char s[] = "language"; // 문자열 char c = 'g'; // 찾고자하는문자 char *p; // 문자포인터 p=strchr(s,c); // str 에서 c 를찾는다. 문자열에서문자열검색 char s[] = "A joy that's shared is a joy made double"; // 입력문자열 char sub[] = "joy"; // 찾으려고하는문자열 char *p; // 문자검색위치저장포인터 p = strstr(s, sub); // s 에서 sub 를찾는다. 31
문자열토큰분리 // strtok 함수의사용예 #include <string.h> #include <stdio.h> char s[] = "Man is immortal, because he has a soul"; char seps[] = ",\t\n"; char *token; int main( void ) // 문자열을전달하고다음토큰을얻는다. token = strtok( s, seps ); 토큰 :Man 토큰 :is 토큰 : immortal 토큰 :because 토큰 :he 토큰 :has 토큰 :a 토큰 :soul while( token!= NULL ) printf( " 토큰 : %s\n", token ); // 문자열 s 에토큰이있는동안반복한다. token = strtok( NULL, seps ); // 다음토큰을얻는다. 32
문자열수치변환 문자열과수치 문자열 수치 scanf() 함수는문자열을수치로변환한다. 33
문자열을수치로변환하는전용함수 전용함수는 scanf() 보다크기가작다. stdlib.h에원형정의- 반드시포함 함수 설명 int atoi( const char *str ); str 을 int 형으로변환한다. long atoi( const char *str ); str 을 long 형으로변환한다. double atof( const char *str ); str 을 double 형으로변환한다. 34
문자열토큰분리 // atoi() 함수 #include <stdio.h> #include <stdlib.h> int main( void ) char s[30]; char t[] = "36.5"; int i; double v; printf(" 정수를입력하시오 :"); gets(s); i = atoi(s); printf(" 입력된정수 : %d \n", i); v = atof(t); printf(" 변환된실수 : %f", v); return 0; 정수를입력하시오 :89 입력된정수 :89 변환된실수 : 36.500000 35
함수 설명 sscanf(), sprintf() sscanf(s,...) 문자열 s 로부터지정된형식으로수치를읽어서변수에저장한다. sprintf(s,...) 변수의값을형식지정자에따라문자열형태로문자배열 s 에저장한다. int main( void ) char s1[] = "100"; char s2[] = "12.93"; char buffer[100]; int i; double d; double result; sscanf(s1, "%d", &i); sscanf(s2, "%lf", &d); result = i + d; sprintf(buffer, "%f", result); printf(" 연산결과는 %s 입니다.\n", buffer); return 0; 연산결과는 112.930000 입니다. 36
문자열의배열 (Q) 문자열이여러개있는경우에는어떤구조를사용하여저장하면제일좋을까? (A) 여러개의문자배열을각각만들어도되지만문자열의배열을만드는것이여러모로간편하다. 문자열이문자배열에저장되므로문자열의배열은배열의배열, 즉 2 차원문자배열이된다. char s[3][6] = "init", "open", "close" ; 37
메뉴디스플레이 #include <stdio.h> int main( void ) int i; char menu[5][10] = "init", "open", "close", "read", "write" ; for(i = 0; i < 5; i++) printf("%d 번째메뉴 : %s \n", i, menu[i]); return 0; 0 번째메뉴 :init 1 번째메뉴 :open 2 번째메뉴 :close 3 번째메뉴 :read 4 번째메뉴 :write 38
#include <stdio.h> 메뉴선택 int main( void ) int i; char buffer[10]; char menu[5][10] = "init", "open", "close", "read", "write" ; printf(" 메뉴를입력하시오 :"); scanf("%s", buffer); for(i = 0; i < 5; i++) if( strcmp(buffer, menu[i]) == 0 ) printf("%d 번째메뉴를입력하였습니다.\n", i); return 0; 메뉴를입력하시오 :open 1번째메뉴를입력하였습니다. 39
단어카운팅 #include <stdio.h> #include <ctype.h> int count_word(const char *s); int main( void ) printf("%d\n", count_word("the c book...")); return 0; int count_word ( const char * s ) int i, wc = 0, waiting = 1; for( i = 0; s[i]!= NULL; ++i) if( isalpha(s[i]) ) if( waiting ) else // s의각글자조사 // s의글자가알파벳이면 // 워드를기다리고있으면 wc++; // 카운터를증가 waiting = 0; // 워드를처리하는중 // 알파벳이아니면 waiting = 1; // 워드를기다린다. return wc; 40
문자열비교 #include <stdio.h> #include <string.h> int str_ncmp(const char *s1, const char *s2, int count); int main( void ) printf("%d\n", str_ncmp("language C++", "language C", 5)); return 0; // returns <0 if s1 < s2 // returns 0 if s1 == s2 // returns >0 if s1 > s2 int str_ncmp ( const char * s1, const char * s2, int count ) if (!count) return(0); while (--count && *s1 && *s1 == *s2) s1++; s2++; return( *s1 - *s2 ); 41
한영사전구현 #define ENTRIES 5 int main( void ) int i, index; char dic[entries][2][30] = "book", " 책 ", "boy", " 소년 ", "computer", " 컴퓨터 ", "lanuguage", " 언어 ", "rain", " 비 ", ; char word[30]; printf(" 단어를입력하시오 :"); scanf("%s", word); index = 0; for(i = 0; i < ENTRIES; i++) if( strcmp(dic[index][0], word) == 0 ) printf("%s: %s\n", word, dic[index][1]); return 0; index++; printf(" 사전에서발견되지않았습니다.\n"); 42
#include <stdio.h> #include <ctype.h> 문자열 -> 정수 int stoi( const char *s ); int main(void) printf("%d\n", stoi("-123")); int stoi( const char *s ) int c; // 현재의글자 int total =0; // 현재의합계 int sign; c = *s++; sign = c; // 부호를저장한다. if (c == '-' c == '+') c = *s++; // 부호를제거한다. while (isdigit(c)) total = 10 * total + (c - '0'); // 누적시킨다. c = *s++; // 다음글자를얻는다. if (sign == '-') return -total; else return total; // 필요하면음수로만든다. 43
Q & A 44