本文主要介绍C标准库<string.h>实现
本文地址:http://wuyudong.com/archives/950,转载请注明源地址。
1.背景知识
<string.h>中声明的函数是对标准C的一个重要补充,它们支持C语言把文本作为字符数组操作的传统。
string.h是C语言中C标准库的头文件,其中包含了宏定义、常量以及函数和类型的声明,涉及的内容除了字符串处理之外,还包括大量的内存处理函数;因此,string.h
这个命名是不恰当的。在string.h
中定义的函数十分常用,作为C标准库的一部分,它们被强制要求可以在任何支持C语言的平台上运行。但是,部分函数存在一些安全隐患,例如缓存溢出等,导致程序员宁愿使用一些更安全的函数而放弃一定的可移植性。同时,这些字符串函数只能处理ASCII字符集或兼容ASCII的字符集,如ISO-8859-1;在处理存在多字节字符的字符集,如UTF-8时,会产生一个警告,指出对字符串“长度”的计算是以字节而不是以Unicode字符为单位。非ASCII兼容字符集的字符串处理函数一般位于wchar.h
中。
C标准库提供了所有重要的功能。这些函数可以对一下3种形式的串进行操作:
- 名字以mem开头的函数对任意的字符序列进行操作
- 名字以strn开头的函数对非空字符序列进行操作
- 所有其他名字以str开头的函数对空字符结尾的字符序列进行操作
2.<string.h>的内容
常量和类型
名称 | 说明 |
---|---|
NULL |
表示空指针常量的宏,即表示一个不指向任何有效内存单元地址的指针常量。 |
size_t |
无符号整型,被用于sizeof 运算符的返回值类型。 |
代码如下:
#ifndef _STRING_H #define _STRING_H #define NULL ((void *)0) #ifndef _SIZE_T #define _SIZE_T typedef unsigned int size_t; /* type returned by sizeof */ #endif /*_SIZE_T */
函数
名称 | 说明 |
---|---|
void *memcpy(void *dest, const void *src, size_t n); |
将n字节长的内容从一个内存地址复制到另一个地址;如果两个地址存在重叠,则最终行为未定义 |
void *memmove(void *dest, const void *src, size_t n); |
将n字节长的内容从一个内存地址复制到另一个地址;与memcpy 不同的是它可以正确作用于两个存在重叠的地址 |
void *memchr(const void *s, char c, size_t n); |
在从s开始的n个字节内查找c第一次出现的地址并返回,若未找到则返回NULL |
int memcmp(const void *s1, const void *s2, size_t n); |
对从两个内存地址开始的n个字符进行比较 |
void *memset(void *, int, size_t); |
用某种字节内容覆写一段内存空间 |
char *strcat(char *dest, const char *src); |
在字符串dest之后连接上src |
char *strncat(char *dest, const char *src, size_t n); |
在字符串dest之后连接上src,最多增加n个字符 |
char *strchr(const char *, int); |
从字符串头开始查找某字符出现的位置 |
char *strrchr(const char *, int); |
从字符串尾开始查找某字符出现的位置 |
int strcmp(const char *, const char *); |
基于字典顺序比较两个字符串 |
int strncmp(const char *, const char *, size_t); |
基于字典顺序比较两个字符串,最多比较n个字节 |
int strcoll(const char *, const char *); |
基于当前区域设置的字符顺序比较两个字符串 |
char *strcpy(char *toHere, const char *fromHere); |
将一个字符串从一个位置复制到另一个位置 |
char *strncpy(char *toHere, const char *fromHere, size_t); |
将一个字符串从一个位置复制到另一个位置,最多复制n个字节 |
char *strerror(int); |
返回错误码对应的解释字符串,参见errno.h(非线程安全函数) |
size_t strlen(const char *); |
返回一个字符串的长度 |
size_t strspn(const char *s, const char *strCharSet); |
从字符串s的起始处开始,寻找第一个不出现在strCharSet中的字符,返回其位置索引值 |
size_t strcspn(const char *s, const char *strCharSet); |
从字符串s的起始处开始,寻找第一个出现在strCharSet中的字符,返回其位置索引值 |
char *strpbrk(const char *s, const char *strCharSet); |
在字符串s中查找strCharSet中任意字符第一次出现的位置的指针值 |
char *strstr(const char *haystack, const char *needle); |
在字符串haystack中查找字符串needle第一次出现的位置,heystack的长度必须长于needle |
char *strtok(char *, const char *); |
将一个字符串分隔成一系列字符串;此函数非线程安全,且不可重入 |
size_t strxfrm(char *dest, const char *src, size_t n); |
根据当前locale转换一个字符串为strcmp使用的内部格式 |
函数原型代码如下:
void *memchr(const void *_s, int _c, size_t _n); int memcmp(const void *_s1, const void *_s2, size_t _n); void *memcpy(void *_s1, const void *_s2, size_t _n); void *memmove(void *_s1, const void *_s2, size_t _n); void *memset(void *_s, int _c, size_t _n); char *strcat(char *_s1, const char *_s2); char *strchr(const char *_s, int _c); int strncmp(const char *_s1, const char *_s2, size_t _n); int strcmp(const char *_s1, const char *_s2); int strcoll(const char *_s1, const char *_s2); char *strcpy(char *_s1, const char *_s2); size_t strcspn(const char *_s1, const char *_s2); char *strerror(int _errnum); size_t strlen(const char *_s); char *strncat(char *_s1, const char *_s2, size_t _n); char *strncpy(char *_s1, const char *_s2, size_t _n); char *strpbrk(const char *_s1, const char *_s2); char *strrchr(const char *_s, int _c); size_t strspn(const char *_s1, const char *_s2); char *strstr(const char *_s1, const char *_s2); char *strtok(char *_s1, const char *_s2); size_t strxfrm(char *_s1, const char *_s2, size_t _n);
3.<string.h>的实现
void * memcpy(void *s1, const void *s2, register size_t n) { register char *p1 = s1; register const char *p2 = s2; if (n) { n++; while (--n > 0) { *p1++ = *p2++; } } return s1; }
2、void *memmove( void* dest, const void* src, size_t count );
功能:由src所指内存区域复制count个字节到dest所指内存区域
返回:函数返回指向dest的指针
void * memmove(void *s1, const void *s2, register size_t n) { register char *p1 = s1; register const char *p2 = s2; if (n>0) { if (p2 <= p1 && p2 + n > p1) { /* overlap, copy backwards */ p1 += n; p2 += n; n++; while (--n > 0) { *--p1 = *--p2; } } else { n++; while (--n > 0) { *p1++ = *p2++; } } } return s1; }
3、void *memchr(const void *buf, int ch, size_t count);
void *memchr(const void *s, register int c, register size_t n) { register const unsigned char *s1 = s; c = (unsigned char) c; if (n) { n++; while (--n > 0) { if (*s1++ != c) continue; return (void *) --s1; } } return NULL; }
4、int memcmp(const void *buf1, const void *buf2, unsigned int count);
int memcmp(const void *s1, const void *s2, size_t n) { register const unsigned char *p1 = s1, *p2 = s2; if (n) { n++; while (--n > 0) { if (*p1++ == *p2++) continue; return *--p1 - *--p2; } } return 0; }
5、void *memset(void *s, int ch, size_t n);
void *memset(void *s, register int c, register size_t n) { register char *s1 = s; if (n>0) { n++; while (--n > 0) { *s1++ = c; } } return s; }
6、char *strcat(char *dest,char *src);
功能:把src所指字符串添加到dest结尾处(覆盖dest结尾处的’\0′)并添加’\0’。
char *strcat(char *ret, register const char *s2) { register char *s1 = ret; while (*s1++ != '\0') /* EMPTY */ ; s1--; while (*s1++ = *s2++) /* EMPTY */ ; return ret; }
7、char *strncat(char * s1,const char * s2.size_t n);
char *strncat(char *ret, register const char *s2, size_t n) { register char *s1 = ret; if (n > 0) { while (*s1++) /* EMPTY */ ; s1--; while (*s1++ = *s2++) { if (--n > 0) continue; *s1 = '\0'; break; } return ret; } else return s1; }
8、char *strchr(const char *s,char c);
功能:查找字符串s中首次出现字符c的位置
char *strchr(register const char *s, register int c) { c = (char) c; while (c != *s) { if (*s++ == '\0') return NULL; } return (char *)s; }
9、char *strrchr(const char *s, int c)
char *strrchr(register const char *s, int c) { register const char *result = NULL; c = (char) c; do { if (c == *s) result = s; } while (*s++ != '\0'); return (char *)result; }
10、int strcmp(const char *s1,const char * s2);
功能:比较两个字符串。设这两个字符串为str1,str2,若str1=str2,则返回零;若str1>str2,则返回正数;若str1<str2,则返回负数。
int strcmp(register const char *s1, register const char *s2) { while (*s1 == *s2++) { if (*s1++ == '\0') { return 0; } } if (*s1 == '\0') return -1; if (*--s2 == '\0') return 1; return (unsigned char) *s1 - (unsigned char) *s2; }
11、int strncmp(char *str1, char *str2, int maxlen);
int strncmp(register const char *s1, register const char *s2, register size_t n) { if (n) { do { if (*s1 != *s2++) break; if (*s1++ == '\0') return 0; } while (--n > 0); if (n > 0) { if (*s1 == '\0') return -1; if (*--s2 == '\0') return 1; return (unsigned char) *s1 - (unsigned char) *s2; } } return 0; }
12、int strcoll(const char *s1,const char * s2);
功能:根据LC_COLLATE比较字符串s1和s2
int strcoll(register const char *s1, register const char *s2) { while (*s1 == *s2++) { if (*s1++ == '\0') { return 0; } } return *s1 - *--s2; }
13、char *strcpy(char* dest, const char *src);
功能:把从src地址开始且含有NULL结束符的字符串复制到以dest开始的地址空间
char *strcpy(char *ret, register const char *s2) { register char *s1 = ret; while (*s1++ = *s2++) /* EMPTY */ ; return ret; }
14、char *strncpy(char *_s1, const char *_s2, size_t _n);
功能:(c/c++)复制字符串src中的内容(字符,数字、汉字….)到字符串dest中,复制多少由size_t的值决定,返回指向dest的指针。如果遇到空字符(’\0’),则空字符后面全部为空(字符)
char *strncpy(char *ret, register const char *s2, register size_t n) { register char *s1 = ret; if (n>0) { while((*s1++ = *s2++) && --n > 0) /* EMPTY */ ; if ((*--s2 == '\0') && --n > 0) { do { *s1++ = '\0'; } while(--n > 0); } } return ret; }
15、char *strerror(int errnum)
功能:通过标准错误的标号,获得错误的描述字符串。
char *strerror(register int errnum) { extern const char *_sys_errlist[]; extern const int _sys_nerr; if (errnum < 0 || errnum >= _sys_nerr) return "unknown error"; return (char *)_sys_errlist[errnum]; }
16、size_t strlen(const char *org)
size_t strlen(const char *org) { register const char *s = org; while (*s++) /* EMPTY */ ; return --s - org; }
17、size_t strspn (const char *s,const char * accept);
功能:strspn()从参数s 字符串的开头计算连续的字符,而这些字符都完全是accept 所指字符串中的字符。简单的说,若strspn()返回的数值为n,则代表字符串s 开头连续有n 个字符都是属于字符串accept内的字符
size_t strspn(const char *string, const char *in) { register const char *s1, *s2; for (s1 = string; *s1; s1++) { for (s2 = in; *s2 && *s2 != *s1; s2++) /* EMPTY */ ; if (*s2 == '\0') break; } return s1 - string; }
18、size_t strcspn(const char *string, const char *notin)
功能:顺序在字符串s1中搜寻与s2中字符的第一个相同字符,返回这个字符在S1中第一次出现的位置
size_t strcspn(const char *string, const char *notin) { register const char *s1, *s2; for (s1 = string; *s1; s1++) { for(s2 = notin; *s2 != *s1 && *s2; s2++) /* EMPTY */ ; if (*s2) break; } return s1 - string; }
19、char *strpbrk(const char *s1, const char *s2);
功能:依次检验字符串s1中的字符,当被检验字符在字符串s2中也包含时,则停止检验,并返回该字符位置,空字符NULL不包括在内
char *strpbrk(register const char *string, register const char *brk) { register const char *s1; while (*string) { for (s1 = brk; *s1 && *s1 != *string; s1++) /* EMPTY */ ; if (*s1) return (char *)string; string++; } return (char *)NULL; }
20、char *strstr(const char *str1, const char *str2);
char *strstr(register const char *s, register const char *wanted) { register const size_t len = strlen(wanted); if (len == 0) return (char *)s; while (*s != *wanted || strncmp(s, wanted, len)) if (*s++ == '\0') return (char *)NULL; return (char *)s; }
21、char *strtok(char *string, const char *separators)
char *strtok(register char *string, const char *separators) { register char *s1, *s2; static char *savestring; if (string == NULL) { string = savestring; if (string == NULL) return (char *)NULL; } s1 = string + strspn(string, separators); if (*s1 == '\0') { savestring = NULL; return (char *)NULL; } s2 = strpbrk(s1, separators); if (s2 != NULL) *s2++ = '\0'; savestring = s2; return s1; }
22、size_t strxfrm(char *s1, const char *save, size_t n)
功能:根据num长度拷贝前num个字符到目的字符串中,并返回源字符串长度。同时,该函数还可以自作为返回字符串长度,这时num=0,destination允许传入NULL
size_t strxfrm(register char *s1, register const char *save, register size_t n) { register const char *s2 = save; while (*s2) { if (n > 1) { n--; *s1++ = *s2++; } else s2++; } if (n > 0) *s1++ = '\0'; return s2 - save; }
Comments