
就目前而言,在编程领域中,C语言的运用非常之多,它兼顾了高级语言的汇编语言的优点,相较于其它编程语言具有较大优势。 在所有标准C语言<string.h>头文件中声明的字符串处理函数中,最常用的是那些用来复制和连接字符串的函数。这两组函数都将字符从一个对象复制到另一个对象,并且都返回它们的第一个参数:指向目标对象的起始指针。这种返回值的方式是导致函数效率低下的一个原因,而这正是本文要探讨的主题。本文中展示的示例代码仅仅用于说明目的。它们可能包含细微的错误,不应该被视为最佳代码实践。 01标准解决方案 为了执行这个连接操作,除了同时发生的相应地在d上的传递之外,一次在s1的传递和一次在s2上的传递是必须要执行的操作,但是上面的调用在s1上进行了两次传递。让我们把这些调用分成两个语句。 char *d1 = strcpy (d, s1); // pass 1 over s1 strcat (d1, s2); // pass 2 over the copy of s1 in d/ F0 o3 q4 ` t' V 因为strcpy返回其第一个参数d的值,所以d1的值与d相同。为简单起见,在后面的示例中我们将使用d,而不是将返回值存储在d1中并使用它。在strcat调用中,我们遍历刚刚复制到d1的字符串以确定最后一个字符的位置,这个成本和第一个字符串s1的长度是线性关系。这个成本乘以每个要连接的字符串。因而最终整个连接操作的成本相当于连接数和所以字符串长度的乘积,趋于一种二次方的关系。这种低效率是如此的臭名昭著,以至于为自己赢得了一个名字:画师施莱米尔算法。(另见http://www.open-std.org/jtc1/sc2 ... 2349.htm#sad-string)必须指出的是,除了效率低下之外,strcat和strcpy还因其缓冲区溢出的问题而臭名昭著,因为它们都对复制字符的数量不做任何限制。0 i; F' K7 b1 s* a! L$ B 02克服局限性的尝试 d[dsize - 1] = '\0'; // remember to nul-terminate size_t n = strlen (d); // pass 2 over copy of s1 in d strncat (d, s2, dsize - n - 1); // pass 3 over copy of s1 in d注意,与对strncat的调用不同,当s1的长度大于d的大小时,上面对strncpy的调用不会将NUL('\0')结束符追加到d上。它是一个常见的想当然的错误。此外,当s1短于dsize-1时,strncpy函数将所有剩余的字符填满为NUL('\0'),这也被视为一种浪费的,因为随后对strncat的调用将覆盖掉它们。为了避免一些冗余,程序员有时会选择先计算字符串长度,然后使用memcpy,如下所示。这种方法仍然效率不高,而且更容易出错,并且代码难以阅读和维护。size_t s1len = strlen (s1); // pass 1 over s1$ n. Z" G2 v+ |; l if (dsize <= s1len) s1len = dsize - 1; // no need to nul-terminate# n6 i9 f Z' U/ g5 L5 S# d4 B memcpy (d, s1, s1len); // pass 2 over s1# h; w6 Y6 {8 v size_t s2len = strlen (s2); // pass 1 over s2 if (dsize - s1len <= s2len) s2len = dsize - s1len - 1; memcpy (d + s1len, s2, s2len); // pass 2, over s24 |, v, s# C( l% b d[s1len + s1len] = '\0'; // nul-terminate result/ k& ?/ V7 A8 K& m5 ^ V 03使用sprintf和snprintf进行连接0 V$ H/ i% B& [) K& B0 S; W 04POSIX的stpcpy和stpncpy函数 ) F; ]5 }( j8 v4 }; E 为了帮助解决这个问题,在过去很多年里出现了很多超出标准C的库解决方案。POSIX标准包括stpcpy和stpncpy函数,这两个函数的实现方法是如果找到NUL结束符,则返回指向该字符的指针。这些函数可以用来缓解上面提到的麻烦和低效率。const char* stpcpy (char* restrict, const char* restrict);" H( V$ d ?3 f# vconst char* stpncpy (char* restrict, const char* restrict, size_t);8 E9 z' h* |, f* f 特别是,在不考虑缓冲区溢出的情况下,可以像下面这样调用stpcpy来连接字符串: stpcpy (stpcpy (d, s1), s2);' p) H: \# D( \4 j% L8 M 然而,当字符串副本必须以目标大小为边界时,等效地使用stpncpy并不会消除将第一个NUL字符之后的剩余目标位置清零并直到边界指定的最大字符位置的开销。char *ret = stpncpy (d, dsize, s1); // zeroes out d beyond the end of s1& R8 \% f0 |" a1 J9 _6 n dsize -= (ret - d);: W. ^# w* F4 n j7 C8 k3 E1 } stpncpy (d, dsize, s2); // again zeroes out d beyond the end 所以,这个函数仍然效率低下,因为对它的每次调用都会将目标中剩余的空间以及复制的字符串的末尾的空间清零。因此,这个操作的复杂性仍然是二次方的。效率低下的严重程度随着目标的大小成比例地增加,而与被连接的字符串的长度成反比增加。# S, ~$ r, v1 `, W 05OpenBSD的strlcpy和strlcat函数 - [& X3 w) ^% a3 q% X+ M# \ 为了应对针对strcpy和strcat函数的弱点以及上面讨论的strncpy和strncat的一些缺点的缓冲区溢出攻击,OpenBSD项目在20世纪90年代末引入了一对替代API(strlcpy和strlcat),旨在使字符串复制和连接更加安全(http://www.open-std.org/jtc1/sc22/wg14/www/docs/n2349.htm)。size_t strlcpy (char* restrict, const char* restrict, size_t);, f: r5 ]1 h" Y, ]/ l# ~size_t strlcat (char* restrict, const char* restrict, size_t); strncpy和strlcpy函数之间的主要区别在于返回值:前者返回指向目标的指针,后者则返回复制的字符数。另一个区别是strlcpy函数总是在目标中只存储一个NUL结束符。要连接s1和s2,可以按以下方式使用strlcpy函数:$ b2 n& F" h6 e, _0 e2 P7 W5 ] size_t n = strlcpy (d, s1, dsize);1 R/ ?+ B8 E0 f dsize -= n; d += n; strlcpy (d, s2, dsize); 这使得strlcpy在使用性和简单性方面都可以与snprintf相提并论(当然snprintf的开销虽然恒定,但要大得多)。 除了OpenBSD以外,strlcpy和strlcat函数在其他系统上也可用,包括Solaris和Linux(在BSD兼容库中)。但是由于这些系统不是由POSIX指定的,所以这两个函数在那些系统中并不总是存在。0 S' L1 z: {. ] 06POSIX的memccpy函数 $ M* n1 p5 q& I0 W* _1 } POSIX还定义了另一个函数memccpy,该函数具有上面讨论过的所有理想属性,可以用来解决上面的问题。void* memccpy (void* restrict dst, const void* restrict src, int c, size_t n);; S+ v9 I6 j* d1 ~- `这个函数结合了memcpy、memchr的特性以及上面讨论的API的最佳方面的特性。% _3 N5 ?+ ?* d* \
为了避免缓冲区溢出的风险,需要为每个调用确定适当的大小限制并作为参数提供。因此,像在snprintf(d, dsize, "%s%s", s1, s2)函数中那样限制目标大小的连接调用,可以像下面这样计算目标大小:char *p = memccpy (d, s1, '\0', dsize);4 K, @# T8 x% d4 }' E, R" S dsize -= (p - d - 1); memccpy (p - 1, s2, '\0', dsize); - {- L/ v+ I6 K2 h, @2 _ 07选择一个解决方案 ' b( v' m" b* p3 g7 }( { 如果字符串函数返回指向最后一个存储字符或它的后面一位的指针,而不是返回其第一个参数的值,则上面讨论的效率问题可以得到解决。然而,在现有函数使用了接近半个世纪后,对其进行更改是不太可行的。尽管解决现有C标准字符串函数的问题是不可行的,但是可以通过添加一个或多个不受相同限制的函数来在新代码中缓解这个问题。由于C标准的章程正在对现有的实践进行编纂整理,所以C语言标准化委员有义不容辞的责任调查这种功能是否已经存在于流行的实现中,如果已经存在,则应该考虑采纳它们。如上文提到的这几种解决方案。在上面提到的解决方案中,memccpy函数是最通用和最高效的,它由ISO 标准支持。即使在POSIX标准实现之外,它的应用范围最广,争议最小。相比之下,stpcpy和stpncpy函数的通用性较差,stpncpy函数会产生不必要的开销,因此无法达到既定的目标。这些函数在C2X中仍然值得采用,以提高移植性。详情请参阅N2352–将stpcpy和stpncpy添加到C2X中的提案。OpenBSD的strlcpy和strlcat函数虽然是最优的,但是它们的通用性较差,支持范围也较低,而且没有得到ISO标准的指定。memccpy函数不仅存在于Unix实现的子集中,它还由另一个名为ISO/IEC 9945的ISO标准指定。ISO/IEC 9945还有另外一个名字,也即大家熟知的IEEE Std 1003.1, 2017版,或者简言之- POSIX: memccpy,在那里它是作为XSI扩展提供给C的。这个函数可以追溯到System V接口定义第1版(SVID1),最初于1985年发布。memccpy甚至可以用于UNIX和POSIX以外的实现,例如:
{4 P+ b9 ?/ l1 t. [# v1 ]( f. b void *pc = memchr (src, c, n); P7 {, ?, f: p7 \+ V void *ret; 6 l" E4 k5 O) M, m/ w if (pc)/ ^$ ~1 N Z) u5 i {) l) l/ i! p+ A& L: H n = (char*)pc - (char*)src + 1; ret = (char*)dst + n;4 f2 h( ~* Z1 d! X8 T& g& f }/ H5 C. B1 Y& S1 z, S: F8 J else ret = 0; ; n, g, i& k& V& b8 f. ^4 r0 i memcpy (dst, src, n);6 q3 m9 n+ }! P% L, m& z return ret;( }' b# d7 R; P8 x5 D4 X! E }& u, K; J8 A2 @" j 这个函数的一个更优化的实现可能如下。 void* memccpy (void* restrict dst, const void* restrict src, int c, size_t n)- l$ R1 y! p, L { const char *s = src; for (char *ret = dst; n; ++ret, ++s, --n)! P1 g4 n5 y9 g# n {! G5 U9 ^; X% i P: V: X9 Z! p *ret = *s;9 Y- p/ @$ D6 e s: i" M; Z* q if ((unsigned char)*ret == (unsigned char)c)- @* o i9 L. V2 r1 } return ret + 1;9 n8 @) e" k* H; `2 l5 g3 r4 u$ t } return 0; } 借助于memccpy的性能优化,编译器将能够把对snprintf (d, dsize, "%s", s)函数的简单调用转换为对memccpy(d, s, '\0', dsize)的最佳有效调用。通过以代码大小换取速度,激进的优化器甚至可以将符合下列条件的snprintf函数调用(其格式字符串由多个%s指令组成,这些指令中间穿插有普通字符,如%s/%s)转换成一系列的此类memccpy函数调用:如下所示 char *p = memccpy (d, s1, '\0', dsize); if (p); V8 B% Y6 K" [8 G { --p;4 [, t# o9 K _/ a- p: E( E. V0 A p = memccpy (p, "/", '\0', dsize - (p - d)); if (p); \7 x8 A* V( Y4 \ {! t1 \. a( f# \( q --p;% o) M5 R0 f. ]6 w& O p = memccpy (p, s2, '\0', dsize - (p - d));9 ~" d+ d4 Q" _ } } if (!p)8 Q. B) K, h6 V9 x* \. Q% P0 L d[dsize - 1] = '\0';! H8 k' Y+ {; B2 Z0 K 2 o( q/ e! w) U# G3 U x 082019年4月WG14会议后的更新 |