
C语言函数为什么不能返回数组?, v/ l2 u# Z, |8 x, T 在C语言程序开发中,我们不可以编写下面这样的代码:
![]() 不可以编写这样的代码* }* N) k* j5 n6 X( y6 h' k 这其实就是不能在C语言函数中返回数组。但是如果将数组定义在结构体里面,就可以将其返回了,例如下面这段C语言代码,请看: ) f" N/ k+ F" l6 E- B1 I; }7 N6 {0 j
![]() 函数可以返回结构体 结构体 s 只有一个数组成员 arr,显然,函数可以返回结构体,即使结构体只有一个数组成员,这是为什么呢?C语言没有严格意义上的“数组类型” J" `; P1 R/ r. z 基本上,C语言中的数据结构可以分为两类,第一类数据结构可以被赋值,而第二类数据结构不可以被赋值,数组属于第二类数据结构。 除了数组,还有其他第二类数据结构吗?我想基本上没有了,除非把函数算上。与函数不能返回数组密切相关的事实是,C语言没有严格意义上的“数组类型”。可能从C语言代码角度来看,似乎有数组类型的变量,但是如果尝试将该变量像其他变量一样使用,得到的实际上是指向数组第一个元素的指针。例如下面这段C语言代码:
这并不能把数组 b 的内容拷贝给数组 a,实际上,上面两行C语言代码相当于下面这一行:7 O2 l5 w: f! h! [- {* [
显然,左边是数组 a,而右边其实是一个指针。即使数组在某种程度上可以看作能够被赋值,但我们有很大几率得到类型不匹配,例如下面这段C语言代码:* j( A9 _+ u" z/ z
4 y a" u8 M) _1 W- d: X- A 这里假设 f() 是一个返回数组的函数,它的核心C语言代码如下:
0 i' T" I* i, P 5 q5 w4 H- K1 b8 {. F+ ^ 不过按照前面所说的,其实上面的返回语句相当于下面这一句:/ V$ [/ e u8 w5 n3 q
同样的,我们若是尝试将数组赋值给 a,最终实际得到仍然是将指针赋值给 a,熟悉C语言语法的读者应该能够看出不妥之处。 为什么把数组塞入结构体,情况就不同了呢?; K% p3 Z: x& Q4 Y/ y: x- \ 文章开头提到,虽然C语言的数组不可以被赋值,但是将其塞入结构体就可以赋值了。这是什么原因呢?$ P& I' C4 _8 | 其实这涉及到C语言的设计初衷,以及相关的一些发展历史了。C语言在语法和语义上与机器硬件很接近,它的基本操作可以被编译为一个或者几个机器指令,占用若干个处理器周期。 C语言中的数组是特殊的,它与指针一直都是非常暧昧的。这种暧昧的关系从C语言的前身B语言就开始了,并一直延续至今,而今天的结构体语法最初并不是包含在C语言中的。 因为C语言数组与指针的暧昧关系,编译器也很难区分它们,所以我们不可能为C语言数组赋值。而且由于“赋值”操作也属于C语言的基本操作,为了贴合硬件,要求其必须在几个处理器周期完成,所以单个的“赋值”运算符 = 基本上不可能扩展到需要几千乃至几万个机器周期,以对成千上万个数组元素赋值。5 T3 j0 Y& o$ D% l: H 基于这样的原理,早期的C语言其实连结构体赋值都是不支持的。. s6 p. J3 V ~: f6 E! o 到这里,相信不少读者又有疑问了,既然C语言的基本操作需要控制在少量的机器周期内,那为什么结构体赋值却是支持的呢?毕竟C语言中的结构体也是可以包含多个字节信息的。/ ^5 {' {0 {* c. C( u7 D3 _2 ^. _ C语言中的结构体也是可以包含多个字节信息的 正如前文所说,早期的C语言的确不支持结构体赋值,但是在后来的发展中却增加了结构体赋值能力。对此只能说是结构体幸运,“将C语言基本操作控制在少量机器周期内”只是一个准则,而不是限制。 要知道,C语言结构体通常很小,只有几十到几百字节,增加结构体赋值能力无疑能够大大方便程序员编写代码。大多数情况下,结构体赋值操作并不会严重“超时”,这其实是一种平衡。: K' i2 ]$ [1 u1 c/ J9 g2 g 我之前的文章曾经讨论过,程序设计语言一般都要处理一个天平,天平的两端分别是机器和程序员,如果追求极致的机器效率,将编程语言设计的十分精简,那么程序员就会非常痛苦。因此,即使是C语言,在追求高效率的同时,也要兼顾程序员的感受,所以稍稍违背一些设计准则,增加一些便利操作也是无可厚非的。 小结 4 w# R7 O. d6 P6 k* z# w5 k7 e+ x C语言不支持数组赋值,更多的原因是C语言本身的特点(贴合硬件)以及一些历史原因。不过,如果真的希望对数组赋值,也是有一些技巧的,例如将数组塞入结构体。 |