C语言函数为什么不能返回数组？

[复制链接]

gaosmile 发布时间：2020-3-30 12:39

文章
文章封面:	-
文章简介:	-

C语言函数为什么不能返回数组？
在C语言程序开发中，我们不可以编写下面这样的代码：

& l v1 c; i& k" R% a
char f(void)[8] {
e* \9 w Y7 V+ S" X" @
char ret;
. I# o7 u4 Z$ ?/ Z5 w# G7 X I
// ...fill...
- |* U, i" O- h$ j$ `2 K; i# ~
return ret;
+ G( X( a$ F* e& [7 d q
}
) E& D) b6 R: f4 H* X; y
int main(int argc, char ** argv) {
' N& j9 I3 D$ g
char obj_a[10];
2 I4 F& K$ Z; q6 ^1 y! }
obj_a = f();
8 ^( N( d+ J8 i, k
}

复制代码

% j. y2 ^( M9 d0 S1 ~2 |" ^不可以编写这样的代码* }* N) k* j5 n6 X( y6 h' k

0 k1 r1 \) y* y- s5 W6 p这其实就是不能在C语言函数中返回数组。但是如果将数组定义在结构体里面，就可以将其返回了，例如下面这段C语言代码，请看：

; [7 g6 }( M: B1 y
struct s { char arr[10]; };
- F$ w$ f9 B3 }+ z0 y
struct s f(void) {
0 ~( b( `) l3 A, }6 b
struct s ret;+ i' D U `0 F5 ^1 w
// ...fill.../ }- P" N# Q5 c# T
return ret;) F2 |" l$ i9 r
}
% V4 F' k8 @$ Y0 y
int main(int argc, char ** argv) {: F* M s" t5 J
struct s obj_a;) S7 h! q' ]! N/ ^
obj_a = f();
. m4 A9 {& A9 T
}

复制代码

0 Y" @1 I; |+ X( O% W: O% L3 C0 ^
函数可以返回结构体
结构体 s 只有一个数组成员 arr，显然，函数可以返回结构体，即使结构体只有一个数组成员，这是为什么呢？C语言没有严格意义上的“数组类型”
基本上，C语言中的数据结构可以分为两类，第一类数据结构可以被赋值，而第二类数据结构不可以被赋值，数组属于第二类数据结构。
除了数组，还有其他第二类数据结构吗？我想基本上没有了，除非把函数算上。与函数不能返回数组密切相关的事实是，C语言没有严格意义上的“数组类型”。可能从C语言代码角度来看，似乎有数组类型的变量，但是如果尝试将该变量像其他变量一样使用，得到的实际上是指向数组第一个元素的指针。例如下面这段C语言代码：

, W9 E9 S: w( x* i& W! i3 b1 e
char a[10], b[10];6 m1 e: ]5 u8 |5 K4 y _
a = b;

复制代码

这并不能把数组 b 的内容拷贝给数组 a，实际上，上面两行C语言代码相当于下面这一行：

a = &b[0];

复制代码

显然，左边是数组 a，而右边其实是一个指针。即使数组在某种程度上可以看作能够被赋值，但我们有很大几率得到类型不匹配，例如下面这段C语言代码：

+ T( m% n% i0 L) U% K; R
a = f();

复制代码

这里假设 f() 是一个返回数组的函数，它的核心C语言代码如下：

* O6 ^" X( N) E; G0 z
char ret[10];
4 G3 `$ ~: U: z( A8 `
/* ... fill ... */
2 j! j% M/ m* C) U5 B
return ret;

复制代码

不过按照前面所说的，其实上面的返回语句相当于下面这一句：

return &ret[0];
/ H: X# K+ ~- a& r' G2 V+ L

复制代码

同样的，我们若是尝试将数组赋值给 a，最终实际得到仍然是将指针赋值给 a，熟悉C语言语法的读者应该能够看出不妥之处。
为什么把数组塞入结构体，情况就不同了呢？
文章开头提到，虽然C语言的数组不可以被赋值，但是将其塞入结构体就可以赋值了。这是什么原因呢？
其实这涉及到C语言的设计初衷，以及相关的一些发展历史了。C语言在语法和语义上与机器硬件很接近，它的基本操作可以被编译为一个或者几个机器指令，占用若干个处理器周期。
C语言中的数组是特殊的，它与指针一直都是非常暧昧的。这种暧昧的关系从C语言的前身B语言就开始了，并一直延续至今，而今天的结构体语法最初并不是包含在C语言中的。
因为C语言数组与指针的暧昧关系，编译器也很难区分它们，所以我们不可能为C语言数组赋值。而且由于“赋值”操作也属于C语言的基本操作，为了贴合硬件，要求其必须在几个处理器周期完成，所以单个的“赋值”运算符 = 基本上不可能扩展到需要几千乃至几万个机器周期，以对成千上万个数组元素赋值。
基于这样的原理，早期的C语言其实连结构体赋值都是不支持的。
到这里，相信不少读者又有疑问了，既然C语言的基本操作需要控制在少量的机器周期内，那为什么结构体赋值却是支持的呢？毕竟C语言中的结构体也是可以包含多个字节信息的。/ ^5 {' {0 {* c. C( u7 D3 _2 ^. _
C语言中的结构体也是可以包含多个字节信息的
正如前文所说，早期的C语言的确不支持结构体赋值，但是在后来的发展中却增加了结构体赋值能力。对此只能说是结构体幸运，“将C语言基本操作控制在少量机器周期内”只是一个准则，而不是限制。
要知道，C语言结构体通常很小，只有几十到几百字节，增加结构体赋值能力无疑能够大大方便程序员编写代码。大多数情况下，结构体赋值操作并不会严重“超时”，这其实是一种平衡。
我之前的文章曾经讨论过，程序设计语言一般都要处理一个天平，天平的两端分别是机器和程序员，如果追求极致的机器效率，将编程语言设计的十分精简，那么程序员就会非常痛苦。因此，即使是C语言，在追求高效率的同时，也要兼顾程序员的感受，所以稍稍违背一些设计准则，增加一些便利操作也是无可厚非的。
小结

C语言不支持数组赋值，更多的原因是C语言本身的特点（贴合硬件）以及一些历史原因。不过，如果真的希望对数组赋值，也是有一些技巧的，例如将数组塞入结构体。

赞收藏评论0 发布时间：2020-3-30 12:39

0个回答

C语言函数为什么不能返回数组？

所属标签