在C语言编程中，错误处理是一个至关重要的方面。由于C语言没有内置的异常处理机制（如C++的 try-catch 或Java的异常类），函数通常通过其返回值来指示操作的成功或失败，并通过错误码（Error Codes）来提供关于错误的具体信息。这种机制虽然简单，但如果设计和使用得当，可以非常有效地进行错误管理。

一、通过函数返回值指示成功/失败

这是C语言中最常见的错误通知方式。

布尔型指示：

函数返回一个整数类型（通常是 int 或 bool (来自 <stdbool.h> in C99)），其中某个值表示成功（例如，0或 true），另一个值表示失败（例如，非0，-1，或 false）。
示例：

       #include <stdbool.h>
       #include <stdio.h>
       
       bool save_data(const char* data) {
           if (data == NULL) {
               fprintf(stderr, "Error: data pointer is NULL.\n");
               return false; // 失败
           }
           // ... 实际保存数据的逻辑 ...
           printf("Data saved successfully.\n");
           return true; // 成功
       }
       
       int main() {
           if (save_data("Hello, World!")) {
               printf("Operation succeeded.\n");
           } else {
               printf("Operation failed.\n");
           }
           if (!save_data(NULL)) {
               printf("Failed intentionally.\n");
           }
           return 0;
       }

约定： 成功和失败的返回值约定必须清晰并在文档中说明。POSIX标准中，很多函数成功时返回0，失败时返回-1。

指针型指示：

需要返回动态分配的资源或指向某个结果的指针的函数，通常在成功时返回有效的指针，在失败时返回 NULL。
示例：

       #include <stdio.h>
       #include <stdlib.h> // For malloc
       #include <string.h> // For strcpy
       
       char* create_string_copy(const char* original) {
           if (original == NULL) {
               return NULL; // 失败：无效参数
           }
           char* copy = (char*)malloc(strlen(original) + 1);
           if (copy == NULL) {
               // malloc 失败通常会设置 errno，但这里我们只返回 NULL
               return NULL; // 失败：内存分配错误
           }
           strcpy(copy, original);
           return copy; // 成功
       }
       
       int main() {
           char* str_copy = create_string_copy("Test string");
           if (str_copy != NULL) {
               printf("Copied string: %s\n", str_copy);
               free(str_copy); // 调用者负责释放资源
           } else {
               printf("Failed to create string copy.\n");
           }
           return 0;
       }

计数或大小指示：

某些函数（如 read, write, fread, fwrite）返回实际处理的项目数或字节数。如果返回值小于预期值，可能表示部分成功或发生了错误/文件结束。
示例 (fread)：

       size_t items_read = fread(buffer, item_size, num_items, fp);
       if (items_read < num_items) {
           if (feof(fp)) {
               // 到达文件末尾
           } else if (ferror(fp)) {
               // 发生读错误
           }
       }

二、错误码 (Error Codes)

当仅通过返回值指示成功/失败不足以区分多种错误原因时，就需要使用错误码。

1. 通过返回值直接返回错误码

函数可以直接返回一个整数作为错误码。通常，0表示成功，正数或负数表示不同类型的错误。

设计：

定义一组枚举类型或宏来表示不同的错误码，提高可读性。
提供一个函数将错误码转换为人类可读的错误信息字符串。

示例：

     // file_processor.h
     #ifndef FILE_PROCESSOR_H
     #define FILE_PROCESSOR_H
     
     typedef enum {
         FP_SUCCESS = 0,
         FP_ERROR_FILE_NOT_FOUND = 1,
         FP_ERROR_PERMISSION_DENIED = 2,
         FP_ERROR_READ_FAILED = 3,
         FP_ERROR_INVALID_FORMAT = 4,
         FP_ERROR_OUT_OF_MEMORY = 5
     } FileProcessor_ErrorCode;
     
     FileProcessor_ErrorCode process_file(const char* filename);
     const char* fp_get_error_string(FileProcessor_ErrorCode code);
     
     #endif

     // file_processor.c
     #include "file_processor.h"
     #include <stdio.h> // For fopen, etc.
     #include <stdlib.h> // For malloc
     
     const char* fp_get_error_string(FileProcessor_ErrorCode code) {
         switch (code) {
             case FP_SUCCESS: return "Success";
             case FP_ERROR_FILE_NOT_FOUND: return "File not found";
             case FP_ERROR_PERMISSION_DENIED: return "Permission denied";
             // ... 其他错误码 ...
             default: return "Unknown error code";
         }
     }
     
     FileProcessor_ErrorCode process_file(const char* filename) {
         if (filename == NULL) return FP_ERROR_INVALID_FORMAT; // 假设这也是一种格式错误
     
         FILE* fp = fopen(filename, "r");
         if (fp == NULL) {
             // 这里可以根据 errno 进一步判断是 FILE_NOT_FOUND 还是 PERMISSION_DENIED
             // 为简化，我们假设 fopen 失败就是 FILE_NOT_FOUND
             return FP_ERROR_FILE_NOT_FOUND;
         }
     
         // ... 实际处理文件 ...
         // 假设在处理中发生读取错误
         // if (read_error_occurred) {
         //     fclose(fp);
         //     return FP_ERROR_READ_FAILED;
         // }
     
         fclose(fp);
         return FP_SUCCESS;
     }
     
     // main.c (示例用法)
     // #include "file_processor.h"
     // #include <stdio.h>
     // int main() {
     //     FileProcessor_ErrorCode err = process_file("mydata.txt");
     //     if (err != FP_SUCCESS) {
     //         fprintf(stderr, "Error processing file: %s (Code: %d)\n", 
     //                 fp_get_error_string(err), err);
     //     }
     //     return 0;
     // }

2. 通过输出参数返回错误码

如果函数需要返回一个有用的值（例如一个计算结果或一个指针），但同时也可能发生多种错误，可以将错误码通过一个指针参数传出。

设计：

函数返回一个主结果（例如，成功时返回 true/false 或一个指针）。
额外接受一个指向错误码存储位置的指针参数 (ErrorCodeType* error_code_ptr)。
如果 error_code_ptr 非 NULL，则在函数执行完毕后（无论成功失败）将相应的错误码写入该位置。

示例：

     #include <stdbool.h>
     #include <stdio.h>
     #include <stdlib.h> // For malloc
     
     typedef enum {
         CALC_SUCCESS = 0,
         CALC_ERROR_DIVIDE_BY_ZERO = 101,
         CALC_ERROR_OVERFLOW = 102,
         CALC_ERROR_INVALID_INPUT = 103
     } Calculator_ErrorCode;
     
     // 函数返回计算结果，通过参数返回错误码
     bool calculate_division(int dividend, int divisor, double* result, Calculator_ErrorCode* err_code) {
         if (result == NULL) { // 必须提供有效的 result 指针
             if (err_code) *err_code = CALC_ERROR_INVALID_INPUT; 
             return false;
         }
     
         if (divisor == 0) {
             if (err_code) *err_code = CALC_ERROR_DIVIDE_BY_ZERO;
             return false; // 失败
         }
     
         // 假设这里可能发生溢出，简化处理
         if ((dividend > 1000 || dividend < -1000) && (divisor < 1 && divisor > -1 && divisor != 0)) {
              if (err_code) *err_code = CALC_ERROR_OVERFLOW;
              return false; // 失败
         }
     
         *result = (double)dividend / divisor;
         if (err_code) *err_code = CALC_SUCCESS;
         return true; // 成功
     }
     
     int main() {
         double res;
         Calculator_ErrorCode err;
     
         if (calculate_division(10, 2, &res, &err)) {
             printf("10 / 2 = %f (Error code: %d)\n", res, err);
         } else {
             printf("Failed to calculate 10 / 2. Error code: %d\n", err);
         }
     
         if (calculate_division(5, 0, &res, &err)) {
             printf("5 / 0 = %f (Error code: %d)\n", res, err);
         } else {
             printf("Failed to calculate 5 / 0. Error code: %d\n", err);
         }
         
         // 用户可以选择不关心错误码
         if (calculate_division(8, 4, &res, NULL)) { // 传入 NULL 作为 err_code 指针
              printf("8 / 4 = %f (Error code not requested)\n", res);
         }
     
         return 0;
     }

3. 使用全局/线程局部错误变量 (如 errno)

标准C库广泛使用 errno (定义在 <errno.h>) 这个全局变量（在多线程环境下通常是线程局部变量）来存储最近一次库函数调用发生的错误码。

工作方式：

当一个库函数失败时，它通常会返回一个特定的值（如-1或 NULL）来指示错误，并设置 errno 为一个表示具体错误原因的正整数。
errno 的值只有在函数明确说明会设置它，并且该函数调用确实失败时才有意义。
在调用可能设置 errno 的函数之前，可以（有时是推荐的）将 errno 设置为0，以便区分是当前调用设置了 errno 还是之前的调用遗留的。
<string.h> 中的 strerror() 函数可以将 errno 值转换为人类可读的错误信息字符串。
<stdio.h> 中的 perror() 函数会打印用户提供的字符串，后跟一个冒号和一个空格，然后是对应当前 errno 值的错误信息。

示例：

     #include <stdio.h>
     #include <errno.h>  // For errno
     #include <string.h> // For strerror
     #include <stdlib.h> // For exit
     
     int main() {
         FILE *fp;
     
         errno = 0; // 清除 errno (可选，但有时是好习惯)
         fp = fopen("non_existent_file.txt", "r");
     
         if (fp == NULL) {
             // fopen 失败，检查 errno
             fprintf(stderr, "Error opening file: %s (errno: %d)\n", strerror(errno), errno);
             perror("fopen failed"); // perror 会自动使用 errno
             
             if (errno == ENOENT) { // ENOENT: No such file or directory
                 fprintf(stderr, "Specific error: File does not exist.\n");
             } else if (errno == EACCES) { // EACCES: Permission denied
                 fprintf(stderr, "Specific error: Permission denied.\n");
             }
             // exit(EXIT_FAILURE);
         } else {
             printf("File opened successfully.\n");
             fclose(fp);
         }
         return 0;
     }

自定义库中使用类似 errno 的机制：

可以模仿 errno 设计自己的模块级错误变量。但需要注意线程安全问题。如果模块可能在多线程环境中使用，这个错误变量必须是线程局部的 (Thread-Local Storage, TLS)。C11标准引入了 _Thread_local 关键字。

三、设计错误处理策略的最佳实践

一致性 (Consistency)：

在整个项目或库中，对错误指示和错误码的使用方式保持一致。例如，所有函数都用0表示成功，负数表示错误；或者都用 bool 返回成功/失败，并通过输出参数传递错误码。

清晰的文档 (Clear Documentation)：

API文档必须清楚地说明每个函数如何指示错误，可能的返回值和错误码的含义，以及在发生错误时函数的状态（例如，资源是否已释放，输入参数是否被修改）。

错误码的层级与分类 (Hierarchical/Categorized Error Codes)：

对于复杂的系统，可以设计具有一定层级或分类的错误码，以便更好地定位问题。例如，高位字节表示模块，低位字节表示模块内的具体错误。

提供错误信息转换函数 (Error Message Conversion)：

提供一个函数（如 mylib_strerror(int err_code)）将错误码转换为人类可读的字符串，方便调试和日志记录。

错误传播 (Error Propagation)：

调用者必须检查函数的返回值和错误码，并适当地处理错误或将错误向上传播给它的调用者。
忽略错误是导致程序不稳定和难以调试的常见原因。

       ErrorCodeType perform_operation() {
           ErrorCodeType err = step1();
           if (err != SUCCESS) {
               return err; // 传播错误
           }
           err = step2();
           if (err != SUCCESS) {
               // 也许需要做一些清理工作
               cleanup_step1_resources();
               return err; // 传播错误
           }
           return SUCCESS;
       }

资源管理 (Resource Management)：

在错误发生时，确保已分配的资源（内存、文件句柄、锁等）得到正确释放，避免资源泄漏。
goto 语句在C语言中可以用于集中的错误处理和资源清理（尽管需要谨慎使用以避免“意大利面条式代码”）。

      int process_resources() {
          ResourceType* res1 = NULL;
          ResourceType* res2 = NULL;
          int status = -1; // Error by default
      
          res1 = acquire_resource1();
          if (res1 == NULL) {
              goto cleanup;
          }
      
          res2 = acquire_resource2();
          if (res2 == NULL) {
              goto cleanup;
          }
      
          // ... use res1 and res2 ...
          if (operation_failed) {
              goto cleanup;
          }
      
          status = 0; // Success
      
      cleanup:
          if (res2) release_resource2(res2);
          if (res1) release_resource1(res1);
          return status;
      }

区分致命错误和非致命错误：

致命错误 (Fatal errors)： 导致程序无法继续正常运行的错误（如内存耗尽、关键资源不可用）。通常需要终止程序或模块的执行。
非致命错误 (Non-fatal errors)： 程序在发生错误后仍有可能恢复或继续执行其他操作的错误（如用户输入无效、文件未找到但可以提示用户重试）。

日志记录 (Logging)：

在发生错误时，记录详细的错误信息（包括错误码、错误消息、发生错误的位置、相关上下文数据）到日志文件或控制台，有助于事后分析和调试。

断言 (Assertions)：

使用 assert() (来自 <assert.h>) 来检查程序中的不变量和前置/后置条件。断言主要用于开发和调试阶段，用于捕捉逻辑错误。当断言失败时，程序通常会终止。
断言不应该用于处理预期的运行时错误（如用户输入错误），这些应该通过返回值和错误码来处理。

四、总结

在C语言中，通过返回值和错误码进行错误处理是一种基本且必要的机制。一个精心设计的错误处理策略应该具备一致性、清晰性，并能提供足够的信息来诊断问题。

关键点：

返回值主要用于快速判断操作的整体成功或失败状态。
错误码用于提供关于失败原因的更具体细节。
错误码可以通过函数直接返回，通过输出参数传递，或者通过类似 errno 的全局/线程局部变量来设置。
调用者必须检查错误指示并采取适当的行动。
良好的文档、一致的约定和周全的资源管理是成功实现错误处理的关键。

虽然这种机制不如现代语言的异常处理那样自动化，但它赋予了C程序员对错误流程的精确控制，如果遵循良好的实践，完全可以构建出非常健壮和可靠的系统。

杰人编程网

C语言设计如何处理返回值与错误码