Linux 网络编程基础(1)--网络相关的数据结构及转化函数

  在Linux下进行网络编程,使用的语言一般为C。就个人感受而言,在Linux下进行网络程序的编写,重要的不是代码能力要多强,而是对Linux的网络编程思想的理解和对Linux网络数据结构的掌握。如果想要掌握一般的Linux网络代码编写,首要的任务是理解TCP和UDP协议,要在写代码的时候清晰的知道某段代码的作用是什么,对应的是网络协议哪一个步骤。这样才能够深刻的理解代码,慢慢的写出真正属于自己的代码,而不是人云亦云,亦步亦趋。

  网络相关的数据结构

  当然只是把IPv4和IPv6的常用数据结构总结一下,网络相关的数据结构还是很多的,Unix域的数据结构另外再说。

      首先介绍struct sockaddr、struct sockaddr_in、struct in_addr。

  typedef unsigned short sa_family_t;
  struct sockaddr {
        sa_family_t     sa_family;    /* address family, AF_XXX      */
        char            sa_data[14];    /* 14 bytes of protocol address */

  };

  结构体struct sockaddr定义在/usr/include/linux/socket.h中。

  struct sockaddr_in {
            sa_family_t       sin_family;      /* Address family */
            __be16            sin_port;         /* Port number */
            struct in_addr    sin_addr;        /* Internet address */
            unsigned char     __pad[__SOCK_SIZE__ - sizeof(short int) -
            sizeof(unsigned short int) - sizeof(struct in_addr)];
           /* 字符数组sin_zero[8]的存在是为了保证结构体struct sockaddr_in的大小和结构体struct sockaddr的大小相等 */
  };

    结构体struct sockaddr_in在/usr/include/netinet/in.h中定义。

    struct in_addr{

     unsigned long s_addr;

  };

  in_addr其实就是32bit的IP地址。

  struct sockaddr是通用的套接字地址,而struct sockaddr_in则是internet环境下套接字的地址形式,二者长度一样,都是16个字节。二者是并列结构,指向sockaddr_in结构的指针也可以指向sockaddr。一般情况下,需要把sockaddr_in结构强制转换成sockaddr结构再传入系统调用函数中

  主机字节序和网络字节序

  在介绍上述三个结构体的成员变量之前,先介绍一下字节序。由于网络的特点是将网络上不同的设备和主机进行连接和通信,这就要求开发的网络程序要兼容不同的设备,数据对于设备要有唯一的含义,字节序就是上述问题的典型代表。字节序分为两类:大端字节序和小端字节序。

  小端字节序(Little Endian):将数据的最低字节放在内存的起始位置。特点是内存的低位放置数据的低位。

  大端字节序(Big Endian):将数据的高字节放在内存的起始位置。特点是内存的低位放置数据的高位。与思维习惯不一致,但是与数据的表达是一致的。比如一个四字节的数据0x12345678,起始的内存位置为0x1000;按照大端和小端的存放规范分别是:

    内存地址    0x1000  0x1001  0x1002  0x1003

    小端模式     0x78    0x56    0x34     0x12

    大端模式     0x12    0x34    0x56     0x78

  网络的字节序为大端字节序,所以在进行网络传输前,要将本地的数据转化为网络字节序,到达主机后,再转化为主机字节序。为了完成字节序的转化,Linux提供了一些转化的API,稍候再讨论相关的细节。那要是不知道一台机器的字节序,怎么通过代码来检查此主机的字节序呢?

  结构体  struct sockaddr_in

  重点分析一下sockaddr_in结构体,它是Intnet域网络编程的重要的数据结构之一。一一分析一下词数据结构的成员。

  1、sin_family可以指定当前的网络程序遵循IPv4还是IPv6,经典的赋值方式是:

  struct sockaddr_in skt_addr;

  skt_addr.sin_family = AF_INET;     /*使用IPv4版本*/

  skt_addr.sin_family = AF_INET6;   /*使用IPv6版本*/

  2、sin_port是一个网络字节序的16整型。一定当前的网络程序的端口(此处的端口可以十分简化的理解为:不同网络程序的标记,不同的网络程序使用不同的端口,这样不同网络服务之间就可以进行区分了,当然这种理解是片面)。端口大致可以分为三类:

    1.周知端口(Well Known Ports)

   周知端口是众所周知的端口号,范围从0到1023,其中80端口分配给www服务,21端口分配给FTP服务等。我们在IE的地址栏里输入一个网址的时候是不必  指定端口号的,因为在默认情况下www服务的端口 号是“80”。所以这个范围的端口就不能自己随便用了。

  2.动态端口(Dynamic Ports)

    动态端口的范围是从49152到65535。之所以称为动态端口,是因为它 一般不固定分配某种服务,而是动态分配。动态分配是指当一个系统进程或应用 程序进      程需要网络通信时,它向主机申请一个端口,主机从可用的端口号中分配 一个供它使用。当这个进程关闭时,同时也就释放了所占用的端口号。

  3.注册端口

     端口1024到49151,分配给用户进程或应用程序。这些进程主要是用户选择安装的一些应用程序,而不是已经分配好了公认端口的常用程序。这些端口在没有      被服务器资源占用的时候,可以用用户端动态选用为源端口。

     所以一般情况下自己写程序,使用的都是注册端口。好了,假如我们已经知道我们在IPv4协议下进行通信,使用端口8888,那代码怎么写?

  struct sockaddr_in  skt_addr;

  skt_addr.sin_family = AF_INET;

  skt_addr.sin_port = 8888;     /*这么写就错了,为啥??!!*/

  原因就是我们要保证所有的数据都是网络字节序的。这个时候字节序的转化函数就很有必要了。为了程序设计的方便,

  Linux提供了平台无关的四个字节转换函数:

  #include<arpa/inet.h>

  uint32_t  htonl(uint32_t hostlong);        /*长整型    主机字节序到网络字节序*/

  uint16_t  htons(uint16_t hostlong);        /*短整型   主机字节序到网络字节序*/

  uint32_t  ntohl(uint32_t hostlong);        /*长整型    网络字节序到主机字节序*/

  uint16_t  ntohs(uint16_t hostlong);        /*短整型   网络字节序到主机字节序*/

  所以上面的代码应该这么写:

  struct sockaddr_in  skt_addr;

  skt_addr.sin_family = AF_INET;

  skt_addr.sin_port = htons(8888);     /*这么写就可以了*/

  3、 struct in_addr   sin_addr 这个成员其实我们很熟悉了,非计算机的人也听说过IP地址。这个就是32bit的IP地址。那编程时对这个成员赋与一个点分十  进制的IP地址,就可以使我们的数据在网络上传输了?显然不可以的。

  计算机的存储和人的认知之间是有差距的,“127.0.0.1”这样的IP地址当然是直观的,但是在网络中需要对此数据进行修饰。修饰的函数如下:

  #include<sys/socket.h>

  #include<netinet/in.h>

  #include<arpa/inet.h>

  int inet_aton(const char *cp, struct in_addr *inp);    /*将点分十进制的IP地址转化为in_addr*/

  in_addr_t  inet_addr(const char *cp);                      /*将点分十进制的IP地址转化为in_addr, 不过返回值不一样了*/

  有了网络上的IP,怎么转化为可读的IP地址呢?

  char * inet_ntoa(struct in_addr  in);                        /*将in_addr转化为点分十进制的IP地址*/ 

  其实现在使用的转化函数为inet_ntop()和inet_pton(); 因为这两个函数是可重入的,而且支持多种地址类型。

  int inet_pton(int af, const char *src, void *dst);

  af: 指定地址类型,AF_INET或者INET_INET6

  src: 点分十进制的IP地址

  dst: 转化后的网络IP地址,一般接收到后,使用强制类型转换得到in_addr

  char *inet_ntop(int af, const void *src, char *dst, socklen_t cnt);

  af: 指定地址类型,AF_INET或者INET_INET6

  src: 待转化的网络地址

  dst: 接收点分十进制的IP地址

  cnt:dst的大小,若此值设置过小,会导致ENOSPC错误。

 

  到目前为止,我们可以完整的定义并且初始化一个sockaddr_in 结构体了。

  struct sockaddr_in  skt_addr;

  skt_addr.sin_family = AF_INET;

  skt_addr.sin_port = htons(8888);     /*这么写就可以了*/

  skt_addr.sin_addr = inet_pton("127.0.0.1");

 

  基本的数据结构介绍到此。

  下一篇:获取主机信息、协议处理函数

Linux 网络编程基础(1)--网络相关的数据结构及转化函数,古老的榕树,5-wow.com

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。