当前位置:操作系统 > Unix/Linux >>

网桥原理及源代码详解

* 解析ie_minix */

  [color=green]/* 概述:

  * 该代码在FB中提供桥接功能,不过他只是在以太网接口上工作,能提供多个逻辑桥

  * ,我们称为组,组是由一组有相同组ID的接口组成,组ID的范围在1到2^16-1之间.

  * 打开桥的功能是通过sysctl net.link.ether.bridge=1来启动的.

  * 而sysctl net.link.ether.bridge_cfg是把以太网接口进行分组的命令,如:

  * sysctl net.link.ether.bridge_cfg="vr0:1,vr1:1,fxp0:2,fxp1:2" 该命令的结果

  * 为网卡vr0和vr1可以进行相互通信,fxp0和fxp1之间可以互相转发,等于是分为俩组了.

  * 但目前的该项设置还不能进行多组成员和单向控制,即一块卡可以为多个组的成员和某卡

  * 与另外卡的数据单向流动.在本文中,我将结合代码来讲解如何实现以上的功能.

  * 在本代码中,重要的数据结构是cluster_softc,他主要是记录一个组的接口所连接的机器

  * 的硬件地址,该地址数组存储采用HASH算法,据我所知,4.4版和OpenBSD版的HASH函数算法根本不同,

  * 我们在下面的代码分析过程中将看到,我也将讲解两个版本的不同之处,说实话,该算法我根本看

  * 不懂(OpenBSD),估计该算法应该有相关的论文描述.

  * 代码的学习顺序:

  * 由于在if_ethersubr.c中的ether_input函数接到一数据包后,先查看bridge功能是否打开,

  * 即判断全局变量do_bridge是否为1(该变量是由上面讲的sysctl来控制的),为真的话就调用

  * 本文中的函数bridge_in(详细可看我写的"ethernet网络驱动代码详解"),所以在本文中的

  * bridge_in函数是第一个被调用的.该函数的作用是在上面讲的哪个重要的数据结构中查找

  * 目标地址要通过本机的哪块卡发送,当然其中还涉及到多播,广播和是否将网卡进行分组以

  * 及是否发送方,目的方经过的本机网卡是否被分在同组中等,在完成后,如果成功找到了发送

  * 到目的地机器和本机直接相连的网卡就返回该网卡的ifnet结构指针(该结构可连接所描述的卡

  * 的所有信息,见我所写的"关于FreeBSD4.4网络源代码接口层数据结构ifnet分析说明"),然后

  * if_ethersubr.c中的ether_input函数还要查看是否是发给本机的包,如果不是则调用本文的

  * bridge_forward函数进行数据的转发,这就是本文的主要功能.和交换机的原理有点类似.

  * 性能分析:

  * 由于在进行桥转发的过程中,是一定要使网卡工作在混杂模式的,所以进行网桥工作的卡要选购

  * 性能好的网卡,我个人觉得intel,3com等比较适合,其他的如rtl8139卡最好只用来做实验,不要

  * 用于实际的工作中(如果要我说明原因,请看看他的驱动程序你就知道了,但单机上网没关系),另

  * 外,PCI漕内不要其他的卡(如声卡等),我们知道,网卡驱动程序目前在BSD中工作于中断驱动模式,

  * 也就是说,进来一个包就能产生一个中断,而中断的系统开销有多达大家可以查看内核代码,总之

  * 是非常大,如果你是四块卡,而且担任网桥及一些过滤功能的话,肯定数据包通过量会比较大,那么

  * 中断产生的频率是平常一块卡的十几甚至是几十倍(平常的卡一个是数据量不大,另一个是不在混

  * 杂模式下).要想桥工作的效率提高,建议去除本机处理针对本机的高层协议处理,如IP协议等,或改

  * 写驱动程序为半轮询模式(使用timeout读卡的数据是否到达),OpenBSD中的bridge是真正的把bridge做

  * 为一个设备来编写的,配备了标准的设备驱动程序,不过我还没有完全分析过,大概的看了看,觉得

  * 比FreeBSD中的桥功能要强很多啊!

  * 如何驱动一个网桥:

  * 首先在内核配置文件中加入以下一行:

  * option BRIDGE

  * 注:我所使用的4.4版本是必须的,当前版本不需要这样,可以kld动态加载.

  * 重新编译核心后重启,使用 sysctl net.link.ether.bridge=1启动桥功能.

  * 如果想把网卡编组,使用 sysctl net.link.ether.bridge_cfg="设备:组号,设备:组号,..."即完成.

  */[/color]/*

  * 此处略去BSD版权申明

  */

  #include <sys/param.h>

  #include <sys/mbuf.h>

  #include <sys/malloc.h>

  #include <sys/protosw.h>

  #include <sys/systm.h>

  #include <sys/socket.h>

  #include <sys/ctype.h>

  #include <sys/kernel.h>

  #include <sys/sysctl.h>

  #include <net/pfil.h>

  #include <net/if.h>

  #include <net/if_types.h>

  #include <net/if_var.h>

  #include <netinet/in.h>

  #include <netinet/in_systm.h>

  #include <netinet/in_var.h>

  #include <netinet/ip.h>

  #include <netinet/if_ether.h>

  #include <net/route.h>

  #include <netinet/ip_fw.h>

  #include <netinet/ip_dummynet.h>

  #include <net/bridge.h>

  /*--------------------*/

  #define HASH_SIZE 8192 /* HASH表的大小,必须是2的权数 */

  /*hash表,该表存放与本机各块卡相连机器的硬件地址*/

  typedef struct hash_table {

  struct ifnet * name; /*与某机器相连的本机网卡的ifnet结构指针*/

  u_char etheraddr[6]; /*某台机器的硬件地址*/

  u_int16_t used; /*这是一个是否在用(某机器是否活动)的标志*/

  } bdg_hash_table ;

  /*

  *哈稀函数,我不理解他的算法,难道这样就不会产生同义字了吗?

  */

  #define HASH_FN(addr) ( \

  ntohs( ((u_int16_t *)addr)[1] ^ ((u_int16_t *)addr)[2] & (HASH_SIZE -1))

  /*

  * 下面的结构存储了本机的各卡的硬件地址.

  */

  struct bdg_addr {

  u_char etheraddr[6] ;/*本机卡的硬件地址*/

  u_int16_t _padding ;/*这个成员还象没看到他用过*/

  };

  /*

  * 这就是我们上面说的组,每块卡都有一个cluster_softc结构

  */

  struct cluster_softc {

  u_int16_t cluster_id; /*组的ID号*/

  u_int16_t ports;/*顺序号*/

  bdg_hash_table *ht;/*和该卡所连接的机器MAC地址哈稀表首指针*/

  struct bdg_addr *my_macs; /* 本卡的硬件地址 */

  };

  extern struct protosw inetsw[]; /* 在netinet/ip_input.c中 */

  extern u_char ip_protox[]; /* 在netinet/ip_input.c中 */

  static int n_clusters; /* 组的数量*/

  static struct cluster_softc *clusters; /*定义一个组的全局初始指针*/

  #define BDG_MUTED(ifp) (ifp2sc[ifp->if_index].flags & IFF_MUTE) /*检查本机某卡是否桥启用*/

  #define BDG_MUTE(ifp) ifp2sc[ifp->if_index].flags |= IFF_MUTE /*禁止本机的该卡桥功能*/

  #define BDG_CLUSTER(ifp) (ifp2sc[ifp->if_index].cluster)/*根据卡在核心的唯一序号定位他的cluster_softc结构指针*/

  #define BDG_SAMECLUSTER(ifp,src) \

  (src == NULL || BDG_CLUSTER(ifp) == BDG_CLUSTER(src) /*俩卡是否在同一组里?*/

  /*src==NULL代表数据包来自ether_output函数.*/

  #ifdef __i386__

  /*比较两个地址是否相同,硬件地址是6个字节,所以他先比较后面的长字(4个字节),再比较前一个字(2个字节)*/

  #define BDG_MATCH(a,b) ( \

  ((u_int16_t *)(a))[2] == ((u_int16_t *)(b))[2] && \

  *((u_int32_t *)(a)) == *((u_int32_t *)(b))

  /*以下是比较广播地址*/

  #define IS_ETHER_BROADCAST(a) ( \

  *((u_int32_t *)(a)) == 0xffffffff && \

  ((u_int16_t *)(a))[2] == 0xffff

  #else

  /* 非i386的机器不一定按长字或字对齐,所以按字节的方式比较. */

  #define BDG_MATCH(a,b) (!bcmp(a, b, ETHER_ADDR_LEN)

  #define IS_ETHER_BROADCAST(a) (!bcmp(a, "\377\377\377\377\377\377", 6))

  #endif

  /*

  *以下两句是调试用的.

  */

  #define DDB(x) x

  #define DEB(x)

  static int bdginit(void);/*申明bridge初始化函数*/

  static void parse_bdg_cfg(void);/*申明sysctl的字符参数分解函数
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,