Linux系统网络设备启动和禁止“ifconfig eth0 up/down”命令的跟踪

2024-02-10 02:58

本文主要是介绍Linux系统网络设备启动和禁止“ifconfig eth0 up/down”命令的跟踪,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前面文章讲了Linux系统的ethtool框架的一些东西,是从用户空间可以直观认识到的地方入手。同样,本文从Linux系统绝大部分人都熟悉的“ifconfig eth0 up”命令来跟踪一下此命令在内核中的发生了什么事情。由于ifconfig启动(up)和禁止(down)网络设备很相似,就放到一起讲了。

首先从ifconfig的源码入手,我下载的源码地址是http://www.tazenda.demon.co.uk/phil/net-tools/。这个网站上还有大量很有用的工具的源码,源码分布符合Linux的系统目录,有兴趣的可以去看看。

在我们输入up或down时,对应的代码如下:

main()
{if (!strcmp(*spp, "up")) {goterr |= set_flag(ifr.ifr_name, (IFF_UP | IFF_RUNNING));spp++;continue;}if (!strcmp(*spp, "down")) {goterr |= clr_flag(ifr.ifr_name, IFF_UP);spp++;continue;}
}

很简单,就是根据用户的输入来标志IFF_UP参考。当up时,使用set_flag置位IFF_UP和IFF_RUNNING,当down时,使用clr_flag清除IFF_UP。Linux的这种思想值得学习,其实对于内核来讲,真的就是通过IFF_UP标志来判断网卡的使能和禁止的。

来看设置标志的set_flag函数:

static int set_flag(char *ifname, short flag)
{struct ifreq ifr;safe_strncpy(ifr.ifr_name, ifname, IFNAMSIZ);if (ioctl(skfd, SIOCGIFFLAGS, &ifr) < 0) {fprintf(stderr, _("%s: unknown interface: %s\n"),ifname,     strerror(errno));return (-1);}safe_strncpy(ifr.ifr_name, ifname, IFNAMSIZ);ifr.ifr_flags |= flag;if (ioctl(skfd, SIOCSIFFLAGS, &ifr) < 0) {perror("SIOCSIFFLAGS");return -1;}return (0);
}

以及清除标志的clr_flag函数:

static int clr_flag(char *ifname, short flag)
{struct ifreq ifr;int fd;if (strchr(ifname, ':')) {/* This is a v4 alias interface.  Downing it via a socket foranother AF may have bad consequences. */fd = get_socket_for_af(AF_INET);if (fd < 0) {fprintf(stderr, _("No support for INET on this system.\n"));return -1;}} elsefd = skfd;safe_strncpy(ifr.ifr_name, ifname, IFNAMSIZ);if (ioctl(fd, SIOCGIFFLAGS, &ifr) < 0) {fprintf(stderr, _("%s: unknown interface: %s\n"),ifname, strerror(errno));return -1;}safe_strncpy(ifr.ifr_name, ifname, IFNAMSIZ);ifr.ifr_flags &= ~flag;if (ioctl(fd, SIOCSIFFLAGS, &ifr) < 0) {perror("SIOCSIFFLAGS");return -1;}return (0);
}

观察这两个函数,最后都是使用SIOCSIFFLAGS命令和内核交互。我们找到这个命令的使用地方,它位于net/core/dev.c文件,如下:

int dev_ioctl(struct net *net, unsigned int cmd, void __user *arg)
{case SIOCSIFFLAGS:case SIOCSIFMETRIC:case SIOCSIFMTU:case SIOCSIFMAP:case SIOCSIFHWADDR:case SIOCSIFSLAVE:case SIOCADDMULTI:case SIOCDELMULTI:case SIOCSIFHWBROADCAST:case SIOCSIFTXQLEN:case SIOCSMIIREG:case SIOCBONDENSLAVE:case SIOCBONDRELEASE:case SIOCBONDSETHWADDR:case SIOCBONDCHANGEACTIVE:case SIOCBRADDIF:case SIOCBRDELIF:case SIOCSHWTSTAMP:if (!capable(CAP_NET_ADMIN))return -EPERM;/* fall through */case SIOCBONDSLAVEINFOQUERY:case SIOCBONDINFOQUERY:dev_load(net, ifr.ifr_name);rtnl_lock();ret = dev_ifsioc(net, &ifr, cmd);rtnl_unlock();return ret;
}

SIOCSIFFLAGS会调用到dev_ifsioc函数:

static int dev_ifsioc(struct net *net, struct ifreq *ifr, unsigned int cmd)
{switch (cmd) {case SIOCSIFFLAGS:     /* Set interface flags */return dev_change_flags(dev, ifr->ifr_flags);
}

继续跟进dev_change_flags函数:

int dev_change_flags(struct net_device *dev, unsigned flags)
{int ret, changes;int old_flags = dev->flags;ret = __dev_change_flags(dev, flags); // 打开设备if (ret < 0)return ret;changes = old_flags ^ dev->flags;if (changes)rtmsg_ifinfo(RTM_NEWLINK, dev, changes); // 暂未了解__dev_notify_flags(dev, old_flags); // 向通道链netdev_chain发出通知return ret;
}

真正干活的是__dev_change_flags函数:

int __dev_change_flags(struct net_device *dev, unsigned int flags)
{if ((old_flags ^ flags) & IFF_UP) {     /* Bit is different  ? */ret = ((old_flags & IFF_UP) ? __dev_close : __dev_open)(dev);
}

根据标志选择打开设备__dev_open或关闭__dev_close。在同一文件还有dev_open或dev_close,我发现它们使用了EXPORT_SYMBOL导出,供给其它模块使用,但在这里,是使用了__dev_XX函数的。

打开函数如下:

static int __dev_open(struct net_device *dev)
{const struct net_device_ops *ops = dev->netdev_ops;int ret;ASSERT_RTNL();/**	Is it even present?*/if (!netif_device_present(dev))return -ENODEV;ret = call_netdevice_notifiers(NETDEV_PRE_UP, dev);ret = notifier_to_errno(ret);if (ret)return ret;/**	Call device private open method*/set_bit(__LINK_STATE_START, &dev->state);if (ops->ndo_validate_addr)ret = ops->ndo_validate_addr(dev);if (!ret && ops->ndo_open)ret = ops->ndo_open(dev);/**	If it went open OK then:*/if (ret)clear_bit(__LINK_STATE_START, &dev->state);return ret;
}

在真正调用具体驱动的接口前,先发NETDEV_PRE_UP给到通知链,再置__LINK_STATE_START,然后才调用驱动的ndo_open接口,最后需要清除__LINK_STATE_START标志。当ndo_open接口调用返回非0(即失败)时,需要清除__LINK_STATE_START标志,因为在调用之前已经置位了该标志,如此一来,才是有始有终。最后返回具体驱动接口的返回值。 (2019.6.26:感谢网友Tiger指正)

关闭函数如下:

static int __dev_close(struct net_device *dev)
{const struct net_device_ops *ops = dev->netdev_ops;ASSERT_RTNL();might_sleep();/**	Tell people we are going down, so that they can*	prepare to death, when device is still operating.*/call_netdevice_notifiers(NETDEV_GOING_DOWN, dev);clear_bit(__LINK_STATE_START, &dev->state);/* Synchronize to scheduled poll. We cannot touch poll list,* it can be even on different cpu. So just clear netif_running().** dev->stop() will invoke napi_disable() on all of it's* napi_struct instances on this device.*/smp_mb__after_clear_bit(); /* Commit netif_running(). */dev_deactivate(dev);/**	Call the device specific close. This cannot fail.*	Only if device is UP**	We allow it to be called even after a DETACH hot-plug*	event.*/if (ops->ndo_stop)ops->ndo_stop(dev);/**	Device is now down.*/dev->flags &= ~IFF_UP;return 0;
}

在真正调用具体驱动的接口前,先发NETDEV_GOING_DOWN给到通知链,表示网络设备准备挂了,再清除__LINK_STATE_START标志,然后才调用驱动的ndo_stop接口,最后需要清除IFF_UP。

经过内核的层层结构,条条框框,终于到了具体的驱动了,上面的函数使用的接口实际上是net_device_ops结构体的函数指针,还是以igb驱动为例,赋值如下:

static const struct net_device_ops igb_netdev_ops = {.ndo_open		= igb_open,.ndo_stop		= igb_close,.ndo_start_xmit		= igb_xmit_frame_adv,.ndo_get_stats64	= igb_get_stats64,.ndo_set_rx_mode	= igb_set_rx_mode,.ndo_set_multicast_list	= igb_set_rx_mode,.ndo_set_mac_address	= igb_set_mac,.ndo_change_mtu		= igb_change_mtu,.ndo_do_ioctl		= igb_ioctl,.ndo_tx_timeout		= igb_tx_timeout,.ndo_validate_addr	= eth_validate_addr,.ndo_vlan_rx_register	= igb_vlan_rx_register,.ndo_vlan_rx_add_vid	= igb_vlan_rx_add_vid,.ndo_vlan_rx_kill_vid	= igb_vlan_rx_kill_vid,.ndo_set_vf_mac		= igb_ndo_set_vf_mac,.ndo_set_vf_vlan	= igb_ndo_set_vf_vlan,.ndo_set_vf_tx_rate	= igb_ndo_set_vf_bw,.ndo_get_vf_config	= igb_ndo_get_vf_config,
#ifdef CONFIG_NET_POLL_CONTROLLER.ndo_poll_controller	= igb_netpoll,
#endif
};

我们看到最开始的2个函数就是打开和关闭。在igb_probe函数对igb_netdev_ops进行赋值:

netdev->netdev_ops = &igb_netdev_ops;

至此,整个过程分析完毕。

文中涉及到通知链,网络设备通知链netdev_chain,这个还没研究过,这里简单列一下:

// 声明通知链表
static RAW_NOTIFIER_HEAD(netdev_chain);//注册
int register_netdevice_notifier(struct notifier_block *nb)
{
raw_notifier_chain_register(&netdev_chain, nb);
}注销:
int unregister_netdevice_notifier(struct notifier_block *nb)
{int err;err = raw_notifier_chain_unregister(&netdev_chain, nb);
}

31号的PS:

写完后想一想,感觉没到分析彻底,因为到具体的驱动后干了些什么还没跟踪,于是又花了点时间跟踪一下。我跟踪的是ti的网卡驱动,主要实现代码在cpsw.c文件,在http://lxr.oss.org.cn/source/drivers/net/ethernet/ti/?v=3.17可以找到。下面列出启动网卡时的过程的重要函数调用:

   > cpsw_ndo_open> cpsw_slave_open> phy_connect (传递cpsw_adjust_link)> phy_connect_direct (PHY_READY)>  phy_prepare_link (赋值cpsw_adjust_link为adjust_link)> phy_start_machine> phy_start (PHY_READY变成PHY_UP)

phy_start之后进入了phy驱动重要的状态判断函数phy_state_machine,phy驱动有一个工作队列就是调用这个函数的,这个函数判断了网络各种状态:PHY_DOWN、PHY_UPPHY_AN、PHY_NOLINK,等,并做出对应的动作。我们设置了PHY_UP,则函数过程如下:

phy_state_machine> phy_start_aneg> config_aneg> genphy_config_aneg(实际上是这个函数,由phy驱动赋值的)

到了genphy_config_aneg这个函数,就是直接和phy芯片打交道了,读phy寄存器、写phy寄存器。默认情况下会进行自动协商(其实就是写phy的第0个寄存器),当然,如果不是,即phy_device成员变量autoneg是AUTONEG_DISABLE,则会强制设置指定的速率、双工模式。

 


至此,就不再继续分析、跟踪了。

2015.3.30 李迟

这篇关于Linux系统网络设备启动和禁止“ifconfig eth0 up/down”命令的跟踪的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/695968

相关文章

基于C++的UDP网络通信系统设计与实现详解

《基于C++的UDP网络通信系统设计与实现详解》在网络编程领域,UDP作为一种无连接的传输层协议,以其高效、低延迟的特性在实时性要求高的应用场景中占据重要地位,下面我们就来看看如何从零开始构建一个完整... 目录前言一、UDP服务器UdpServer.hpp1.1 基本框架设计1.2 初始化函数Init详解

Linux内核定时器使用及说明

《Linux内核定时器使用及说明》文章详细介绍了Linux内核定时器的特性、核心数据结构、时间相关转换函数以及操作API,通过示例展示了如何编写和使用定时器,包括按键消抖的应用... 目录1.linux内核定时器特征2.Linux内核定时器核心数据结构3.Linux内核时间相关转换函数4.Linux内核定时

检查 Nginx 是否启动的几种方法

《检查Nginx是否启动的几种方法》本文主要介绍了检查Nginx是否启动的几种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学... 目录1. 使用 systemctl 命令(推荐)2. 使用 service 命令3. 检查进程是否存在4

Linux镜像文件制作方式

《Linux镜像文件制作方式》本文介绍了Linux镜像文件制作的过程,包括确定磁盘空间布局、制作空白镜像文件、分区与格式化、复制引导分区和其他分区... 目录1.确定磁盘空间布局2.制作空白镜像文件3.分区与格式化1) 分区2) 格式化4.复制引导分区5.复制其它分区1) 挂载2) 复制bootfs分区3)

解决idea启动项目报错java: OutOfMemoryError: insufficient memory

《解决idea启动项目报错java:OutOfMemoryError:insufficientmemory》:本文主要介绍解决idea启动项目报错java:OutOfMemoryError... 目录原因:解决:总结 原因:在Java中遇到OutOfMemoryError: insufficient me

SpringBoot项目整合Netty启动失败的常见错误总结

《SpringBoot项目整合Netty启动失败的常见错误总结》本文总结了SpringBoot集成Netty时常见的8类问题及解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参... 目录一、端口冲突问题1. Tomcat与Netty端口冲突二、主线程被阻塞问题1. Netty启动阻

SpringBoot整合Kafka启动失败的常见错误问题总结(推荐)

《SpringBoot整合Kafka启动失败的常见错误问题总结(推荐)》本文总结了SpringBoot项目整合Kafka启动失败的常见错误,包括Kafka服务器连接问题、序列化配置错误、依赖配置问题、... 目录一、Kafka服务器连接问题1. Kafka服务器无法连接2. 开发环境与生产环境网络不通二、序

Redis 命令详解与实战案例

《Redis命令详解与实战案例》本文详细介绍了Redis的基础知识、核心数据结构与命令、高级功能与命令、最佳实践与性能优化,以及实战应用场景,通过实战案例,展示了如何使用Redis构建高性能应用系统... 目录Redis 命令详解与实战案例一、Redis 基础介绍二、Redis 核心数据结构与命令1. 字符

Linux服务器数据盘移除并重新挂载的全过程

《Linux服务器数据盘移除并重新挂载的全过程》:本文主要介绍在Linux服务器上移除并重新挂载数据盘的整个过程,分为三大步:卸载文件系统、分离磁盘和重新挂载,每一步都有详细的步骤和注意事项,确保... 目录引言第一步:卸载文件系统第二步:分离磁盘第三步:重新挂载引言在 linux 服务器上移除并重新挂p

Linux下屏幕亮度的调节方式

《Linux下屏幕亮度的调节方式》文章介绍了Linux下屏幕亮度调节的几种方法,包括图形界面、手动调节(使用ACPI内核模块)和外接显示屏调节,以及自动调节软件(CaliseRedshift和Reds... 目录1 概述2 手动调节http://www.chinasem.cn2.1 手动屏幕调节2.2 外接显