中移（苏州）软件技术有限公司面试问题与解答（8）—

本文主要是介绍中移（苏州）软件技术有限公司面试问题与解答（8）—— coredump与vmcore（1），希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

接前一篇文章：中移（苏州）软件技术有限公司面试问题与解答（0）—— 面试感悟与问题记录

本文参考以下文章：

详解coredump

内核vmcore文件分析方法

特此致谢！

本文对于中移（苏州）软件技术有限公司面试问题中的“（13）实际工作中有没有使用core dump进行调试以及问题定位？core dump的具体机制是什么？”进行解答与解析。

实际上不只是中移（苏州）闻到了这个问题，笔者在前天参加蔚来汽车一面时，再次被问到了coredump和vmcore；并且当年在裕兴软件，只要年轻的技术员们（声明：不包括本人）一出疑难问题搞不定，向技术女副总求助、求教，她的的一句话永远都是：把coredump给我；前几年在小狗机器人的时候，在给系统“添装备”时，也稍微研究过coredump和vmcore，当时还转载过博文（ulimit -c unlimited 详解）。只是一来当时研究的时间不长，二来时间过去几年了，印象早已不深了。正好借着最近这个“热乎劲”，把coredump和vmcore再次全方位研究一下，一把研究透了，今后就不能忘了。

1. 什么是coredump

经常听到大家说到程序core掉了（笔者其实经常听到的是程序崩了、系统荡掉了），需要定位解决。这里说的大部分是指对应程序由于各种异常或者bug导致在运行过程中异常退出或者中止，并且在满足一定条件下会产生一个叫做core的文件。
通常情况下，core文件会包含了程序运行时的内存、寄存器状态、堆栈指针、内存管理信息还有各种函数调用堆栈信息等。我们可以理解为是程序工作当前状态存储生成的一个文件，许多的程序出错的时候都会产生一个core文件，通过工具分析这个文件，我们可以定位到程序异常退出的时候对应的堆栈调用等信息，找出问题所在并进行及时解决。

2. 开启或关闭core文件的生成

（1）查看core文件是否打开

ulimit -c 可以查看是否打开此选项，若为0则为关闭。

ulimit -c # 如果为 0 表示coredump开关处于关闭状态

（2）打开core文件生成

ulimit -c 1024 # 1024个blocks,一般1block=512bytes
ulimit -c unlimited # 取消大小限制

（3）检查core文件的选项是否打开

ulimit -a # 显示当前所有limit信息

（4）永久配置core

以上配置只对当前会话起作用，下次重新登陆后，还是得重新配置。要想配置永久生效，得在/etc/profile或者/etc/security/limits.conf文件中进行配置。有两种方法：

方法1 通过/etc/profile（或bashrc、bash_profile）设置

首先打开/etc/profile文件，一般都可以在文件中找到这句语句：ulimit -S -c 0 > /dev/null 2>&1，根据上面的例子，只要把那个0改为unlimited就ok了，然后保存退出。之后通过source /etc/profile使当期设置生效。

如果想配置只针对某一用户有效，则修改此用户的~/.bashrc或者~/.bash_profile文件，加入一句或者修改既有的，还是改为

ulimit -c unlimited

方法2 通过/etc/security/limits.conf文件来设置

首先以root权限登陆，然后打开/etc/security/limits.conf文件，进行配置：

#vim /etc/security/limits.conf
<domain> <type> <item> <value>

* soft core unlimited

3. core文件的存储位置和文件名

除了可以设置core文件的大小之外，还可以对core文件的名称进行一些规定。这种设置是对/proc/sys/kernel/core_pattern和/proc/sys/kernel/core_uses_pid这两个文件进行修改。

（1）存储位置

core文件默认的存储位置与对应的可执行程序在同一目录下，文件名是core。可以通过下面的命令看到core文件的存在位置：

cat /proc/sys/kernel/core_pattern # 缺省值是|/usr/share/apport/apport %p %s %c %P

注意：这里是指在进程当前工作目录的下创建。通常与程序在相同的路径下。但如果程序中调用了chdir函数，则有可能改变了当前工作目录。这时core文件创建在chdir指定的路径下。有好多程序崩溃了，我们却找不到core文件放在什么位置。和chdir函数就有关系。当然程序崩溃了不一定都产生core文件。

更改coredump文件的存储位置：

echo “/data/coredump/core”> /proc/sys/kernel/core_pattern # 把core文件生成到/data/coredump/core目录下

（2）core文件的命名

缺省情况下，内核在coredump时所产生的core文件放在与该程序相同的目录中，并且文件名固定为“core”。很显然，如果有多个程序产生core文件，或者同一个程序多次崩溃，就会重复覆盖同一个core文件，因此我们有必要对不同程序生成的core文件进行分别命名。有两种方法：

方法1 通过/proc/sys/kernel/core_uses_pid设置

/proc/sys/kernel/core_uses_pid文件可以控制core文件的文件名中是否添加pid作为扩展。文件内容为1，表示添加pid作为扩展名，生成的core文件格式为core.xxxx；为0则表示生成的core文件同一命名为core。可通过以下命令修改此文件：

echo "1" > /proc/sys/kernel/core_uses_pid

方法2 通过proc/sys/kernel/core_pattern设置

/proc/sys/kernel/core_pattern文件可以控制core文件保存位置和文件名格式，可通过以下命令修改此文件：

echo "/corefile/core-%e-%p-%t" > core_pattern # 可以将core文件统一生成到/corefile目录下，产生的文件名为core-命令名-pid-时间戳

core_pattern接受的是core文件名称的pattern，它包含任何字符串，并且用%作为转移符号生成一些标示符，为core文件名称加入特殊含义。已定义的标示符有如下这些：

%%：单个%字符，相当于%

%p：添加pid，相当于<pid>

%u：添加当前uid，相当于<uid>

%g：添加当前gid，相当于<gid>

%s：添加导致产生core的信号，相当于导致dump的信号的数字

%t：添加core文件生成时的unix时间，相当于dump的时间

%e：添加主机名，相当于执行文件的名称

%h：添加程序文件名，相当于hostname

除以上这些标志位外，还规定：

1. 末尾的单个%可以直接去除；

2. %加上除上述以外的任何字符，%和该字符都会被去除；

3. 所有其它字符都作为一般字符加入名称中；

4. core文件的名称最大值为64个字节（包括'\0'）；

5. core_pattern中默认的pattern为core；

6. 为了保持兼容性，通过设置core_uses_pid，可以在core文件的末尾加上%p；

7. pattern中可以包含路径信息。

至此，coredump就基本弄清楚了。按照笔者的理解，所谓coredump，其实应该是“core dump”，也就是说把core文件dump出来。

下回借着coredump，也把vmcore相关内容讲一下。

这篇关于中移（苏州）软件技术有限公司面试问题与解答（8）—— coredump与vmcore（1）的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！