c++ - Cómo generar automáticamente un stacktrace cuando mi programa falla




gcc crash (19)

Linux

Si bien ya se ha sugerido el uso de backtrace () en execinfo.h para imprimir un seguimiento de pila y salir correctamente cuando se produce un fallo de segmentación, no veo ninguna mención de las complejidades necesarias para garantizar que el retroceso resultante apunta a la ubicación real de el fallo (al menos para algunas arquitecturas - x86 y ARM).

Las dos primeras entradas en la cadena de cuadros de pila cuando ingresas al controlador de señales contienen una dirección de retorno dentro del controlador de señales y una dentro de sigaction () en libc. El marco de la pila de la última función llamada antes de la señal (que es la ubicación de la falla) se pierde.

Código

#ifndef _GNU_SOURCE
#define _GNU_SOURCE
#endif
#ifndef __USE_GNU
#define __USE_GNU
#endif

#include <execinfo.h>
#include <signal.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <ucontext.h>
#include <unistd.h>

/* This structure mirrors the one found in /usr/include/asm/ucontext.h */
typedef struct _sig_ucontext {
 unsigned long     uc_flags;
 struct ucontext   *uc_link;
 stack_t           uc_stack;
 struct sigcontext uc_mcontext;
 sigset_t          uc_sigmask;
} sig_ucontext_t;

void crit_err_hdlr(int sig_num, siginfo_t * info, void * ucontext)
{
 void *             array[50];
 void *             caller_address;
 char **            messages;
 int                size, i;
 sig_ucontext_t *   uc;

 uc = (sig_ucontext_t *)ucontext;

 /* Get the address at the time the signal was raised */
#if defined(__i386__) // gcc specific
 caller_address = (void *) uc->uc_mcontext.eip; // EIP: x86 specific
#elif defined(__x86_64__) // gcc specific
 caller_address = (void *) uc->uc_mcontext.rip; // RIP: x86_64 specific
#else
#error Unsupported architecture. // TODO: Add support for other arch.
#endif

 fprintf(stderr, "signal %d (%s), address is %p from %p\n", 
  sig_num, strsignal(sig_num), info->si_addr, 
  (void *)caller_address);

 size = backtrace(array, 50);

 /* overwrite sigaction with caller's address */
 array[1] = caller_address;

 messages = backtrace_symbols(array, size);

 /* skip first stack frame (points here) */
 for (i = 1; i < size && messages != NULL; ++i)
 {
  fprintf(stderr, "[bt]: (%d) %s\n", i, messages[i]);
 }

 free(messages);

 exit(EXIT_FAILURE);
}

int crash()
{
 char * p = NULL;
 *p = 0;
 return 0;
}

int foo4()
{
 crash();
 return 0;
}

int foo3()
{
 foo4();
 return 0;
}

int foo2()
{
 foo3();
 return 0;
}

int foo1()
{
 foo2();
 return 0;
}

int main(int argc, char ** argv)
{
 struct sigaction sigact;

 sigact.sa_sigaction = crit_err_hdlr;
 sigact.sa_flags = SA_RESTART | SA_SIGINFO;

 if (sigaction(SIGSEGV, &sigact, (struct sigaction *)NULL) != 0)
 {
  fprintf(stderr, "error setting signal handler for %d (%s)\n",
    SIGSEGV, strsignal(SIGSEGV));

  exit(EXIT_FAILURE);
 }

 foo1();

 exit(EXIT_SUCCESS);
}

Salida

signal 11 (Segmentation fault), address is (nil) from 0x8c50
[bt]: (1) ./test(crash+0x24) [0x8c50]
[bt]: (2) ./test(foo4+0x10) [0x8c70]
[bt]: (3) ./test(foo3+0x10) [0x8c8c]
[bt]: (4) ./test(foo2+0x10) [0x8ca8]
[bt]: (5) ./test(foo1+0x10) [0x8cc4]
[bt]: (6) ./test(main+0x74) [0x8d44]
[bt]: (7) /lib/libc.so.6(__libc_start_main+0xa8) [0x40032e44]

Todos los peligros de llamar a las funciones backtrace () en un manejador de señales aún existen y no deben pasarse por alto, pero me parece que la funcionalidad que describí aquí es muy útil para los errores de depuración.

Es importante tener en cuenta que el ejemplo que proporcioné está desarrollado / probado en Linux para x86. También lo he implementado con éxito en ARM usando uc_mcontext.arm_pc lugar de uc_mcontext.eip .

Aquí hay un enlace al artículo donde aprendí los detalles de esta implementación: http://www.linuxjournal.com/article/6391

Estoy trabajando en Linux con el compilador GCC. Cuando mi programa C ++ falla, me gustaría que generara automáticamente un seguimiento de pila.

Mi programa está siendo ejecutado por muchos usuarios diferentes y también se ejecuta en Linux, Windows y Macintosh (todas las versiones se compilan usando gcc ).

Me gustaría que mi programa pueda generar un seguimiento de la pila cuando se bloquee y la próxima vez que el usuario lo ejecute, les preguntará si está bien que me envíen el seguimiento de la pila para que pueda localizar el problema. Puedo manejar el envío de la información, pero no sé cómo generar la cadena de seguimiento. ¿Algunas ideas?


* nix: puede interceptar SIGSEGV (por lo general, esta señal se genera antes de fallar) y mantener la información en un archivo. (además del archivo central que puede usar para depurar usando gdb por ejemplo).

ganar: compruebe this desde msdn.

También puede consultar el código chrome de google para ver cómo maneja los bloqueos. Tiene un bonito mecanismo de manejo de excepciones.


Aunque se ha proporcionado una respuesta correcta que describe cómo utilizar la función 1 de GNU libc backtrace() y proporcioné mi propia respuesta que describe cómo garantizar que un retroceso desde un controlador de señales apunta a la ubicación real del error 2 , no No vea ninguna mención de la salida de símbolos de C ++ demangling desde el backtrace.

Al obtener backtraces de un programa de C ++, la salida se puede ejecutar a través de c++filt 1 para desentrañar los símbolos o usando abi::__cxa_demangle 1 directamente.

  • 1 Linux y OS X Tenga en cuenta que c++filt y __cxa_demangle son específicos de GCC
  • 2 Linux

El siguiente ejemplo de C ++ Linux usa el mismo controlador de señal que mi otra respuesta y demuestra cómo se puede usar c++filt para desentrañar los símbolos.

Código :

class foo
{
public:
    foo() { foo1(); }

private:
    void foo1() { foo2(); }
    void foo2() { foo3(); }
    void foo3() { foo4(); }
    void foo4() { crash(); }
    void crash() { char * p = NULL; *p = 0; }
};

int main(int argc, char ** argv)
{
    // Setup signal handler for SIGSEGV
    ...

    foo * f = new foo();
    return 0;
}

Salida ( ./test ):

signal 11 (Segmentation fault), address is (nil) from 0x8048e07
[bt]: (1) ./test(crash__3foo+0x13) [0x8048e07]
[bt]: (2) ./test(foo4__3foo+0x12) [0x8048dee]
[bt]: (3) ./test(foo3__3foo+0x12) [0x8048dd6]
[bt]: (4) ./test(foo2__3foo+0x12) [0x8048dbe]
[bt]: (5) ./test(foo1__3foo+0x12) [0x8048da6]
[bt]: (6) ./test(__3foo+0x12) [0x8048d8e]
[bt]: (7) ./test(main+0xe0) [0x8048d18]
[bt]: (8) ./test(__libc_start_main+0x95) [0x42017589]
[bt]: (9) ./test(__register_frame_info+0x3d) [0x8048981]

Salida demangled ( ./test 2>&1 | c++filt ):

signal 11 (Segmentation fault), address is (nil) from 0x8048e07
[bt]: (1) ./test(foo::crash(void)+0x13) [0x8048e07]
[bt]: (2) ./test(foo::foo4(void)+0x12) [0x8048dee]
[bt]: (3) ./test(foo::foo3(void)+0x12) [0x8048dd6]
[bt]: (4) ./test(foo::foo2(void)+0x12) [0x8048dbe]
[bt]: (5) ./test(foo::foo1(void)+0x12) [0x8048da6]
[bt]: (6) ./test(foo::foo(void)+0x12) [0x8048d8e]
[bt]: (7) ./test(main+0xe0) [0x8048d18]
[bt]: (8) ./test(__libc_start_main+0x95) [0x42017589]
[bt]: (9) ./test(__register_frame_info+0x3d) [0x8048981]

Lo siguiente se basa en el controlador de señales de mi respuesta original y puede reemplazar el controlador de señales en el ejemplo anterior para demostrar cómo abi::__cxa_demangle se puede usar para desentrañar los símbolos. Este manejador de señales produce la misma salida descompuesta que el ejemplo anterior.

Código :

void crit_err_hdlr(int sig_num, siginfo_t * info, void * ucontext)
{
    sig_ucontext_t * uc = (sig_ucontext_t *)ucontext;

    void * caller_address = (void *) uc->uc_mcontext.eip; // x86 specific

    std::cerr << "signal " << sig_num 
              << " (" << strsignal(sig_num) << "), address is " 
              << info->si_addr << " from " << caller_address 
              << std::endl << std::endl;

    void * array[50];
    int size = backtrace(array, 50);

    array[1] = caller_address;

    char ** messages = backtrace_symbols(array, size);    

    // skip first stack frame (points here)
    for (int i = 1; i < size && messages != NULL; ++i)
    {
        char *mangled_name = 0, *offset_begin = 0, *offset_end = 0;

        // find parantheses and +address offset surrounding mangled name
        for (char *p = messages[i]; *p; ++p)
        {
            if (*p == '(') 
            {
                mangled_name = p; 
            }
            else if (*p == '+') 
            {
                offset_begin = p;
            }
            else if (*p == ')')
            {
                offset_end = p;
                break;
            }
        }

        // if the line could be processed, attempt to demangle the symbol
        if (mangled_name && offset_begin && offset_end && 
            mangled_name < offset_begin)
        {
            *mangled_name++ = '\0';
            *offset_begin++ = '\0';
            *offset_end++ = '\0';

            int status;
            char * real_name = abi::__cxa_demangle(mangled_name, 0, 0, &status);

            // if demangling is successful, output the demangled function name
            if (status == 0)
            {    
                std::cerr << "[bt]: (" << i << ") " << messages[i] << " : " 
                          << real_name << "+" << offset_begin << offset_end 
                          << std::endl;

            }
            // otherwise, output the mangled function name
            else
            {
                std::cerr << "[bt]: (" << i << ") " << messages[i] << " : " 
                          << mangled_name << "+" << offset_begin << offset_end 
                          << std::endl;
            }
            free(real_name);
        }
        // otherwise, print the whole line
        else
        {
            std::cerr << "[bt]: (" << i << ") " << messages[i] << std::endl;
        }
    }
    std::cerr << std::endl;

    free(messages);

    exit(EXIT_FAILURE);
}

Consulte la función Stack Trace en ACE (ADAPTIVE Communication Environment). Ya está escrito para cubrir todas las plataformas principales (y más). La biblioteca tiene una licencia de estilo BSD, por lo que incluso puede copiar / pegar el código si no desea utilizar ACE.


Encontré que la solución @tgamblin no está completa. No se puede manejar con . Creo que porque, por defecto, el manejador de señales se llama con la misma pila y SIGSEGV se lanza dos veces. Para protegerte necesitas registrar una pila independiente para el manejador de señales.

Puedes verificar esto con el código de abajo. Por defecto el manejador falla. Con la macro definida STACK_OVERFLOW está bien.

#include <iostream>
#include <execinfo.h>
#include <signal.h>
#include <stdlib.h>
#include <unistd.h>
#include <string>
#include <cassert>

using namespace std;

//#define STACK_OVERFLOW

#ifdef STACK_OVERFLOW
static char stack_body[64*1024];
static stack_t sigseg_stack;
#endif

static struct sigaction sigseg_handler;

void handler(int sig) {
  cerr << "sig seg fault handler" << endl;
  const int asize = 10;
  void *array[asize];
  size_t size;

  // get void*'s for all entries on the stack
  size = backtrace(array, asize);

  // print out all the frames to stderr
  cerr << "stack trace: " << endl;
  backtrace_symbols_fd(array, size, STDERR_FILENO);
  cerr << "resend SIGSEGV to get core dump" << endl;
  signal(sig, SIG_DFL);
  kill(getpid(), sig);
}

void foo() {
  foo();
}

int main(int argc, char **argv) {
#ifdef STACK_OVERFLOW
  sigseg_stack.ss_sp = stack_body;
  sigseg_stack.ss_flags = SS_ONSTACK;
  sigseg_stack.ss_size = sizeof(stack_body);
  assert(!sigaltstack(&sigseg_stack, nullptr));
  sigseg_handler.sa_flags = SA_ONSTACK;
#else
  sigseg_handler.sa_flags = SA_RESTART;  
#endif
  sigseg_handler.sa_handler = &handler;
  assert(!sigaction(SIGSEGV, &sigseg_handler, nullptr));
  cout << "sig action set" << endl;
  foo();
  return 0;
} 

Es importante tener en cuenta que una vez que genere un archivo central, necesitará usar la herramienta gdb para verlo. Para que gdb le dé sentido a su archivo principal, debe decirle a gcc que instale el binario con símbolos de depuración: para hacer esto, compile con el indicador -g:

$ g++ -g prog.cpp -o prog

Luego, puedes configurar "ulimit -c unlimited" para que descargue un núcleo, o simplemente ejecuta tu programa dentro de gdb. Me gusta más el segundo enfoque:

$ gdb ./prog
... gdb startup output ...
(gdb) run
... program runs and crashes ...
(gdb) where
... gdb outputs your stack trace ...

Espero que esto ayude.


Gracias a enthusiasticgeek por llamar mi atención a la utilidad addr2line.

He escrito una secuencia de comandos rápida y sucia para procesar la salida de la respuesta que se proporciona here : (¡gracias a jschmier!) Mediante la utilidad addr2line.

La secuencia de comandos acepta un solo argumento: el nombre del archivo que contiene la salida de la utilidad de jschmier.

La salida debe imprimir algo como lo siguiente para cada nivel de la traza:

BACKTRACE:  testExe 0x8A5db6b
FILE:       pathToFile/testExe.C:110
FUNCTION:   testFunction(int) 
   107  
   108           
   109           int* i = 0x0;
  *110           *i = 5;
   111      
   112        }
   113        return i;

Código:

#!/bin/bash

LOGFILE=$1

NUM_SRC_CONTEXT_LINES=3

old_IFS=$IFS  # save the field separator           
IFS=$'\n'     # new field separator, the end of line           

for bt in `cat $LOGFILE | grep '\[bt\]'`; do
   IFS=$old_IFS     # restore default field separator 
   printf '\n'
   EXEC=`echo $bt | cut -d' ' -f3 | cut -d'(' -f1`  
   ADDR=`echo $bt | cut -d'[' -f3 | cut -d']' -f1`
   echo "BACKTRACE:  $EXEC $ADDR"
   A2L=`addr2line -a $ADDR -e $EXEC -pfC`
   #echo "A2L:        $A2L"

   FUNCTION=`echo $A2L | sed 's/\<at\>.*//' | cut -d' ' -f2-99`
   FILE_AND_LINE=`echo $A2L | sed 's/.* at //'`
   echo "FILE:       $FILE_AND_LINE"
   echo "FUNCTION:   $FUNCTION"

   # print offending source code
   SRCFILE=`echo $FILE_AND_LINE | cut -d':' -f1`
   LINENUM=`echo $FILE_AND_LINE | cut -d':' -f2`
   if ([ -f $SRCFILE ]); then
      cat -n $SRCFILE | grep -C $NUM_SRC_CONTEXT_LINES "^ *$LINENUM\>" | sed "s/ $LINENUM/*$LINENUM/"
   else
      echo "File not found: $SRCFILE"
   fi
   IFS=$'\n'     # new field separator, the end of line           
done

IFS=$old_IFS     # restore default field separator 

He estado mirando este problema por un tiempo.

Y enterrado profundamente en las herramientas de rendimiento de Google README

http://code.google.com/p/google-perftools/source/browse/trunk/README

habla de libunwind

libunwind

Me encantaría escuchar las opiniones de esta biblioteca.

El problema con -rdynamic es que puede aumentar el tamaño del binario de manera relativamente significativa en algunos casos


Mirar:

hombre 3 retroceso

Y:

#include <exeinfo.h>
int backtrace(void **buffer, int size);

Estas son las extensiones de GNU.


No especificó su sistema operativo, por lo que es difícil de responder. Si está utilizando un sistema basado en gnu libc, es posible que pueda usar la función libc backtrace() .

GCC también tiene dos componentes integrados que pueden ayudarlo, pero que pueden o no implementarse completamente en su arquitectura, y son __builtin_frame_address y __builtin_return_address . Ambos quieren un nivel entero inmediato (por inmediato, quiero decir que no puede ser una variable). Si __builtin_frame_address para un nivel dado no es cero, debería ser seguro tomar la dirección de retorno del mismo nivel.


Para Linux y creo que Mac OS X, si está usando gcc, o cualquier compilador que use glibc, puede usar las funciones backtrace () en execinfo.h para imprimir un stacktrace y salir con gracia cuando se produce un fallo de segmentación. La documentación se puede encontrar en el manual de libc .

Aquí hay un programa de ejemplo que instala un controlador SIGSEGV e imprime un seguimiento de pila en stderr cuando se ejecuta el error. La función baz() aquí causa el segfault que activa el manejador:

#include <stdio.h>
#include <execinfo.h>
#include <signal.h>
#include <stdlib.h>
#include <unistd.h>


void handler(int sig) {
  void *array[10];
  size_t size;

  // get void*'s for all entries on the stack
  size = backtrace(array, 10);

  // print out all the frames to stderr
  fprintf(stderr, "Error: signal %d:\n", sig);
  backtrace_symbols_fd(array, size, STDERR_FILENO);
  exit(1);
}

void baz() {
 int *foo = (int*)-1; // make a bad pointer
  printf("%d\n", *foo);       // causes segfault
}

void bar() { baz(); }
void foo() { bar(); }


int main(int argc, char **argv) {
  signal(SIGSEGV, handler);   // install our handler
  foo(); // this will call foo, bar, and baz.  baz segfaults.
}

Al compilar con -g -rdynamic información de símbolos en tu salida, que glibc puede usar para hacer un buen seguimiento de pila:

$ gcc -g -rdynamic ./test.c -o test

Ejecutando esto obtienes esta salida:

$ ./test
Error: signal 11:
./test(handler+0x19)[0x400911]
/lib64/tls/libc.so.6[0x3a9b92e380]
./test(baz+0x14)[0x400962]
./test(bar+0xe)[0x400983]
./test(foo+0xe)[0x400993]
./test(main+0x28)[0x4009bd]
/lib64/tls/libc.so.6(__libc_start_main+0xdb)[0x3a9b91c4bb]
./test[0x40086a]

Esto muestra el módulo de carga, el desplazamiento y la función de la que procedía cada fotograma de la pila. Aquí puede ver el manejador de señales en la parte superior de la pila y las funciones libc antes de main además de main , foo , bar y baz .


Puede que valga la pena ver Google Breakpad , un generador de volcado de fallos multiplataforma y herramientas para procesar los volcados.


Puedo ayudar con la versión de Linux: se pueden usar las funciones backtrace, backtrace_symbols y backtrace_symbols_fd. Consulte las páginas de manual correspondientes.


Utilizaría el código que genera un seguimiento de pila para la memoria filtrada en el Detector de fugas visual . Sin embargo, esto solo funciona en Win32.


ulimit -c <value> establece el límite de tamaño del archivo principal en unix. De forma predeterminada, el límite de tamaño del archivo principal es 0. Puede ver los valores de ulimit -a con ulimit -a .

también, si ejecuta su programa desde gdb, detendrá su programa en "infracciones de segmentación" ( SIGSEGV , generalmente cuando accedió a una parte de la memoria que no había asignado) o puede establecer puntos de interrupción.

ddd y nemiver son front-ends para gdb, lo que hace que trabajar con él sea mucho más fácil para el principiante.


Además de las respuestas anteriores, aquí se explica cómo hacer que el sistema operativo Debian Linux genere un volcado de memoria

  1. Cree una carpeta "coredumps" en la carpeta de inicio del usuario
  2. Vaya a /etc/security/limits.conf. Debajo de la línea '', escriba "soft core unlimited", y "root soft core unlimited" si habilita volcados de núcleo para root, para permitir espacio ilimitado para volcados de núcleo.
  3. NOTA: “* soft core unlimited” no cubre la raíz, por lo que la raíz debe especificarse en su propia línea.
  4. Para verificar estos valores, cierre sesión, vuelva a iniciar sesión y escriba "ulimit -a". El "tamaño del archivo del núcleo" se debe establecer en ilimitado.
  5. Verifique los archivos .bashrc (usuario y root si corresponde) para asegurarse de que ulimit no esté configurado allí. De lo contrario, el valor anterior se sobrescribirá en el inicio.
  6. Abra el archivo /etc/sysctl.conf. Introduzca lo siguiente en la parte inferior: "kernel.core_pattern = /home//coredumps/%e_%t.dump". (% e será el nombre del proceso y% t será la hora del sistema)
  7. Salga y escriba "sysctl -p" para cargar la nueva configuración Verifique / proc / sys / kernel / core_pattern y verifique que esto coincida con lo que acaba de escribir.
  8. El volcado de núcleo se puede probar ejecutando un proceso en la línea de comando ("&"), y luego matándolo con "kill -11". Si el volcado de núcleo es exitoso, verá "(volcado de núcleo)" después de la indicación de falla de segmentación.

En Linux / Unix / MacOSX, use los archivos principales (puede habilitarlos con ulimit o llamada al sistema compatible ). En Windows, utilice los informes de errores de Microsoft (puede convertirse en socio y obtener acceso a los datos de bloqueo de su aplicación).


Olvidé la tecnología de GNOME de "apport", pero no sé mucho sobre su uso. Se utiliza para generar stacktraces y otros diagnósticos para el procesamiento y puede archivar errores automáticamente. Sin duda vale la pena registrarse.


ulimit -c unlimited

es una variable del sistema, que permitirá crear un volcado de memoria después de que la aplicación se bloquee. En este caso una cantidad ilimitada. Busque un archivo llamado núcleo en el mismo directorio. ¡Asegúrese de compilar su código con las informaciones de depuración habilitadas!

Saludos





assert