Download Decompiladores - DraXus.org

Document related concepts
no text concepts found
Transcript
Decompiladores
I.T. Informática de Sistemas
Traductores
Manuel Martín Salvador
draxus@correo.ugr.es
http://draxus.org
¿Qué es un decompilador?
Es un programa que realiza la operación
inversa de un compilador: obtener el
código fuente de un programa compilado
¿Por qué decompilar?
●
Para arreglar bugs (errores)
●
Para encontrar vulnerabilidades
●
Para buscar malware
●
Para aprender
●
Por interoperabilidad
●
Para optimizar el código
●
Para mejorar el programa
●
Por si has perdido el código
¿Es legal?
La licencia de la mayoría de los programas
propietarios prohíben explícitamente la
decompilación, pero en algunos países hay leyes
que la permiten para los siguientes casos:
✔
✔
✔
Para propósitos de interoperabilidad con otro
software o hardware
Para corregir errores en aquellos casos en el que
el propietario no pueda hacerlos
Para saber si se están usando algoritmos
protegidos por patentes
¿Es posible?
●
●
●
Muchos creemos que de la misma forma que no se puede
obtener una vaca de una hamburguesa, tampoco se puede
obtener el código de un programa binario.
Si bien es cierto que no todo programa se puede decompilar,
hay casos en los que podemos obtener un código útil.
La verdad es que la mayoría de los decompiladores actuales sólo
son capaces de usarse en programas preparados y no en el
MundoReal(TM)
¿Es posible?
Código C
void main()
{
int i, j, k;
i = 10;
j = 20;
k = i*j + 5;
}
Ensamblador
Ensamblador
optimizado
;---- i = 10;
mov si, 10
;---- j = 20;
mov di, 20
;---- k = i*j + 5;
mov ax, si
mov bx, di
mul bx
add ax, 5
mov [bp+6], ax
;---- k = i*j + 5;
mov ax, 10
mov bx, 20
mul bx
add ax, 5
mov [bp+6], ax
¿Es posible?
Código C
if (i>20){
j=30;
}
else{
j=40;
}
j++;
Ensamblador 1
cmp [bp+2], 20
jle lab1
mov [bp+4], 30
jmp lab2
lab1:
mov [bp+4], 40
lab2:
inc [bp+4]
Ensamblador 2
cmp [bp+2], 20
jg lab1
jmp lab2
lab1:
mov [bp+4], 30
jmp lab3
lab2:
mov [bp+4], 40
lab3:
inc [bp+4]
¿Cómo funciona?
binario
análisis sintáctico
análisis semántico
generación de código intermedio
generación del grafo del flujo de control
análisis del flujo de datos
análisis del flujo de control
generación de código
código de alto nivel
¿Cómo funciona?
1º Averiguar el compilador
2º Encontrar el main()
3º Definir las funciones
4º Agrupar el código en asignaciones,
condiciones, saltos y llamadas a
funciones.
¿Cómo funciona?
Asignación
mov ax, [bp+4]
mov bx, 20
mul bx
add ax, 4
mov [bp+4], ax
i = ( i*20 ) + 4;
¿Cómo funciona?
Saltos
mov ax, [bp+4]
cmp ax, 10
jnz lab1
mov bx, 15
mov [bp+2], bx
jmp lab2
lab1:
mov bx,20
mov [bp+2], bx
lab2:
if (i != 10) goto lab1;
j = 15;
goto lab2;
lab1:
j = 20;
lab2:
if (i!= 10){
j = 20;
}
else{
j = 15;
}
¿Cómo funciona?
Llamada a funciones
mov ax, [bp+4];
push ax
mov ax, [bp+2];
push ax
call _func
mov [bp+4], ax
i = func(j, i);
Tipos de decompiladores
●
Código máquina
●
Ensamblador
●
Delphi
●
Visual Basic
●
Java
●
.NET
●
Python
●
Flash
●
C/C++
Decompiladores Java
●
Jdec (libre)
●
JODE (libre)
●
Jad (gratis)
●
Mocha (gratis, obsoleto)
●
JreversePro (libre)
●
ClassCracker 3 (comercial)
●
DJ Java Decompiler (gratis)
●
Más en http://java-decompiler.com
DEMO!
Decompiladores .NET
●
Salamander (.NET 2.0 comercial)
●
Anakrino (.NET 1.1)
●
LSW DotNet-Lab (decompilador, ofuscador y otros)
●
Lutz Roeder's Programming.NET (comercial)
●
Dis# (.NET 2.0 comercial)
●
●
Spices.net (.NET 2.0 decompilador, ofuscador y otros;
comercial)
Decompiler.NET (.NET 2.0 comercial)
Decompiladores Flash
Sothink SWF Decompiler (gratis)
http://www.sothink.com/product/flashdecompiler/
Gordon Flash Decompiler (comercial)
http://www.futurecandy.net/
DEMO!
¿Qué pasa con C/C++?
Los compiladores de Java, .NET y Flash no generan código binario, si
no bytecode, esto es, código para ser ejecutable sobre sus
máquinas virtuales. Por eso estos lenguajes son multiplataforma.
En cambio, los compiladores de C generan código optimizado en
binario para un procesador determinado (x86, AMD64, SPARC...)
De esta manera, es mucho más difícil decompilar programas en C.
La única documentación hoy día que he podido encontrar es una
tesis de Cristina Cifuentes (Universidad de Queensland) dedicada
exclusivamente a la decompilación en C en la arquitectura i386.
Los pocos decompiladores existentes para C no son automáticos, es
decir, necesitan la interacción del usuario y sólo funcionan con
programas pequeños.
Decompiladores C
dcc (i386,DOS)
http://www.itee.uq.edu.au/~cristina/dcc.html#example
boomerang
http://boomerang.sourceforge.net/cando.php?hidemenu
DisC (TurboC)
http://www.debugmode.com/dcompile/disc.htm
DEMO!
¿Cómo evitarlo?
●
Ofuscar el código: convertir el programa en otro equivalente por
medio de transformaciones de forma que no se consiga código útil
al decompilar. Por ejemplo:
➔
➔
➔
➔
➔
●
Que todos los nombres de funciones y
variables carezcan de sentido
Incluir ocasionalmente cálculos y bucles
sin sentido
Esconder números pequeños en
cadenas de texto
Crear métodos grandes, en vez de
utilizar subrutinas
Distribuir los métodos entre las
subclases
Tamperproofing: es una técnica para ocultar el código del
programa, añadiendo código extra de manera que sea
imposible reobtener el código original al decompilar.
Referencias
●
Program Transformation http://www.program-transformation.org
●
Wikipedia http://en.wikipedia.org/wiki/Decompiler
●
DebugMode http://www.debugmode.com/dcompile/
●
Criptonomicón http://www.iec.csic.es/CRIPTONOMICON/java/ofuscacion.html
●
Watermarking, Tamper-Proofing, and Obfuscation - Tools for Software Protection
http://www.cs.arizona.edu/~collberg/Research/Publications/CollbergThomborson2000a/index.html
●
Nolan, Godfrey - Decompiling Java
http://adrastea.ugr.es/search*spi/?searchtype=t&searcharg=Decompiling+Java
Imágenes
Tango Icons http://tango.freedesktop.org/ CC by-sa
Gray Cow http://openclipart.org/media/files/mairin/3076 PD
FIN
Gracias