/* OpenIDA - Outil d'analyse de fichiers binaires
* il.h - mise en place d'un langage intermédiaire
*
* Copyright (C) 2012 Cyrille Bagard
*
* This file is part of OpenIDA.
*
* OpenIDA is free software; you can redistribute it and/or modify
* it under the terms of the GNU General Public License as published by
* the Free Software Foundation; either version 3 of the License, or
* (at your option) any later version.
*
* OpenIDA is distributed in the hope that it will be useful,
* but WITHOUT ANY WARRANTY; without even the implied warranty of
* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
* GNU General Public License for more details.
*
* You should have received a copy of the GNU General Public License
* along with Foobar. If not, see .
*/
#include "il.h"
#include "../blocks/flow.h"
#include "../blocks/virtual.h"
#include "../../decomp/expr/block.h"
#include "../../decomp/instr/ite.h"
/* --------------------- GESTION DES CONTEXTES DE DECOMPILATION --------------------- */
/* -------------------------- ENCADREMENT DES INSTRUCTIONS -------------------------- */
/* Retrouve et rassemble les instructions décompilées. */
static GDecInstruction *merge_decompiled_instructions(GDecInstruction *, GDecInstruction *);
/* Procède à la décompilation d'un bloc déterminé. */
static GDecInstruction *decompiled_instructions_block(GFlowBlock *, GDecContext *);
/* Procède à la décompilation d'un ensemble de blocs déterminé. */
static GDecInstruction *decompiled_instructions_blocks(GVirtualBlock *, GDecContext *);
/* Procède à la décompilation d'un bloc basique quelconque. */
static GDecInstruction *decompiled_basic_block(GInstrBlock *, GDecContext *);
/* ---------------------------------------------------------------------------------- */
/* GESTION DES CONTEXTES DE DECOMPILATION */
/* ---------------------------------------------------------------------------------- */
/* ---------------------------------------------------------------------------------- */
/* ENCADREMENT DES INSTRUCTIONS */
/* ---------------------------------------------------------------------------------- */
/******************************************************************************
* *
* Paramètres : group = groupe d'instructions à compléter ou constituer. *
* list = liste d'instructions à intégrer. *
* *
* Description : Retrouve et rassemble les instructions décompilées. *
* *
* Retour : Groupe fourni ou nouveau groupe créé pour l'occasion. *
* *
* Remarques : - *
* *
******************************************************************************/
static GDecInstruction *merge_decompiled_instructions(GDecInstruction *group, GDecInstruction *list)
{
GExprBlock *block; /* Autre vision du groupe */
GDecInstruction *iter; /* Boucle de parcours */
if (group == NULL) block = NULL;
else block = G_EXPR_BLOCK(group);
for (iter = list;
iter != NULL;
iter = g_dec_instruction_get_next_iter(list, iter))
{
if (block == NULL)
block = G_EXPR_BLOCK(g_expr_block_new(iter));
else
g_expr_block_add_item(block, iter);
}
return G_DEC_INSTRUCTION(block);
}
/******************************************************************************
* *
* Paramètres : block = ensemble des instructions d'assemblage à traiter. *
* ctx = contexte de soutien à associer à l'opération. *
* *
* Description : Procède à la décompilation d'un bloc déterminé. *
* *
* Retour : Instructions créées et enregistrées, ou NULL si erreur. *
* *
* Remarques : - *
* *
******************************************************************************/
static GDecInstruction *decompiled_instructions_block(GFlowBlock *block, GDecContext *ctx)
{
GDecInstruction *res;
GArchInstruction *instrs; /* Liste d'instructions natives*/
GArchInstruction *first; /* Première instruction du lot */
GArchInstruction *last; /* Dernière instruction du lot */
vmpa_t max; /* Adresse de fin du bloc */
GArchInstruction *iter; /* Boucle de parcours */
GDecInstruction *decomp; /* Dernier résultat de décomp. */
GDecInstruction *true_dinstr; /* Décompilation 'cond vraie' */
GDecInstruction *false_dinstr; /* Décompilation 'cond fausse' */
GArchInstruction *next; /* Instruction de branchement */
vmpa_t next_addr; /* Adresse de cette instruct° */
GInstrBlock *next_parent; /* Bloc basique correspondant */
GInstrBlock *next_block; /* Sous-bloc basique direct */
instrs = g_flow_block_get_all_instructions_list(block);
g_flow_block_get_boundary(block, &first, &last);
g_flow_block_get_boundary_addresses(block, NULL, &max);
max++;
/* Décompilation du corps du bloc */
for (iter = first;
iter != NULL;
iter = g_arch_instruction_get_next_iter(instrs, iter, max))
{
decomp = g_arch_instruction_decompile(iter, ctx);
}
/* Post-traitement selon les types de lien */
res = g_dec_context_get_decomp_instrs(ctx);
/* if ... then ... else ... */
if (G_IS_ITE_INSTRUCTION(decomp))
{
next = g_arch_instruction_get_given_destination(last, ILT_JUMP_IF_TRUE);
printf("@ 0x%08llx : true : %p\n", max, next);
true_dinstr = NULL;
if (next != NULL)
{
g_arch_instruction_get_location(next, NULL, NULL, &next_addr);
next_block = g_instr_block_find_by_addr(g_instr_block_get_links_block(block), next_addr);
if (next_block != NULL)
true_dinstr = decompiled_basic_block(next_block, ctx);
}
next = g_arch_instruction_get_given_destination(last, ILT_JUMP_IF_FALSE);
printf("@ 0x%08llx : false : %p\n", max, next);
false_dinstr = NULL;
if (next != NULL)
{
g_arch_instruction_get_location(next, NULL, NULL, &next_addr);
next_block = g_instr_block_find_by_addr(g_instr_block_get_links_block(block), next_addr);
if (next_block != NULL)
false_dinstr = decompiled_basic_block(next_block, ctx);
}
printf(" -> ite : %p + %p\n", true_dinstr, false_dinstr);
printf(" -> ite : %s + %s\n",
true_dinstr ? g_type_name(G_TYPE_FROM_INSTANCE(true_dinstr)) : "none",
false_dinstr ? g_type_name(G_TYPE_FROM_INSTANCE(false_dinstr)) : "none");
g_ite_instruction_set_branches(G_ITE_INSTRUCTION(decomp), true_dinstr, false_dinstr);
}
/* Renvoi des instructions mises en place */
return res;
//return g_dec_context_get_decomp_instrs(ctx);
}
/******************************************************************************
* *
* Paramètres : block = ensemble des instructions d'assemblage à traiter. *
* ctx = contexte de soutien à associer à l'opération. *
* *
* Description : Procède à la décompilation d'un ensemble de blocs déterminé. *
* *
* Retour : Instructions créées et enregistrées, ou NULL si erreur. *
* *
* Remarques : - *
* *
******************************************************************************/
static GDecInstruction *decompiled_instructions_blocks(GVirtualBlock *block, GDecContext *ctx)
{
GDecInstruction *result; /* Instructions à renvoyer */
size_t count; /* Nombre de sous-blocs */
size_t i; /* Boucle de parcours */
GInstrBlock *sub_block; /* Sous-bloc à traiter */
GDecInstruction *dinstrs; /* Instructions décompilées */
result = NULL;
count = g_virtual_block_count_children(block);
for (i = 0; i < count; i++)
{
sub_block = g_virtual_block_get_child(block, i);
/**
* Les groupes de blocs sont forcément rattachés à une instruction,
* donc ils sont décompilés depuis ces instructions, pas ici.
*/
if (!G_IS_FLOW_BLOCK(sub_block)) continue;
/* FIXME */
g_dec_context_set_decomp_instrs(ctx, NULL);
dinstrs = decompiled_instructions_block(G_FLOW_BLOCK(sub_block), ctx);
result = merge_decompiled_instructions(result, dinstrs);
}
return result;
}
/******************************************************************************
* *
* Paramètres : block = ensemble des instructions d'assemblage à traiter. *
* ctx = contexte de soutien à associer à l'opération. *
* *
* Description : Procède à la décompilation d'un bloc basique quelconque. *
* *
* Retour : Instructions créées et enregistrées, ou NULL si erreur. *
* *
* Remarques : - *
* *
******************************************************************************/
static GDecInstruction *decompiled_basic_block(GInstrBlock *block, GDecContext *ctx)
{
GDecInstruction *result; /* Instructions à retourner */
/* FIXME */
g_dec_context_set_decomp_instrs(ctx, NULL);
if (G_IS_VIRTUAL_BLOCK(block))
result = decompiled_instructions_blocks(G_VIRTUAL_BLOCK(block), ctx);
else
{
result = decompiled_instructions_block(G_FLOW_BLOCK(block), ctx);
if (!G_IS_EXPR_BLOCK(result))
result = merge_decompiled_instructions(NULL, result);
}
return result;
}
/******************************************************************************
* *
* Paramètres : routine = routine dont le corps est à traiter. *
* format = format du binaire contenant les instructions. *
* proc = architecture du code machine. *
* *
* Description : Procède à la décompilation d'une routinée déterminée. *
* *
* Retour : Instructions créées ou NULL si erreur. *
* *
* Remarques : - *
* *
******************************************************************************/
GDecInstruction *decompiled_routine_instructions(GBinRoutine *routine, GExeFormat *format, GArchProcessor *proc)
{
GDecInstruction *result; /* Instructions à retourner */
GDecContext *context; /* Contexte pour la décompil. */
GInstrBlock *blocks; /* Blocs basiques de routine */
context = g_arch_processor_get_decomp_context(proc);
g_object_set_data(G_OBJECT(context), "format", format);
g_object_set_data(G_OBJECT(context), "routine", routine);
blocks = g_binary_routine_get_basic_blocks(routine);
result = decompiled_basic_block(blocks, context);
g_object_unref(context);
return result;
}
#if 0
#include
#include
#include
#include "../../decomp/expr/block.h"
#include "../../decomp/instr/ite.h"
/* Indications sur une branche */
typedef struct _branch_info
{
vmpa_t *jumps; /* Jalons de la branche */
size_t count; /* Quantité de ces jalons */
} branch_info;
/* Indique si une adresse est retenue comme point de passage. */
static bool is_addr_in_branch(const branch_info *, const vmpa_t *, bool);
/* Identifie les différents points de passage d'une branche. */
static void find_next_jumps(GArchInstruction *, vmpa_t, vmpa_t, branch_info *);
/* Retrouve le point de ralliement entre deux branches. */
static vmpa_t compute_first_common_addr(branch_info *, branch_info *);
/******************************************************************************
* *
* Paramètres : info = informations à consulter. *
* addr = adresse à rechercher. *
* fast = autorise une recherche rapide. *
* *
* Description : Indique si une adresse est retenue comme point de passage. *
* *
* Retour : true si le jalon est déjà dans la liste, false sinon. *
* *
* Remarques : - *
* *
******************************************************************************/
static bool is_addr_in_branch(const branch_info *info, const vmpa_t *addr, bool fast)
{
bool result; /* Bilan à retourner */
size_t i; /* Boucle de parcours */
void *ptr; /* Résultat des recherches */
result = false;
if (!fast)
for (i = 0; i < info->count && !result; i++)
result = (info->jumps[i] == *addr);
else
{
ptr = bsearch(addr, info->jumps, info->count, sizeof(vmpa_t), (__compar_fn_t)compare_vmpa);
result = (ptr != NULL);
}
return result;
}
/******************************************************************************
* *
* Paramètres : instrs = ensemble des instructions d'assemblage. *
* start = adresse de début du bloc. *
* end = adresse de fin du bloc (exclusive). *
* count = nombre de sauts détectés. [OUT] *
* *
* Description : Identifie les différents points de passage d'une branche. *
* *
* Retour : Jalons dans le flot d'exécution. *
* *
* Remarques : - *
* *
******************************************************************************/
static void find_next_jumps(GArchInstruction *instrs, vmpa_t start, vmpa_t end, branch_info *info)
{
GArchInstruction *iter; /* Boucle de parcours #1 */
GArchInstruction **dests; /* Instr. visée par une autre */
InstructionLinkType *types; /* Type de lien entre lignes */
size_t dcount; /* Nombre de liens de dest. */
size_t i; /* Boucle de parcours #2 */
vmpa_t addr; /* Adresse de la destination */
/* On évite de boucler... */
if (is_addr_in_branch(info, &start, false))
return;
info->jumps = (vmpa_t *)realloc(info->jumps, ++(info->count) * sizeof(vmpa_t));
info->jumps[info->count - 1] = start;
/* On suit le flot jusqu'à la prochaine bifurcation */
for (iter = g_arch_instruction_find_by_address(instrs, start, true);
iter != NULL;
iter = g_arch_instruction_get_next_iter(instrs, iter, end))
{
if (!g_arch_instruction_has_destinations(iter))
continue;
dcount = g_arch_instruction_get_destinations(iter, &dests, &types);
for (i = 0; i < dcount; i++)
switch (types[i])
{
case ILT_EXEC_FLOW:
case ILT_JUMP:
case ILT_JUMP_IF_TRUE:
case ILT_JUMP_IF_FALSE:
g_arch_instruction_get_location(dests[i], NULL, NULL, &addr);
find_next_jumps(instrs, addr, end, info);
break;
default:
break;
}
break;
}
/* Si on termine... */
if (iter != NULL && !is_addr_in_branch(info, &end, false))
{
info->jumps = (vmpa_t *)realloc(info->jumps, ++(info->count) * sizeof(vmpa_t));
info->jumps[info->count - 1] = end;
}
}
/******************************************************************************
* *
* Paramètres : a = premier ensemble de jalons à parcourir. *
* b = second ensemble de jalons à parcourir. *
* *
* Description : Retrouve le point de ralliement entre deux branches. *
* *
* Retour : Adresse commune à deux branches. *
* *
* Remarques : - *
* *
******************************************************************************/
static vmpa_t compute_first_common_addr(branch_info *a, branch_info *b)
{
vmpa_t result; /* Adresse trouvée à retourner */
size_t i; /* Boucle de parcours */
/* Valeur conceptuellement impossible à renvoyer */
result = VMPA_MAX;
//qsort(a->jumps, a->count, sizeof(vmpa_t), (__compar_fn_t)compare_vmpa);
//qsort(b->jumps, b->count, sizeof(vmpa_t), (__compar_fn_t)compare_vmpa);
for (i = 0; i < a->count && result == VMPA_MAX; i++)
if (is_addr_in_branch(b, &a->jumps[i], false))
result = a->jumps[i];
return result;
}
#include "../../arch/processor.h"
/******************************************************************************
* *
* Paramètres : instrs = ensemble des instructions d'assemblage. *
* start = adresse de début du bloc. *
* end = adresse de fin du bloc (exclusive). *
* stop = adresse d'arrêt en cas de saut ou VMPA_MAX. *
* ctx = contexte de soutien à associer à l'opération. *
* *
* Description : Procède à la décompilation basique d'un bloc déterminé. *
* *
* Retour : Instructions créées et enregistrées, ou NULL si erreur. *
* *
* Remarques : - *
* *
******************************************************************************/
GDecInstruction *build_decompiled_block(GArchInstruction *instrs, vmpa_t start, vmpa_t end, vmpa_t stop, GDecContext *ctx)
{
GDecInstruction *result; /* Instructions décompilées */
GArchInstruction *iter; /* Boucle de parcours */
GDecInstruction *pite; /* IfThenElse potientiel... */
GArchInstruction **dests; /* Instr. visée par une autre */
InstructionLinkType *types; /* Type de lien entre lignes */
size_t dcount; /* Nombre de liens de dest. */
size_t i; /* Boucle de parcours */
vmpa_t addr; /* Adresse de la destination */
branch_info true_branch; /* Branche 'condition vraie' */
branch_info false_branch; /* Branche 'condition fausse' */
GDecInstruction *true_dinstr; /* Décompilation 'cond vraie' */
GDecInstruction *false_dinstr; /* Décompilation 'cond fausse' */
vmpa_t next_addr; /* Prochaine instruction visée */
GDecInstruction *first; /* Première décompilation */
GDecInstruction *dinstr; /* Nouvelle décompilation */
GExeFormat *format; /* Format du binaire fourni */
GArchProcessor *proc; /* Architecture du binaire */
GDecContext *context; /* Contexte pour la décompil. */
result = NULL;
//printf("[+] processing 0x%08llx -> 0x%08llx... stop @ 0x%08llx\n", start, end, stop);
for (iter = g_arch_instruction_find_by_address(instrs, start, true);
iter != NULL;
)
{
/* On s'arrêter si l'instruction est déjà décompilée */
if (g_object_get_data(G_OBJECT(iter), "decomp_done") != NULL) break;
g_object_set_data(G_OBJECT(iter), "decomp_done", iter);
pite = g_arch_instruction_decompile(iter, ctx);
g_arch_instruction_get_location(iter, NULL, NULL, &addr);
//printf(" --- decomp %p @ 0x%08llx\n", pite, addr);
/* On n'approfondit que les chemins qui se séparent */
if (!g_arch_instruction_has_destinations(iter))
{
iter = g_arch_instruction_get_next_iter(instrs, iter, end);
continue;
}
/* Adaptations en fonction du type de bifurcation */
dcount = g_arch_instruction_get_destinations(iter, &dests, &types);
next_addr = 0;
memset(&true_branch, 0, sizeof(branch_info));
memset(&false_branch, 0, sizeof(branch_info));
for (i = 0; i < dcount; i++)
switch (types[i])
{
case ILT_EXEC_FLOW:
case ILT_JUMP:
g_arch_instruction_get_location(dests[i], NULL, NULL, &next_addr);
break;
case ILT_JUMP_IF_TRUE:
g_arch_instruction_get_location(dests[i], NULL, NULL, &addr);
find_next_jumps(instrs, addr, end, &true_branch);
break;
case ILT_JUMP_IF_FALSE:
g_arch_instruction_get_location(dests[i], NULL, NULL, &addr);
find_next_jumps(instrs, addr, end, &false_branch);
break;
default:
next_addr = VMPA_MAX;
break;
}
if (next_addr == VMPA_MAX)
{
iter = g_arch_instruction_get_next_iter(instrs, iter, end);
continue;
}
else if (true_branch.count > 0 || false_branch.count > 0)
{
next_addr = compute_first_common_addr(&true_branch, &false_branch);
next_addr = MIN(next_addr, end);
format = g_object_get_data(G_OBJECT(ctx), "format");
proc = get_arch_processor_from_format(G_EXE_FORMAT(format));
context = g_arch_processor_get_decomp_context(proc);
g_object_set_data(G_OBJECT(context), "format", g_object_get_data(G_OBJECT(ctx), "format"));
g_object_set_data(G_OBJECT(context), "routine", g_object_get_data(G_OBJECT(ctx), "routine"));
g_dec_context_set_max_address(context, next_addr);
true_dinstr = build_decompiled_block(instrs, true_branch.jumps[0],
end, next_addr, context);
context = g_arch_processor_get_decomp_context(proc);
g_object_set_data(G_OBJECT(context), "format", g_object_get_data(G_OBJECT(ctx), "format"));
g_object_set_data(G_OBJECT(context), "routine", g_object_get_data(G_OBJECT(ctx), "routine"));
g_dec_context_set_max_address(context, next_addr);
false_dinstr = build_decompiled_block(instrs, false_branch.jumps[0],
end, next_addr, context);
/*
printf("{branch : %p (0x%08llx) | %p (0x%08llx)\n",
true_dinstr, true_branch.jumps[0],
false_dinstr, false_branch.jumps[0]);
*/
g_ite_instruction_set_branches(G_ITE_INSTRUCTION(pite), true_dinstr, false_dinstr);
if (next_addr == end) break;
}
/* Détermination du prochain point de chute */
if (next_addr == stop) break;
iter = g_arch_instruction_find_by_address(instrs, next_addr, true);
}
first = g_dec_context_get_decomp_instrs(ctx);
//printf(" ... context instr : %p\n", first);
for (dinstr = first;
dinstr != NULL;
dinstr = g_dec_instruction_get_next_iter(first, dinstr))
{
if (result == NULL) result = g_expr_block_new(dinstr);
else g_expr_block_add_item(G_EXPR_BLOCK(result), dinstr);
}
//printf(" ... return %p\n", result);
return result;
}
#endif