/* OpenIDA - Outil d'analyse de fichiers binaires
* macro.c - vue macroscopique des liens entre blocs d'instructions
*
* Copyright (C) 2012 Cyrille Bagard
*
* This file is part of OpenIDA.
*
* OpenIDA is free software; you can redistribute it and/or modify
* it under the terms of the GNU General Public License as published by
* the Free Software Foundation; either version 3 of the License, or
* (at your option) any later version.
*
* OpenIDA is distributed in the hope that it will be useful,
* but WITHOUT ANY WARRANTY; without even the implied warranty of
* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
* GNU General Public License for more details.
*
* You should have received a copy of the GNU General Public License
* along with Foobar. If not, see .
*/
#include "macro.h"
#include
#include
#include "../blocks/flow.h"
#include "../blocks/virtual.h"
/* ------------------------ COUVERTURE D'UNE ZONE A DECOUPER ------------------------ */
/* Bornes d'une zone à couvrir */
typedef struct _code_coverage
{
vmpa_t start; /* Adresse de départ */
vmpa_t *ends; /* Adresses butoir de fin */
size_t ends_count; /* Quantité de fins possibles */
} code_coverage;
/* Met en place les délimitations d'une zone de code. */
static code_coverage *create_code_coverage(vmpa_t, vmpa_t);
/* Crée une copie d'une couverture de zone de code. */
static code_coverage *dup_code_coverage(vmpa_t, const code_coverage *);
/* Détruit des délimitations d'une zone de code. */
static void delete_code_coverage(code_coverage *);
/* Indique si une adresse est hors zone ou non. */
static bool code_coverage_stop_here(const code_coverage *, const vmpa_t *);
/* Ajoute une adresse butoir pour la zone à couvrir. */
static void add_ending_address_code_coverage(code_coverage *, const vmpa_t *);
/* ------------------------- SUIVI DES FLOTS D'INSTRUCTIONS ------------------------- */
/* Indications sur une branche */
typedef struct _branch_info
{
vmpa_t *jumps; /* Jalons de la branche */
size_t count; /* Quantité de ces jalons */
} branch_info;
/* Indique si une adresse est retenue comme point de passage. */
static bool is_addr_in_branch(const branch_info *, const vmpa_t *);
/* Identifie les différents points de passage d'une branche. */
static void find_next_jumps(GArchInstruction *, vmpa_t, const code_coverage *, branch_info *);
/* Retrouve le point de ralliement entre deux branches. */
static vmpa_t compute_first_common_addr(branch_info *, branch_info *);
/* Retrouve le point de ralliement entre un groupe de branches. */
static vmpa_t compute_first_common_addr_in_group(const branch_info *, size_t);
/* --------------------------- DECOUPAGE EN BLOCS DE CODE --------------------------- */
/**
* Macros pour le marquage des instructions traitées.
* Dans un soucis d'optimisation, on ne traite que les instructions
* démarrant un bloc.
*/
#define MACRO_MARK_AS_PROCESSED(_instr) g_object_set_data(G_OBJECT(_instr), "macro_done", _instr)
#define MACRO_IS_PROCESSED(_instr) (g_object_get_data(G_OBJECT(_instr), "macro_done") != NULL)
#define MACRO_CLEAR_PROCESSED(_instr) g_object_set_data(G_OBJECT(_instr), "macro_done", NULL)
/* Procède à la définition de bloc regroupant des instructions. */
static GInstrBlock *build_instruction_block(GArchInstruction *, const code_coverage *);
/* ---------------------------------------------------------------------------------- */
/* COUVERTURE D'UNE ZONE A DECOUPER */
/* ---------------------------------------------------------------------------------- */
/******************************************************************************
* *
* Paramètres : start = adresse du début de la zone à couvrir. *
* end = adresse de fin de la zone à couvrir (exclusive). *
* *
* Description : Met en place les délimitations d'une zone de code. *
* *
* Retour : Couverture d'une zone de code. *
* *
* Remarques : - *
* *
******************************************************************************/
static code_coverage *create_code_coverage(vmpa_t start, vmpa_t end)
{
code_coverage *result; /* Couverture à retourner */
result = (code_coverage *)calloc(1, sizeof(code_coverage));
result->start = start;
result->ends = (vmpa_t *)calloc(1, sizeof(vmpa_t));
result->ends_count = 1;
result->ends[0] = end;
return result;
}
/******************************************************************************
* *
* Paramètres : start = nouvelle adresse de début, plus profonde. *
* src = informations de couverture à consulter. *
* *
* Description : Crée une copie d'une couverture de zone de code. *
* *
* Retour : Couverture d'une zone de code copiée. *
* *
* Remarques : - *
* *
******************************************************************************/
static code_coverage *dup_code_coverage(vmpa_t start, const code_coverage *src)
{
code_coverage *result; /* Couverture à retourner */
size_t i; /* Boucle de parcours */
result = (code_coverage *)calloc(1, sizeof(code_coverage));
result->start = start;
result->ends = (vmpa_t *)calloc(src->ends_count, sizeof(vmpa_t));
result->ends_count = src->ends_count;
for (i = 0; i < result->ends_count; i++)
result->ends[i] = src->ends[i];
return result;
}
/******************************************************************************
* *
* Paramètres : coverage = structure à libérer de la mémoire. *
* *
* Description : Détruit des délimitations d'une zone de code. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void delete_code_coverage(code_coverage *coverage)
{
free(coverage->ends);
free(coverage);
}
/******************************************************************************
* *
* Paramètres : coverage = informations de couverture à consulter. *
* addr = adresse à tester. *
* *
* Description : Indique si une adresse est hors zone ou non. *
* *
* Retour : true si l'adresse ne doit pas être couverte, false sinon. *
* *
* Remarques : - *
* *
******************************************************************************/
static bool code_coverage_stop_here(const code_coverage *coverage, const vmpa_t *addr)
{
void *ptr; /* Résultat des recherches */
ptr = bsearch(addr, coverage->ends, coverage->ends_count,
sizeof(vmpa_t), (__compar_fn_t)compare_vmpa);
return (ptr != NULL);
}
/******************************************************************************
* *
* Paramètres : coverage = informations de couverture à compléter. *
* addr = adresse à ajouter. *
* *
* Description : Ajoute une adresse butoir pour la zone à couvrir. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void add_ending_address_code_coverage(code_coverage *coverage, const vmpa_t *addr)
{
coverage->ends = (vmpa_t *)realloc(coverage->ends, ++coverage->ends_count * sizeof(vmpa_t));
coverage->ends[coverage->ends_count - 1] = *addr;
qsort(coverage->ends, coverage->ends_count, sizeof(vmpa_t), (__compar_fn_t)compare_vmpa);
}
/* ---------------------------------------------------------------------------------- */
/* SUIVI DES FLOTS D'INSTRUCTIONS */
/* ---------------------------------------------------------------------------------- */
/******************************************************************************
* *
* Paramètres : info = informations à consulter. *
* addr = adresse à rechercher. *
* *
* Description : Indique si une adresse est retenue comme point de passage. *
* *
* Retour : true si le jalon est déjà dans la liste, false sinon. *
* *
* Remarques : - *
* *
******************************************************************************/
static bool is_addr_in_branch(const branch_info *info, const vmpa_t *addr)
{
bool result; /* Bilan à retourner */
size_t i; /* Boucle de parcours */
result = false;
for (i = 0; i < info->count && !result; i++)
result = (info->jumps[i] == *addr);
return result;
}
/******************************************************************************
* *
* Paramètres : instrs = ensemble des instructions d'assemblage. *
* start = adresse de début du bloc. *
* coverage = liste des adresses de fin butoir. *
* count = nombre de sauts détectés. [OUT] *
* *
* Description : Identifie les différents points de passage d'une branche. *
* *
* Retour : Jalons dans le flot d'exécution. *
* *
* Remarques : - *
* *
******************************************************************************/
static void find_next_jumps(GArchInstruction *instrs, vmpa_t start, const code_coverage *coverage, branch_info *info)
{
GArchInstruction *iter; /* Boucle de parcours #1 */
vmpa_t addr; /* Adresse d'une instruction */
GArchInstruction **dests; /* Instr. visée par une autre */
InstructionLinkType *types; /* Type de lien entre lignes */
size_t dcount; /* Nombre de liens de dest. */
size_t i; /* Boucle de parcours #2 */
/* On évite de boucler... */
if (is_addr_in_branch(info, &start))
return;
info->jumps = (vmpa_t *)realloc(info->jumps, ++(info->count) * sizeof(vmpa_t));
info->jumps[info->count - 1] = start;
/* On suit le flot jusqu'à la prochaine bifurcation */
for (iter = g_arch_instruction_find_by_address(instrs, start, true);
iter != NULL;
iter = g_arch_instruction_get_next_iter(instrs, iter, VMPA_MAX))
{
g_arch_instruction_get_location(iter, NULL, NULL, &addr);
if (code_coverage_stop_here(coverage, &addr))
break;
if (g_arch_instruction_is_return(iter))
{
iter = NULL;
break;
}
if (!g_arch_instruction_has_destinations(iter))
continue;
dcount = g_arch_instruction_get_destinations(iter, &dests, &types, NULL);
for (i = 0; i < dcount; i++)
switch (types[i])
{
case ILT_EXEC_FLOW:
case ILT_JUMP:
case ILT_CASE_JUMP:
case ILT_JUMP_IF_TRUE:
case ILT_JUMP_IF_FALSE:
g_arch_instruction_get_location(dests[i], NULL, NULL, &addr);
find_next_jumps(instrs, addr, coverage, info);
break;
default:
break;
}
break;
}
/* Si on termine... */
if (iter != NULL && !is_addr_in_branch(info, &addr))
{
info->jumps = (vmpa_t *)realloc(info->jumps, ++(info->count) * sizeof(vmpa_t));
info->jumps[info->count - 1] = addr;
}
}
/******************************************************************************
* *
* Paramètres : a = premier ensemble de jalons à parcourir. *
* b = second ensemble de jalons à parcourir. *
* *
* Description : Retrouve le point de ralliement entre deux branches. *
* *
* Retour : Adresse commune à deux branches. *
* *
* Remarques : - *
* *
******************************************************************************/
static vmpa_t compute_first_common_addr(branch_info *a, branch_info *b)
{
vmpa_t result; /* Adresse trouvée à retourner */
size_t i; /* Boucle de parcours */
/* Valeur conceptuellement impossible à renvoyer */
result = VMPA_MAX;
for (i = 0; i < a->count && result == VMPA_MAX; i++)
if (is_addr_in_branch(b, &a->jumps[i]))
result = a->jumps[i];
return result;
}
/******************************************************************************
* *
* Paramètres : list = liste d'ensembles de jalons à parcourir. *
* count = taille de cette liste. *
* *
* Description : Retrouve le point de ralliement entre un groupe de branches. *
* *
* Retour : Adresse commune aux branches. *
* *
* Remarques : - *
* *
******************************************************************************/
static vmpa_t compute_first_common_addr_in_group(const branch_info *list, size_t count)
{
vmpa_t result; /* Adresse trouvée à retourner */
size_t i; /* Boucle de parcours #1 */
bool keep; /* Candidate à garder ? */
size_t j; /* Boucle de parcours #2 */
/* Valeur conceptuellement impossible à renvoyer */
result = VMPA_MAX;
for (i = 0; i < list[0].count && result == VMPA_MAX; i++)
{
keep = true;
for (j = 1; j < count && keep; j++)
keep = is_addr_in_branch(&list[j], &list[0].jumps[i]);
if (keep)
result = list[0].jumps[i];
}
return result;
}
/* ---------------------------------------------------------------------------------- */
/* DECOUPAGE EN BLOCS DE CODE */
/* ---------------------------------------------------------------------------------- */
/******************************************************************************
* *
* Paramètres : instrs = ensemble des instructions d'assemblage. *
* coverage = délimitations de la zone à couvrir. *
* *
* Description : Procède à la définition de bloc regroupant des instructions. *
* *
* Retour : Bloc créé et enregistré, ou NULL si erreur. *
* *
* Remarques : - *
* *
******************************************************************************/
static GInstrBlock *build_instruction_block(GArchInstruction *instrs, const code_coverage *coverage)
{
GInstrBlock *result; /* Regroupement à retourner */
GInstrBlock *result_cached; /* Temporisation pour unicité */
branch_info main_branch; /* Flot d'exécution complet */
GArchInstruction *first; /* Première instruction */
GArchInstruction *last; /* Dernière instruction */
GArchInstruction *iter; /* Boucle de parcours */
vmpa_t addr; /* Adresse de la destination */
GArchInstruction **dests; /* Instr. visée par une autre */
InstructionLinkType *types; /* Type de lien entre lignes */
size_t dcount; /* Nombre de liens de dest. */
size_t i; /* Boucle de parcours #1 */
GInstrBlock *block; /* Nouveau bloc mis en place */
GInstrBlock *parent; /* Mémorisation pour les liens */
GInstrBlock *group; /* Regroupement de blocs */
size_t not_handled; /* Quantité de liens non gérés */
vmpa_t next_addr; /* Prochaine instruction visée */
branch_info *cases_branches; /* Branches d'un aiguillage */
size_t cases_count; /* Nombre d'aiguillages */
branch_info true_branch; /* Branche 'condition vraie' */
branch_info false_branch; /* Branche 'condition fausse' */
branch_info *excep_branches; /* Branches d'exceptions */
size_t excep_count; /* Nombre d'exceptions */
code_coverage *sub_coverage; /* Couverture pour les suivants*/
size_t j; /* Boucle de parcours #2 */
vmpa_t stop_addr; /* Adresse de fin de bloc */
result = NULL;
result_cached = NULL;
/**
* Procédure d'ajout de blocs : pour le premier, on conserve le bloc en mémoire
* et on attend. Si rien ne suit, il constitura l'unique retour. Sinon, on
* l'ajoute à partir de la sauvegarde, et le reste suit.
*/
#define DELAYED_BLOCK_ADDING(res, cache, blk) \
do \
{ \
if (res == NULL) \
{ \
if (cache == NULL) \
cache = blk; \
else \
{ \
res = g_virtual_block_new(); \
g_virtual_block_add_child(G_VIRTUAL_BLOCK(res), cache); \
} \
} \
\
if (res != NULL) \
g_virtual_block_add_child(G_VIRTUAL_BLOCK(res), blk); \
\
} \
while (0)
first = NULL;
last = NULL;
memset(&main_branch, 0, sizeof(branch_info));
find_next_jumps(instrs, coverage->start, coverage, &main_branch);
for (iter = g_arch_instruction_find_by_address(instrs, coverage->start, true);
iter != NULL;
)
{
g_arch_instruction_get_location(iter, NULL, NULL, &addr);
if (code_coverage_stop_here(coverage, &addr)) break;
/* On s'arrêter si l'instruction est déjà décompilée */
if (MACRO_IS_PROCESSED(iter)) break;
if (first == NULL)
first = iter;
last = iter;
/* On n'approfondit que les chemins qui se séparent */
if (!g_arch_instruction_has_destinations(iter))
{
iter = g_arch_instruction_get_next_iter(instrs, iter, VMPA_MAX);
continue;
}
/* Adaptations en fonction du type de bifurcation */
dcount = g_arch_instruction_get_destinations(iter, &dests, &types, NULL);
not_handled = 0;
next_addr = VMPA_MAX;
cases_branches = NULL;
cases_count = 0;
memset(&true_branch, 0, sizeof(branch_info));
memset(&false_branch, 0, sizeof(branch_info));
excep_branches = NULL;
excep_count = 0;
for (i = 0; i < dcount; i++)
switch (types[i])
{
case ILT_EXEC_FLOW:
case ILT_JUMP:
block = g_flow_block_new(instrs, first, iter);
MACRO_MARK_AS_PROCESSED(first);
first = NULL;
DELAYED_BLOCK_ADDING(result, result_cached, block);
g_arch_instruction_get_location(dests[i], NULL, NULL, &next_addr);
break;
case ILT_CASE_JUMP:
g_arch_instruction_get_location(dests[i], NULL, NULL, &addr);
cases_branches = (branch_info *)realloc(cases_branches,
++cases_count * sizeof(branch_info));
memset(&cases_branches[cases_count - 1], 0, sizeof(branch_info));
find_next_jumps(instrs, addr, coverage, &cases_branches[cases_count - 1]);
break;
case ILT_JUMP_IF_TRUE:
g_arch_instruction_get_location(dests[i], NULL, NULL, &addr);
find_next_jumps(instrs, addr, coverage, &true_branch);
break;
case ILT_JUMP_IF_FALSE:
g_arch_instruction_get_location(dests[i], NULL, NULL, &addr);
find_next_jumps(instrs, addr, coverage, &false_branch);
break;
case ILT_CATCH_EXCEPTION:
g_arch_instruction_get_location(dests[i], NULL, NULL, &addr);
excep_branches = (branch_info *)realloc(excep_branches,
++excep_count * sizeof(branch_info));
memset(&excep_branches[excep_count - 1], 0, sizeof(branch_info));
find_next_jumps(instrs, addr, coverage, &excep_branches[excep_count - 1]);
/**
* Les deux cas sont les seuls à ne pas conduire à une définition de
* next_addr, donc on les comptabilise sur un pied d'égalité !
*/
//break;
default:
not_handled++;
break;
}
/* Post-traitements de ILT_CASE_JUMP */
if (cases_count > 0)
{
/**
* On doit clôturer le bloc renvoyant vers les branches de cas ici.
* Les sauts conditionnels sont normalement présents de façon exclusive,
* sauf pour les exceptions, qui sont traitées après.
*/
block = g_flow_block_new(instrs, first, iter);
MACRO_MARK_AS_PROCESSED(first);
first = NULL;
DELAYED_BLOCK_ADDING(result, result_cached, block);
next_addr = compute_first_common_addr_in_group(cases_branches, cases_count);
parent = block;
group = g_virtual_block_new();
for (i = 0; i < cases_count; i++)
{
sub_coverage = dup_code_coverage(cases_branches[i].jumps[0], coverage);
add_ending_address_code_coverage(sub_coverage, &next_addr);
for (j = 0; j < cases_count; j++)
if (cases_branches[j].jumps[0] != cases_branches[i].jumps[0])
add_ending_address_code_coverage(sub_coverage, &cases_branches[j].jumps[0]);
block = build_instruction_block(instrs, sub_coverage);
delete_code_coverage(sub_coverage);
if (block != NULL)
g_virtual_block_add_child(G_VIRTUAL_BLOCK(group), block);
free(cases_branches[i].jumps);
}
if (g_virtual_block_count_children(G_VIRTUAL_BLOCK(group)) > 0)
{
DELAYED_BLOCK_ADDING(result, result_cached, group);
g_instr_block_set_links_block(parent, group);
}
else
g_object_unref(G_OBJECT(group));
free(cases_branches);
}
else if (true_branch.count > 0 || false_branch.count > 0)
{
next_addr = compute_first_common_addr(&true_branch, &false_branch);
/**
* On doit clôturer le bloc renvoyant vers les branches 'true' et 'false' ici.
* Les sauts conditionnels sont normalement présents de façon exclusive,
* sauf pour les exceptions, qui sont traitées après.
*/
block = g_flow_block_new(instrs, first, iter);
MACRO_MARK_AS_PROCESSED(first);
first = NULL;
DELAYED_BLOCK_ADDING(result, result_cached, block);
parent = block;
group = g_virtual_block_new();
/* Branche 'true' */
sub_coverage = dup_code_coverage(true_branch.jumps[0], coverage);
add_ending_address_code_coverage(sub_coverage, &next_addr);
add_ending_address_code_coverage(sub_coverage, &false_branch.jumps[0]);
block = build_instruction_block(instrs, sub_coverage);
if (block != NULL)
g_virtual_block_add_child(G_VIRTUAL_BLOCK(group), block);
delete_code_coverage(sub_coverage);
/* Branche 'false' */
sub_coverage = dup_code_coverage(false_branch.jumps[0], coverage);
add_ending_address_code_coverage(sub_coverage, &next_addr);
add_ending_address_code_coverage(sub_coverage, &true_branch.jumps[0]);
block = build_instruction_block(instrs, sub_coverage);
if (block != NULL)
g_virtual_block_add_child(G_VIRTUAL_BLOCK(group), block);
delete_code_coverage(sub_coverage);
/* Conclusion */
if (g_virtual_block_count_children(G_VIRTUAL_BLOCK(group)) > 0)
{
DELAYED_BLOCK_ADDING(result, result_cached, group);
g_instr_block_set_links_block(parent, group);
}
else
g_object_unref(G_OBJECT(group));
free(true_branch.jumps);
free(false_branch.jumps);
}
/* Post-traitements de ILT_CATCH_EXCEPTION */
if (excep_count > 0)
{
if (first != NULL)
{
block = g_flow_block_new(instrs, first, iter);
MACRO_MARK_AS_PROCESSED(first);
first = NULL;
DELAYED_BLOCK_ADDING(result, result_cached, block);
}
for (j = 0; j < excep_count; j++)
{
stop_addr = compute_first_common_addr(&main_branch, &excep_branches[j]);
sub_coverage = dup_code_coverage(excep_branches[j].jumps[0], coverage);
add_ending_address_code_coverage(sub_coverage, &stop_addr);
block = build_instruction_block(instrs, sub_coverage);
delete_code_coverage(sub_coverage);
if (block != NULL)
DELAYED_BLOCK_ADDING(result, result_cached, block);
free(excep_branches[j].jumps);
}
free(excep_branches);
}
/* Détermination du prochain point de chute */
if (not_handled == dcount)
iter = g_arch_instruction_get_next_iter(instrs, iter, VMPA_MAX);
else
iter = g_arch_instruction_find_by_address(instrs, next_addr, true);
}
if (first != NULL && last != NULL)
{
if (!MACRO_IS_PROCESSED(first))
{
block = g_flow_block_new(instrs, first, last);
MACRO_MARK_AS_PROCESSED(first);
DELAYED_BLOCK_ADDING(result, result_cached, block);
}
}
return (result != NULL ? result : result_cached);
}
/******************************************************************************
* *
* Paramètres : list = ensemble d'instructions à relier. *
* routines = prototypes existants à insérer. *
* count = quantité de ces prototypes. *
* statusbar = barre de statut avec progression à mettre à jour.*
* id = identifiant du message affiché à l'utilisateur. *
* *
* Description : Regroupe les instructions par blocs. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
void group_routines_instructions(GArchInstruction *list, GBinRoutine **routines, size_t count, GtkExtStatusBar *statusbar, guint id)
{
size_t i; /* Boucle de parcours */
vmpa_t start; /* Adresse de départ */
vmpa_t end; /* Adresse de fin */
code_coverage *coverage; /* Couverture de zone de code */
GInstrBlock *block; /* Regroupement d'instructions */
for (i = 0; i < count; i++)
{
start = g_binary_routine_get_address(routines[i]);
end = start + g_binary_routine_get_size(routines[i]);
coverage = create_code_coverage(start, end);
block = build_instruction_block(list, coverage);
g_binary_routine_set_basic_blocks(routines[i], block);
delete_code_coverage(coverage);
gtk_extended_status_bar_update_activity(statusbar, id, (i + 1) * 1.0 / count);
}
}