/* Chrysalide - Outil d'analyse de fichiers binaires
* area.c - définition et manipulation des aires à désassembler
*
* Copyright (C) 2014-2017 Cyrille Bagard
*
* This file is part of Chrysalide.
*
* Chrysalide is free software; you can redistribute it and/or modify
* it under the terms of the GNU General Public License as published by
* the Free Software Foundation; either version 3 of the License, or
* (at your option) any later version.
*
* Chrysalide is distributed in the hope that it will be useful,
* but WITHOUT ANY WARRANTY; without even the implied warranty of
* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
* GNU General Public License for more details.
*
* You should have received a copy of the GNU General Public License
* along with Chrysalide. If not, see .
*/
#include "area.h"
#include
#include
#include
#include
#include "../routine.h"
#include "../contents/restricted.h"
#include "../../arch/raw.h"
#include "../../common/bits.h"
#include "../../common/sort.h"
#include "../../core/global.h"
#include "../../core/logs.h"
#include "../../core/nproc.h"
#include "../../format/format.h"
#include "../../glibext/delayed-int.h"
/* ------------------------- TRAITEMENT DES ZONES DE DONNES ------------------------- */
/* Zone mémoire bien bornée */
typedef struct _mem_area
{
GBinFormat *format; /* Format du fichier binaire */
GBinContent *content; /* Données binaires à lire */
GArchProcessor *proc; /* Architecture du binaire */
SourceEndian endianness; /* Boutisme de cette machine */
mrange_t range; /* Couverture de la zone */
phys_t packing_size; /* Granularité des découpages */
bitfield_t *processed; /* Octets traités dans la zone */
GArchInstruction **instructions; /* Instructions en place */
size_t count; /* Quantité d'instructions */
GMutex mutex; /* Garantie d'atomicité */
GMutex *global; /* Atomicité sur zones multi. */
bool is_exec; /* Zone exécutable ? */
} mem_area;
/* Initialise une aire de données à partir d'une adresse donnée. */
static void init_mem_area_from_addr(mem_area *, const vmpa2t *, phys_t, const GLoadedBinary *, GMutex *);
/* Libère d'une aire de données les ressources allouées. */
static void fini_mem_area(mem_area *);
/* Indique si une zone donnée est intégralement vierge. */
static bool _is_range_empty_in_mem_area(mem_area *, phys_t, phys_t);
/* Indique si une zone donnée est intégralement vierge. */
static bool is_range_empty_in_mem_area(mem_area *, phys_t, phys_t);
/* Indique si une zone donnée est intégralement occupée. */
static bool is_range_busy_in_mem_area(mem_area *, phys_t, phys_t);
/* Marque une série d'octets comme ayant été traités. */
static void mark_range_in_mem_area_as_processed(mem_area *area, GArchInstruction *, phys_t, phys_t);
/* Marque une série d'octets comme non traités. */
static void unmark_range_in_mem_area_as_processed(mem_area *, phys_t, phys_t);
/* Crée une instruction issue d'un désassemblage brut. */
static GArchInstruction *load_raw_instruction_from_mem_area(mem_area *, phys_t, vmpa2t *, phys_t *);
/* S'assure de la présence d'un début de routine à un point. */
static void update_address_as_routine(GBinFormat *, const vmpa2t *);
/* Procède au désassemblage d'un contenu binaire non exécutable. */
static void load_data_from_mem_area(mem_area *, const vmpa2t *, GtkStatusStack *, activity_id_t);
/* S'assure qu'une aire contient toutes ses instructions. */
static void fill_mem_area_with_code(mem_area *, mem_area *, size_t, GProcContext *, GtkStatusStack *, activity_id_t);
/* S'assure qu'une aire contient toutes ses instructions. */
static void fill_mem_area_with_data(mem_area *, mem_area *, size_t, GtkStatusStack *, activity_id_t);
/* Rassemble les instructions conservées dans une zone donnée. */
static GArchInstruction **get_instructions_from_mem_area(const mem_area *, GArchInstruction **, size_t *);
/* -------------------------- TRAITEMENT DE ZONES PAR LOTS -------------------------- */
/* Insère une instruction dans un ensemble d'aires. */
static bool insert_instr_into_mem_areas(mem_area *, size_t, GArchInstruction *, mem_area **);
/* Force l'insertion d'une instruction dans un ensemble d'aires. */
static void insert_instr_into_mem_areas_forced(mem_area *, size_t, GArchInstruction *);
/* ----------------------- MANIPULATIONS PARALLELES DES ZONES ----------------------- */
#define G_TYPE_AREA_COLLECTOR g_area_collector_get_type()
#define G_AREA_COLLECTOR(obj) (G_TYPE_CHECK_INSTANCE_CAST((obj), G_TYPE_AREA_COLLECTOR, GAreaCollector))
#define G_IS_AREA_COLLECTOR(obj) (G_TYPE_CHECK_INSTANCE_TYPE((obj), G_TYPE_AREA_COLLECTOR))
#define G_AREA_COLLECTOR_CLASS(klass) (G_TYPE_CHECK_CLASS_CAST((klass), G_TYPE_AREA_COLLECTOR, GAreaCollectorClass))
#define G_IS_AREA_COLLECTOR_CLASS(klass) (G_TYPE_CHECK_CLASS_TYPE((klass), G_TYPE_AREA_COLLECTOR))
#define G_AREA_COLLECTOR_GET_CLASS(obj) (G_TYPE_INSTANCE_GET_CLASS((obj), G_TYPE_AREA_COLLECTOR, GAreaCollectorClass))
/* Ensembles binaires à désassembler (instance) */
typedef struct _GAreaCollector
{
GDelayedWork parent; /* A laisser en premier */
activity_id_t id; /* Groupe de progression */
run_task_fc run; /* Activité dans la pratique */
mem_area *areas; /* Zone de productions */
union
{
struct
{
size_t created; /* Nombre de zones créées */
GLoadedBinary *binary; /* Binaire à associer aux zones*/
GMutex *global; /* Verrou pour zones multi. */
phys_t first; /* Début de traitement */
phys_t last; /* Fin de traitement */
bool closing; /* Tâche clôturant le parcours */
};
struct
{
size_t available; /* Nombre de zones créées */
GPreloadInfo *info; /* Préchargements à intégrer */
size_t start; /* Départ des intégrations */
size_t stop; /* Fin des intégrations */
};
struct
{
size_t count; /* Nombre de zones présentes */
GProcContext *ctx; /* Contexte de désassemblage */
size_t fill_start; /* Première zone à remplir */
size_t fill_stop; /* Première zone à écarter */
};
struct
{
size_t begin; /* Début du parcours à mener */
size_t end; /* Fin de ce même parcours */
GArchInstruction **collected; /* Instructions collectées */
size_t ccount; /* Quantité de ces instructions*/
};
};
} GAreaCollector;
/* Ensembles binaires à désassembler (classe) */
typedef struct _GAreaCollectorClass
{
GDelayedWorkClass parent; /* A laisser en premier */
} GAreaCollectorClass;
/* Indique le type défini pour les tâches de traitement des zones. */
GType g_area_collector_get_type(void);
/* Initialise la classe des manipulations parallèles de zones. */
static void g_area_collector_class_init(GAreaCollectorClass *);
/* Initialise des manipulations parallèles de zones. */
static void g_area_collector_init(GAreaCollector *);
/* Supprime toutes les références externes. */
static void g_area_collector_dispose(GAreaCollector *);
/* Procède à la libération totale de la mémoire. */
static void g_area_collector_finalize(GAreaCollector *);
/* Assure un traitement particulier concernant les zones. */
static void g_area_collector_process(GAreaCollector *, GtkStatusStack *);
/* Crée une tâche de calcul des zones binaires à désassembler. */
static GAreaCollector *g_area_collector_new_intro(activity_id_t, GLoadedBinary *, GMutex *, phys_t, phys_t, bool);
/* Construit une liste bornée de zones contigües. */
static void g_area_collector_do_compute(GAreaCollector *, GtkStatusStack *);
/* Crée une tâche de calcul des zones binaires à remplir. */
static GAreaCollector *g_area_collector_new_insert(activity_id_t, mem_area *, size_t, GPreloadInfo *, size_t, size_t);
/* Insère dans les zones contigües les instructions préchargées. */
static void g_area_collector_do_insert(GAreaCollector *, GtkStatusStack *);
/* Crée une tâche de fin de désassemblage pour zones binaires. */
static GAreaCollector *g_area_collector_new_filling(activity_id_t, mem_area *, size_t, GProcContext *, size_t, size_t);
/* Remplit de code ou de données une série de zones. */
static void g_area_collector_do_fill(GAreaCollector *, GtkStatusStack *);
/* Crée une tâche de récupération d'instructions différée. */
static GAreaCollector *g_area_collector_new_outro(activity_id_t, mem_area *, size_t, size_t);
/* Assure la récupération d'instructions en différé. */
static void g_area_collector_do_collect(GAreaCollector *, GtkStatusStack *);
/* ---------------------------------------------------------------------------------- */
/* RAITEMENT DES ZONES DE DONNES */
/* ---------------------------------------------------------------------------------- */
/******************************************************************************
* *
* Paramètres : area = aire représentant à contenu à initialiser. *
* addr = adresse de départ de l'espace à mettre en place. *
* len = longueur de l'espace à créer. *
* binary = binaire analysé content quantités d'informations. *
* global = verrou pour les accès sur plusieurs zones. *
* *
* Description : Initialise une aire de données à partir d'une adresse donnée.*
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void init_mem_area_from_addr(mem_area *area, const vmpa2t *addr, phys_t len, const GLoadedBinary *binary, GMutex *global)
{
GBinContent *content; /* Données binaires à lire */
assert(len > 0);
area->format = G_BIN_FORMAT(g_loaded_binary_get_format(binary));
content = g_binary_format_get_content(area->format);
area->proc = g_loaded_binary_get_processor(binary);
area->endianness = g_arch_processor_get_endianness(area->proc);
init_mrange(&area->range, addr, len);
area->content = g_restricted_content_new(content, &area->range);
area->packing_size = 2; /* FIXME */
area->processed = create_bit_field(len, false);
area->instructions = (GArchInstruction **)calloc(len, sizeof(GArchInstruction *));
area->count = 0;
g_mutex_init(&area->mutex);
area->global = global;
}
/******************************************************************************
* *
* Paramètres : area = aire représentant à contenu à nettoyer en mémoire. *
* *
* Description : Libère d'une aire de données les ressources allouées. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void fini_mem_area(mem_area *area)
{
phys_t len; /* Etendue du parcours total */
phys_t i; /* Boucle de parcours */
g_object_unref(area->format);
g_object_unref(area->content);
g_object_unref(area->proc);
delete_bit_field(area->processed);
len = get_mrange_length(&area->range);
for (i = 0; i < len; i++)
if (area->instructions[i] != NULL)
g_object_unref(G_OBJECT(area->instructions[i]));
free(area->instructions);
g_mutex_clear(&area->mutex);
}
/******************************************************************************
* *
* Paramètres : area = aire représentant à contenu à parcourir. *
* start = début de la zone à manipuler. *
* len = taille de cette même aire de données. *
* *
* Description : Indique si une zone donnée est intégralement vierge. *
* *
* Retour : true si l'aire visée n'a jamais été traitée, false sinon. *
* *
* Remarques : - *
* *
******************************************************************************/
static bool _is_range_empty_in_mem_area(mem_area *area, phys_t start, phys_t len)
{
bool result; /* Résultat à renvoyer */
assert(!g_mutex_trylock(&area->mutex));
assert((start + len) <= get_mrange_length(&area->range));
result = test_none_in_bit_field(area->processed, start, len);
return result;
}
/******************************************************************************
* *
* Paramètres : area = aire représentant à contenu à parcourir. *
* start = début de la zone à manipuler. *
* len = taille de cette même aire de données. *
* *
* Description : Indique si une zone donnée est intégralement vierge. *
* *
* Retour : true si l'aire visée n'a jamais été traitée, false sinon. *
* *
* Remarques : - *
* *
******************************************************************************/
static bool is_range_empty_in_mem_area(mem_area *area, phys_t start, phys_t len)
{
bool result; /* Résultat à renvoyer */
/**
* Les accès au champ de bits sont atomiques, mais la fonction
* (un)mark_range_in_mem_area_as_processed() peut y accéder en deux temps
* (réinitialisation, puis définition).
*
* On protège donc les accès de façon constante.
*/
g_mutex_lock(&area->mutex);
result = _is_range_empty_in_mem_area(area, start, len);
g_mutex_unlock(&area->mutex);
return result;
}
/******************************************************************************
* *
* Paramètres : area = aire représentant à contenu à parcourir. *
* start = début de la zone à manipuler. *
* len = taille de cette même aire de données. *
* *
* Description : Indique si une zone donnée est intégralement vierge ou non. *
* *
* Retour : true si l'aire visée n'a jamais été traitée, false sinon. *
* *
* Remarques : - *
* *
******************************************************************************/
static bool is_range_busy_in_mem_area(mem_area *area, phys_t start, phys_t len)
{
bool result; /* Résultat à renvoyer */
assert((start + len) <= get_mrange_length(&area->range));
/**
* Les accès au champ de bits sont atomiques, mais la fonction
* (un)mark_range_in_mem_area_as_processed() peut y accéder en deux temps
* (réinitialisation, puis définition).
*
* On protège donc les accès de façon constante.
*/
g_mutex_lock(&area->mutex);
result = test_all_in_bit_field(area->processed, start, len);
g_mutex_unlock(&area->mutex);
return result;
}
/******************************************************************************
* *
* Paramètres : area = aire représentant à contenu à parcourir. *
* instr = instruction à mémoriser pour la suite ou NULL. *
* start = début de la zone à manipuler. *
* len = taille de cette même aire de données. *
* *
* Description : Marque une série d'octets comme ayant été traités. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void mark_range_in_mem_area_as_processed(mem_area *area, GArchInstruction *instr, phys_t start, phys_t len)
{
#ifndef NDEBUG
bool status; /* Validation de disponibilité */
phys_t i; /* Boucle de parcours */
#endif
assert(!g_mutex_trylock(&area->mutex));
assert((start + len) <= get_mrange_length(&area->range));
assert(instr != NULL || start == 0);
/* Application dans le registre des bits */
#ifndef NDEBUG
status = test_none_in_bit_field(area->processed, start, len);
assert(status);
#endif
set_in_bit_field(area->processed, start, len);
/* Inscription de l'instruction dans les comptes */
#ifndef NDEBUG
for (i = 0; i < len; i++)
assert(area->instructions[start + i] == NULL);
#endif
if (instr != NULL)
{
area->instructions[start] = instr;
g_object_ref(G_OBJECT(instr));
g_atomic_pointer_add(&area->count, 1);
}
}
/******************************************************************************
* *
* Paramètres : area = aire représentant à contenu à parcourir. *
* instr = instruction à mémoriser pour la suite ou NULL. *
* start = début de la zone à manipuler. *
* len = taille de cette même aire de données. *
* *
* Description : Marque une série d'octets comme non traités. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void unmark_range_in_mem_area_as_processed(mem_area *area, phys_t start, phys_t len)
{
phys_t i; /* Boucle de parcours */
GArchInstruction *old; /* Instruction remplacée */
assert(!g_mutex_trylock(&area->mutex));
assert((start + len) <= get_mrange_length(&area->range));
/* Retrait d'éventuelles instructions */
for (i = 0; i < len; i++)
{
old = area->instructions[start + i];
if (old != NULL)
{
g_object_unref(G_OBJECT(old));
area->instructions[start + i] = NULL;
g_atomic_pointer_add(&area->count, -1);
}
}
/* Actualisation du registre des bits */
reset_in_bit_field(area->processed, start, len);
}
/******************************************************************************
* *
* Paramètres : area = aire représentant à contenu à parcourir. *
* offset = point de départ au sein de l'aire en question. *
* pos = tête de lecture dans l'espace global. *
* size = taille de l'instruction mise en place. [OUT] *
* *
* Description : Crée une instruction issue d'un désassemblage brut. *
* *
* Retour : Instruction mise en place ou NULL en cas d'échec. *
* *
* Remarques : - *
* *
******************************************************************************/
static GArchInstruction *load_raw_instruction_from_mem_area(mem_area *area, phys_t offset, vmpa2t *pos, phys_t *size)
{
GArchInstruction *result; /* Instruction à retourner */
GBinContent *content; /* Données binaires à lire */
SourceEndian endianness; /* Boutisme de cette machine */
phys_t sz; /* Volume de données traité */
vmpa2t prev; /* Boucle de parcours */
result = NULL;
content = area->content;
endianness = area->endianness;
sz = area->packing_size;
/**
* Une vérification est effectuée en amont pour garantir qu'il existe
* toujours au moins un octet à traiter.
*
* Si on veut en manipuler plus d'un, aucune vérification en amont ne s'occupe
* du cas où on dépasse les limites de la zone lors des tests de marquage.
*
* D'habitude, c'est la création préalable d'une instruction, via la lecture
* du contenu binaire restreint, qui part en échec et qui fait qu'on ne teste
* pas la zone sur un espace hors champ.
*
* Ce test est effectué avant la création d'une instruction ici (et c'est le
* seul endroit dans ce cas de figure), donc il faut faire les vérifications
* de débordement avant tout !
*/
if (get_virt_addr(pos) % sz == 0
&& (offset + sz) <= get_mrange_length(&area->range)
&& is_range_empty_in_mem_area(area, offset, sz))
{
*size = sz;
copy_vmpa(&prev, pos);
result = g_raw_instruction_new_array(content, MDS_FROM_BYTES(sz), 1, pos, endianness);
if (result == NULL)
copy_vmpa(pos, &prev);
}
if (result == NULL)
{
*size = 1;
result = g_raw_instruction_new_array(content, MDS_8_BITS, 1, pos, endianness);
}
return result;
}
/******************************************************************************
* *
* Paramètres : format = format binaire en cours de traitement. *
* addr = adresse d'une instruction présentée comme première. *
* *
* Description : S'assure de la présence d'un début de routine à un point. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void update_address_as_routine(GBinFormat *format, const vmpa2t *addr)
{
GBinSymbol *symbol; /* Symbole présent ou créé */
bool found; /* Détection de symbole */
SymbolType sym_type; /* Type de symbole en place */
bool wrong_type; /* Analyse plus fine de ce type*/
mrange_t range; /* Etendue du symbole à créer */
VMPA_BUFFER(loc); /* Traduction de l'adresse */
char name[5 + VMPA_MAX_LEN]; /* Nom de symbole nouveau */
GBinRoutine *routine; /* Nouvelle routine trouvée */
found = g_binary_format_find_symbol_at(format, addr, &symbol);
if (found)
{
sym_type = g_binary_symbol_get_target_type(symbol);
wrong_type = (sym_type != STP_ROUTINE && sym_type != STP_ENTRY_POINT);
}
if (!found || (found && wrong_type))
{
if (found)
g_binary_format_remove_symbol(format, symbol);
init_mrange(&range, addr, 0);
vmpa2_virt_to_string(addr, MDS_UNDEFINED, loc, NULL);
snprintf(name, sizeof(name), "sub_%s", loc + 2);
routine = g_binary_routine_new();
symbol = G_BIN_SYMBOL(routine);
g_binary_routine_set_name(routine, strdup(name));
g_binary_symbol_set_range(symbol, &range);
g_binary_format_add_symbol(format, symbol);
}
else
g_object_unref(G_OBJECT(symbol));
}
/******************************************************************************
* *
* Paramètres : area = aire représentant à contenu à parcourir. *
* list = liste de zones délimitant des contenus à traiter. *
* count = nombre de zones à disposition. *
* index = indice de l'aire à considérer pendant l'opération. *
* binary = représentation de binaire chargé. *
* ctx = contexte offert en soutien à un désassemblage. *
* start = démarrage de l'exécution au sein de la zone. *
* force = force la création d'au moins une instruction. *
* status = barre de statut à actualiser. *
* id = identifiant du groupe de progression à l'affichage. *
* *
* Description : Procède au désassemblage d'un contenu binaire exécutable. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
void load_code_from_mem_area(mem_area *area, mem_area *list, size_t count, GProcContext *ctx, const vmpa2t *start, bool force, GtkStatusStack *status, activity_id_t id)
{
GBinFormat *format; /* Format du fichier binaire */
GArchProcessor *proc; /* Architecture du binaire */
GBinContent *content; /* Données binaires à lire */
phys_t init_diff; /* Position initiale de lecture*/
phys_t alen; /* Taille de l'aire utilisée */
vmpa2t pos; /* Tête de lecture */
bool forced_once; /* Préfigure une sortie rapide */
phys_t i; /* Boucle de parcours */
vmpa2t prev; /* Sauvegarde de la tête */
GArchInstruction *instr; /* Instruction décodée */
phys_t diff; /* Volume de données traité */
mrange_t range; /* Couverture de l'instruction */
bool done; /* Enregistrement effectué ? */
GArchInstruction *extra; /* Instruction supplémentaire */
/* Récupération des informations de base */
format = area->format;
proc = area->proc;
content = area->content;
init_diff = compute_vmpa_diff(get_mrange_addr(&area->range), start);
alen = get_mrange_length(&area->range);
copy_vmpa(&pos, start);
/* Traitement de la zone */
forced_once = false;
for (i = init_diff; i < alen; i += diff)
{
/**
* On réalise un premier test informel (car non atomique) peu coûteux
* avant de se lancer dans un désassemblage d'instruction potentiellement
* inutile.
*/
if (is_range_busy_in_mem_area(area, i, 1))
break;
/* Décodage d'une nouvelle instruction */
copy_vmpa(&prev, &pos);
instr = g_arch_processor_disassemble(proc, ctx, content, &pos, G_EXE_FORMAT(format));
if (instr != NULL)
diff = compute_vmpa_diff(&prev, &pos);
else
{
if (i == init_diff && force)
{
instr = load_raw_instruction_from_mem_area(area, i, &pos, &diff);
forced_once = true;
}
if (instr == NULL)
break;
}
/* Enregistrement des positions et adresses */
init_mrange(&range, &prev, diff);
g_arch_instruction_set_range(instr, &range);
/* Progression dans les traitements */
done = insert_instr_into_mem_areas(list, count, instr, (mem_area *[]) { area });
if (!done)
{
g_object_unref(G_OBJECT(instr));
break;
}
gtk_status_stack_update_activity_value(status, id, diff);
/* Enregistrement d'un éventuel début de routine */
if (g_arch_instruction_get_flags(instr) & AIF_ROUTINE_START)
update_address_as_routine(format, &prev);
/* Eventuel renvoi vers d'autres adresses */
g_arch_instruction_call_hook(instr, IPH_FETCH, proc, ctx, G_EXE_FORMAT(format));
/* Insertion des symboles découverts en parallèle */
for (extra = g_preload_info_pop_instruction(G_PRELOAD_INFO(ctx));
extra != NULL;
extra = g_preload_info_pop_instruction(G_PRELOAD_INFO(ctx)))
{
insert_instr_into_mem_areas_forced(list, count, extra);
g_object_unref(G_OBJECT(extra));
}
/* Rupture du flot d'exécution ? */
if (forced_once || g_arch_instruction_get_flags(instr) & AIF_RETURN_POINT)
{
g_object_unref(G_OBJECT(instr));
break;
}
else
g_object_unref(G_OBJECT(instr));
}
}
/******************************************************************************
* *
* Paramètres : area = aire représentant à contenu à parcourir. *
* start = démarrage de l'exécution au sein de la zone. *
* status = barre de statut à actualiser. *
* id = identifiant du groupe de progression à l'affichage. *
* *
* Description : Procède au désassemblage d'un contenu binaire non exécutable.*
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void load_data_from_mem_area(mem_area *area, const vmpa2t *start, GtkStatusStack *status, activity_id_t id)
{
phys_t diff; /* Volume de données traité */
phys_t alen; /* Taille de l'aire utilisée */
vmpa2t pos; /* Boucle de parcours */
phys_t i; /* Boucle de parcours */
vmpa2t prev; /* Boucle de parcours */
GArchInstruction *instr; /* Instruction décodée */
mrange_t range; /* Couverture de l'instruction */
bool done; /* Enregistrement effectué ? */
/* Récupération des informations de base */
diff = compute_vmpa_diff(get_mrange_addr(&area->range), start);
alen = get_mrange_length(&area->range);
copy_vmpa(&pos, start);
/* Traitement de la zone */
for (i = diff; i < alen; i += diff)
{
/* On cherche à obtenir l'assurance que le traitement n'a jamais été fait */
if (is_range_busy_in_mem_area(area, i, 1))
break;
/* Décodage d'une nouvelle instruction, sur mesure puis minimale */
copy_vmpa(&prev, &pos);
instr = load_raw_instruction_from_mem_area(area, i, &pos, &diff);
/* On rencontre ici un morceau déjà traité. */
if (instr == NULL) break;
/* Enregistrement des positions et adresses */
assert(diff == compute_vmpa_diff(&prev, &pos));
init_mrange(&range, &prev, diff);
g_arch_instruction_set_range(instr, &range);
/* Progression dans les traitements */
done = insert_instr_into_mem_areas(area, 1, instr, (mem_area *[]) { area });
g_object_unref(G_OBJECT(instr));
if (!done)
break;
gtk_status_stack_update_activity_value(status, id, diff);
/* On laisse une chance au code pour se reprendre... */
if (area->is_exec) break;
}
}
/******************************************************************************
* *
* Paramètres : area = aire représentant à contenu à parcourir. *
* list = liste de zones délimitant des contenus à traiter. *
* count = nombre de zones à disposition. *
* binary = représentation de binaire chargé. *
* ctx = contexte offert en soutien à un désassemblage. *
* status = barre de statut à actualiser. *
* id = identifiant du groupe de progression à l'affichage. *
* *
* Description : S'assure qu'une aire contient toutes ses instructions. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void fill_mem_area_with_code(mem_area *area, mem_area *list, size_t count, GProcContext *ctx, GtkStatusStack *status, activity_id_t id)
{
const vmpa2t *addr; /* Début de la zone à traiter */
phys_t len; /* Taille de la zone à remplir */
phys_t i; /* Boucle de parcours */
vmpa2t start; /* Adresse de départ de combles*/
if (area->is_exec)
{
addr = get_mrange_addr(&area->range);
len = get_mrange_length(&area->range);
for (i = 0; i < len; i++)
{
if (is_range_empty_in_mem_area(area, i, 1))
{
copy_vmpa(&start, addr);
advance_vmpa(&start, i);
if (get_virt_addr(&start) % area->packing_size == 0)
load_code_from_mem_area(area, list, count, ctx, &start, false, status, id);
}
}
}
}
/******************************************************************************
* *
* Paramètres : area = aire représentant à contenu à parcourir. *
* list = liste de zones délimitant des contenus à traiter. *
* count = nombre de zones à disposition. *
* status = barre de statut à actualiser. *
* id = identifiant du groupe de progression à l'affichage. *
* *
* Description : S'assure qu'une aire contient toutes ses instructions. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void fill_mem_area_with_data(mem_area *area, mem_area *list, size_t count, GtkStatusStack *status, activity_id_t id)
{
const vmpa2t *addr; /* Début de la zone à traiter */
phys_t len; /* Taille de la zone à remplir */
bool err_trigger; /* Présence d'une instruction */
phys_t i; /* Boucle de parcours */
vmpa2t start; /* Adresse de départ de combles*/
addr = get_mrange_addr(&area->range);
len = get_mrange_length(&area->range);
err_trigger = true;
for (i = 0; i < len; i++)
{
if (is_range_empty_in_mem_area(area, i, 1))
{
copy_vmpa(&start, addr);
advance_vmpa(&start, i);
if (area->is_exec && err_trigger)
{
g_arch_processor_add_error(area->proc, APE_DISASSEMBLY, &start,
_("Unable to disassemble code instruction"));
err_trigger = false;
}
load_data_from_mem_area(area, &start, status, id);
}
else
err_trigger = true;
assert(is_range_busy_in_mem_area(area, i, 1));
}
}
/******************************************************************************
* *
* Paramètres : area = aire représentant à contenu à parcourir. *
* list = liste d'instructions à compléter. *
* count = taille de cette liste. [OUT] *
* *
* Description : Rassemble les instructions conservées dans une zone donnée. *
* *
* Retour : Liste d'instructions prêtes à emploi. *
* *
* Remarques : - *
* *
******************************************************************************/
static GArchInstruction **get_instructions_from_mem_area(const mem_area *area, GArchInstruction **list, size_t *count)
{
GArchInstruction **result; /* Liste d'instr. à renvoyer */
phys_t len; /* Nombre d'instructions au max*/
#ifndef NDEBUG
size_t check; /* Verification de débordement */
#endif
phys_t i; /* Boucle de parcours */
GArchInstruction *instr; /* Instruction décodée */
result = (GArchInstruction **)realloc(list, (*count + area->count) * sizeof(GArchInstruction *));
len = get_mrange_length(&area->range);
#ifndef NDEBUG
check = 0;
#endif
for (i = 0; i < len; i++)
{
instr = area->instructions[i];
if (instr != NULL)
{
g_object_ref(G_OBJECT(instr));
result[(*count)++] = instr;
#ifndef NDEBUG
check++;
assert(check <= area->count);
#endif
}
}
return result;
}
/* ---------------------------------------------------------------------------------- */
/* TRAITEMENT DE ZONES PAR LOTS */
/* ---------------------------------------------------------------------------------- */
/******************************************************************************
* *
* Paramètres : list = listes de zones utable à consulter. *
* count = nombre de zones mises en place. *
* addr = adresse à retrouver dans les aires présentes. *
* *
* Description : Détermine une liste de zones contigües à traiter. *
* *
* Retour : Indice de la zone trouvée, ou nombre d'aires en cas d'échec. *
* *
* Remarques : - *
* *
******************************************************************************/
mem_area *find_memory_area_by_addr(mem_area *list, size_t count, const vmpa2t *addr)
{
mem_area *result; /* Elément trouvé à renvoyer */
int find_mem_area(const vmpa2t *_addr, const mem_area *_area)
{
int status; /* Bilan à retourner */
if (mrange_contains_addr(&_area->range, _addr))
status = 0;
else
status = cmp_vmpa(_addr, get_mrange_addr(&_area->range));
return status;
}
result = bsearch(addr, list, count, sizeof(mem_area), (__compar_fn_t)find_mem_area);
return result;
}
/******************************************************************************
* *
* Paramètres : areas = liste de zones délimitant des contenus à traiter. *
* count = nombre de zones à disposition. *
* instr = nouvelle instruction à venir insérer dans les zones.*
* advice = éventuelle indication pour la zone de départ. [OUT] *
* *
* Description : Insère une instruction dans un ensemble d'aires. *
* *
* Retour : true si l'enregistrement a bien été réalisé, false sinon. *
* *
* Remarques : - *
* *
******************************************************************************/
static bool insert_instr_into_mem_areas(mem_area *areas, size_t count, GArchInstruction *instr, mem_area **advice)
{
bool result; /* Bilan d'action à renvoyer */
const mrange_t *range; /* Emplacement d'instruction */
const vmpa2t *start_addr; /* Localisation précise */
mem_area *first_area; /* Zone d'appartenance */
vmpa2t end_addr; /* Position finale nominale */
mem_area *last_area; /* Zone d'arrivée */
size_t first_index; /* Indice de la première zone */
size_t last_index; /* Indice de la dernière zone */
size_t i; /* Boucle de parcours */
phys_t mark_start; /* Début du marquage */
phys_t mark_len; /* Taille dudit marquage */
range = g_arch_instruction_get_range(instr);
start_addr = get_mrange_addr(range);
/* Zone de départ */
first_area = NULL;
if (advice != NULL && *advice != NULL)
{
if (mrange_contains_addr(&(*advice)->range, start_addr))
first_area = *advice;
}
if (first_area == NULL)
first_area = find_memory_area_by_addr(areas, count, start_addr);
assert(first_area != NULL);
/* Zone d'arrivée */
compute_mrange_end_addr(range, &end_addr);
deminish_vmpa(&end_addr, 1);
if (mrange_contains_addr(&first_area->range, &end_addr))
last_area = first_area;
else
{
last_area = find_memory_area_by_addr(areas, count, &end_addr);
assert(last_area != NULL);
}
/* Verrouillage global ou local */
first_index = first_area - areas;
last_index = last_area - areas;
if (first_index != last_index)
g_mutex_lock(first_area->global);
for (i = first_index; i <= last_index; i++)
g_mutex_lock(&areas[i].mutex);
if (first_index != last_index)
g_mutex_unlock(first_area->global);
/* Vérification des disponibilités */
result = true;
for (i = first_index; i <= last_index && result; i++)
{
if (i == first_index)
mark_start = compute_vmpa_diff(get_mrange_addr(&first_area->range), start_addr);
else
mark_start = 0;
if (i == last_index)
mark_len = compute_vmpa_diff(get_mrange_addr(&last_area->range), &end_addr) + 1;
else
mark_len = get_mrange_length(&areas[i].range);;
mark_len -= mark_start;
result = _is_range_empty_in_mem_area(&areas[i], mark_start, mark_len);
}
if (!result)
goto no_space_available;
/* Inscriptions */
for (i = first_index; i <= last_index; i++)
{
if (i == first_index)
mark_start = compute_vmpa_diff(get_mrange_addr(&first_area->range), start_addr);
else
mark_start = 0;
if (i == last_index)
mark_len = compute_vmpa_diff(get_mrange_addr(&last_area->range), &end_addr) + 1;
else
mark_len = get_mrange_length(&areas[i].range);;
mark_len -= mark_start;
mark_range_in_mem_area_as_processed(&areas[i],
i == first_index ? instr : NULL,
mark_start, mark_len);
}
no_space_available:
/* Déverrouillage global ou local */
for (i = first_index; i <= last_index; i++)
g_mutex_unlock(&areas[i].mutex);
if (advice != NULL)
*advice = last_area;
return result;
}
/******************************************************************************
* *
* Paramètres : areas = liste de zones délimitant des contenus à traiter. *
* count = nombre de zones à disposition. *
* instr = nouvelle instruction à venir insérer dans les zones. *
* *
* Description : Force l'insertion d'une instruction dans un ensemble d'aires.*
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void insert_instr_into_mem_areas_forced(mem_area *areas, size_t count, GArchInstruction *instr)
{
const mrange_t *range; /* Emplacement d'instruction */
const vmpa2t *start_addr; /* Localisation précise */
mem_area *first_area; /* Zone d'appartenance */
vmpa2t end_addr; /* Position finale nominale */
mem_area *last_area; /* Zone d'arrivée */
size_t first_index; /* Indice de la première zone */
size_t last_index; /* Indice de la dernière zone */
size_t i; /* Boucle de parcours */
bool available; /* Zone intégralement dispo ? */
phys_t mark_start; /* Début du marquage */
phys_t mark_len; /* Taille dudit marquage */
mem_area *first_covered_area; /* Zone d'appartenance */
size_t first_covered_index; /* Indice de la première zone */
phys_t coverage_start; /* Début de zone à vider */
phys_t coverage_iter; /* Parcours des zones à vider */
phys_t coverage_len; /* Taille de cette même zone */
mem_area *last_covered_area; /* Zone d'appartenance */
size_t last_covered_index; /* Indice de la première zone */
phys_t remaining; /* Couverture minimale restante*/
phys_t length; /* Taille de zone restante */
range = g_arch_instruction_get_range(instr);
start_addr = get_mrange_addr(range);
/* Récupération des zones couvertes par l'instruction */
first_area = find_memory_area_by_addr(areas, count, start_addr);
assert(first_area != NULL);
compute_mrange_end_addr(range, &end_addr);
deminish_vmpa(&end_addr, 1);
if (mrange_contains_addr(&first_area->range, &end_addr))
last_area = first_area;
else
{
last_area = find_memory_area_by_addr(areas, count, &end_addr);
assert(last_area != NULL);
}
/* Verrouillage global */
first_index = first_area - areas;
last_index = last_area - areas;
g_mutex_lock(first_area->global);
for (i = first_index; i <= last_index; i++)
g_mutex_lock(&areas[i].mutex);
/* Validation des disponibilités */
available = true;
for (i = first_index; i <= last_index && available; i++)
{
if (i == first_index)
mark_start = compute_vmpa_diff(get_mrange_addr(&first_area->range), start_addr);
else
mark_start = 0;
if (i == last_index)
mark_len = compute_vmpa_diff(get_mrange_addr(&last_area->range), &end_addr) + 1;
else
mark_len = get_mrange_length(&areas[i].range);;
mark_len -= mark_start;
available = _is_range_empty_in_mem_area(&areas[i], mark_start, mark_len);
}
/* Si la couverture nécessite une mise à disposition */
if (!available)
{
/**
* Un cas de remplacement forcé intervient en ARM, lorsque qu'une
* instruction utilise une valeur immédiate placée dans le code.
*
* Cette valeur doit être référencée en tant que donnée.
*
* Mais cette même valeur a pu être désassemblée en tant que code
* exécutable si le flot d'exécution s'est poursuivi jusqu'à elle.
*
* C'est par exemple le cas lors de l'utilisation d'appels système
* en assembleur, qui ne sont pas reconnus en tant qu'instructions
* cassant le flot d'exécution (typiquement : un exit()).
*
* On réinitialise donc la zone couverte par la nouvelle instruction.
*/
first_covered_area = first_area;
first_covered_index = first_index;
coverage_start = compute_vmpa_diff(get_mrange_addr(&first_covered_area->range), start_addr);
coverage_iter = coverage_start;
coverage_len = 0;
/**
* Par ailleurs, il se peut que la nouvelle instruction ne couvre
* que partiellement une instruction existante.
*
* Il faut donc dans ce cas remonter la table des enregistrements
* pour retrouver l'instruction à l'origine de la couverture à remplacer.
*/
while (first_covered_area->instructions[coverage_start] == NULL)
{
if (coverage_start == 0)
{
assert(first_covered_index > 0);
first_covered_area = &areas[--first_covered_index];
g_mutex_lock(&first_covered_area->mutex);
assert(get_mrange_length(&first_covered_area->range) > 0);
coverage_start = get_mrange_length(&first_covered_area->range) - 1;
}
else
coverage_start--;
coverage_len++;
}
/**
* De la même manière, on étend la couverture au besoin dans l'autre sens.
*/
last_covered_area = last_area;
last_covered_index = last_index;
remaining = get_mrange_length(range);
while (remaining > 0)
{
length = get_mrange_length(&last_covered_area->range) - coverage_iter;
if (remaining >= length)
{
coverage_len += length;
remaining -= length;
if (remaining > 0)
{
assert((last_covered_index + 1) < count);
last_covered_area = &areas[++last_covered_index];
g_mutex_lock(&last_covered_area->mutex);
coverage_iter = 0;
}
}
else
{
coverage_len += remaining;
remaining = 0;
}
}
g_mutex_unlock(first_area->global);
assert(coverage_len >= get_mrange_length(range));
/* Réinitialisation */
for (i = first_covered_index; i <= last_covered_index; i++)
{
if (i == first_covered_index)
mark_start = coverage_start;
else
mark_start = 0;
if (i == last_covered_index)
mark_len = coverage_len;
else
{
mark_len = get_mrange_length(&areas[i].range);;
assert(mark_len > mark_start);
mark_len -= mark_start;
}
coverage_len -= mark_len;
unmark_range_in_mem_area_as_processed(&areas[i], mark_start, mark_len);
}
/* Libération des zones frontalières */
for (i = first_covered_index; i < first_index; i++)
g_mutex_unlock(&areas[i].mutex);
for (i = (last_index + 1); i <= last_covered_index; i++)
g_mutex_unlock(&areas[i].mutex);
/* Vérification ultime */
#ifndef NDEBUG
available = true;
for (i = first_index; i <= last_index && available; i++)
{
if (i == first_index)
mark_start = compute_vmpa_diff(get_mrange_addr(&first_area->range), start_addr);
else
mark_start = 0;
if (i == last_index)
mark_len = compute_vmpa_diff(get_mrange_addr(&last_area->range), &end_addr) + 1;
else
mark_len = get_mrange_length(&areas[i].range);;
mark_len -= mark_start;
available = _is_range_empty_in_mem_area(&areas[i], mark_start, mark_len);
}
assert(available);
#endif
}
else
g_mutex_unlock(first_area->global);
/* Inscription */
for (i = first_index; i <= last_index; i++)
{
if (i == first_index)
mark_start = compute_vmpa_diff(get_mrange_addr(&first_area->range), start_addr);
else
mark_start = 0;
if (i == last_index)
mark_len = compute_vmpa_diff(get_mrange_addr(&last_area->range), &end_addr) + 1;
else
mark_len = get_mrange_length(&areas[i].range);;
mark_len -= mark_start;
mark_range_in_mem_area_as_processed(&areas[i],
i == first_index ? instr : NULL,
mark_start, mark_len);
}
/* Déverrouillage des zones traitées restantes */
for (i = first_index; i <= last_index; i++)
g_mutex_unlock(&areas[i].mutex);
}
/* ---------------------------------------------------------------------------------- */
/* MANIPULATIONS PARALLELES DES ZONES */
/* ---------------------------------------------------------------------------------- */
/* Indique le type défini pour les tâches de traitement des zones. */
G_DEFINE_TYPE(GAreaCollector, g_area_collector, G_TYPE_DELAYED_WORK);
/******************************************************************************
* *
* Paramètres : klass = classe à initialiser. *
* *
* Description : Initialise la classe des manipulations parallèles de zones. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void g_area_collector_class_init(GAreaCollectorClass *klass)
{
GObjectClass *object; /* Autre version de la classe */
GDelayedWorkClass *work; /* Version en classe parente */
object = G_OBJECT_CLASS(klass);
object->dispose = (GObjectFinalizeFunc/* ! */)g_area_collector_dispose;
object->finalize = (GObjectFinalizeFunc)g_area_collector_finalize;
work = G_DELAYED_WORK_CLASS(klass);
work->run = (run_task_fc)g_area_collector_process;
}
/******************************************************************************
* *
* Paramètres : collector = instance à initialiser. *
* *
* Description : Initialise des manipulations parallèles de zones. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void g_area_collector_init(GAreaCollector *collector)
{
}
/******************************************************************************
* *
* Paramètres : collector = instance d'objet GLib à traiter. *
* *
* Description : Supprime toutes les références externes. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void g_area_collector_dispose(GAreaCollector *collector)
{
if (collector->run == (run_task_fc)g_area_collector_do_compute)
g_clear_object(&collector->binary);
else if (collector->run == (run_task_fc)g_area_collector_do_insert)
g_clear_object(&collector->info);
else if (collector->run == (run_task_fc)g_area_collector_do_fill)
g_clear_object(&collector->ctx);
G_OBJECT_CLASS(g_area_collector_parent_class)->dispose(G_OBJECT(collector));
}
/******************************************************************************
* *
* Paramètres : collector = instance d'objet GLib à traiter. *
* *
* Description : Procède à la libération totale de la mémoire. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void g_area_collector_finalize(GAreaCollector *collector)
{
if (collector->run == (run_task_fc)g_area_collector_do_compute)
{
/**
* Il s'agit de la seule procédure où les zones mises en place sont
* propres à un collecteur donné unique.
*
* Dans les autres cas, la liste est globale et partagée.
*/
if (collector->areas != NULL)
free(collector->areas);
}
else if (collector->run == (run_task_fc)g_area_collector_do_collect)
{
if (collector->collected != NULL)
free(collector->collected);
}
G_OBJECT_CLASS(g_area_collector_parent_class)->finalize(G_OBJECT(collector));
}
/******************************************************************************
* *
* Paramètres : collector = opérations à mener. *
* status = barre de statut à tenir informée. *
* *
* Description : Assure un traitement particulier concernant les zones. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void g_area_collector_process(GAreaCollector *collector, GtkStatusStack *status)
{
collector->run(G_DELAYED_WORK(collector), status);
}
/******************************************************************************
* *
* Paramètres : id = identifiant pour signaler la progression courante. *
* binary = binaire chargé à conserver dans les zones définies.*
* global = verrou pour les accès sur plusieurs zones. *
* info = préchargements effectués via le format binaire. *
* first = localisation du début de la portion à traiter. *
* last = localisation de la fin de la portion à traiter. *
* closing = indique si la tâche doit terminer l'analyse. *
* *
* Description : Crée une tâche de calcul des zones binaires à désassembler. *
* *
* Retour : Tâche créée. *
* *
* Remarques : - *
* *
******************************************************************************/
static GAreaCollector *g_area_collector_new_intro(activity_id_t id, GLoadedBinary *binary, GMutex *global, phys_t first, phys_t last, bool closing)
{
GAreaCollector *result; /* Tâche à retourner */
result = g_object_new(G_TYPE_AREA_COLLECTOR, NULL);
result->id = id;
result->run = (run_task_fc)g_area_collector_do_compute;
result->areas = NULL;
result->created = 0;
result->binary = binary;
g_object_ref(G_OBJECT(binary));
result->global = global;
result->first = first;
result->last = last;
result->closing = closing;
return result;
}
/******************************************************************************
* *
* Paramètres : collector = opération à mener. *
* status = barre de statut à tenir informée. *
* *
* Description : Construit une liste bornée de zones contigües. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void g_area_collector_do_compute(GAreaCollector *collector, GtkStatusStack *status)
{
mem_area **list; /* Liste de zones à constituer */
size_t *count; /* Nombre d'éléments intégrés */
vmpa2t first; /* Point de départ */
vmpa2t last; /* Point d'arrivée */
GExeFormat *format; /* Format du binaire */
vmpa2t prev; /* Dernière bordure rencontrée */
bool state; /* Bilan d'une conversion */
GBinPortion *portions; /* Couche première de portions */
void fill_gap(vmpa2t *old, vmpa2t *new, bool alloc, bool exec)
{
phys_t diff; /* Espace entre bordures */
mem_area *area; /* Zone avec valeurs à éditer */
diff = compute_vmpa_diff(old, new);
/**
* S'il existe un écart entre la dernière bordure ajoutée et
* l'extréminité de la portion courante, on le comble !
*/
if (diff > 0)
{
if (!alloc)
reset_virt_addr(old);
/* Zone tampon à constituer */
*list = (mem_area *)realloc(*list, ++(*count) * sizeof(mem_area));
area = &(*list)[*count - 1];
init_mem_area_from_addr(area, old, diff, collector->binary, collector->global);
area->is_exec = exec;
/* Avancée du curseur */
copy_vmpa(old, new);
gtk_status_stack_update_activity_value(status, collector->id, diff);
}
else
{
/**
* La comparaison entre les bordures se réalise selon les positions
* physiques renseignées.
*
* Aussi, même dans le cas d'une jointure sans espace, il se peut que
* la transition concerne deux zones aux adresses virtuelles non
* consécutives.
*
* Comme "old" est mise à jour pour devenir le point de départ de
* la zone suivante, on se doit de même à jour les deux positions :
* physique et virtuelle.
*/
copy_vmpa(old, new);
}
}
bool build_area_from_portion(GBinPortion *portion, GBinPortion *parent, BinaryPortionVisit visit, void *unused)
{
const mrange_t *range; /* Espace de portion à traiter */
vmpa2t border; /* Nouvelle bordure rencontrée */
bool on_track; /* Le tronçon courant est bon ?*/
PortionAccessRights rights; /* Droits d'accès à analyser */
range = g_binary_portion_get_range(portion);
if (visit == BPV_ENTER)
{
copy_vmpa(&border, get_mrange_addr(range));
on_track = cmp_vmpa(&first, &border) <= 0 && cmp_vmpa(&border, &last) < 0;
if (on_track)
{
rights = (parent != NULL ? g_binary_portion_get_rights(parent) : PAC_NONE);
fill_gap(&prev, &border, rights != PAC_NONE, rights & PAC_EXEC);
}
else
copy_vmpa(&prev, &border);
}
else if (visit == BPV_SHOW)
{
copy_vmpa(&border, get_mrange_addr(range));
on_track = cmp_vmpa(&first, &border) <= 0 && cmp_vmpa(&border, &last) < 0;
if (on_track)
{
rights = (parent != NULL ? g_binary_portion_get_rights(parent) : PAC_NONE);
fill_gap(&prev, &border, rights != PAC_NONE, rights & PAC_EXEC);
compute_mrange_end_addr(range, &border);
rights = g_binary_portion_get_rights(portion);
fill_gap(&prev, &border, rights != PAC_NONE, rights & PAC_EXEC);
}
else
compute_mrange_end_addr(range, &prev);
}
else if (visit == BPV_EXIT)
{
compute_mrange_end_addr(range, &border);
if (collector->closing)
on_track = cmp_vmpa(&first, &border) <= 0 && cmp_vmpa(&border, &last) <= 0;
else
on_track = cmp_vmpa(&first, &border) <= 0 && cmp_vmpa(&border, &last) < 0;
if (on_track)
{
rights = (parent != NULL ? g_binary_portion_get_rights(parent) : PAC_NONE);
fill_gap(&prev, &border, rights != PAC_NONE, rights & PAC_EXEC);
}
else
copy_vmpa(&prev, &border);
}
#ifndef NDEBUG
else
assert(false);
#endif
return (cmp_vmpa(&prev, &last) < 0);
}
list = &collector->areas;
count = &collector->created;
init_vmpa(&first, collector->first, VMPA_NO_VIRTUAL);
init_vmpa(&last, collector->last, VMPA_NO_VIRTUAL);
format = g_loaded_binary_get_format(collector->binary);
state = g_exe_format_translate_offset_into_vmpa(format, 0, &prev);
if (!state)
init_vmpa(&prev, 0, VMPA_NO_PHYSICAL);
portions = g_exe_format_get_portions(format);
g_binary_portion_visit(portions, (visit_portion_fc)build_area_from_portion, NULL);
g_object_unref(G_OBJECT(portions));
g_object_unref(G_OBJECT(format));
}
/******************************************************************************
* *
* Paramètres : gid = groupe de travail impliqué. *
* status = barre de statut à tenir informée. *
* binary = binaire analysé contenant quantités d'infos. *
* length = quantité d'octets à traiter au total. *
* count = nombre de zones mises en place. [OUT] *
* *
* Description : Détermine une liste de zones contigües à traiter. *
* *
* Retour : Liste de zones mémoire à libérer après usage. *
* *
* Remarques : - *
* *
******************************************************************************/
mem_area *collect_memory_areas(wgroup_id_t gid, GtkStatusStack *status, GLoadedBinary *binary, phys_t length, size_t *count)
{
mem_area *result; /* Liste finale à retourner */
guint runs_count; /* Qté d'exécutions parallèles */
GAreaCollector **collectors; /* Collecteurs à suivre */
phys_t run_size; /* Volume réparti par exécution*/
GWorkQueue *queue; /* Gestionnaire de différés */
activity_id_t id; /* Identifiant de progression */
GMutex *global; /* Atomicité sur zones multi. */
guint i; /* Boucle de parcours */
phys_t first; /* Début de zone de traitement */
bool closing; /* Détection de fin en amont */
phys_t last; /* Fin de zone de traitement */
/* Création d'un verrou global */
global = (GMutex *)malloc(sizeof(GMutex));
g_mutex_init(global);
/* Lancement des traitements */
runs_count = get_max_online_threads();
collectors = (GAreaCollector **)calloc(runs_count, sizeof(GAreaCollector *));
run_size = length / runs_count;
queue = get_work_queue();
id = gtk_status_stack_add_activity(status, _("Computing memory areas to disassemble"), length);
for (i = 0; i < runs_count; i++)
{
first = i * run_size;
closing = ((i + 1) == runs_count);
if (closing)
last = length;
else
last = first + run_size;
collectors[i] = g_area_collector_new_intro(id, binary, global, first, last, closing);
g_object_ref(G_OBJECT(collectors[i]));
g_work_queue_schedule_work(queue, G_DELAYED_WORK(collectors[i]), gid);
}
g_work_queue_wait_for_completion(queue, gid);
/* Récupération des aires */
result = NULL;
*count = 0;
for (i = 0; i < runs_count; i++)
{
result = (mem_area *)realloc(result, (*count + collectors[i]->created) * sizeof(mem_area));
memcpy(&result[*count], collectors[i]->areas, collectors[i]->created * sizeof(mem_area));
*count += collectors[i]->created;
g_object_unref(G_OBJECT(collectors[i]));
}
/* Fin */
free(collectors);
gtk_status_stack_remove_activity(status, id);
return result;
}
/******************************************************************************
* *
* Paramètres : id = identifiant pour signaler la progression. *
* areas = liste des zones en place à parcourir. *
* available = nombre de zones disponibles pour les traitements.*
* info = préchargements effectués via le format binaire. *
* start = indice de la première instruction à insérer. *
* stop = indice de la première instruction à ignorer. *
* *
* Description : Crée une tâche de calcul des zones binaires à remplir. *
* *
* Retour : Tâche créée. *
* *
* Remarques : - *
* *
******************************************************************************/
static GAreaCollector *g_area_collector_new_insert(activity_id_t id, mem_area *areas, size_t available, GPreloadInfo *info, size_t start, size_t stop)
{
GAreaCollector *result; /* Tâche à retourner */
result = g_object_new(G_TYPE_AREA_COLLECTOR, NULL);
result->id = id;
result->run = (run_task_fc)g_area_collector_do_insert;
result->areas = areas;
result->available = available;
result->info = info;
g_object_ref(G_OBJECT(info));
result->start = start;
result->stop = stop;
return result;
}
/******************************************************************************
* *
* Paramètres : collector = opération à mener. *
* status = barre de statut à tenir informée. *
* *
* Description : Insère dans les zones contigües les instructions préchargées.*
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void g_area_collector_do_insert(GAreaCollector *collector, GtkStatusStack *status)
{
mem_area *last; /* Zone d'appartenance */
size_t i; /* Boucle de parcours #1 */
GArchInstruction *instr; /* Instruction à analyser */
bool done; /* Insertion réalisée ? */
const mrange_t *range; /* Emplacement de l'instruction*/
VMPA_BUFFER(loc); /* Traduction en texte */
last = NULL;
for (i = collector->start; i < collector->stop; i++)
{
instr = _g_preload_info_grab_instruction(collector->info, i);
done = insert_instr_into_mem_areas(collector->areas, collector->available, instr, &last);
if (!done)
{
range = g_arch_instruction_get_range(instr);
vmpa2_phys_to_string(get_mrange_addr(range), MDS_UNDEFINED, loc, NULL);
log_variadic_message(LMT_ERROR, "Failed to insert one collected instruction @ %s", loc);
}
g_object_unref(G_OBJECT(instr));
gtk_status_stack_update_activity_value(status, collector->id, 1);
}
}
/******************************************************************************
* *
* Paramètres : gid = groupe de travail impliqué. *
* status = barre de statut à tenir informée. *
* area = nombre de zones mises en place. *
* count = quantité de ces zones. *
* info = préchargements effectués via le format binaire. *
* *
* Description : Intègre toutes les instructions préchargées dans des zones. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
void populate_fresh_memory_areas(wgroup_id_t gid, GtkStatusStack *status, mem_area *areas, size_t count, GPreloadInfo *info)
{
size_t icount; /* Quantité d'instructions */
guint runs_count; /* Qté d'exécutions parallèles */
GAreaCollector **collectors; /* Collecteurs à suivre */
phys_t run_size; /* Volume réparti par exécution*/
GWorkQueue *queue; /* Gestionnaire de différés */
activity_id_t id; /* Identifiant de progression */
guint i; /* Boucle de parcours */
size_t start; /* Premier indice à traiter */
size_t stop; /* Premier indice à ignorer */
g_preload_info_lock_instructions(info);
icount = _g_preload_info_count_instructions(info);
runs_count = get_max_online_threads();
collectors = (GAreaCollector **)calloc(runs_count, sizeof(GAreaCollector *));
run_size = icount / runs_count;
queue = get_work_queue();
id = gtk_status_stack_add_activity(status, _("Inserting all preloaded instructions"), icount);
for (i = 0; i < runs_count; i++)
{
start = i * run_size;
if ((i + 1) == runs_count)
stop = icount;
else
stop = start + run_size;
collectors[i] = g_area_collector_new_insert(id, areas, count, info, start, stop);
g_work_queue_schedule_work(queue, G_DELAYED_WORK(collectors[i]), gid);
}
g_work_queue_wait_for_completion(queue, gid);
/* Fin */
free(collectors);
_g_preload_info_drain_instructions(info);
assert(_g_preload_info_count_instructions(info) == 0);
g_preload_info_unlock_instructions(info);
gtk_status_stack_remove_activity(status, id);
}
/******************************************************************************
* *
* Paramètres : id = identifiant pour signaler la progression courante. *
* areas = liste complète des zones à traiter. *
* count = taille de cette liste. *
* ctx = éventuel contexte pour du code ou NULL si données. *
* start = première zone à traiter. *
* stop = première zone à écarter. *
* *
* Description : Crée une tâche de fin de désassemblage pour zones binaires. *
* *
* Retour : Tâche créée. *
* *
* Remarques : - *
* *
******************************************************************************/
static GAreaCollector *g_area_collector_new_filling(activity_id_t id, mem_area *areas, size_t count, GProcContext *ctx, size_t start, size_t stop)
{
GAreaCollector *result; /* Tâche à retourner */
result = g_object_new(G_TYPE_AREA_COLLECTOR, NULL);
result->id = id;
result->run = (run_task_fc)g_area_collector_do_fill;
result->areas = areas;
result->count = count;
result->ctx = ctx;
if (ctx != NULL)
g_object_ref(G_OBJECT(ctx));
result->fill_start = start;
result->fill_stop = stop;
return result;
}
/******************************************************************************
* *
* Paramètres : collector = opération à mener. *
* status = barre de statut à tenir informée. *
* *
* Description : Remplit de code ou de données une série de zones. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void g_area_collector_do_fill(GAreaCollector *collector, GtkStatusStack *status)
{
mem_area *areas; /* Zone de productions */
size_t count; /* Nombre de ces zones */
size_t i; /* Boucle de parcours */
areas = collector->areas;
count = collector->count;
if (collector->ctx != NULL)
for (i = collector->fill_start; i < collector->fill_stop; i++)
fill_mem_area_with_code(&areas[i], areas, count, collector->ctx, status, collector->id);
else
for (i = collector->fill_start; i < collector->fill_stop; i++)
fill_mem_area_with_data(&areas[i], areas, count, status, collector->id);
}
/******************************************************************************
* *
* Paramètres : gid = groupe de travail impliqué. *
* status = barre de statut à tenir informée. *
* id = identifiant d'activité à modifier. *
* area = nombre de zones mises en place. *
* count = quantité de ces zones. *
* ctx = contexte de désassemblage pour du code, ou NULL. *
* *
* Description : Remplit les espaces vacants des zones à désassembler. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
void ensure_all_mem_areas_are_filled(wgroup_id_t gid, GtkStatusStack *status, activity_id_t id, mem_area *areas, size_t count, GProcContext *ctx)
{
guint runs_count; /* Qté d'exécutions parallèles */
phys_t run_size; /* Volume réparti par exécution*/
GWorkQueue *queue; /* Gestionnaire de différés */
guint i; /* Boucle de parcours */
size_t start; /* Premier indice à traiter */
size_t stop; /* Premier indice à ignorer */
GAreaCollector *collector; /* Collecteur à lancer */
runs_count = get_max_online_threads();
run_size = count / runs_count;
queue = get_work_queue();
if (ctx != NULL)
gtk_status_stack_update_activity(status, id, _("Disassembling the remaining instructions..."));
else
gtk_status_stack_update_activity(status, id, _("Filling holes with data..."));
for (i = 0; i < runs_count; i++)
{
start = i * run_size;
if ((i + 1) == runs_count)
stop = count;
else
stop = start + run_size;
collector = g_area_collector_new_filling(id, areas, count, ctx, start, stop);
g_work_queue_schedule_work(queue, G_DELAYED_WORK(collector), gid);
}
g_work_queue_wait_for_completion(queue, gid);
}
/******************************************************************************
* *
* Paramètres : id = identifiant pour signaler la progression courante. *
* list = liste des zones en place à parcourir. *
* begin = indice de la première zone à traiter. *
* end = indice de la première zone à ne pas traiter. *
* *
* Description : Crée une tâche de récupération d'instructions différée. *
* *
* Retour : Tâche créée. *
* *
* Remarques : - *
* *
******************************************************************************/
static GAreaCollector *g_area_collector_new_outro(activity_id_t id, mem_area *list, size_t begin, size_t end)
{
GAreaCollector *result; /* Tâche à retourner */
result = g_object_new(G_TYPE_AREA_COLLECTOR, NULL);
result->id = id;
result->run = (run_task_fc)g_area_collector_do_collect;
result->areas = list;
result->begin = begin;
result->end = end;
result->collected = NULL;
result->ccount = 0;
return result;
}
/******************************************************************************
* *
* Paramètres : collector = opération à mener. *
* status = barre de statut à tenir informée. *
* *
* Description : Assure la récupération d'instructions en différé. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void g_area_collector_do_collect(GAreaCollector *collector, GtkStatusStack *status)
{
size_t i; /* Boucle de parcours */
for (i = collector->begin; i < collector->end; i++)
{
collector->collected = get_instructions_from_mem_area(&collector->areas[i],
collector->collected, &collector->ccount);
fini_mem_area(&collector->areas[i]);
gtk_status_stack_update_activity_value(status, collector->id, 1);
}
}
/******************************************************************************
* *
* Paramètres : gid = groupe de travail impliqué. *
* status = barre de statut à tenir informée. *
* list = liste des zones de données à relire puis libérer. *
* acount = taille de cette liste de zones. *
* icount = nombre d'instructions récupérées. [OUT] *
* *
* Description : Rassemble les instructions conservées dans des zones données.*
* *
* Retour : Liste d'instructions rassemblées. *
* *
* Remarques : - *
* *
******************************************************************************/
GArchInstruction **collect_disassembled_instructions(wgroup_id_t gid, GtkStatusStack *status, mem_area *list, size_t acount, size_t *icount)
{
GArchInstruction **result; /* Liste finale à retourner */
GMutex *global; /* Atomicité sur zones multi. */
guint runs_count; /* Qté d'exécutions parallèles */
GAreaCollector **collectors; /* Collecteurs à suivre */
size_t run_size; /* Volume réparti par exécution*/
GWorkQueue *queue; /* Gestionnaire de différés */
activity_id_t id; /* Identifiant de progression */
guint i; /* Boucle de parcours */
size_t begin; /* Début de bloc de traitement */
size_t end; /* Fin d'un bloc de traitement */
/* Suppression du verrou global */
assert(acount > 0);
global = list[0].global;
g_mutex_clear(global);
free(global);
/* Lancement des traitements */
runs_count = get_max_online_threads();
collectors = (GAreaCollector **)calloc(runs_count, sizeof(GAreaCollector *));
run_size = acount / runs_count;
queue = get_work_queue();
id = gtk_status_stack_add_activity(status, _("Collecting all disassembled instructions"), acount);
for (i = 0; i < runs_count; i++)
{
begin = i * run_size;
if ((i + 1) == runs_count)
end = acount;
else
end = begin + run_size;
collectors[i] = g_area_collector_new_outro(id, list, begin, end);
g_object_ref(G_OBJECT(collectors[i]));
g_work_queue_schedule_work(queue, G_DELAYED_WORK(collectors[i]), gid);
}
g_work_queue_wait_for_completion(queue, gid);
/* Récupération des instructions */
result = NULL;
*icount = 0;
for (i = 0; i < runs_count; i++)
{
result = (GArchInstruction **)realloc(result,
(*icount + collectors[i]->ccount) * sizeof(GArchInstruction *));
memcpy(&result[*icount], collectors[i]->collected, collectors[i]->ccount * sizeof(GArchInstruction *));
*icount += collectors[i]->ccount;
g_object_unref(G_OBJECT(collectors[i]));
}
/* Fin */
free(collectors);
free(list);
gtk_status_stack_remove_activity(status, id);
return result;
}