/* Chrysalide - Outil d'analyse de fichiers binaires * program.c - support des différents formats de programmes * * Copyright (C) 2009-2024 Cyrille Bagard * * This file is part of Chrysalide. * * Chrysalide is free software; you can redistribute it and/or modify * it under the terms of the GNU General Public License as published by * the Free Software Foundation; either version 3 of the License, or * (at your option) any later version. * * Chrysalide is distributed in the hope that it will be useful, * but WITHOUT ANY WARRANTY; without even the implied warranty of * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the * GNU General Public License for more details. * * You should have received a copy of the GNU General Public License * along with Chrysalide. If not, see . */ #include "program.h" //#include //#include //#include #include "program-int.h" /* #include "preload.h" #include "../arch/processor.h" #include "../common/sort.h" #include "../core/demanglers.h" #include "../plugins/pglist.h" */ /* Initialise la classe des formats binaires génériques. */ static void g_program_format_class_init(GProgramFormatClass *); /* Initialise une instance de format binaire générique. */ static void g_program_format_init(GProgramFormat *); /* Supprime toutes les références externes. */ static void g_program_format_dispose(GProgramFormat *); /* Procède à la libération totale de la mémoire. */ static void g_program_format_finalize(GProgramFormat *); #if 0 /* Charge les plages de couvertures depuis une mémoire tampon. */ static bool g_program_format_load_start_points(GProgramFormat *, packed_buffer_t *); /* Sauvegarde les points de départ enregistrés pour un format. */ static bool g_program_format_store_start_points(GProgramFormat *, packed_buffer_t *); /* ---------------------- RASSEMBLEMENT ET GESTION DE SYMBOLES ---------------------- */ /* Retire un symbole de la collection du format binaire. */ static void _g_program_format_remove_symbol(GProgramFormat *, size_t); /* Recherche le symbole associé à une adresse. */ static bool _g_program_format_find_symbol(const GProgramFormat *, const vmpa2t *, __compar_fn_t, size_t *, GBinSymbol **); /* Recherche un symbole particulier. */ static bool __g_program_format_find_symbol(const GProgramFormat *, const void *, __compar_fn_t, size_t *, GBinSymbol **); /* ------------------ CONSERVATION DES SOUCIS DURANT LE CHARGEMENT ------------------ */ /* Charge les erreurs de chargement depuis une mémoire tampon. */ static bool g_program_format_load_errors(GProgramFormat *, packed_buffer_t *); /* Sauvegarde les erreurs de chargement dans une mémoire tampon. */ static bool g_program_format_store_errors(GProgramFormat *, packed_buffer_t *); /* --------------------- IMPLEMENTATION DES FONCTIONS DE CLASSE --------------------- */ /* Charge un format depuis une mémoire tampon. */ static bool g_program_format_load(GProgramFormat *, GObjectStorage *, packed_buffer_t *); /* Sauvegarde un format dans une mémoire tampon. */ static bool g_program_format_store(GProgramFormat *, GObjectStorage *, packed_buffer_t *); #endif /* Indique le type défini pour un format binaire générique. */ G_DEFINE_TYPE(GProgramFormat, g_program_format, G_TYPE_KNOWN_FORMAT); /****************************************************************************** * * * Paramètres : klass = classe à initialiser. * * * * Description : Initialise la classe des formats binaires génériques. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ static void g_program_format_class_init(GProgramFormatClass *klass) { GObjectClass *object; /* Autre version de la classe */ //GKnownFormatClass *known; /* Version de classe parente */ object = G_OBJECT_CLASS(klass); object->dispose = (GObjectFinalizeFunc/* ! */)g_program_format_dispose; object->finalize = (GObjectFinalizeFunc)g_program_format_finalize; #if 0 known = G_KNOWN_FORMAT_CLASS(klass); known->load = (load_known_fc)g_program_format_load; known->store = (load_known_fc)g_program_format_store; g_signal_new("symbol-added", G_TYPE_BIN_FORMAT, G_SIGNAL_RUN_LAST, G_STRUCT_OFFSET(GProgramFormatClass, symbol_added), NULL, NULL, g_cclosure_marshal_VOID__OBJECT, G_TYPE_NONE, 1, G_TYPE_OBJECT); g_signal_new("symbol-removed", G_TYPE_BIN_FORMAT, G_SIGNAL_RUN_LAST, G_STRUCT_OFFSET(GProgramFormatClass, symbol_removed), NULL, NULL, g_cclosure_marshal_VOID__OBJECT, G_TYPE_NONE, 1, G_TYPE_OBJECT); #endif } /****************************************************************************** * * * Paramètres : format = instance à initialiser. * * * * Description : Initialise une instance de format binaire générique. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ static void g_program_format_init(GProgramFormat *format) { #if 0 fmt_extra_data_t *extra; /* Données insérées à modifier */ extra = GET_BIN_FORMAT_EXTRA(format); INIT_GOBJECT_EXTRA_LOCK(extra); g_rw_lock_init(&format->pt_lock); format->info = g_preload_info_new(); format->demangler = NULL; g_rw_lock_init(&format->syms_lock); #ifndef NDEBUG g_atomic_int_set(&format->sym_locked, 0); #endif format->errors = NULL; format->error_count = 0; g_mutex_init(&format->error_mutex); #ifndef NDEBUG g_atomic_int_set(&format->error_locked, 0); #endif #endif } /****************************************************************************** * * * Paramètres : format = instance d'objet GLib à traiter. * * * * Description : Supprime toutes les références externes. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ static void g_program_format_dispose(GProgramFormat *format) { #if 0 size_t i; /* Boucle de parcours */ g_rw_lock_clear(&format->pt_lock); g_clear_object(&format->info); g_clear_object(&format->demangler); for (i = 0; i < format->sym_count; i++) g_clear_object(&format->symbols[i]); g_rw_lock_clear(&format->syms_lock); g_mutex_clear(&format->error_mutex); #endif G_OBJECT_CLASS(g_program_format_parent_class)->dispose(G_OBJECT(format)); } /****************************************************************************** * * * Paramètres : format = instance d'objet GLib à traiter. * * * * Description : Procède à la libération totale de la mémoire. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ static void g_program_format_finalize(GProgramFormat *format) { #if 0 DisassPriorityLevel i; /* Boucle de parcours #1 */ size_t k; /* Boucle de parcours #2 */ for (i = 0; i < DPL_COUNT; i++) if (format->start_points[i] != NULL) free(format->start_points[i]); if (format->symbols != NULL) free(format->symbols); if (format->errors != NULL) { for (k = 0; k < format->error_count; k++) if (format->errors[k].desc != NULL) free(format->errors[k].desc); free(format->errors); } #endif G_OBJECT_CLASS(g_program_format_parent_class)->finalize(G_OBJECT(format)); } /****************************************************************************** * * * Paramètres : format = description du format à initialiser pleinement. * * content = contenu binaire à parcourir. * * * * Description : Met en place un nouveau contenu binaire à analyser. * * * * Retour : Bilan de l'opération. * * * * Remarques : - * * * ******************************************************************************/ bool g_program_format_create(GProgramFormat *format, GBinContent *content) { bool result; /* Bilan à retourner */ result = g_known_format_create(G_KNOWN_FORMAT(format), content); return result; } #if 0 /****************************************************************************** * * * Paramètres : format = format à venir modifier. * * flag = drapeau d'information complémentaire à planter. * * * * Description : Ajoute une information complémentaire à un format. * * * * Retour : Bilan de l'opération. * * * * Remarques : - * * * ******************************************************************************/ bool g_program_format_set_flag(GProgramFormat *format, FormatFlag flag) { bool result; /* Bilan à retourner */ fmt_extra_data_t *extra; /* Données insérées à modifier */ extra = GET_BIN_FORMAT_EXTRA(format); LOCK_GOBJECT_EXTRA(extra); result = !(extra->flags & flag); extra->flags |= flag; UNLOCK_GOBJECT_EXTRA(extra); return result; } /****************************************************************************** * * * Paramètres : format = format à venir modifier. * * flag = drapeau d'information complémentaire à planter. * * * * Description : Retire une information complémentaire à un format. * * * * Retour : Bilan de l'opération. * * * * Remarques : - * * * ******************************************************************************/ bool g_program_format_unset_flag(GProgramFormat *format, FormatFlag flag) { bool result; /* Bilan à retourner */ fmt_extra_data_t *extra; /* Données insérées à modifier */ extra = GET_BIN_FORMAT_EXTRA(format); LOCK_GOBJECT_EXTRA(extra); result = (extra->flags & flag); extra->flags &= ~flag; UNLOCK_GOBJECT_EXTRA(extra); return result; } /****************************************************************************** * * * Paramètres : format = format à venir consulter. * * flag = drapeau d'information à rechercher. * * * * Description : Détermine si un format possède un fanion particulier. * * * * Retour : Bilan de la détection. * * * * Remarques : - * * * ******************************************************************************/ bool g_program_format_has_flag(const GProgramFormat *format, FormatFlag flag) { bool result; /* Bilan à retourner */ fmt_extra_data_t *extra; /* Données insérées à modifier */ extra = GET_BIN_FORMAT_EXTRA(format); LOCK_GOBJECT_EXTRA(extra); result = (extra->flags & flag); UNLOCK_GOBJECT_EXTRA(extra); return result; } /****************************************************************************** * * * Paramètres : format = format à venir consulter. * * * * Description : Fournit les particularités du format. * * * * Retour : Somme de tous les fanions associés au format. * * * * Remarques : - * * * ******************************************************************************/ FormatFlag g_program_format_get_flags(const GProgramFormat *format) { FormatFlag result; /* Fanions à retourner */ fmt_extra_data_t *extra; /* Données insérées à modifier */ extra = GET_BIN_FORMAT_EXTRA(format); LOCK_GOBJECT_EXTRA(extra); result = (extra->flags & FFL_MASK); UNLOCK_GOBJECT_EXTRA(extra); return result; } #endif /****************************************************************************** * * * Paramètres : format = description de l'exécutable à consulter. * * * * Description : Indique le boutisme employé par le format binaire analysé. * * * * Retour : Boutisme associé au format. * * * * Remarques : - * * * ******************************************************************************/ SourceEndian g_program_format_get_endianness(const GProgramFormat *format) { SourceEndian result; /* Boutisme à retourner */ GProgramFormatClass *class; /* Classe de l'instance */ class = G_PROGRAM_FORMAT_GET_CLASS(format); result = class->get_endian(format); return result; } /****************************************************************************** * * * Paramètres : format = description du programme à consulter. * * name = nom de la section recherchée. * * range = emplacement en mémoire à renseigner. [OUT] * * * * Description : Fournit l'emplacement d'une section donnée. * * * * Retour : Bilan de l'opération. * * * * Remarques : - * * * ******************************************************************************/ bool g_program_format_find_section_range_by_name(const GProgramFormat *format, const char *name, mrange_t *range) { bool result; /* Bilan à retourner */ GProgramFormatClass *class; /* Classe de l'instance */ class = G_PROGRAM_FORMAT_GET_CLASS(format); if (class->find_range_by_name == NULL) result = false; else result = class->find_range_by_name(format, name, range); return result; } #if 0 /****************************************************************************** * * * Paramètres : format = description de l'exécutable à compléter. * * pt = point de l'espace mémoire à considérer. * * level = indication de priorité et d'origine de l'adresse. * * * * Description : Enregistre une adresse comme début d'une zone de code. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ void g_program_format_register_code_point(GProgramFormat *format, virt_t pt, DisassPriorityLevel level) { assert(level < DPL_COUNT); g_rw_lock_writer_lock(&format->pt_lock); if (format->pt_count[level] == format->pt_allocated[level]) { format->pt_allocated[level] += EXTRA_POINT_BLOCK; format->start_points[level] = realloc(format->start_points[level], format->pt_allocated[level] * sizeof(virt_t)); } format->start_points[level][format->pt_count[level]++] = pt; g_rw_lock_writer_unlock(&format->pt_lock); } /****************************************************************************** * * * Paramètres : proc = architecture concernée par la procédure. * * pbuf = zone tampon à vider. * * * * Description : Charge les plages de couvertures depuis une mémoire tampon. * * * * Retour : Bilan de l'opération. * * * * Remarques : - * * * ******************************************************************************/ static bool g_program_format_load_start_points(GProgramFormat *format, packed_buffer_t *pbuf) { bool result; /* Bilan à retourner */ DisassPriorityLevel i; /* Boucle de parcours #1 */ uleb128_t count; /* Quantité de points présents */ size_t k; /* Boucle de parcours #2 */ uleb128_t value; /* Valeur ULEB128 à charger */ result = true; g_rw_lock_writer_lock(&format->pt_lock); for (i = 0; i < DPL_COUNT && result; i++) { result = unpack_uleb128(&count, pbuf); if (!result) break; format->pt_allocated[i] = count; format->pt_count[i] = count; format->start_points[i] = calloc(format->pt_count[i], sizeof(virt_t)); for (k = 0; k < format->pt_count[i] && result; k++) { result = unpack_uleb128(&value, pbuf); if (!result) break; format->start_points[i][k] = value; } } g_rw_lock_writer_unlock(&format->pt_lock); return result; } /****************************************************************************** * * * Paramètres : format = description de l'exécutable à consulter. * * pbuf = zone tampon à remplir. * * * * Description : Sauvegarde les points de départ enregistrés pour un format. * * * * Retour : Bilan de l'opération. * * * * Remarques : - * * * ******************************************************************************/ static bool g_program_format_store_start_points(GProgramFormat *format, packed_buffer_t *pbuf) { bool result; /* Bilan à retourner */ DisassPriorityLevel i; /* Boucle de parcours #1 */ size_t count; /* Quantité de points présents */ size_t k; /* Boucle de parcours #2 */ result = true; g_rw_lock_writer_lock(&format->pt_lock); for (i = 0; i < DPL_COUNT && result; i++) { count = format->pt_count[i]; result = pack_uleb128((uleb128_t []){ count }, pbuf); for (k = 0; k < count && result; k++) result = pack_uleb128((uleb128_t []){ format->start_points[i][k] }, pbuf); } g_rw_lock_writer_unlock(&format->pt_lock); return result; } /****************************************************************************** * * * Paramètres : format = description de l'exécutable à consulter. * * ctx = contexte de désassemblage à préparer. * * status = barre de statut à tenir informée. * * * * Description : Intègre dans un contexte les informations tirées d'un format.* * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ void g_program_format_preload_disassembling_context(GProgramFormat *format, GProcContext *ctx, GtkStatusStack *status) { g_preload_info_copy(format->info, G_PRELOAD_INFO(ctx)); } /****************************************************************************** * * * Paramètres : format = description de l'exécutable à consulter. * * ctx = contexte de désassemblage à préparer. * * status = barre de statut à tenir informée. * * * * Description : Définit les points de départ d'un contexte de désassemblage. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ void g_program_format_activate_disassembling_context(GProgramFormat *format, GProcContext *ctx, GtkStatusStack *status) { DisassPriorityLevel i; /* Boucle de parcours #1 */ size_t k; /* Boucle de parcours #2 */ g_rw_lock_reader_lock(&format->pt_lock); for (i = 0; i < DPL_COUNT; i++) for (k = 0; k < format->pt_count[i]; k++) g_proc_context_push_drop_point(ctx, i, format->start_points[i][k]); g_rw_lock_reader_unlock(&format->pt_lock); } /* ---------------------------------------------------------------------------------- */ /* DECODAGE DE SYMBOLES */ /* ---------------------------------------------------------------------------------- */ /****************************************************************************** * * * Paramètres : format = format binaire à consulter pour l'opération. * * * * Description : Fournit le décodeur de symboles privilégié pour un format. * * * * Retour : Décodeur préféré ou NULL s'il n'est pas renseigné. * * * * Remarques : - * * * ******************************************************************************/ GCompDemangler *g_program_format_get_demangler(const GProgramFormat *format) { GCompDemangler *result; /* Décodeur à retourner */ result = format->demangler; if (result != NULL) g_object_ref(G_OBJECT(result)); return result; } /****************************************************************************** * * * Paramètres : format = format binaire à consulter pour l'opération. * * desc = chaîne de caractères à décoder. * * * * Description : Décode une chaîne de caractères donnée en type. * * * * Retour : Instance obtenue ou NULL en cas d'échec. * * * * Remarques : - * * * ******************************************************************************/ GDataType *g_program_format_decode_type(const GProgramFormat *format, const char *desc) { GDataType *result; /* Construction à remonter */ GCompDemangler *demangler; /* Accès plus lisible */ demangler = format->demangler; if (demangler != NULL) result = g_compiler_demangler_decode_type(demangler, desc); else result = NULL; return result; } /****************************************************************************** * * * Paramètres : format = format binaire à consulter pour l'opération. * * desc = chaîne de caractères à décoder. * * * * Description : Décode une chaîne de caractères donnée en routine. * * * * Retour : Instance obtenue ou NULL en cas d'échec. * * * * Remarques : - * * * ******************************************************************************/ GBinRoutine *g_program_format_decode_routine(const GProgramFormat *format, const char *desc) { GBinRoutine *result; /* Construction à remonter */ GCompDemangler *demangler; /* Accès plus lisible */ demangler = format->demangler; if (demangler != NULL) result = g_compiler_demangler_decode_routine(demangler, desc); else result = NULL; if (result == NULL) { result = g_binary_routine_new(); g_binary_routine_set_name(result, strdup(desc)); } return result; } /* ---------------------------------------------------------------------------------- */ /* RASSEMBLEMENT ET GESTION DE SYMBOLES */ /* ---------------------------------------------------------------------------------- */ /****************************************************************************** * * * Paramètres : format = architecture à manipuler. * * state = nouvel état de l'accès aux symboles. * * * * Description : Protège ou lève la protection de l'accès aux symboles. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ void g_program_format_lock_unlock_symbols_rd(GProgramFormat *format, bool state) { #ifndef NDEBUG gint test; /* Test de valeur courante */ #endif if (state) { g_rw_lock_reader_lock(&format->syms_lock); #ifndef NDEBUG g_atomic_int_inc(&format->sym_locked); #endif } else { #ifndef NDEBUG test = g_atomic_int_add(&format->sym_locked, -1); assert(test > 0); #endif g_rw_lock_reader_unlock(&format->syms_lock); } } /****************************************************************************** * * * Paramètres : format = architecture à manipuler. * * state = nouvel état de l'accès aux symboles. * * * * Description : Protège ou lève la protection de l'accès aux symboles. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ void g_program_format_lock_unlock_symbols_wr(GProgramFormat *format, bool state) { if (state) { g_rw_lock_writer_lock(&format->syms_lock); #ifndef NDEBUG g_atomic_int_set(&format->sym_locked, 1); #endif } else { #ifndef NDEBUG g_atomic_int_set(&format->sym_locked, 0); #endif g_rw_lock_writer_unlock(&format->syms_lock); } } /****************************************************************************** * * * Paramètres : format = architecture à consulter via la procédure. * * * * Description : Assure qu'un verrou est bien posé pour l'accès aux symboles. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ #ifndef NDEBUG void g_program_format_check_for_symbols_lock(const GProgramFormat *format) { assert(g_atomic_int_get(&format->sym_locked) > 0); } #endif /****************************************************************************** * * * Paramètres : format = architecture à consulter via la procédure. * * * * Description : Fournit la marque de dernière modification des symboles. * * * * Retour : Marque de la dernière modification de la liste de symboles. * * * * Remarques : - * * * ******************************************************************************/ unsigned int g_program_format_get_symbols_stamp(const GProgramFormat *format) { return format->sym_stamp; } /****************************************************************************** * * * Paramètres : format = format visé par la procédure. * * * * Description : Compte le nombre de symboles représentés. * * * * Retour : Nombre de symboles présents. * * * * Remarques : - * * * ******************************************************************************/ size_t g_program_format_count_symbols(const GProgramFormat *format) { assert(g_atomic_int_get(&format->sym_locked) > 0); return format->sym_count; } /****************************************************************************** * * * Paramètres : format = format visé par la procédure. * * index = indice du symbole visé. * * * * Description : Fournit un symbole lié à un format. * * * * Retour : Symbole conservé trouvé ou NULL si aucun. * * * * Remarques : - * * * ******************************************************************************/ GBinSymbol *g_program_format_get_symbol(const GProgramFormat *format, size_t index) { GBinSymbol *result; /* Symbole à retourner */ assert(g_atomic_int_get(&format->sym_locked) > 0); if (format->sym_count == 0) result = NULL; else { assert(index < format->sym_count); result = format->symbols[index]; assert(result != NULL); g_object_ref(G_OBJECT(result)); } return result; } /****************************************************************************** * * * Paramètres : format = informations chargées à compléter. * * symbol = symbole à ajouter à la liste. * * * * Description : Ajoute un symbole à la collection du format binaire. * * * * Retour : true si le symbole était bien localisé et a été inséré. * * * * Remarques : - * * * ******************************************************************************/ bool g_program_format_add_symbol(GProgramFormat *format, GBinSymbol *symbol) { bool result; /* Statut d'ajout à retourner */ #ifndef NDEBUG const mrange_t *range; /* Couverture du symbole */ const vmpa2t *addr; /* Emplacement du symbole */ #endif size_t index; /* Indice du point d'insertion */ /** * Pour que les fonctions de recherche basées sur _g_program_format_find_symbol() * fassent bien leur office, il faut que les symboles soient triés. * * Cependant, les localisations à satisfaire lors d'une recherche recontrent * un problème si les positions physiques ne sont pas renseignées. En effet * les adresses virtuelles en sont potentiellement décorrélées (c'est le cas * avec le format ELF par exemple, où les zones en mémoire ne suivent pas le * même ordre que les segments du binaire). * * Comme les comparaisons entre localisations se réalisent sur les éléments * renseignés communs, à commencer par la position physique si c'est possible, * une localisation s'appuyant uniquement sur une adresse virtuelle va être * analysée suivant une liste non triée d'adresses virtuelles. * * On corrige donc le tir si besoin est en forçant la comparaison via les * positions physiques. */ #ifndef NDEBUG range = g_binary_symbol_get_range(symbol); addr = get_mrange_addr(range); assert(has_phys_addr(addr) || g_binary_symbol_get_status(symbol) == SSS_DYNAMIC); #endif g_program_format_lock_unlock_symbols_wr(format, true); /** * Avec tous les traitements parallèles, il est possible que plusieurs chemins d'exécution * amènent à la création d'un même symbole. * * Plutôt que de verrouiller la liste des symboles en amont (et donc assez longtemps) * pour faire une vérification avant construction puis ajout, on préfère limiter * l'état figé à cette seule fonction, quitte à annuler le travail fourni pour la * construction du symbole dans les cas peu fréquents où le symbole était déjà en place. */ result = bsearch_index(&symbol, format->symbols, format->sym_count, sizeof(GBinSymbol *), (__compar_fn_t)g_binary_symbol_cmp, &index); if (!result) { format->symbols = _qinsert(format->symbols, &format->sym_count, sizeof(GBinSymbol *), &symbol, index); format->sym_stamp++; result = true; } else g_object_unref(G_OBJECT(symbol)); g_program_format_lock_unlock_symbols_wr(format, false); if (result) g_signal_emit_by_name(format, "symbol-added", symbol); return result; } /****************************************************************************** * * * Paramètres : format = informations chargées à compléter. * * symbols = ensemble de symboles à ajouter à la liste. * * count = taille de cet ensemble. * * * * Description : Ajoute plusieurs symboles à la collection du format binaire. * * * * Retour : true si les symboles dûment localisés ont été insérés. * * * * Remarques : - * * * ******************************************************************************/ bool g_program_format_add_symbols(GProgramFormat *format, GBinSymbol **symbols, size_t count) { bool result; /* Statut d'ajout à retourner */ #ifndef NDEBUG phys_t last; /* Dernière position rencontrée*/ #endif size_t i; /* Boucle de parcours */ #ifndef NDEBUG const mrange_t *range; /* Couverture du symbole */ const vmpa2t *addr; /* Emplacement du symbole */ #endif size_t index; /* Indice du point d'insertion */ /** * Pour que les fonctions de recherche basées sur _g_program_format_find_symbol() * fassent bien leur office, il faut que les symboles soient triés. * * Cependant, les localisations à satisfaire lors d'une recherche recontrent * un problème si les positions physiques ne sont pas renseignées. En effet * les adresses virtuelles en sont potentiellement décorrélées (c'est le cas * avec le format ELF par exemple, où les zones en mémoire ne suivent pas le * même ordre que les segments du binaire). * * Comme les comparaisons entre localisations se réalisent sur les éléments * renseignés communs, à commencer par la position physique si c'est possible, * une localisation s'appuyant uniquement sur une adresse virtuelle va être * analysée suivant une liste non triée d'adresses virtuelles. * * On corrige donc le tir si besoin est en forçant la comparaison via les * positions physiques. */ #ifndef NDEBUG last = VMPA_NO_PHYSICAL; for (i = 0; i < count; i++) { range = g_binary_symbol_get_range(symbols[i]); addr = get_mrange_addr(range); assert(has_phys_addr(addr) || g_binary_symbol_get_status(symbols[i]) == SSS_DYNAMIC); if (has_phys_addr(addr)) { assert(last == VMPA_NO_PHYSICAL || last <= get_phy_addr(addr)); last = get_phy_addr(addr); } } #endif g_program_format_lock_unlock_symbols_wr(format, true); /** * Avec tous les traitements parallèles, il est possible que plusieurs chemins d'exécution * amènent à la création d'un même symbole. * * Plutôt que de verrouiller la liste des symboles en amont (et donc assez longtemps) * pour faire une vérification avant construction puis ajout, on préfère limiter * l'état figé à cette seule fonction, quitte à annuler le travail fourni pour la * construction du symbole dans les cas peu fréquents où le symbole était déjà en place. */ result = bsearch_index(&symbols[0], format->symbols, format->sym_count, sizeof(GBinSymbol *), (__compar_fn_t)g_binary_symbol_cmp, &index); if (!result) { for (i = 0; i < count; i++) g_object_ref(G_OBJECT(symbols[i])); format->symbols = _qinsert_batch(format->symbols, &format->sym_count, sizeof(GBinSymbol *), symbols, count, index); format->sym_stamp++; result = true; } g_program_format_lock_unlock_symbols_wr(format, false); if (result) for (i = 0; i < count; i++) g_signal_emit_by_name(format, "symbol-added", symbols[i]); return result; } /****************************************************************************** * * * Paramètres : format = informations chargées à compléter. * * index = indice du symbole à retirer de la liste. * * * * Description : Retire un symbole de la collection du format binaire. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ static void _g_program_format_remove_symbol(GProgramFormat *format, size_t index) { assert(g_atomic_int_get(&format->sym_locked) == 1); assert(index < format->sym_count); g_object_unref(G_OBJECT(format->symbols[index])); if ((index + 1) < format->sym_count) memmove(&format->symbols[index], &format->symbols[index + 1], (format->sym_count - index - 1) * sizeof(GBinSymbol *)); format->symbols = realloc(format->symbols, --format->sym_count * sizeof(GBinSymbol *)); } /****************************************************************************** * * * Paramètres : format = informations chargées à compléter. * * symbol = symbole à retirer de la liste. * * * * Description : Retire un symbole de la collection du format binaire. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ void g_program_format_remove_symbol(GProgramFormat *format, GBinSymbol *symbol) { bool found; /* Jeton de présence */ size_t index; /* Indice du point de retrait */ g_object_ref(G_OBJECT(symbol)); g_program_format_lock_unlock_symbols_wr(format, true); found = bsearch_index(&symbol, format->symbols, format->sym_count, sizeof(GBinSymbol *), (__compar_fn_t)g_binary_symbol_cmp, &index); if (found) _g_program_format_remove_symbol(format, index); g_program_format_lock_unlock_symbols_wr(format, false); if (found) g_signal_emit_by_name(format, "symbol-removed", symbol); g_object_unref(G_OBJECT(symbol)); } /****************************************************************************** * * * Paramètres : format = informations chargées à consulter. * * label = étiquette à retrouver lors des recherches. * * symbol = éventuel symbole trouvé à déréfenrencer. [OUT] * * * * Description : Recherche le symbole correspondant à une étiquette. * * * * Retour : true si l'opération a été un succès, false sinon. * * * * Remarques : - * * * ******************************************************************************/ bool g_program_format_find_symbol_by_label(GProgramFormat *format, const char *label, GBinSymbol **symbol) { bool result; /* Bilan à retourner */ size_t i; /* Boucle de parcours */ char *cur_lbl; /* Etiquette courante */ result = false; g_program_format_lock_symbols_rd(format); for (i = 0; i < format->sym_count && !result; i++) { cur_lbl = g_binary_symbol_get_label(format->symbols[i]); if (cur_lbl == NULL) continue; if (strcmp(label, cur_lbl) == 0) { *symbol = format->symbols[i]; g_object_ref(G_OBJECT(*symbol)); result = true; } free(cur_lbl); } g_program_format_unlock_symbols_rd(format); return result; } /****************************************************************************** * * * Paramètres : format = informations chargées à consulter. * * addr = adresse à cibler lors des recherches. * * fn = méthode de comparaison des symboles. * * index = indice de l'éventuel symbole trouvé ou NULL. [OUT] * * symbol = éventuel symbole trouvé à déréfenrencer. [OUT] * * * * Description : Recherche le symbole associé à une adresse. * * * * Retour : true si l'opération a été un succès, false sinon. * * * * Remarques : - * * * ******************************************************************************/ static bool _g_program_format_find_symbol(const GProgramFormat *format, const vmpa2t *addr, __compar_fn_t fn, size_t *index, GBinSymbol **symbol) { /** * Pour ce qui est des justifications quant à la vérification suivante, * se référer aux commentaires placés dans g_program_format_add_symbol(). */ assert(has_phys_addr(addr)); return __g_program_format_find_symbol(format, addr, fn, index, symbol); } /****************************************************************************** * * * Paramètres : format = informations chargées à consulter. * * key = clef fournie pour distinguer les éléments. * * fn = méthode de comparaison des symboles. * * index = indice de l'éventuel symbole trouvé ou NULL. [OUT] * * symbol = éventuel symbole trouvé à déréfenrencer. [OUT] * * * * Description : Recherche un symbole particulier. * * * * Retour : true si l'opération a été un succès, false sinon. * * * * Remarques : - * * * ******************************************************************************/ static bool __g_program_format_find_symbol(const GProgramFormat *format, const void *key, __compar_fn_t fn, size_t *index, GBinSymbol **symbol) { bool result; /* Bilan à retourner */ void *found; /* Résultat de recherches */ assert(g_atomic_int_get(&format->sym_locked) > 0); found = bsearch(key, format->symbols, format->sym_count, sizeof(GBinSymbol *), fn); if (found != NULL) { if (index != NULL) *index = (GBinSymbol **)found - format->symbols; if (symbol != NULL) { *symbol = *(GBinSymbol **)found; g_object_ref(G_OBJECT(*symbol)); } result = true; } else { if (symbol != NULL) *symbol = NULL; result = false; } return result; } /****************************************************************************** * * * Paramètres : format = informations chargées à consulter. * * addr = adresse à cibler lors des recherches. * * index = indice de l'éventuel symbole trouvé. [OUT] * * * * Description : Recherche l'indice du symbole correspondant à une adresse. * * * * Retour : true si l'opération a été un succès, false sinon. * * * * Remarques : - * * * ******************************************************************************/ bool g_program_format_find_symbol_index_at(GProgramFormat *format, const vmpa2t *addr, size_t *index) { bool result; /* Bilan à retourner */ int find_symbol(const vmpa2t *addr, const GBinSymbol **sym) { const mrange_t *range; /* Espace mémoire parcouru */ range = g_binary_symbol_get_range(*sym); return cmp_vmpa(addr, get_mrange_addr(range)); } g_program_format_lock_symbols_rd(format); result = _g_program_format_find_symbol(format, addr, (__compar_fn_t)find_symbol, index, NULL); g_program_format_unlock_symbols_rd(format); return result; } /****************************************************************************** * * * Paramètres : format = informations chargées à consulter. * * addr = adresse à cibler lors des recherches. * * symbol = éventuel symbole trouvé à déréfenrencer. [OUT] * * * * Description : Recherche le symbole correspondant à une adresse. * * * * Retour : true si l'opération a été un succès, false sinon. * * * * Remarques : - * * * ******************************************************************************/ bool g_program_format_find_symbol_at(GProgramFormat *format, const vmpa2t *addr, GBinSymbol **symbol) { bool result; /* Bilan à retourner */ int find_symbol(const vmpa2t *addr, const GBinSymbol **sym) { const mrange_t *range; /* Espace mémoire parcouru */ range = g_binary_symbol_get_range(*sym); return cmp_vmpa(addr, get_mrange_addr(range)); } g_program_format_lock_symbols_rd(format); result = _g_program_format_find_symbol(format, addr, (__compar_fn_t)find_symbol, NULL, symbol); g_program_format_unlock_symbols_rd(format); return result; } /****************************************************************************** * * * Paramètres : format = informations chargées à consulter. * * addr = adresse à cibler lors des recherches. * * symbol = éventuel symbole trouvé à déréfenrencer. [OUT] * * * * Description : Recherche le symbole contenant une adresse. * * * * Retour : true si l'opération a été un succès, false sinon. * * * * Remarques : - * * * ******************************************************************************/ bool g_program_format_find_symbol_for(GProgramFormat *format, const vmpa2t *addr, GBinSymbol **symbol) { bool result; /* Bilan à retourner */ int find_symbol(const vmpa2t *addr, const GBinSymbol **sym) { const mrange_t *range; /* Espace mémoire parcouru */ range = g_binary_symbol_get_range(*sym); return cmp_mrange_with_vmpa(range, addr); } g_program_format_lock_symbols_rd(format); result = _g_program_format_find_symbol(format, addr, (__compar_fn_t)find_symbol, NULL, symbol); g_program_format_unlock_symbols_rd(format); return result; } /****************************************************************************** * * * Paramètres : format = informations chargées à consulter. * * addr = adresse à cibler lors des recherches. * * symbol = éventuel symbole trouvé à déréfenrencer. [OUT] * * * * Description : Recherche le symbole suivant celui lié à une adresse. * * * * Retour : true si l'opération a été un succès, false sinon. * * * * Remarques : - * * * ******************************************************************************/ bool g_program_format_find_next_symbol_at(GProgramFormat *format, const vmpa2t *addr, GBinSymbol **symbol) { bool result; /* Bilan à retourner */ size_t index; /* Indice à considérer */ int find_symbol(const vmpa2t *addr, const GBinSymbol **sym) { const mrange_t *range; /* Espace mémoire parcouru */ range = g_binary_symbol_get_range(*sym); return cmp_mrange_with_vmpa(range, addr); } g_program_format_lock_symbols_rd(format); result = _g_program_format_find_symbol(format, addr, (__compar_fn_t)find_symbol, &index, NULL); if (result && (index + 1) < format->sym_count) { *symbol = format->symbols[index + 1]; g_object_ref(G_OBJECT(*symbol)); } else { *symbol = NULL; result = false; } g_program_format_unlock_symbols_rd(format); return result; } /****************************************************************************** * * * Paramètres : format = informations chargées à consulter. * * range = zone à cibler lors des recherches. * * index = indice de l'éventuel symbole trouvé. [OUT] * * * * Description : Recherche le premier symbole inclus dans une zone mémoire. * * * * Retour : true si l'opération a été un succès, false sinon. * * * * Remarques : - * * * ******************************************************************************/ bool g_program_format_find_first_symbol_inside(GProgramFormat *format, const mrange_t *range, size_t *index) { bool result; /* Bilan à retourner */ const GBinSymbol *prev; /* Symbole précédent */ const mrange_t *srange; /* Espace mémoire associé */ int ret; /* Bilan de comparaison */ int find_symbol(const mrange_t *ref_range, const GBinSymbol **sym) { const mrange_t *sym_range; /* Espace mémoire parcouru */ int ret; sym_range = g_binary_symbol_get_range(*sym); ret = cmp_mrange_with_vmpa(ref_range, get_mrange_addr(sym_range)); ret *= -1; return ret; } g_rw_lock_reader_lock(&format->syms_lock); result = __g_program_format_find_symbol(format, range, (__compar_fn_t)find_symbol, index, NULL); if (result) while (*index > 0) { prev = format->symbols[*index - 1]; srange = g_binary_symbol_get_range(prev); ret = cmp_mrange_with_vmpa(range, get_mrange_addr(srange)); assert(ret <= 0); if (ret < 0) break; else (*index)--; } g_rw_lock_reader_unlock(&format->syms_lock); return result; } /****************************************************************************** * * * Paramètres : format = informations chargées à consulter. * * addr = adresse à cibler lors des recherches. * * strict = indication de tolérance acceptée. * * symbol = éventuel symbole trouvé à déréfenrencer. [OUT] * * diff = décalage entre l'adresse et le symbole. [OUT] * * * * Description : Recherche le symbole correspondant à une adresse. * * * * Retour : true si l'opération a été un succès, false sinon. * * * * Remarques : - * * * ******************************************************************************/ bool g_program_format_resolve_symbol(GProgramFormat *format, const vmpa2t *addr, bool strict, GBinSymbol **symbol, phys_t *diff) { bool result; /* Bilan à retourner */ const mrange_t *range; /* Espace mémoire parcouru */ if (strict) result = g_program_format_find_symbol_at(format, addr, symbol); else result = g_program_format_find_symbol_for(format, addr, symbol); if (result) { range = g_binary_symbol_get_range(*symbol); *diff = compute_vmpa_diff(get_mrange_addr(range), addr); assert(!strict || *diff == 0); } else *diff = 0; return result; } /* ---------------------------------------------------------------------------------- */ /* CONSERVATION DES SOUCIS DURANT LE CHARGEMENT */ /* ---------------------------------------------------------------------------------- */ /****************************************************************************** * * * Paramètres : format = architecture à manipuler. * * state = nouvel état de l'accès aux erreurs relevées. * * * * Description : Protège ou lève la protection de l'accès aux erreurs. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ void g_program_format_lock_unlock_errors(GProgramFormat *format, bool state) { if (state) { g_mutex_lock(&format->error_mutex); #ifndef NDEBUG g_atomic_int_set(&format->error_locked, 1); #endif } else { #ifndef NDEBUG g_atomic_int_set(&format->error_locked, 0); #endif g_mutex_unlock(&format->error_mutex); } } /****************************************************************************** * * * Paramètres : format = architecture concernée par la procédure. * * index = indice du problème visé. * * type = type d'erreur retrouvée. * * addr = localisation associée. * * desc = éventuelle description humaine de description. * * * * Description : Etend la liste des soucis détectés avec de nouvelles infos. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ void g_program_format_add_error(GProgramFormat *format, BinaryFormatError type, const vmpa2t *addr, const char *desc) { fmt_error *error; /* Raccourci de confort */ g_program_format_lock_errors(format); format->errors = realloc(format->errors, ++format->error_count * sizeof(fmt_error)); error = &format->errors[format->error_count - 1]; error->type = type; copy_vmpa(&error->addr, addr); if (desc != NULL) error->desc = strdup(desc); else error->desc = NULL; g_program_format_unlock_errors(format); } /****************************************************************************** * * * Paramètres : format = architecture à consulter durant la procédure. * * * * Description : Indique le nombre d'erreurs relevées au niveau assembleur. * * * * Retour : Nombre d'erreurs en stock. * * * * Remarques : - * * * ******************************************************************************/ size_t g_program_format_count_errors(GProgramFormat *format) { size_t result; /* Quantité à retourner */ assert(g_atomic_int_get(&format->error_locked) == 1); result = format->error_count; return result; } /****************************************************************************** * * * Paramètres : format = architecture concernée par la procédure. * * index = indice du problème visé. * * type = type d'erreur retrouvée. [OUT] * * addr = localisation associée. [OUT] * * desc = éventuelle description humaine de description. [OUT]* * * * Description : Fournit les éléments concernant un soucis détecté. * * * * Retour : Validité des informations renseignées. * * * * Remarques : - * * * ******************************************************************************/ bool g_program_format_get_error(GProgramFormat *format, size_t index, BinaryFormatError *type, vmpa2t *addr, char **desc) { bool result; /* Bilan à retourner */ fmt_error *error; /* Raccourci de confort */ assert(g_atomic_int_get(&format->error_locked) == 1); result = (index < format->error_count); assert(result); if (result) { error = &format->errors[index]; *type = error->type; copy_vmpa(addr, &error->addr); if (error->desc != NULL) *desc = strdup(error->desc); else *desc = NULL; } return result; } /****************************************************************************** * * * Paramètres : format = format de binaire concerné par la procédure. * * pbuf = zone tampon à vider. * * * * Description : Charge les erreurs de chargement depuis une mémoire tampon. * * * * Retour : Bilan de l'opération. * * * * Remarques : - * * * ******************************************************************************/ static bool g_program_format_load_errors(GProgramFormat *format, packed_buffer_t *pbuf) { bool result; /* Bilan à retourner */ uleb128_t value; /* Valeur ULEB128 à charger */ size_t i; /* Boucle de parcours */ fmt_error *error; /* Raccourci de confort */ rle_string str; /* Chaîne à charger */ g_program_format_lock_errors(format); result = unpack_uleb128(&value, pbuf); if (!result) goto exit; format->error_count = value; format->errors = calloc(format->error_count, sizeof(fmt_error)); for (i = 0; i < format->error_count && result; i++) { error = &format->errors[i]; result = unpack_uleb128(&value, pbuf); if (!result) break; error->type = value; result = unpack_vmpa(&error->addr, pbuf); if (!result) break; setup_empty_rle_string(&str); result = unpack_rle_string(&str, pbuf); if (!result) break; if (get_rle_string(&str) != NULL) error->desc = strdup(get_rle_string(&str)); exit_rle_string(&str); } exit: g_program_format_unlock_errors(format); return result; } /****************************************************************************** * * * Paramètres : format = format de binaire concerné par la procédure. * * pbuf = zone tampon à remplir. * * * * Description : Sauvegarde les erreurs de chargement dans une mémoire tampon.* * * * Retour : Bilan de l'opération. * * * * Remarques : - * * * ******************************************************************************/ static bool g_program_format_store_errors(GProgramFormat *format, packed_buffer_t *pbuf) { bool result; /* Bilan à retourner */ size_t i; /* Boucle de parcours */ fmt_error *error; /* Raccourci de confort */ rle_string str; /* Chaîne à conserver */ g_program_format_lock_errors(format); result = pack_uleb128((uleb128_t []){ format->error_count }, pbuf); for (i = 0; i < format->error_count && result; i++) { error = &format->errors[i]; result = pack_uleb128((uleb128_t []){ error->type }, pbuf); if (!result) break; result = pack_vmpa(&error->addr, pbuf); if (!result) break; init_static_rle_string(&str, error->desc); result = pack_rle_string(&str, pbuf); exit_rle_string(&str); } g_program_format_unlock_errors(format); return result; } /* ---------------------------------------------------------------------------------- */ /* IMPLEMENTATION DES FONCTIONS DE CLASSE */ /* ---------------------------------------------------------------------------------- */ /****************************************************************************** * * * Paramètres : operand = élément GLib à constuire. * * storage = conservateur de données à manipuler ou NULL. * * pbuf = zone tampon à lire. * * * * Description : Charge un format depuis une mémoire tampon. * * * * Retour : Bilan de l'opération. * * * * Remarques : - * * * ******************************************************************************/ static bool g_program_format_load(GProgramFormat *format, GObjectStorage *storage, packed_buffer_t *pbuf) { bool result; /* Bilan à retourner */ fmt_extra_data_t *extra; /* Données insérées à consulter*/ uleb128_t value; /* Valeur ULEB128 à charger */ rle_string str; /* Chaîne à charger */ extra = GET_BIN_FORMAT_EXTRA(format); LOCK_GOBJECT_EXTRA(extra); result = unpack_uleb128(&value, pbuf); if (result) extra->flags = value; UNLOCK_GOBJECT_EXTRA(extra); if (result) result = g_program_format_load_start_points(format, pbuf); if (result) { setup_empty_rle_string(&str); result = unpack_rle_string(&str, pbuf); if (result) result = (get_rle_string(&str) != NULL); if (result) format->demangler = get_compiler_demangler_for_key(get_rle_string(&str)); if (result) result = (format->demangler != NULL); exit_rle_string(&str); } if (result) result = g_program_format_load_errors(format, pbuf); return result; } /****************************************************************************** * * * Paramètres : operand = élément GLib à consulter. * * storage = conservateur de données à manipuler ou NULL. * * pbuf = zone tampon à remplir. * * * * Description : Sauvegarde un format dans une mémoire tampon. * * * * Retour : Bilan de l'opération. * * * * Remarques : - * * * ******************************************************************************/ static bool g_program_format_store(GProgramFormat *format, GObjectStorage *storage, packed_buffer_t *pbuf) { bool result; /* Bilan à retourner */ fmt_extra_data_t *extra; /* Données insérées à consulter*/ char *key; /* Désignation du décodeur */ rle_string str; /* Chaîne à conserver */ extra = GET_BIN_FORMAT_EXTRA(format); LOCK_GOBJECT_EXTRA(extra); result = pack_uleb128((uleb128_t []){ extra->flags }, pbuf); UNLOCK_GOBJECT_EXTRA(extra); if (result) result = g_program_format_store_start_points(format, pbuf); if (result) { key = g_compiler_demangler_get_key(format->demangler); init_dynamic_rle_string(&str, key); result = pack_rle_string(&str, pbuf); exit_rle_string(&str); } if (result) result = g_program_format_store_errors(format, pbuf); return result; } #endif