/* Chrysalide - Outil d'analyse de fichiers binaires * dex.c - support du format DEX * * Copyright (C) 2010-2012 Cyrille Bagard * * This file is part of Chrysalide. * * OpenIDA is free software; you can redistribute it and/or modify * it under the terms of the GNU General Public License as published by * the Free Software Foundation; either version 3 of the License, or * (at your option) any later version. * * OpenIDA is distributed in the hope that it will be useful, * but WITHOUT ANY WARRANTY; without even the implied warranty of * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the * GNU General Public License for more details. * * You should have received a copy of the GNU General Public License * along with Foobar. If not, see . */ #include "dex.h" #include #include "dex-int.h" #include "pool.h" /* Initialise la classe des formats d'exécutables DEX. */ static void g_dex_format_class_init(GDexFormatClass *); /* Initialise une instance de format d'exécutable DEX. */ static void g_dex_format_init(GDexFormat *); /* Détermine tous les fichiers source indiqués. */ static void g_dex_format_find_all_sources(GDexFormat *); /* Procède à la décompilation complète du format. */ static void g_dex_format_decompile(const GDexFormat *, GCodeBuffer *, const char *); /* Indique le type d'architecture visée par le format. */ static const char *g_dex_format_get_target_machine(const GDexFormat *); /* Fournit les références aux zones binaires à analyser. */ //static GBinPart **g_dex_format_get_parts(const GDexFormat *, size_t *); /* Fournit la position correspondant à une adresse virtuelle. */ static bool g_dex_format_translate_address_into_offset(const GDexFormat *, vmpa_t, off_t *); /* Fournit l'adresse virtuelle correspondant à une position. */ static bool g_dex_format_translate_offset_into_address(const GDexFormat *, off_t, vmpa_t *); /****************************************************************************** * * * Paramètres : content = contenu binaire à parcourir. * * * * Description : Indique si le format peut être pris en charge ici. * * * * Retour : true si la réponse est positive, false sinon. * * * * Remarques : - * * * ******************************************************************************/ bool dex_is_matching(GBinContent *content) { bool result; /* Bilan à faire connaître */ vmpa2t addr; /* Tête de lecture initiale */ char magic[DEX_FILE_MAGIC_LEN]; /* Idenfiant standard */ init_vmpa(&addr, 0, VMPA_NO_VIRTUAL); result = g_binary_content_read_raw(content, &addr, DEX_FILE_MAGIC_LEN, (bin_t *)magic); result &= (memcmp(magic, DEX_FILE_MAGIC, DEX_FILE_MAGIC_LEN) == 0); return result; } /* Indique le type défini pour un format d'exécutable DEX. */ G_DEFINE_TYPE(GDexFormat, g_dex_format, G_TYPE_EXE_FORMAT); /****************************************************************************** * * * Paramètres : klass = classe à initialiser. * * * * Description : Initialise la classe des formats d'exécutables DEX. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ static void g_dex_format_class_init(GDexFormatClass *klass) { } /****************************************************************************** * * * Paramètres : format = instance à initialiser. * * * * Description : Initialise une instance de format d'exécutable DEX. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ static void g_dex_format_init(GDexFormat *format) { GExeFormat *exe_format; /* Format parent à compléter #1*/ GBinFormat *bin_format; /* Format parent à compléter #2*/ bin_format = G_BIN_FORMAT(format); bin_format->decompile = (format_decompile_fc)g_dex_format_decompile; exe_format = G_EXE_FORMAT(format); exe_format->get_machine = (get_target_machine_fc)g_dex_format_get_target_machine; exe_format->translate_addr = (translate_addr_fc)g_dex_format_translate_address_into_offset; exe_format->translate_off = (translate_off_fc)g_dex_format_translate_offset_into_address; } /****************************************************************************** * * * Paramètres : content = contenu binaire à parcourir. * * length = taille du contenu en question. * * * * Description : Prend en charge un nouveau format DEX. * * * * Retour : Adresse de la structure mise en place ou NULL en cas d'échec.* * * * Remarques : - * * * ******************************************************************************/ GBinFormat *g_dex_format_new(const bin_t *content, off_t length) { GDexFormat *result; /* Structure à retourner */ off_t offset; /* Tête de lecture */ result = g_object_new(G_TYPE_DEX_FORMAT, NULL); //g_binary_format_set_content(G_BIN_FORMAT(result), content, length); offset = 0; if (!read_dex_header(result, &offset, &result->header)) { /* TODO */ return NULL; } /* TODO : vérifier l'en-tête ! */ if (!load_all_dex_classes(result)) { g_object_unref(G_OBJECT(result)); return NULL; } register_all_dex_class_methods(result); g_dex_format_find_all_sources(result); if (!find_all_dex_strings(result)) { g_object_unref(G_OBJECT(result)); return NULL; } return G_BIN_FORMAT(result); } /****************************************************************************** * * * Paramètres : format = informations chargées à consulter. * * addr = adresse de la routine à retrouver. * * * * Description : Retrouve si possible la méthode associée à une adresse. * * * * Retour : Méthde retrouvée ou NULL en cas d'échec. * * * * Remarques : - * * * ******************************************************************************/ GDexMethod *g_dex_format_find_method_by_address(const GDexFormat *format, vmpa_t addr) { GDexMethod *result; /* Trouvaille à retourner */ size_t i; /* Boucle de parcours */ result = NULL; for (i = 0; i < format->classes_count && result == NULL; i++) result = g_dex_class_find_method_by_address(format->classes[i], addr); return result; } /****************************************************************************** * * * Paramètres : format = informations chargées à mettre à jour. * * * * Description : Détermine tous les fichiers source indiqués. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ static void g_dex_format_find_all_sources(GDexFormat *format) { GBinFormat *bf; /* Instance parente */ size_t i; /* Boucle de parcours #1 */ const char *source; /* Fichier source trouvé */ bool found; /* Présence dans la liste */ size_t k; /* Boucle de parcours #2 */ bf = G_BIN_FORMAT(format); for (i = 0; i < format->classes_count; i++) { source = g_dex_class_get_source_file(format->classes[i], format); if (source == NULL) continue; found = false; for (k = 0; k < bf->src_count && !found; k++) found = (strcmp(source, bf->src_files[k]) == 0); if (!found) { bf->src_files = (const char **)realloc(bf->src_files, ++bf->src_count * sizeof(const char **)); bf->src_files[bf->src_count - 1] = source; } } } /****************************************************************************** * * * Paramètres : format = informations chargées à consulter. * * buffer = tampon mis à disposition pour la sortie. * * filename = nom du fichier source à cibler. * * * * Description : Procède à la décompilation complète du format. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ static void g_dex_format_decompile(const GDexFormat *format, GCodeBuffer *buffer, const char *filename) { GLangOutput *lang; /* Langage de sortie */ size_t i; /* Boucle de parcours */ const char *source; /* Fichier source trouvé */ lang = g_java_output_new(); for (i = 0; i < format->classes_count; i++) { source = g_dex_class_get_source_file(format->classes[i], format); if (source == NULL || strcmp(source, filename) != 0) continue; g_dex_class_decompile(format->classes[i], lang, buffer, format); #if 0 GDataType *get_type_from_dex_pool(const GDexFormat *format, uint16_t index) Décrit le type fourni sous forme de caractères. * * * * Retour : Chaîne à libérer de la mémoire après usage. * * * * Remarques : - * * * ******************************************************************************/ char *_g_data_type_to_string(const GDataType *type, bool simple) #endif } } /****************************************************************************** * * * Paramètres : format = informations chargées à consulter. * * * * Description : Indique le type d'architecture visée par le format. * * * * Retour : Identifiant de l'architecture ciblée par le format. * * * * Remarques : - * * * ******************************************************************************/ static const char *g_dex_format_get_target_machine(const GDexFormat *format) { return "dalvik"; } /****************************************************************************** * * * Paramètres : format = informations chargées à consulter. * * count = quantité de zones listées. [OUT] * * * * Description : Fournit les références aux zones binaires à analyser. * * * * Retour : Zones binaires à analyser. * * * * Remarques : - * * * ******************************************************************************/ #if 0 static GBinPart **g_dex_format_get_parts(const GDexFormat *format, size_t *count) { GBinPart **result; /* Tableau à retourner */ size_t i; /* Boucle de parcours */ result = NULL; *count = 0; for (i = 0; i < format->classes_count; i++) result = g_dex_class_get_parts(format->classes[i], result, count); return result; } #endif /****************************************************************************** * * * Paramètres : format = description de l'exécutable à consulter. * * addr = adresse virtuelle à retrouver. * * pos = position correspondante. [OUT] * * * * Description : Fournit la position correspondant à une adresse virtuelle. * * * * Retour : Bilan de l'opération. * * * * Remarques : - * * * ******************************************************************************/ static bool g_dex_format_translate_address_into_offset(const GDexFormat *format, vmpa_t addr, off_t *pos) { bool result; /* Bilan à retourner */ result = false; return result; } /****************************************************************************** * * * Paramètres : format = description de l'exécutable à consulter. * * pos = position dans le flux binaire à retrouver. * * addr = adresse virtuelle correspondante. [OUT] * * * * Description : Fournit l'adresse virtuelle correspondant à une position. * * * * Retour : Bilan de l'opération. * * * * Remarques : - * * * ******************************************************************************/ static bool g_dex_format_translate_offset_into_address(const GDexFormat *format, off_t pos, vmpa_t *addr) { bool result; /* Bilan à retourner */ result = false; return result; } /****************************************************************************** * * * Paramètres : format = description de l'exécutable à consulter. * * * * Description : Dénombre le nombre de classes trouvées. * * * * Retour : Quantité de classes présentes. * * * * Remarques : - * * * ******************************************************************************/ size_t g_dex_format_count_classes(const GDexFormat *format) { return format->classes_count; } /****************************************************************************** * * * Paramètres : format = description de l'exécutable à consulter. * * index = indice de la classe visée. * * * * Description : Fournit une classe du format chargée en mémoire. * * * * Retour : Instance représentant une classe chargée. * * * * Remarques : - * * * ******************************************************************************/ GDexClass *g_dex_format_get_class(const GDexFormat *format, size_t index) { return format->classes[index]; }