/* OpenIDA - Outil d'analyse de fichiers binaires
* binary.c - traitement des flots de code binaire
*
* Copyright (C) 2008 Cyrille Bagard
*
* This file is part of OpenIDA.
*
* OpenIDA is free software; you can redistribute it and/or modify
* it under the terms of the GNU General Public License as published by
* the Free Software Foundation; either version 3 of the License, or
* (at your option) any later version.
*
* OpenIDA is distributed in the hope that it will be useful,
* but WITHOUT ANY WARRANTY; without even the implied warranty of
* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
* GNU General Public License for more details.
*
* You should have received a copy of the GNU General Public License
* along with Foobar. If not, see .
*/
#include "binary.h"
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include "line_code.h"
#include "line_comment.h"
#include "line_prologue.h"
#include "prototype.h"
#include "../common/extstr.h"
#include "../panel/log.h"
#include "../plugins/pglist.h"
#include "../format/dbg_format.h"
#ifndef _
# define _(str) str
#endif
extern bool find_line_info(const uint8_t *content, off_t *size);
/* Description d'un fichier binaire */
struct _openida_binary
{
char *filename; /* Fichier chargé en mémoire */
off_t bin_length; /* Taille des données brutes */
uint8_t *bin_data; /* Données binaires brutes */
exe_format *format; /* Format du binaire */
GArchProcessor *proc; /* Architecture du binaire */
GRenderingLine *lines; /* Lignes de rendu en place */
GRenderingOptions *options; /* Options de désassemblage */
};
/* Charge en mémoire le contenu d'un fichier à partir d'XML. */
openida_binary *load_binary_file_from_xml(xmlXPathObjectPtr);
/* Charge en mémoire le contenu d'un fichier. */
uint8_t *map_binary_file(const char *, off_t *);
/* Construit la description d'introduction du désassemblage. */
GRenderingLine *build_binary_prologue(const char *, const uint8_t *, off_t);
/* Procède au désassemblage basique d'un contenu binaire. */
void disassemble_openida_binary(openida_binary *);
/* Etablit les liens entres les différentes lignes de code. */
void establish_links_in_openida_binary(const openida_binary *);
/* S'assure que toutes les routines ont une taille définie. */
void limit_all_routines_in_openida_binary(const openida_binary *);
/* Cherche l'adresse de fin d'une routine. */
vmpa_t find_best_ending_address_for_routine(GRenderingLine *, size_t, const vmpa_t *, const off_t *, size_t);
/******************************************************************************
* *
* Paramètres : filename = nom du fichier à charger. *
* *
* Description : Charge en mémoire le contenu d'un fichier. *
* *
* Retour : Adresse de la représentation ou NULL en cas d'échec. *
* *
* Remarques : - *
* *
******************************************************************************/
openida_binary *load_binary_file(const char *filename)
{
openida_binary *result; /* Adresse à retourner */
result = (openida_binary *)calloc(1, sizeof(openida_binary));
result->filename = strdup(filename);
result->bin_data = map_binary_file(filename, &result->bin_length);
if (result->bin_data == NULL) goto lbf_error;
result->format = load_new_exe_format(result->bin_data, result->bin_length);
if (result->format == NULL) goto lbf_error;
switch (get_exe_target_machine(result->format))
{
case FTM_JVM:
log_simple_message(LMT_INFO, _("Detected architecture: Java Virtual Machine"));
break;
case FTM_MIPS:
log_simple_message(LMT_INFO, _("Detected architecture: Microprocessor without Interlocked Pipeline Stages"));
break;
case FTM_386:
log_simple_message(LMT_INFO, _("Detected architecture: i386"));
break;
default:
log_simple_message(LMT_INFO, _("Unknown architecture"));
goto lbf_error;
break;
}
result->proc = get_arch_processor_from_format(result->format);
result->options = g_rendering_options_new(result->format, result->proc);
g_rendering_options_show_address(result->options, MRD_BLOCK, true);
g_rendering_options_show_code(result->options, MRD_BLOCK, true);
g_rendering_options_show_address(result->options, MRD_GRAPH, true);
g_rendering_options_show_code(result->options, MRD_GRAPH, false);
disassemble_openida_binary(result);
return result;
lbf_error:
unload_binary_file(result);
return NULL;
}
/******************************************************************************
* *
* Paramètres : context = contexte pour les recherches XPath. *
* path = chemin d'accès au noeud XML à lire. *
* *
* Description : Charge en mémoire le contenu d'un fichier à partir d'XML. *
* *
* Retour : Adresse de la représentation ou NULL en cas d'échec. *
* *
* Remarques : - *
* *
******************************************************************************/
openida_binary *g_binary_file_new_from_xml(xmlXPathContextPtr context, const char *path)
{
openida_binary *result; /* Adresse à retourner */
size_t access_len; /* Taille d'un chemin interne */
char *access; /* Chemin pour une sous-config.*/
char *filename; /* Chemin du binaire à charger */
result = NULL;
/* Chemin du fichier à retrouver */
access_len = strlen(path) + strlen("/Filename") + 1;
access = calloc(access_len, sizeof(char));
snprintf(access, access_len, "%s/Filename", path);
filename = get_node_text_value(context, access);
free(access);
/* Chargement */
if (filename != NULL)
{
result = load_binary_file(filename);
free(filename);
}
return result;
}
/******************************************************************************
* *
* Paramètres : binary = élément binaire à traiter. *
* xdoc = structure XML en cours d'édition. *
* context = contexte à utiliser pour les recherches. *
* path = chemin d'accès réservé au binaire. *
* *
* Description : Ecrit une sauvegarde du binaire dans un fichier XML. *
* *
* Retour : true si l'opération a bien tourné, false sinon. *
* *
* Remarques : - *
* *
******************************************************************************/
bool g_openida_binary_save(const openida_binary *binary, xmlDocPtr xdoc, xmlXPathContextPtr context, const char *path)
{
bool result; /* Bilan à faire remonter */
char *access; /* Chemin d'accès à un élément */
result = true;
/* Nom du fichier associé */
access = strdup(path);
access = stradd(access, "/Filename");
result &= add_content_to_node(xdoc, context, access, binary->filename);
free(access);
return result;
}
/******************************************************************************
* *
* Paramètres : binary = élément binaire à supprimer de la mémoire. *
* *
* Description : Décharge de la mémoire le contenu d'un fichier. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
void unload_binary_file(openida_binary *binary)
{
free(binary->filename);
free(binary);
}
/******************************************************************************
* *
* Paramètres : binary = élément binaire à consulter. *
* *
* Description : Fournit le fichier correspondant à l'élément binaire. *
* *
* Retour : Nom de fichier avec chemin absolu. *
* *
* Remarques : - *
* *
******************************************************************************/
const char *openida_binary_get_filename(const openida_binary *binary)
{
return binary->filename;
}
/******************************************************************************
* *
* Paramètres : binary = élément binaire à consulter. *
* *
* Description : Fournit une description humaine d'un élément binaire. *
* *
* Retour : Chaîne de caractères humainenement lisible de représentation.*
* *
* Remarques : - *
* *
******************************************************************************/
const char *openida_binary_to_string(const openida_binary *binary)
{
return binary->filename;
}
/******************************************************************************
* *
* Paramètres : binary = élément binaire à consulter. *
* length = taille en octets des données chargées. [OUT] *
* *
* Description : Fournit les détails du contenu binaire chargé en mémoire. *
* *
* Retour : Pointeur vers le début des données. *
* *
* Remarques : - *
* *
******************************************************************************/
uint8_t *get_openida_binary_data(const openida_binary *binary, off_t *length)
{
*length = binary->bin_length;
return binary->bin_data;
}
/******************************************************************************
* *
* Paramètres : binary = élément binaire à consulter. *
* *
* Description : Fournit le format de fichier reconnu dans le contenu binaire.*
* *
* Retour : Adresse du format reconnu. *
* *
* Remarques : - *
* *
******************************************************************************/
exe_format *get_openida_binary_format(const openida_binary *binary)
{
return binary->format;
}
/******************************************************************************
* *
* Paramètres : binary = élément binaire à consulter. *
* *
* Description : Fournit les options d'affichage définies pour le binaire. *
* *
* Retour : Adresse des options d'affichage. *
* *
* Remarques : - *
* *
******************************************************************************/
GRenderingOptions *get_openida_binary_options(const openida_binary *binary)
{
return binary->options;
}
/******************************************************************************
* *
* Paramètres : binary = élément binaire à consulter. *
* *
* Description : Fournit les lignes de rendu issues du désassemblage. *
* *
* Retour : Lignes issues du désassemblage. *
* *
* Remarques : - *
* *
******************************************************************************/
GRenderingLine *get_openida_binary_lines(const openida_binary *binary)
{
return binary->lines;
}
/******************************************************************************
* *
* Paramètres : filename = nom du fichier à charger. *
* length = taille des données mises en mémoire. [OUT] *
* *
* Description : Charge en mémoire le contenu d'un fichier. *
* *
* Retour : Adresse du contenu binaire ou NULL en cas d'échec. *
* *
* Remarques : - *
* *
******************************************************************************/
uint8_t *map_binary_file(const char *filename, off_t *length)
{
uint8_t *result; /* Données à retourner */
int fd; /* Fichier ouvert en lecture */
struct stat info; /* Informations sur le fichier */
int ret; /* Bilan d'un appel */
fd = open(filename, 0, O_RDONLY);
if (fd == -1)
{
perror("open()");
return NULL;
}
ret = fstat(fd, &info);
if (ret == -1)
{
perror("fstat()");
close(fd);
return NULL;
}
*length = info.st_size;
result = (uint8_t *)mmap(NULL, *length, PROT_READ, MAP_PRIVATE, fd, 0);
if (result == MAP_FAILED)
{
perror("mmap()");
result = NULL;
}
ret = close(fd);
if (ret == -1)
perror("close()");
return result;
}
/******************************************************************************
* *
* Paramètres : filename = nom du fichier chargé. *
* data = données en mémoire pour l'empreinte. *
* length = quantité de données à prendre en compte. *
* *
* Description : Construit la description d'introduction du désassemblage. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
GRenderingLine *build_binary_prologue(const char *filename, const uint8_t *data, off_t length)
{
GRenderingLine *result; /* Contenu à renvoyer */
size_t len; /* Taille du texte */
char *content; /* Contenu textuel d'une ligne */
GRenderingLine *line; /* Représentation à ajouter */
GChecksum *checksum; /* Calcul de l'empreinte */
const gchar *hex; /* Valeur hexadécimale du SHA */
result = NULL;/* FIXME DL_LIST_HEAD_INIT( **/
line = g_prologue_line_new("Disassembly generated by OpenIDA");
g_rendering_line_add_to_lines(&result, line);
line = g_prologue_line_new("OpenIDA is free software - © 2008-2009 Cyrille Bagard");
g_rendering_line_add_to_lines(&result, line);
line = g_prologue_line_new("");
g_rendering_line_add_to_lines(&result, line);
/* Fichier */
len = strlen(_("File: ")) + strlen(filename);
content = (char *)calloc(len + 1, sizeof(char));
snprintf(content, len + 1, "%s%s", _("File: "), filename);
line = g_prologue_line_new(content);
g_rendering_line_add_to_lines(&result, line);
free(content);
/* Checksum SHA256 */
checksum = g_checksum_new(G_CHECKSUM_SHA256);
g_checksum_update(checksum, data, length);
hex = g_checksum_get_string(checksum);
len = strlen(_("Sha256: ")) + strlen(hex);
content = (char *)calloc(len + 1, sizeof(char));
snprintf(content, len + 1, "%s%s", _("Sha256: "), hex);
g_checksum_free(checksum);
line = g_prologue_line_new(content);
g_rendering_line_add_to_lines(&result, line);
free(content);
line = g_prologue_line_new("");
g_rendering_line_add_to_lines(&result, line);
line = g_prologue_line_new("");
g_rendering_line_add_to_lines(&result, line);
return result;
}
/******************************************************************************
* *
* Paramètres : binary = binaire dont le contenu est à analyser. *
* *
* Description : Procède au désassemblage basique d'un contenu binaire. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
void disassemble_openida_binary(openida_binary *binary)
{
GArchInstruction *instr;
GBinRoutine **routines; /* Liste des routines trouvées */
size_t routines_count; /* Nombre de ces routines */
bin_part **parts;
size_t parts_count;
GRenderingLine *line;
off_t start;
off_t pos;
off_t len;
uint64_t base = 0;
vmpa_t addr = 0;
size_t i;
size_t k;
uint64_t routine_offset; /* Point de départ de routine */
char *routine_desc; /* Prototype d'une routine */
GPluginModule **pglist; /* Liste de greffons */
size_t pgcount; /* Taille de cette liste */
binary->lines = build_binary_prologue(binary->filename, binary->bin_data, binary->bin_length);
routines = get_all_exe_routines(binary->format, &routines_count);
parts = /* !!! */get_elf_default_code_parts(binary->format, &parts_count);
qsort(parts, parts_count, sizeof(bin_part *), compare_bin_parts);
printf("PARTS COUNT :: %d\n", parts_count);
for (i = 0; i < parts_count; i++)
{
get_bin_part_values(parts[i], &pos, &len, &base);
/* Décodage des instructions */
start = pos;
pos = 0;
while (pos < len)
{
addr = base + pos;
instr = g_arch_processor_decode_instruction(binary->proc, &binary->bin_data[start], &pos, len, start, addr);
line = g_code_line_new(addr, instr, binary->options);
g_rendering_line_add_to_lines(&binary->lines, line);
}
/* Ajout des prototypes de fonctions */
for (k = 0; k < routines_count; k++)
{
routine_offset = g_binary_routine_get_address(routines[k]);
if (!(base <= routine_offset && routine_offset < (base + len))) continue;
routine_desc = g_binary_routine_to_string(routines[k]);
line = g_comment_line_new(routine_offset, routine_desc, binary->options);
g_rendering_line_insert_into_lines(&binary->lines, line, true);
free(routine_desc);
}
}
establish_links_in_openida_binary(binary);
limit_all_routines_in_openida_binary(binary);
line = g_rendering_line_find_by_address(binary->lines, NULL, get_exe_entry_point(binary->format));
if (line != NULL) g_rendering_line_add_flag(line, RLF_ENTRY_POINT);
/* Action post-désassemblage */
pglist = get_all_plugins_for_action(PGA_CODE_PROCESS, &pgcount);
if (pgcount > 0)
{
for (i = 0; i < pgcount; i++)
g_plugin_module_execute_action_on_binary(pglist[i], binary, PGA_CODE_PROCESS);
free(pglist);
}
}
/******************************************************************************
* *
* Paramètres : binary = binaire dont le contenu est à lier. *
* *
* Description : Etablit les liens entres les différentes lignes de code. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
void establish_links_in_openida_binary(const openida_binary *binary)
{
GBinRoutine **routines; /* Liste des routines trouvées */
size_t routines_count; /* Nombre de ces routines */
size_t i; /* Boucle de parcours */
vmpa_t start; /* Adresse de départ */
vmpa_t end; /* Adresse de fin */
GRenderingLine *iter; /* Boucle de parcours */
GArchInstruction *instr; /* Instruction à ausculter */
vmpa_t addr; /* Adresse référencée */
InstructionLinkType type; /* Type de référence */
GRenderingLine *target; /* Ligne visée par la référence*/
routines = get_all_exe_routines(binary->format, &routines_count);
for (i = 0; i < routines_count; i++)
{
start = g_binary_routine_get_address(routines[i]);
end = start + g_binary_routine_get_size(routines[i]);
for (iter = g_rendering_line_find_by_address(binary->lines, NULL, start);
iter != NULL;
iter = g_rendering_line_get_next_iter(binary->lines, iter, NULL))
{
/* Si on sort de la zone... */
if (get_rendering_line_address(iter) >= end) break;
/* On ne traite que du code ici ! */
if (!G_IS_CODE_LINE(iter)) continue;
instr = g_code_line_get_instruction(G_CODE_LINE(iter));
type = g_arch_instruction_get_link(instr, &addr);
switch (type)
{
case ILT_NONE:
break;
case ILT_JUMP:
target = g_rendering_line_find_by_address(binary->lines, NULL, addr);
if (target != NULL)
g_rendering_line_link_with(iter, target, type);
break;
case ILT_JUMP_IF_FALSE:
break;
case ILT_JUMP_IF_TRUE:
target = g_rendering_line_find_by_address(binary->lines, NULL, addr);
if (target != NULL)
{
g_rendering_line_link_with(iter, target, type);
target = g_rendering_line_get_next_iter(binary->lines, iter, NULL);
if (target != NULL)
g_rendering_line_link_with(iter, target, ILT_JUMP_IF_FALSE);
}
break;
case ILT_CALL:
target = g_rendering_line_find_by_address(binary->lines, NULL, addr);
if (target != NULL)
g_rendering_line_link_with(iter, target, type);
break;
}
}
}
}
/******************************************************************************
* *
* Paramètres : binary = binaire dont le contenu est à lier. *
* *
* Description : S'assure que toutes les routines ont une taille définie. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
void limit_all_routines_in_openida_binary(const openida_binary *binary)
{
GBinRoutine **routines; /* Liste des routines trouvées */
size_t routines_count; /* Nombre de ces routines */
size_t i; /* Boucle de parcours */
vmpa_t *starts; /* Adresses de départ */
off_t *lengths; /* Tailles des routines */
GRenderingLine *line; /* Ligne de départ / d'arrivée */
vmpa_t start; /* Adresse de début de routine */
vmpa_t last; /* Meilleur dernière adresse */
GArchInstruction *instr; /* Instruction à ausculter */
off_t length; /* Taille du code */
routines = get_all_exe_routines(binary->format, &routines_count);
if (routines_count == 0) return;
qsort(routines, routines_count, sizeof(GBinRoutine *), g_binary_routine_rcompare);
starts = (vmpa_t *)calloc(routines_count, sizeof(vmpa_t));
lengths = (off_t *)calloc(routines_count, sizeof(off_t));
for (i = 0; i < routines_count; i++)
{
starts[i] = g_binary_routine_get_address(routines[i]);
lengths[i] = g_binary_routine_get_size(routines[i]);
}
for (i = 0; i < routines_count; i++)
{
if (lengths[i] > 0) continue;
start = g_binary_routine_get_address(routines[i]);
line = g_rendering_line_find_by_address(binary->lines, NULL, start);
last = find_best_ending_address_for_routine(line, i, starts, lengths, routines_count);
line = g_rendering_line_find_by_address(binary->lines, NULL, last);
line = g_rendering_line_loop_for_code(line, NULL);
instr = g_code_line_get_instruction(G_CODE_LINE(line));
g_arch_instruction_get_location(instr, NULL, &length, NULL);
lengths[i] = last - start + length;
g_binary_routine_set_size(routines[i], lengths[i]);
}
free(starts);
free(lengths);
}
/******************************************************************************
* *
* Paramètres : line = ligne de départ du parcours. *
* index = indice de la routine traitée dans la liste. *
* starts = adresse de départ des autres routines. *
* lengths = taille des différentes routines, valides ou nulles.*
* count = quantité de routines présentes. *
* *
* Description : Cherche l'adresse de fin d'une routine. *
* *
* Retour : Plus grande adresse de dernière instruction de routine. *
* *
* Remarques : - *
* *
******************************************************************************/
vmpa_t find_best_ending_address_for_routine(GRenderingLine *line, size_t index, const vmpa_t *starts, const off_t *lengths, size_t count)
{
vmpa_t result; /* Haute adresse à remonter */
GRenderingLine *iter; /* Boucle de parcours #1 */
vmpa_t candidate; /* Candidat potentiel */
size_t i; /* Boucle de parcours #2 */
GArchInstruction *instr; /* Instruction à ausculter */
result = starts[index];
for (iter = line; iter != NULL; iter = g_rendering_line_get_next_iter(line, iter, NULL))
{
if (!G_IS_CODE_LINE(iter)) continue;
candidate = get_rendering_line_address(iter);
/* Regarde si on n'empiète pas sur une autre routine */
for (i = 0; i < count; i++)
{
if (i == index) continue;
if (starts[i] <= candidate && candidate < (starts[i] + lengths[i]))
break;
}
if (i != count) break;
else result = candidate;
/* Retour de fonction ? */
instr = g_code_line_get_instruction(G_CODE_LINE(iter));
if (g_arch_instruction_is_return(instr)) break;
}
return result;
}