/* Chrysalide - Outil d'analyse de fichiers binaires * artificial.c - instructions pures vues de l'esprit * * Copyright (C) 2014-2017 Cyrille Bagard * * This file is part of Chrysalide. * * Chrysalide is free software; you can redistribute it and/or modify * it under the terms of the GNU General Public License as published by * the Free Software Foundation; either version 3 of the License, or * (at your option) any later version. * * Chrysalide is distributed in the hope that it will be useful, * but WITHOUT ANY WARRANTY; without even the implied warranty of * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the * GNU General Public License for more details. * * You should have received a copy of the GNU General Public License * along with Foobar. If not, see . */ #include "raw.h" #include #include #include #include #include "immediate.h" #include "instruction-int.h" #include "target.h" /* ------------------------- INSTRUCTION INCONNUE / DONNEES ------------------------- */ /* Définition générique d'une instruction brute d'architecture (instance) */ struct _GRawInstruction { GArchInstruction parent; /* A laisser en premier */ bool is_padding; /* Bourrage à représenter ? */ bool is_string; /* Chaîne de caractères ? */ }; /* Définition générique d'une instruction brute d'architecture (classe) */ struct _GRawInstructionClass { GArchInstructionClass parent; /* A laisser en premier */ }; /* Initialise la classe des instructions brutes d'architecture. */ static void g_raw_instruction_class_init(GRawInstructionClass *); /* Initialise une instance d'instruction brute d'architecture. */ static void g_raw_instruction_init(GRawInstruction *); /* Supprime toutes les références externes. */ static void g_raw_instruction_dispose(GRawInstruction *); /* Procède à la libération totale de la mémoire. */ static void g_raw_instruction_finalize(GRawInstruction *); /* Indique l'encodage d'une instruction de façon détaillée. */ static const char *g_raw_instruction_get_encoding(const GRawInstruction *); /* Fournit le nom humain de l'instruction manipulée. */ static const char *g_raw_instruction_get_keyword(const GRawInstruction *, AsmSyntax); /* Ajoute à un tampon GLib le contenu de l'instance spécifiée. */ static void g_raw_instruction_print(GRawInstruction *, GBufferLine *, size_t, size_t, const GBinContent *); /* ---------------------------------------------------------------------------------- */ /* INSTRUCTION INCONNUE / DONNEES */ /* ---------------------------------------------------------------------------------- */ /* Indique le type défini pour une instruction inconnue d'architecture. */ G_DEFINE_TYPE(GRawInstruction, g_raw_instruction, G_TYPE_ARCH_INSTRUCTION); /****************************************************************************** * * * Paramètres : klass = classe à initialiser. * * * * Description : Initialise la classe des instructions brutes d'architecture. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ static void g_raw_instruction_class_init(GRawInstructionClass *klass) { GObjectClass *object; /* Autre version de la classe */ GArchInstructionClass *instr; /* Encore une autre vision... */ object = G_OBJECT_CLASS(klass); object->dispose = (GObjectFinalizeFunc/* ! */)g_raw_instruction_dispose; object->finalize = (GObjectFinalizeFunc)g_raw_instruction_finalize; instr = G_ARCH_INSTRUCTION_CLASS(klass); instr->get_encoding = (get_instruction_encoding_fc)g_raw_instruction_get_encoding; instr->get_keyword = (get_instruction_keyword_fc)g_raw_instruction_get_keyword; instr->print = (print_instruction_fc)g_raw_instruction_print; } /****************************************************************************** * * * Paramètres : instr = instance à initialiser. * * * * Description : Initialise une instance d'instruction brute d'architecture. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ static void g_raw_instruction_init(GRawInstruction *instr) { } /****************************************************************************** * * * Paramètres : instr = instance d'objet GLib à traiter. * * * * Description : Supprime toutes les références externes. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ static void g_raw_instruction_dispose(GRawInstruction *instr) { G_OBJECT_CLASS(g_raw_instruction_parent_class)->dispose(G_OBJECT(instr)); } /****************************************************************************** * * * Paramètres : instr = instance d'objet GLib à traiter. * * * * Description : Procède à la libération totale de la mémoire. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ static void g_raw_instruction_finalize(GRawInstruction *instr) { G_OBJECT_CLASS(g_raw_instruction_parent_class)->finalize(G_OBJECT(instr)); } /****************************************************************************** * * * Paramètres : addr = position à associer à l'instruction. * * size = taille de l'opérande souhaitée. * * value = valeur sur x bits à venir récupérer. * * * * Description : Crée une instruction de type 'db/dw/etc' simple. * * * * Retour : Instruction mise en place. * * * * Remarques : - * * * ******************************************************************************/ GArchInstruction *g_raw_instruction_new_from_value(const vmpa2t *addr, MemoryDataSize size, uint64_t value) { GArchInstruction *result; /* Instruction à retourner */ GImmOperand *operand; /* Octet non décodé à afficher */ mrange_t range; /* Couverture de l'instruction */ result = g_object_new(G_TYPE_RAW_INSTRUCTION, NULL); operand = G_IMM_OPERAND(g_imm_operand_new_from_value(size, value)); if (operand == NULL) goto grinfv_error; g_imm_operand_pad(&operand, true, NULL); g_arch_instruction_attach_extra_operand(result, G_ARCH_OPERAND(operand)); switch (size) { case MDS_8_BITS_UNSIGNED: case MDS_8_BITS_SIGNED: init_mrange(&range, addr, 1); break; case MDS_16_BITS_UNSIGNED: case MDS_16_BITS_SIGNED: init_mrange(&range, addr, 2); break; case MDS_32_BITS_UNSIGNED: case MDS_32_BITS_SIGNED: init_mrange(&range, addr, 4); break; case MDS_64_BITS_UNSIGNED: case MDS_64_BITS_SIGNED: init_mrange(&range, addr, 8); break; default: assert(false); goto grinfv_error; break; } g_arch_instruction_set_range(result, &range); return result; grinfv_error: g_object_unref(G_OBJECT(result)); return NULL; } /****************************************************************************** * * * Paramètres : content = flux de données à analyser. * * addr = position courante dans ce flux. [OUT] * * * * Description : Crée une instruction de type 'db/dw/etc' pour un uleb128. * * * * Retour : Instruction mise en place. * * * * Remarques : - * * * ******************************************************************************/ GArchInstruction *g_raw_instruction_new_uleb128(const GBinContent *content, vmpa2t *addr) { GArchInstruction *result; /* Instruction à retourner */ vmpa2t start; /* Départ original de lecture */ uleb128_t value; /* Valeur uleb128 à représenter*/ phys_t diff; /* Couverture de la lecture */ MemoryDataSize leb_size; /* Taille de la valeur */ GImmOperand *operand; /* Octet non décodé à afficher */ mrange_t range; /* Couverture de l'instruction */ copy_vmpa(&start, addr); if (!g_binary_content_read_uleb128(content, addr, &value)) goto grinu_error; diff = compute_vmpa_diff(&start, addr); leb_size = MDS_FROM_BYTES(diff); assert(leb_size != MDS_UNDEFINED); result = g_object_new(G_TYPE_RAW_INSTRUCTION, NULL); init_mrange(&range, &start, diff); g_arch_instruction_set_range(result, &range); operand = G_IMM_OPERAND(g_imm_operand_new_from_value(leb_size, (uint64_t)value)); if (operand == NULL) goto grinu_error; g_imm_operand_pad(&operand, true, NULL); g_arch_instruction_attach_extra_operand(result, G_ARCH_OPERAND(operand)); return result; grinu_error: return NULL; } /****************************************************************************** * * * Paramètres : content = flux de données à analyser. * * addr = position courante dans ce flux. [OUT] * * * * Description : Crée une instruction de type 'db/dw/etc' pour un sleb128. * * * * Retour : Instruction mise en place. * * * * Remarques : - * * * ******************************************************************************/ GArchInstruction *g_raw_instruction_new_sleb128(const GBinContent *content, vmpa2t *addr) { GArchInstruction *result; /* Instruction à retourner */ vmpa2t start; /* Départ original de lecture */ uleb128_t value; /* Valeur uleb128 à représenter*/ phys_t diff; /* Couverture de la lecture */ MemoryDataSize leb_size; /* Taille de la valeur */ GImmOperand *operand; /* Octet non décodé à afficher */ mrange_t range; /* Couverture de l'instruction */ copy_vmpa(&start, addr); if (!g_binary_content_read_uleb128(content, addr, &value)) goto grins_error; diff = compute_vmpa_diff(&start, addr); leb_size = MDS_FROM_BYTES(diff) | MDS_SIGN; assert(leb_size != MDS_SIGN); result = g_object_new(G_TYPE_RAW_INSTRUCTION, NULL); init_mrange(&range, &start, diff); g_arch_instruction_set_range(result, &range); operand = G_IMM_OPERAND(g_imm_operand_new_from_value(leb_size, (uint64_t)value)); if (operand == NULL) goto grins_error; g_imm_operand_pad(&operand, true, NULL); g_arch_instruction_attach_extra_operand(result, G_ARCH_OPERAND(operand)); return result; grins_error: return NULL; } /****************************************************************************** * * * Paramètres : content = flux de données à analyser. * * size = taille de chacun des éléments à représenter. * * count = nombre de ces éléments. * * addr = position courante dans ce flux. [OUT] * * endian = ordre des bits dans la source. * * * * Description : Crée une instruction de type 'db/dw/etc' étendue. * * * * Retour : Instruction mise en place. * * * * Remarques : - * * * ******************************************************************************/ GArchInstruction *g_raw_instruction_new_array(const GBinContent *content, MemoryDataSize size, size_t count, vmpa2t *addr, SourceEndian endian) { GArchInstruction *result; /* Instruction à retourner */ vmpa2t old; /* Sauvegarde de la position */ size_t i; /* Boucle de parcours */ GImmOperand *operand; /* Octet non décodé à afficher */ mrange_t range; /* Couverture de l'instruction */ /* Par soucis de cohérence */ if (count == 0) return NULL; result = g_object_new(G_TYPE_RAW_INSTRUCTION, NULL); copy_vmpa(&old, addr); for (i = 0; i < count; i++) { operand = G_IMM_OPERAND(g_imm_operand_new_from_data(size, content, addr, endian)); if (operand == NULL) goto grina_error; g_imm_operand_pad(&operand, true, NULL); g_arch_instruction_attach_extra_operand(result, G_ARCH_OPERAND(operand)); } init_mrange(&range, &old, compute_vmpa_diff(addr, &old)); g_arch_instruction_set_range(result, &range); return result; grina_error: g_object_unref(G_OBJECT(result)); return NULL; } /****************************************************************************** * * * Paramètres : instr = instruction quelconque à consulter. * * * * Description : Indique l'encodage d'une instruction de façon détaillée. * * * * Retour : Description humaine de l'encodage utilisé. * * * * Remarques : - * * * ******************************************************************************/ static const char *g_raw_instruction_get_encoding(const GRawInstruction *instr) { const char *result; /* Description à retourner */ if (instr->is_string) result = _("String"); else result = _("Raw"); return result; } /****************************************************************************** * * * Paramètres : instr = instruction d'assemblage à consulter. * * syntax = type de représentation demandée. * * * * Description : Fournit le nom humain de l'instruction manipulée. * * * * Retour : Mot clef de bas niveau. * * * * Remarques : - * * * ******************************************************************************/ static const char *g_raw_instruction_get_keyword(const GRawInstruction *instr, AsmSyntax syntax) { GArchOperand *operand; /* Octet décodé à afficher */ MemoryDataSize size; /* Taille de valeur associée */ static char *defines[] = { "dn", "db", "dw", "dd", "dq" }; operand = g_arch_instruction_get_operand(G_ARCH_INSTRUCTION(instr), 0); if (G_IS_TARGET_OPERAND(operand)) size = g_target_operand_get_size(G_TARGET_OPERAND(operand)); else size = g_imm_operand_get_size(G_IMM_OPERAND(operand)); return defines[MDS_RANGE(size)]; } /****************************************************************************** * * * Paramètres : instr = instruction d'assemblage à représenter. * * buffer = espace où placer ledit contenu. * * msize = taille idéale des positions et adresses; * * content = contenu binaire global à venir lire. * * syntax = type de représentation demandée. * * content = éventuel contenu binaire brut à imprimer. * * * * Description : Ajoute à un tampon GLib le contenu de l'instance spécifiée. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ static void g_raw_instruction_print(GRawInstruction *instr, GBufferLine *line, size_t index, size_t repeat, const GBinContent *content) { GArchInstruction *base; /* Autre version de l'instance */ phys_t max_displayed_len; /* Quantité de code affichée */ const char *key; /* Mot clef principal */ size_t klen; /* Taille de ce mot clef */ char *string; /* Chaîne reconstituée */ size_t iter; /* Tête d'écriture */ bool first; /* Mémorise une énumération */ size_t count; /* Nombre d'opérandes en place */ size_t i; /* Boucle de parcours */ GArchOperand *op; /* Opérande à manipuler */ GImmOperand *imm; /* Version opérande de valeur */ char byte; /* Octet à afficher (ou pas) */ bool status; /* Bilan d'une récupération */ base = G_ARCH_INSTRUCTION(instr); /* Localisation */ g_buffer_line_fill_vmpa(line, get_mrange_addr(&base->range), MDS_32_BITS_UNSIGNED, MDS_32_BITS_UNSIGNED); /* Contenu */ if (instr->is_padding) max_displayed_len = 0; else if (instr->is_string) max_displayed_len = 1; else { max_displayed_len = get_mrange_length(&base->range); max_displayed_len /= g_arch_instruction_count_operands(base); } g_buffer_line_fill_content(line, content, &base->range, max_displayed_len); /* Zone du code d'assemblage */ key = g_arch_instruction_get_keyword(base, 0/*, syntax*/); klen = strlen(key); g_buffer_line_append_text(line, BLC_ASSEMBLY_HEAD, key, klen, RTT_INSTRUCTION, NULL); if (instr->is_padding) g_buffer_line_append_text(line, BLC_ASSEMBLY, "...", 3, RTT_RAW, NULL); else { string = NULL; iter = 0; first = true; g_arch_instruction_lock_operands(base); count = _g_arch_instruction_count_operands(base); for (i = 0; i < count; i++) { op = _g_arch_instruction_get_operand(base, i); if (!G_IS_IMM_OPERAND(op)) goto grip_fallback; imm = G_IMM_OPERAND(op); if (g_imm_operand_get_size(imm) != MDS_8_BITS) goto grip_fallback; if (!instr->is_string && g_imm_operand_get_display(imm) != IOD_CHAR) goto grip_fallback; status = g_imm_operand_get_value(imm, MDS_8_BITS, &byte); assert(status); /* Si le caractère doit apparaître en hexadécimal... */ if (!isprint(byte)) goto grip_fallback; /* Impression de l'octet */ if (string == NULL) { string = (char *)calloc(count + 3, sizeof(char)); strcpy(string, "\""); iter = 1; } string[iter++] = byte; continue; grip_fallback: /* Si une chaîne précède */ if (string != NULL && iter > 1) { if (!first) { g_buffer_line_append_text(line, BLC_ASSEMBLY, ",", 1, RTT_PUNCT, NULL); g_buffer_line_append_text(line, BLC_ASSEMBLY, " ", 1, RTT_RAW, NULL); } else first = false; string[iter++] = '"'; g_buffer_line_append_text(line, BLC_ASSEMBLY, string, iter, RTT_STRING, NULL); iter = 1; } /* Intégration en tant qu'opérande classique */ if (!first) { g_buffer_line_append_text(line, BLC_ASSEMBLY, ",", 1, RTT_PUNCT, NULL); g_buffer_line_append_text(line, BLC_ASSEMBLY, " ", 1, RTT_RAW, NULL); } else first = false; g_arch_operand_print(op, line, 0/*syntax*/); } /* Si au final une chaîne traine encore */ if (string != NULL && iter > 1) { if (!first) { g_buffer_line_append_text(line, BLC_ASSEMBLY, ",", 1, RTT_PUNCT, NULL); g_buffer_line_append_text(line, BLC_ASSEMBLY, " ", 1, RTT_RAW, NULL); } string[iter++] = '"'; g_buffer_line_append_text(line, BLC_ASSEMBLY, string, iter, RTT_STRING, NULL); } g_arch_instruction_unlock_operands(base); if (string != NULL) free(string); } } /****************************************************************************** * * * Paramètres : instr = instruction à traiter. * * is_padding = nouveau statut à associer au contenu. * * * * Description : Marque l'instruction comme ne contenant que du bourrage. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ void g_raw_instruction_mark_as_padding(GRawInstruction *instr, bool is_padding) { instr->is_padding = is_padding; } /****************************************************************************** * * * Paramètres : instr = instruction à traiter. * * is_padding = nouveau statut à associer au contenu. * * * * Description : Indique si le contenu de l'instruction est du bourrage. * * * * Retour : Statut du contenu de l'instruction. * * * * Remarques : - * * * ******************************************************************************/ bool g_raw_instruction_is_padding(const GRawInstruction *instr) { return instr->is_padding; } /****************************************************************************** * * * Paramètres : instr = instruction à traiter. * * is_string = nouveau statut à associer au contenu. * * * * Description : Marque l'instruction comme contenant une chaîne de texte. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ void g_raw_instruction_mark_as_string(GRawInstruction *instr, bool is_string) { instr->is_string = is_string; } /****************************************************************************** * * * Paramètres : instr = instruction à traiter. * * is_string = nouveau statut à associer au contenu. * * * * Description : Indique si le contenu de l'instruction est un texte. * * * * Retour : Statut du contenu de l'instruction. * * * * Remarques : - * * * ******************************************************************************/ bool g_raw_instruction_is_string(const GRawInstruction *instr) { return instr->is_string; }