/* Chrysalide - Outil d'analyse de fichiers binaires * token.c - bribes de recherche textuelle * * Copyright (C) 2023 Cyrille Bagard * * This file is part of Chrysalide. * * Chrysalide is free software; you can redistribute it and/or modify * it under the terms of the GNU General Public License as published by * the Free Software Foundation; either version 3 of the License, or * (at your option) any later version. * * Chrysalide is distributed in the hope that it will be useful, * but WITHOUT ANY WARRANTY; without even the implied warranty of * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the * GNU General Public License for more details. * * You should have received a copy of the GNU General Public License * along with Foobar. If not, see . */ #include "token.h" #include #include #include #include "token-int.h" #include "tokens/nodes/plain.h" #include "../../../common/cpp.h" #include "../../../core/logs.h" /* ------------------------- CIBLAGE DES SEQUENCES D'OCTETS ------------------------- */ /* Initialise la classe des bribes de recherche textuelle. */ static void g_bytes_token_class_init(GBytesTokenClass *); /* Initialise une instance de bribe de recherche textuelle. */ static void g_bytes_token_init(GBytesToken *); /* Supprime toutes les références externes. */ static void g_bytes_token_dispose(GBytesToken *); /* Procède à la libération totale de la mémoire. */ static void g_bytes_token_finalize(GBytesToken *); /* --------------------- IMPLEMENTATION DES FONCTIONS DE CLASSE --------------------- */ /* Affiche un motif de recherche au format texte. */ static void g_bytes_token_output_to_text(const GBytesToken *, GScanContext *, int); /* Affiche un motif de recherche au format JSON. */ static void g_bytes_token_output_to_json(const GBytesToken *, GScanContext *, const sized_string_t *, unsigned int, int); /* ---------------------------------------------------------------------------------- */ /* CIBLAGE DES SEQUENCES D'OCTETS */ /* ---------------------------------------------------------------------------------- */ /* Indique le type défini pour une bribe de recherche textuelle. */ G_DEFINE_TYPE(GBytesToken, g_bytes_token, G_TYPE_SEARCH_PATTERN); /****************************************************************************** * * * Paramètres : klass = classe à initialiser. * * * * Description : Initialise la classe des bribes de recherche textuelle. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ static void g_bytes_token_class_init(GBytesTokenClass *klass) { GObjectClass *object; /* Autre version de la classe */ GSearchPatternClass *pattern; /* Version de classe parente */ object = G_OBJECT_CLASS(klass); object->dispose = (GObjectFinalizeFunc/* ! */)g_bytes_token_dispose; object->finalize = (GObjectFinalizeFunc)g_bytes_token_finalize; pattern = G_SEARCH_PATTERN_CLASS(klass); pattern->to_text = (output_pattern_to_text_fc)g_bytes_token_output_to_text; pattern->to_json = (output_pattern_to_json_fc)g_bytes_token_output_to_json; } /****************************************************************************** * * * Paramètres : token = instance à initialiser. * * * * Description : Initialise une instance de bribe de recherche textuelle. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ static void g_bytes_token_init(GBytesToken *token) { token->root = NULL; token->slow = 0; token->need_backward = false; token->fullword = false; token->private = false; } /****************************************************************************** * * * Paramètres : token = instance d'objet GLib à traiter. * * * * Description : Supprime toutes les références externes. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ static void g_bytes_token_dispose(GBytesToken *token) { g_clear_object(&token->root); G_OBJECT_CLASS(g_bytes_token_parent_class)->dispose(G_OBJECT(token)); } /****************************************************************************** * * * Paramètres : token = instance d'objet GLib à traiter. * * * * Description : Procède à la libération totale de la mémoire. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ static void g_bytes_token_finalize(GBytesToken *token) { G_OBJECT_CLASS(g_bytes_token_parent_class)->finalize(G_OBJECT(token)); } /****************************************************************************** * * * Paramètres : token = encadrement de motif à initialiser pleinement. * * root = représentation du motif à recherche. * * fullword = limite les correspondances à des mots entiers. * * private = donne une vocation privée au motif de recherche. * * * * Description : Met en place un gestionnaire de recherche de binaire. * * * * Retour : Bilan de l'opération. * * * * Remarques : - * * * ******************************************************************************/ bool g_bytes_token_create(GBytesToken *token, GScanTokenNode *root, bool fullword, bool private) { bool result; /* Bilan à retourner */ result = true; token->root = root; g_object_ref(G_OBJECT(root)); token->fullword = fullword; token->private = private; return result; } /****************************************************************************** * * * Paramètres : token = encadrement de motif à consulter. * * * * Description : Indique si seuls des mots entiers sont retenus des analyses. * * * * Retour : Bilan de l'opération. * * * * Remarques : - * * * ******************************************************************************/ bool g_bytes_token_target_fullword(const GBytesToken *token) { bool result; /* Statut à renvoyer */ result = token->fullword; return result; } /****************************************************************************** * * * Paramètres : token = encadrement de motif à consulter. * * * * Description : Détermine si le gestionnaire est à vocation privée. * * * * Retour : Bilan de l'opération. * * * * Remarques : - * * * ******************************************************************************/ bool g_bytes_token_is_private(const GBytesToken *token) { bool result; /* Statut à renvoyer */ result = token->private; return result; } /****************************************************************************** * * * Paramètres : token = définition de la bribe à enregistrer. * * backend = moteur de recherche à préchauffer. * * maxsize = taille max. des atomes (mise en commun optimisée). * * * * Description : Inscrit la définition d'un motif dans un moteur de recherche.* * * * Retour : Bilan de l'opération à renvoyer. * * * * Remarques : - * * * ******************************************************************************/ bool g_bytes_token_enroll(GBytesToken *token, GEngineBackend *backend, size_t maxsize) { bool result; /* Statut à retourner */ token->need_backward = g_scan_token_node_setup_tree(token->root); result = g_scan_token_node_enroll(token->root, backend, maxsize, &token->slow); return result; } /****************************************************************************** * * * Paramètres : token = définition de la bribe à peaufiner. * * backend = moteur de recherche à préchauffer. * * * * Description : Récupère les identifiants finaux pour un motif recherché. * * * * Retour : Bilan de l'opération à renvoyer. * * * * Remarques : - * * * ******************************************************************************/ bool g_bytes_token_build_id(GBytesToken *token, GEngineBackend *backend) { bool result; /* Statut à retourner */ result = g_scan_token_node_build_id(token->root, backend); return result; } /****************************************************************************** * * * Paramètres : token = définition de la bribe à manipuler. * * matches = suivi des correspondances à consolider. * * params = paramètres des opérations de validation. * * * * Description : Transforme les correspondances locales en trouvailles. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ void g_bytes_token_check(const GBytesToken *token, GScanBytesMatches *matches, scan_node_check_params_t *params) { match_area_t *area; /* Correspondance à valider */ match_area_t *next; /* Correspondance suivante */ vmpa2t pos; /* Tête de lecture */ const bin_t *byte; /* Octet à valider */ /* Réinitialisation */ // TODO: offset params->initialized = false; params->main_areas = NULL; params->main_count = 0; params->created_areas = NULL; params->created_count = 0; params->kept_areas = NULL; params->kept_count = 0; /* Lancement des analyses */ g_scan_token_node_check_forward(token->root, params); if (token->need_backward) g_scan_token_node_check_backward(token->root, params); // REMME ? sort_and_filter_pending_matches(matches); if (token->fullword) { for_each_match_area_safe(area, ¶ms->main_areas, next) { /* Validation de l'octet précédent, s'il existe */ if (area->start > params->content_start) { init_vmpa(&pos, area->start - 1, VMPA_NO_VIRTUAL); byte = g_binary_content_get_raw_access(params->content, &pos, 1); if (isalnum(*byte)) { del_match_area(area, ¶ms->main_areas); assert(¶ms->main_count > 0); params->main_count--; continue; } } /* Validation de l'octet suivant, s'il existe */ if (area->end < params->content_end) { init_vmpa(&pos, area->end, VMPA_NO_VIRTUAL); byte = g_binary_content_get_raw_access(params->content, &pos, 1); if (isalnum(*byte)) { del_match_area(area, ¶ms->main_areas); assert(¶ms->main_count > 0); params->main_count--; continue; } } } } g_scan_bytes_matches_set_list(matches, params->main_areas, params->main_count); } /****************************************************************************** * * * Paramètres : token = définition de la bribe à consulter. * * index = indice de la combinaison de modificateurs ciblée. * * * * Description : Retrouve l'origine d'une correspondance à partir d'un indice.* * * * Retour : Version humainement lisible de la combinaison gagnante. * * * * Remarques : - * * * ******************************************************************************/ char *g_bytes_token_get_modifier_path(const GBytesToken *token, size_t index) { char *result; /* Combinaison à retourner */ if (G_IS_SCAN_TOKEN_NODE_PLAIN(token->root)) result = g_scan_token_node_plain_get_modifier_path(G_SCAN_TOKEN_NODE_PLAIN(token->root), index); else result = NULL; return result; } /* ---------------------------------------------------------------------------------- */ /* IMPLEMENTATION DES FONCTIONS DE CLASSE */ /* ---------------------------------------------------------------------------------- */ /****************************************************************************** * * * Paramètres : pattern = définition de motif à considérer. * * context = contexte de l'analyse à mener. * * fd = canal d'écriture. * * * * Description : Affiche un motif de recherche au format texte. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ static void g_bytes_token_output_to_text(const GBytesToken *pattern, GScanContext *context, int fd) { GScanMatches *matches; /* Correspondances établies */ if (g_bytes_token_is_private(pattern)) return; matches = g_scan_context_get_full_matches(context, G_SEARCH_PATTERN(pattern)); if (matches != NULL) { g_scan_matches_output_to_text(matches, fd); g_object_unref(G_OBJECT(matches)); } } /****************************************************************************** * * * Paramètres : pattern = définition de motif à considérer. * * context = contexte de l'analyse à mener. * * padding = éventuel bourrage initial à placer ou NULL. * * level = profondeur actuelle. * * fd = canal d'écriture. * * * * Description : Affiche un motif de recherche au format JSON. * * * * Retour : - * * * * Remarques : - * * * ******************************************************************************/ static void g_bytes_token_output_to_json(const GBytesToken *pattern, GScanContext *context, const sized_string_t *padding, unsigned int level, int fd) { GScanMatches *matches; /* Correspondances établies */ if (g_bytes_token_is_private(pattern)) return; matches = g_scan_context_get_full_matches(context, G_SEARCH_PATTERN(pattern)); if (matches != NULL) { g_scan_matches_output_to_json(matches, padding, level, fd); g_object_unref(G_OBJECT(matches)); } }