/* Chrysalide - Outil d'analyse de fichiers binaires
* plain.c - recherche d'une chaîne de caractères brute
*
* Copyright (C) 2023 Cyrille Bagard
*
* This file is part of Chrysalide.
*
* Chrysalide is free software; you can redistribute it and/or modify
* it under the terms of the GNU General Public License as published by
* the Free Software Foundation; either version 3 of the License, or
* (at your option) any later version.
*
* Chrysalide is distributed in the hope that it will be useful,
* but WITHOUT ANY WARRANTY; without even the implied warranty of
* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
* GNU General Public License for more details.
*
* You should have received a copy of the GNU General Public License
* along with Foobar. If not, see .
*/
#include "plain.h"
#include
#include
#include "plain-int.h"
/* ----------------------- RECHERCHE D'UN MOTIF DE TEXTE BRUT ----------------------- */
/* Initialise la classe des recherches de texte brut. */
static void g_scan_plain_bytes_class_init(GScanPlainBytesClass *klass);
/* Initialise une instance de recherche de texte brut. */
static void g_scan_plain_bytes_init(GScanPlainBytes *);
/* Supprime toutes les références externes. */
static void g_scan_plain_bytes_dispose(GScanPlainBytes *);
/* Procède à la libération totale de la mémoire. */
static void g_scan_plain_bytes_finalize(GScanPlainBytes *);
/* --------------------- IMPLEMENTATION DES FONCTIONS DE CLASSE --------------------- */
/* Affiche un motif de recherche au format texte. */
static void g_scan_plain_bytes_output_to_text(const GScanPlainBytes *, GScanContext *, int);
/* Affiche un motif de recherche au format JSON. */
static void g_scan_plain_bytes_output_to_json(const GScanPlainBytes *, GScanContext *, const sized_string_t *, unsigned int, int);
/* Inscrit la définition d'un motif dans un moteur de recherche. */
static bool g_scan_plain_bytes_enroll(GScanPlainBytes *, GScanContext *, GEngineBackend *, size_t);
/* Transforme les correspondances locales en trouvailles. */
static void g_scan_plain_bytes_check(const GScanPlainBytes *, GScanContext *, GBinContent *, pending_matches_t *);
/* ---------------------------------------------------------------------------------- */
/* RECHERCHE D'UN MOTIF DE TEXTE BRUT */
/* ---------------------------------------------------------------------------------- */
/* Indique le type défini pour une suite d'octets à retrouver dans un binaire. */
G_DEFINE_TYPE(GScanPlainBytes, g_scan_plain_bytes, G_TYPE_STRING_TOKEN);
/******************************************************************************
* *
* Paramètres : klass = classe à initialiser. *
* *
* Description : Initialise la classe des recherches de texte brut. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void g_scan_plain_bytes_class_init(GScanPlainBytesClass *klass)
{
GObjectClass *object; /* Autre version de la classe */
GSearchPatternClass *pattern; /* Version de classe ancêtre */
GStringTokenClass *token; /* Version de classe parente */
object = G_OBJECT_CLASS(klass);
object->dispose = (GObjectFinalizeFunc/* ! */)g_scan_plain_bytes_dispose;
object->finalize = (GObjectFinalizeFunc)g_scan_plain_bytes_finalize;
pattern = G_SEARCH_PATTERN_CLASS(klass);
pattern->to_text = (output_pattern_to_text_fc)g_scan_plain_bytes_output_to_text;
pattern->to_json = (output_pattern_to_json_fc)g_scan_plain_bytes_output_to_json;
token = G_STRING_TOKEN_CLASS(klass);
token->enroll = (enroll_token_fc)g_scan_plain_bytes_enroll;
token->check = (check_token_fc)g_scan_plain_bytes_check;
}
/******************************************************************************
* *
* Paramètres : bytes = instance à initialiser. *
* *
* Description : Initialise une instance de recherche de texte brut. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void g_scan_plain_bytes_init(GScanPlainBytes *bytes)
{
init_szstr(&bytes->orig);
bytes->modifier = NULL;
bytes->flags = SPBF_NONE;
bytes->raw = NULL;
bytes->atoms = NULL;
bytes->count = 0;
}
/******************************************************************************
* *
* Paramètres : bytes = instance d'objet GLib à traiter. *
* *
* Description : Supprime toutes les références externes. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void g_scan_plain_bytes_dispose(GScanPlainBytes *bytes)
{
g_clear_object(&bytes->modifier);
G_OBJECT_CLASS(g_scan_plain_bytes_parent_class)->dispose(G_OBJECT(bytes));
}
/******************************************************************************
* *
* Paramètres : bytes = instance d'objet GLib à traiter. *
* *
* Description : Procède à la libération totale de la mémoire. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void g_scan_plain_bytes_finalize(GScanPlainBytes *bytes)
{
size_t i; /* Boucle de parcours */
exit_szstr(&bytes->orig);
for (i = 0; i < bytes->count; i++)
exit_szstr(&bytes->raw[i]);
if (bytes->raw != NULL)
free(bytes->raw);
if (bytes->atoms != NULL)
free(bytes->atoms);
G_OBJECT_CLASS(g_scan_plain_bytes_parent_class)->finalize(G_OBJECT(bytes));
}
/******************************************************************************
* *
* Paramètres : text = texte brut à rechercher. *
* modifier = transformateur éventuel à solliciter. *
* flags = particularités à prendre en considération. *
* *
* Description : Construit un gestionnaire de recherche de texte brut. *
* *
* Retour : Mécanismes mis en place. *
* *
* Remarques : - *
* *
******************************************************************************/
GSearchPattern *g_scan_plain_bytes_new(const sized_binary_t *text, GScanTokenModifier *modifier, ScanPlainBytesFlags flags)
{
GSearchPattern *result; /* Structure à retourner */
result = g_object_new(G_TYPE_SCAN_PLAIN_BYTES, NULL);
if (!g_scan_plain_bytes_create(G_SCAN_PLAIN_BYTES(result), text, modifier, flags))
g_clear_object(&result);
return result;
}
/******************************************************************************
* *
* Paramètres : bytes = encadrement de motif à initialiser pleinement. *
* text = texte brut à rechercher. *
* modifier = transformateur éventuel à solliciter. *
* flags = particularités à prendre en considération. *
* *
* Description : Met en place un gestionnaire de recherche de texte brut. *
* *
* Retour : Bilan de l'opération. *
* *
* Remarques : - *
* *
******************************************************************************/
bool g_scan_plain_bytes_create(GScanPlainBytes *bytes, const sized_binary_t *text, GScanTokenModifier *modifier, ScanPlainBytesFlags flags)
{
bool result; /* Bilan à retourner */
result = true;
szstrdup(&bytes->orig, text);
if (modifier != NULL)
{
bytes->modifier = modifier;
g_object_ref(G_OBJECT(modifier));
}
bytes->flags = flags;
return result;
}
/* ---------------------------------------------------------------------------------- */
/* IMPLEMENTATION DES FONCTIONS DE CLASSE */
/* ---------------------------------------------------------------------------------- */
/******************************************************************************
* *
* Paramètres : pattern = définition de motif à considérer. *
* context = contexte de l'analyse à mener. *
* fd = canal d'écriture. *
* *
* Description : Affiche un motif de recherche au format texte. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void g_scan_plain_bytes_output_to_text(const GScanPlainBytes *pattern, GScanContext *context, int fd)
{
G_SEARCH_PATTERN_CLASS(g_scan_plain_bytes_parent_class)->to_text(G_SEARCH_PATTERN(pattern), context, fd);
}
/******************************************************************************
* *
* Paramètres : pattern = définition de motif à considérer. *
* context = contexte de l'analyse à mener. *
* padding = éventuel bourrage initial à placer ou NULL. *
* level = profondeur actuelle. *
* fd = canal d'écriture. *
* *
* Description : Affiche un motif de recherche au format JSON. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void g_scan_plain_bytes_output_to_json(const GScanPlainBytes *pattern, GScanContext *context, const sized_string_t *padding, unsigned int level, int fd)
{
G_SEARCH_PATTERN_CLASS(g_scan_plain_bytes_parent_class)->to_json(G_SEARCH_PATTERN(pattern), context, padding, level, fd);
/* TODO */
}
/******************************************************************************
* *
* Paramètres : bytes = définition de la bribe à enregistrer. *
* context = contexte de l'analyse à mener. *
* backend = moteur de recherche à préchauffer. *
* maxsize = taille max. des atomes (mise en commun optimisée). *
* *
* Description : Inscrit la définition d'un motif dans un moteur de recherche.*
* *
* Retour : Bilan de l'opération à renvoyer. *
* *
* Remarques : - *
* *
******************************************************************************/
static bool g_scan_plain_bytes_enroll(GScanPlainBytes *bytes, GScanContext *context, GEngineBackend *backend, size_t maxsize)
{
return false;
#if 0
bool result; /* Statut à retourner */
size_t i; /* Boucle de parcours #1 */
tracked_scan_atom_t atom; /* Atome identifié */
size_t letters; /* Nombre de lettres présentes */
size_t k; /* Boucle de parcours #2 */
size_t extra_count; /* Quantité pour l'exhaustivité*/
sized_binary_t *extra; /* Couverture supplémntaire */
size_t remaining; /* Quantité restant à traiter */
/* Génération d'une base de chaînes à couvrir */
if (bytes->modifier == NULL)
{
bytes->raw = malloc(sizeof(sized_binary_t));
bytes->count = 1;
szstrdup(&bytes[0].raw[0], &bytes->orig);
result = true;
}
else
result = g_scan_token_modifier_transform(bytes->modifier, &bytes->orig, &bytes->raw, &bytes->count);
if (!result)
goto exit;
/* Préparation pour la mémorisation des atomes */
bytes->atoms = malloc(bytes->count * sizeof(tracked_scan_atom_t));
/* Recherche des atomes */
for (i = 0; i < bytes->count; i++)
{
if (bytes->flags & SPBF_CASE_INSENSITIVE)
{
find_best_atom(&bytes->raw[i], maxsize, &atom, &letters);
if (letters == 0)
bytes->atoms[i] = atom;
/* Insertion des combinaisons pour couvrir toutes les casses */
else
{
for (k = 0, extra_count = 1; k < letters; k++, extra_count *= 2)
;
extra = make_atoms_case_insensitive(&bytes->raw[i], extra_count);
remaining = bytes->count - i - 1;
bytes->count += (extra_count - 1);
bytes->raw = realloc(bytes->raw, bytes->count * sizeof(sized_binary_t));
memmove(&bytes->raw[i + extra_count], &bytes->raw[i + 1], remaining * sizeof(sized_binary_t));
for (k = 0; k < extra_count; k++)
bytes->raw[i + k] = extra[k];
free(extra);
bytes->atoms = realloc(bytes->raw, bytes->count * sizeof(tracked_scan_atom_t));
for (k = 0; k < extra_count; k++)
bytes->atoms[i + k] = atom;
i += extra_count - 1;
}
}
else
find_best_atom(&bytes->raw[i], maxsize, &bytes->atoms[i], &letters);
}
/* Enregistrements en masse */
for (i = 0; i < bytes->count && result; i++)
result = enroll_prepared_atom(&bytes->raw[i], context, backend, &bytes->atoms[i]);
exit:
return result;
#endif
}
/******************************************************************************
* *
* Paramètres : bytes = définition de la bribe à manipuler. *
* context = contexte de l'analyse à mener. *
* content = accès au contenu brut pour vérifications (optim.) *
* matches = suivi des correspondances à consolider. *
* *
* Description : Transforme les correspondances locales en trouvailles. *
* *
* Retour : - *
* *
* Remarques : - *
* *
******************************************************************************/
static void g_scan_plain_bytes_check(const GScanPlainBytes *bytes, GScanContext *context, GBinContent *content, pending_matches_t *matches)
{
#if 0
size_t i; /* Boucle de parcours #1 */
const sized_binary_t *raw; /* Données brutes d'origine */
const tracked_scan_atom_t *atom; /* Atome correspondant */
size_t count; /* Quantité de bribes trouvées */
const phys_t *found; /* Localisations des bribes */
size_t k; /* Boucle de parcours #2 */
phys_t start; /* Point de départ */
vmpa2t pos; /* Position dans les données */
const bin_t *ptr; /* Accès aux données brutes */
int ret; /* Bilan d'une comparaison */
for (i = 0; i < bytes->count; i++)
{
raw = &bytes->raw[i];
atom = &bytes->atoms[i];
found = g_scan_context_get_atom_matches(context, atom->pid, &count);
for (k = 0; k < count; k++)
{
start = found[k] - atom->pos;
init_vmpa(&pos, start, VMPA_NO_VIRTUAL);
/* Validation du contenu avant l'atome */
if (atom->pos > 0)
{
ptr = g_binary_content_get_raw_access(content, &pos, atom->pos);
ret = memcmp(raw->data, ptr, atom->pos);
if (ret != 0) continue;
}
/* Validation du contenu après l'atome */
if (atom->rem > 0)
{
advance_vmpa(&pos, atom->len);
ptr = g_binary_content_get_raw_access(content, &pos, atom->rem);
ret = memcmp(raw->data + atom->pos + atom->len, ptr, atom->rem);
if (ret != 0) continue;
}
/* Mémorisation de la correspondance */
add_pending_matches(matches, start, raw->len);
}
}
#endif
}