/* Chrysalide - Outil d'analyse de fichiers binaires
 * bytes.h - sauvegarde d'une correspondance identifiée de suite d'octets
 *
 * Copyright (C) 2022 Cyrille Bagard
 *
 *  This file is part of Chrysalide.
 *
 *  Chrysalide is free software; you can redistribute it and/or modify
 *  it under the terms of the GNU General Public License as published by
 *  the Free Software Foundation; either version 3 of the License, or
 *  (at your option) any later version.
 *
 *  Chrysalide is distributed in the hope that it will be useful,
 *  but WITHOUT ANY WARRANTY; without even the implied warranty of
 *  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 *  GNU General Public License for more details.
 *
 *  You should have received a copy of the GNU General Public License
 *  along with Foobar.  If not, see <http://www.gnu.org/licenses/>.
 */


#include "bytes.h"


#include <assert.h>
#include <ctype.h>
#include <stdio.h>


#include "bytes-int.h"
#include "../patterns/token.h"
#include "../../../common/cpp.h"
#include "../../../core/logs.h"



/* -------------------- CONSERVATION DE CORRESPONDANCES ETABLIES -------------------- */


/* Initialise la classe des séries de correspondances d'octets. */
static void g_scan_bytes_matches_class_init(GScanBytesMatchesClass *);

/* Initialise une instance de série de correspondances trouvées. */
static void g_scan_bytes_matches_init(GScanBytesMatches *);

/* Supprime toutes les références externes. */
static void g_scan_bytes_matches_dispose(GScanBytesMatches *);

/* Procède à la libération totale de la mémoire. */
static void g_scan_bytes_matches_finalize(GScanBytesMatches *);



/* --------------------- IMPLEMENTATION DES FONCTIONS DE CLASSE --------------------- */


/* Dénombre les correspondances enregistrées pour un motif. */
static size_t g_scan_bytes_matches_count(const GScanBytesMatches *);

/* Affiche une correspondance au format texte. */
static void g_scan_bytes_matches_output_to_text(const GScanBytesMatches *, int);

/* Affiche une correspondance au format JSON. */
static void g_scan_bytes_matches_output_to_json(const GScanBytesMatches *, const sized_string_t *, unsigned int, int);



/* ---------------------------------------------------------------------------------- */
/*                      CONSERVATION DE CORRESPONDANCES ETABLIES                      */
/* ---------------------------------------------------------------------------------- */


/* Indique le type défini pour une série de correspondances d'octets identifiées. */
G_DEFINE_TYPE(GScanBytesMatches, g_scan_bytes_matches, G_TYPE_SCAN_MATCHES);


/******************************************************************************
*                                                                             *
*  Paramètres  : klass = classe à initialiser.                                *
*                                                                             *
*  Description : Initialise la classe des séries de correspondances d'octets. *
*                                                                             *
*  Retour      : -                                                            *
*                                                                             *
*  Remarques   : -                                                            *
*                                                                             *
******************************************************************************/

static void g_scan_bytes_matches_class_init(GScanBytesMatchesClass *klass)
{
    GObjectClass *object;                   /* Autre version de la classe  */
    GScanMatchesClass *matches;             /* Version parente de la classe*/

    object = G_OBJECT_CLASS(klass);

    object->dispose = (GObjectFinalizeFunc/* ! */)g_scan_bytes_matches_dispose;
    object->finalize = (GObjectFinalizeFunc)g_scan_bytes_matches_finalize;

    matches = G_SCAN_MATCHES_CLASS(klass);

    matches->count = (count_scan_matches_fc)g_scan_bytes_matches_count;

    matches->to_text = (output_scan_matches_to_text_fc)g_scan_bytes_matches_output_to_text;
    matches->to_json = (output_scan_matches_to_json_fc)g_scan_bytes_matches_output_to_json;

}


/******************************************************************************
*                                                                             *
*  Paramètres  : matches = instance à initialiser.                            *
*                                                                             *
*  Description : Initialise une instance de série de correspondances trouvées.*
*                                                                             *
*  Retour      : -                                                            *
*                                                                             *
*  Remarques   : -                                                            *
*                                                                             *
******************************************************************************/

static void g_scan_bytes_matches_init(GScanBytesMatches *matches)
{
    matches->areas = NULL;
    matches->count = 0;

}


/******************************************************************************
*                                                                             *
*  Paramètres  : matches = instance d'objet GLib à traiter.                   *
*                                                                             *
*  Description : Supprime toutes les références externes.                     *
*                                                                             *
*  Retour      : -                                                            *
*                                                                             *
*  Remarques   : -                                                            *
*                                                                             *
******************************************************************************/

static void g_scan_bytes_matches_dispose(GScanBytesMatches *matches)
{
    G_OBJECT_CLASS(g_scan_bytes_matches_parent_class)->dispose(G_OBJECT(matches));

}


/******************************************************************************
*                                                                             *
*  Paramètres  : matches = instance d'objet GLib à traiter.                   *
*                                                                             *
*  Description : Procède à la libération totale de la mémoire.                *
*                                                                             *
*  Retour      : -                                                            *
*                                                                             *
*  Remarques   : -                                                            *
*                                                                             *
******************************************************************************/

static void g_scan_bytes_matches_finalize(GScanBytesMatches *matches)
{
    G_OBJECT_CLASS(g_scan_bytes_matches_parent_class)->finalize(G_OBJECT(matches));

}


/******************************************************************************
*                                                                             *
*  Paramètres  : -                                                            *
*                                                                             *
*  Description : Crée un suivi pour série de correspondances avec des octets. *
*                                                                             *
*  Retour      : Correspondance mise en place.                                *
*                                                                             *
*  Remarques   : -                                                            *
*                                                                             *
******************************************************************************/

GScanMatches *g_scan_bytes_matches_new(void)
{
    GScanMatches *result;                   /* Structure à retourner       */

    result = g_object_new(G_TYPE_SCAN_BYTES_MATCHES, NULL);

    return result;

}


/******************************************************************************
*                                                                             *
*  Paramètres  : matches = suivi de correspondances à manipuler.              *
*                list    = correspondances établies à mémoriser.              *
*                count   = taille de cette liste.                             *
*                                                                             *
*  Description : Intègre une liste de correspondances vérifiées.              *
*                                                                             *
*  Retour      : -                                                            *
*                                                                             *
*  Remarques   : -                                                            *
*                                                                             *
******************************************************************************/

void g_scan_bytes_matches_set_list(GScanBytesMatches *matches, match_area_t *list, size_t count)
{
    matches->areas = list;

    matches->count = count;

}


/******************************************************************************
*                                                                             *
*  Paramètres  : matches = suivi de correspondances à consulter.              *
*                index   = indice de la correspondance recherchée.            *
*                                                                             *
*  Description : Fournit les informations relatives à une correspondance.     *
*                                                                             *
*  Retour      : Propritétés de la correspondance visée ou NULL pour un échec.*
*                                                                             *
*  Remarques   : -                                                            *
*                                                                             *
******************************************************************************/

const match_area_t *g_scan_bytes_matches_get(const GScanBytesMatches *matches, size_t index)
{
    const match_area_t *result;             /* Pointeur à retourner        */

    for_each_match_area(result, matches->areas)
    {
        if (index == 0)
            break;
    }

    assert(index == 0);

    return result;

}


/******************************************************************************
*                                                                             *
*  Paramètres  : matches = informations de correspondance à consulter.        *
*                index   = indice de la correspondance visée.                 *
*                start   = position de départ d'un motif détecté. [OUT]       *
*                end     = position d'arrivée d'un motif détecté. [OUT]       *
*                                                                             *
*  Description : Indique la localisation d'une correspondance établie.        *
*                                                                             *
*  Retour      : Taille mesurée de la correspondance.                         *
*                                                                             *
*  Remarques   : -                                                            *
*                                                                             *
******************************************************************************/

phys_t g_scan_bytes_matches_get_location(const GScanBytesMatches *matches, size_t index, phys_t *start, phys_t *end)
{
    phys_t result;                          /* Taille à retourner          */

    result = 0;

    /*
    result = match->len;

    *start = match->start;
    *end = match->start + result;
    */

    return result;

}


/******************************************************************************
*                                                                             *
*  Paramètres  : matches = informations de correspondance à consulter.        *
*                                                                             *
*  Description : Retrouve l'origine d'une correspondance à partir d'un indice.*
*                                                                             *
*  Retour      : Version humainement lisible de la combinaison gagnante.      *
*                                                                             *
*  Remarques   : -                                                            *
*                                                                             *
******************************************************************************/

char *g_scan_bytes_matches_get_modifier_path(const GScanBytesMatches *matches)
{
    char *result;                           /* Combinaison à retourner     */
    GBytesToken *pattern;                   /* Autre version du motif      */

    result = NULL;

    /*

    if (match->has_mod_path)
    {
        pattern = G_BYTES_TOKEN(G_SCAN_MATCH(match)->source);
        result = g_bytes_token_get_modifier_path(pattern, match->mod_path_index);
    }

    else
        result = NULL;
    */

    return result;

}



/* ---------------------------------------------------------------------------------- */
/*                       IMPLEMENTATION DES FONCTIONS DE CLASSE                       */
/* ---------------------------------------------------------------------------------- */


/******************************************************************************
*                                                                             *
*  Paramètres  : matches = suivi de correspondances à consulter.              *
*                                                                             *
*  Description : Dénombre les correspondances enregistrées pour un motif.     *
*                                                                             *
*  Retour      : Quantité de correspondances établies.                        *
*                                                                             *
*  Remarques   : -                                                            *
*                                                                             *
******************************************************************************/

static size_t g_scan_bytes_matches_count(const GScanBytesMatches *matches)
{
    size_t result;                          /* Quantité à retourner        */

    result = matches->count;

    return result;

}


/******************************************************************************
*                                                                             *
*  Paramètres  : matches = définition de correspondance à manipuler.          *
*                fd      = canal d'écriture.                                  *
*                                                                             *
*  Description : Affiche une correspondance au format texte.                  *
*                                                                             *
*  Retour      : -                                                            *
*                                                                             *
*  Remarques   : -                                                            *
*                                                                             *
******************************************************************************/

static void g_scan_bytes_matches_output_to_text(const GScanBytesMatches *matches, int fd)
{
    GScanMatches *base;                     /* Lien vers les infos de base */
    GBinContent *content;                   /* Contenu binaire analysé     */
    const char *name;                       /* Désignation du motif ciblé  */
    match_area_t *iter;                     /* Boucle de parcours #1       */
    char value[2 + ULLONG_MAXLEN];          /* Impression de la position   */
    int ret;                                /* Bilan d'une conversion      */
    vmpa2t pos;                             /* Tête de lecture             */
    phys_t len;                             /* Taille d'une correspondance */
    const bin_t *data;                      /* Accès aux données brutes    */
    phys_t k;                               /* Boucle de parcours #2       */

    base = G_SCAN_MATCHES(matches);

    content = g_scan_context_get_content(base->context);

    name = g_search_pattern_get_name(base->source);

    for_each_match_area(iter, matches->areas)
    {
        /* Position dans le binaire (hexadécimal) */

        ret = snprintf(value, ULLONG_MAXLEN, "0x%llx", (unsigned long long)iter->start);

        if (ret > 0)
            write(fd, value, ret);

        else
        {
            log_simple_message(LMT_EXT_ERROR, "Error while converting offset to hex!");
            write(fd, "\"<error>\"", 9);
        }

        write(fd, ":", 1);

        /* Affichage de la désignation */

        write(fd, "$", 1);

        /**
         * Les fonctionnalités Yara d'origine autorisent les variables anonymes '$'.
         *
         * Cette absence de nom est supportée ici.
         */

        if (name != NULL)
            write(fd, name, strlen(name));

        write(fd, ": ", 2);

        /* Affichage du contenu */

        init_vmpa(&pos, iter->start, VMPA_NO_VIRTUAL);

        len = iter->end - iter->start;

        data = g_binary_content_get_raw_access(content, &pos, len);
        assert(data != NULL);

        for (k = 0; k < len; k++)
        {
            if (isprint(data[k]))
                write(fd, &data[k], 1);

            else
            {
                write(fd, "\\x", 2);

                ret = snprintf(value, ULLONG_MAXLEN, "%02hhx", data[k]);

                if (ret > 0)
                {
                    assert(ret == 2);
                    write(fd, value, ret);
                }

                else
                {
                    log_simple_message(LMT_EXT_ERROR, "Error while converting data!");
                    write(fd, "??", 2);
                }

            }

        }

        write(fd, "\n", 1);

    }

    g_object_unref(G_OBJECT(content));

}


/******************************************************************************
*                                                                             *
*  Paramètres  : matches = définition de correspondance à manipuler.          *
*                padding = éventuel bourrage initial à placer ou NULL.        *
*                level   = profondeur actuelle.                               *
*                fd      = canal d'écriture.                                  *
*                                                                             *
*  Description : Affiche une correspondance au format JSON.                   *
*                                                                             *
*  Retour      : -                                                            *
*                                                                             *
*  Remarques   : -                                                            *
*                                                                             *
******************************************************************************/

static void g_scan_bytes_matches_output_to_json(const GScanBytesMatches *matches, const sized_string_t *padding, unsigned int level, int fd)
{
    unsigned int i;                         /* Boucle de parcours #1       */
    char value[4 + ULLONG_MAXLEN];          /* Impression de la position   */
    int ret;                                /* Bilan d'une conversion      */
    GScanMatches *base;                     /* Lien vers les infos de base */
    GBinContent *content;                   /* Contenu binaire analysé     */
    match_area_t *iter;                     /* Boucle de parcours #1       */
    vmpa2t pos;                             /* Tête de lecture             */
    phys_t len;                             /* Taille d'une correspondance */
    const bin_t *data;                      /* Accès aux données brutes    */
    phys_t k;                               /* Boucle de parcours #2       */

    /* Nombre de correspondances */

    for (i = 0; i < level; i++)
        write(fd, padding->data, padding->len);

    write(fd, "\"match_count\": ", 15);

    ret = snprintf(value, ULLONG_MAXLEN, "%zu", matches->count);

    if (ret > 0)
        write(fd, value, ret);

    else
    {
        log_simple_message(LMT_EXT_ERROR, "Error while converting value!");
        write(fd, "null", 4);
    }

    write(fd, ",\n", 2);

    /* Détail des correspondances */

    for (i = 0; i < level; i++)
        write(fd, padding->data, padding->len);

    write(fd, "\"matches\": [\n", 13);

    base = G_SCAN_MATCHES(matches);

    content = g_scan_context_get_content(base->context);

    for_each_match_area(iter, matches->areas)
    {
        /* Marqueur de début */

        for (i = 0; i < (level + 1); i++)
            write(fd, padding->data, padding->len);

        write(fd, "{\n", 2);

        /* Position dans le binaire (décimal) */

        for (i = 0; i < (level + 2); i++)
            write(fd, padding->data, padding->len);

        write(fd, "\"offset\": ", 10);

        ret = snprintf(value, ULLONG_MAXLEN, "%llu", (unsigned long long)iter->start);

        if (ret > 0)
            write(fd, value, ret);

        else
        {
            log_simple_message(LMT_EXT_ERROR, "Error while converting offset!");
            write(fd, "null", 4);
        }

        write(fd, ",\n", 2);

        /* Position dans le binaire (hexadécimal) */

        for (i = 0; i < (level + 2); i++)
            write(fd, padding->data, padding->len);

        write(fd, "\"offset_hex\": ", 14);

        ret = snprintf(value, ULLONG_MAXLEN, "\"0x%llx\"", (unsigned long long)iter->start);

        if (ret > 0)
            write(fd, value, ret);

        else
        {
            log_simple_message(LMT_EXT_ERROR, "Error while converting offset to hex!");
            write(fd, "null", 4);
        }

        write(fd, ",\n", 2);

        /* Affichage du contenu brut */

        for (i = 0; i < (level + 2); i++)
            write(fd, padding->data, padding->len);

        write(fd, "\"content\": \"", 12);

        init_vmpa(&pos, iter->start, VMPA_NO_VIRTUAL);

        len = iter->end - iter->start;

        data = g_binary_content_get_raw_access(content, &pos, len);
        assert(data != NULL);

        for (k = 0; k < len; k++)
        {
            if (data[k] == '\\')
                write(fd, "\\\\", 2);

            else if (isprint(data[k]))
                write(fd, &data[k], 1);

            else
            {
                write(fd, "\\u", 2);

                /**
                 * Cf. https://datatracker.ietf.org/doc/html/rfc8259#section-7
                 */
                ret = snprintf(value, ULLONG_MAXLEN, "%04hhx", data[k]);

                if (ret > 0)
                {
                    assert(ret == 4);
                    write(fd, value, ret);
                }

                else
                {
                    log_simple_message(LMT_EXT_ERROR, "Error while converting data!");
                    write(fd, "??", 2);
                }

            }

        }

        write(fd, "\",\n", 3);

        /* Affichage du contenu en version humainement lisible */

        for (i = 0; i < (level + 2); i++)
            write(fd, padding->data, padding->len);

        write(fd, "\"content_str\": \"", 16);

        init_vmpa(&pos, iter->start, VMPA_NO_VIRTUAL);

        data = g_binary_content_get_raw_access(content, &pos, len);
        assert(data != NULL);

        for (k = 0; k < len; k++)
        {
            if (data[k] == '\\')
                write(fd, "\\\\", 2);

            else if (isprint(data[k]))
                write(fd, &data[k], 1);

            else
            {
                write(fd, "\\\\x", 3);

                ret = snprintf(value, ULLONG_MAXLEN, "%02hhx", data[k]);

                if (ret > 0)
                {
                    assert(ret == 2);
                    write(fd, value, ret);
                }

                else
                {
                    log_simple_message(LMT_EXT_ERROR, "Error while converting data!");
                    write(fd, "??", 2);
                }

            }

        }

        write(fd, "\",\n", 3);

        /* Affichage du contenu brut */

        for (i = 0; i < (level + 2); i++)
            write(fd, padding->data, padding->len);

        write(fd, "\"length\": ", 10);

        ret = snprintf(value, ULLONG_MAXLEN, "%llu", (unsigned long long)len);

        if (ret > 0)
            write(fd, value, ret);

        else
        {
            log_simple_message(LMT_EXT_ERROR, "Error while converting data!");
            write(fd, "-1", 2);
        }

        write(fd, ",\n", 2);

        /* Affichage du contenu brut (hexadécimal) */

        for (i = 0; i < (level + 2); i++)
            write(fd, padding->data, padding->len);

        write(fd, "\"length_hex\": ", 14);

        ret = snprintf(value, ULLONG_MAXLEN, "\"0x%llx\"", (unsigned long long)len);

        if (ret > 0)
            write(fd, value, ret);

        else
        {
            log_simple_message(LMT_EXT_ERROR, "Error while converting data!");
            write(fd, "\"0xffffffffffffffff\"", 20);
        }

        write(fd, "\n", 1);

        /* Marqueur de fin */

        for (i = 0; i < (level + 1); i++)
            write(fd, padding->data, padding->len);

        if (is_last_match_area(iter, matches->areas))
            write(fd, "}\n", 2);
        else
            write(fd, "},\n", 3);

    }

    g_object_unref(G_OBJECT(content));

    for (i = 0; i < level; i++)
        write(fd, padding->data, padding->len);

    write(fd, "]\n", 2);

}