diff options
author | Cyrille Bagard <nocbos@gmail.com> | 2018-12-12 06:21:51 (GMT) |
---|---|---|
committer | Cyrille Bagard <nocbos@gmail.com> | 2018-12-12 06:21:51 (GMT) |
commit | 5c656e5bd946498400f44d696e81175437a7e9eb (patch) | |
tree | 8bc4bbffc9c87f597934fc4ac41a4d3392808d49 | |
parent | 6a90f3e67610b5a32cc701730773574ad36ae99c (diff) |
Loaded MUTF-8 strings from Dex pools.
-rw-r--r-- | plugins/dex/dex-int.c | 63 |
1 files changed, 61 insertions, 2 deletions
diff --git a/plugins/dex/dex-int.c b/plugins/dex/dex-int.c index 287ec7a..843db32 100644 --- a/plugins/dex/dex-int.c +++ b/plugins/dex/dex-int.c @@ -32,6 +32,7 @@ #include <common/endianness.h> +#include <common/utf8.h> #include <plugins/dalvik/pseudo/identifiers.h> @@ -160,6 +161,14 @@ bool read_dex_string_data_item(const GDexFormat *format, vmpa2t *pos, vmpa2t *in { bool result; /* Bilan à retourner */ GBinContent *content; /* Contenu binaire à lire */ + size_t consumed; /* Taille effective des données*/ + phys_t fullsize; /* Taille complète du contenu */ + vmpa2t old; /* Sauvegarde de position */ + uleb128_t i; /* Boucle de parcours */ + phys_t maxsize; /* Taille maximale d'une unité */ + const bin_t *tmp; /* Zone de parcours temporaire */ + size_t used; /* Quantié d'octets consommés */ + unichar_t ch; /* Unité de code MUTF-8 */ content = G_BIN_FORMAT(format)->content; @@ -170,8 +179,58 @@ bool read_dex_string_data_item(const GDexFormat *format, vmpa2t *pos, vmpa2t *in if (inter != NULL) copy_vmpa(inter, pos); - str_data->data = g_binary_content_get_raw_access(content, pos, str_data->utf16_size); - result = (str_data->data != NULL); + consumed = 0; + + fullsize = g_binary_content_compute_size(content); + + copy_vmpa(&old, pos); + + for (i = 0; i < (str_data->utf16_size + 1) && result; i++) + { + if (i > 0) + { + copy_vmpa(pos, &old); + advance_vmpa(pos, consumed); + } + + /** + * Théoriquement, les 4 octets maximaux pour l'encodage ne sont pas + * forcément tous disponibles... + * + * Il est alors possible d'obtenir une erreur pour un caractère + * légitime d'un octet. + * + * On borne donc la taille de la prochaine unité MUTF-8. + */ + + maxsize = fullsize - get_phy_addr(pos); + + if (maxsize > 4) + maxsize = 4; + + tmp = g_binary_content_get_raw_access(content, pos, maxsize); + + ch = decode_utf8_char(tmp, maxsize, &used); + + if (IS_UTF8_ERROR(ch)) + result = false; + + else + consumed += used; + + if (i == str_data->utf16_size) + result = (ch == 0x0); + + } + + copy_vmpa(pos, &old); + + if (result) + { + str_data->data = g_binary_content_get_raw_access(content, pos, consumed); + result = (str_data->data != NULL); + } + } return result; |