Discussion:
[HS] Récupération contacts dans Gmail
(trop ancien pour répondre)
Alf92
2019-11-20 17:28:20 UTC
Permalink
Bonjour,

Pour une personne qui a mis un gros bazar dans son ordi je cherche à
récupérer les contacts et plus précisément les adresses mails.

La seule source dont je dispose c'est l'historique de ses mails depuis
5 ans dans un compte Gmail.

Question : comment récupérer les adresses mails de tous les mails reçus
pour les inclure dans le carnet d'adresses de Gmail ?
Un module complémentaire Gmail serait faire ça...?

Merci

FU2 : fr.comp.divers
efji
2019-11-20 18:45:12 UTC
Permalink
Post by Alf92
Bonjour,
Pour une personne qui a mis un gros bazar dans son ordi je cherche à
récupérer les contacts et plus précisément les adresses mails.
La seule source dont je dispose c'est l'historique de ses mails depuis
5 ans dans un compte Gmail.
Tu peux préciser ce que tu entends par "historique de ses mails dans un
compte gmail" ? Elle a tous ses mail mais a perdu ses contacts ?

Si c'est le cas tu peux utiliser tout simplement thunderbird: il
collecte toutes les adresses automatiquement dans ton courrier dans un
adressbook appelé "collected addresses". J'en ai 2053 actuellement dans
le mien :)
--
F.J.
Alf92
2019-11-20 23:50:14 UTC
Permalink
Post by efji
Post by Alf92
Bonjour,
Pour une personne qui a mis un gros bazar dans son ordi je cherche à
récupérer les contacts et plus précisément les adresses mails.
La seule source dont je dispose c'est l'historique de ses mails depuis
5 ans dans un compte Gmail.
Tu peux préciser ce que tu entends par "historique de ses mails dans un
compte gmail" ? Elle a tous ses mail mais a perdu ses contacts ?
oui c'est ça
les mails ont été importés depuis un mail Orange, mais pas les
contacts.
Post by efji
Si c'est le cas tu peux utiliser tout simplement thunderbird: il
collecte toutes les adresses automatiquement dans ton courrier dans un
adressbook appelé "collected addresses". J'en ai 2053 actuellement dans
le mien :)
j'installe Thunderbird.
je le paramètre en POP3 ou en IMAP ?
je collecte tous les contacts.
j'exporte en .CSV
j'importe le .CSV dans Gmail

c'est bien ça ?
pehache
2019-11-21 09:42:52 UTC
Permalink
Post by Alf92
Post by efji
Post by Alf92
Bonjour,
Pour une personne qui a mis un gros bazar dans son ordi je cherche à
récupérer les contacts et plus précisément les adresses mails.
La seule source dont je dispose c'est l'historique de ses mails depuis
5 ans dans un compte Gmail.
Tu peux préciser ce que tu entends par "historique de ses mails dans un
compte gmail" ? Elle a tous ses mail mais a perdu ses contacts ?
oui c'est ça
les mails ont été importés depuis un mail Orange, mais pas les
contacts.
Post by efji
Si c'est le cas tu peux utiliser tout simplement thunderbird: il
collecte toutes les adresses automatiquement dans ton courrier dans un
adressbook appelé "collected addresses". J'en ai 2053 actuellement dans
le mien :)
j'installe Thunderbird.
je le paramètre en POP3 ou en IMAP ?
je collecte tous les contacts.
Autant que je sache ça ne marchera pas aussi simplement. Thunderbird
collecte automatiquement les adresses, oui, mais sur les mails envoyés
(***@labassijissui.com t'envoies un mail, tu lui réponds, hop son
adresse est ajoutée dans les contacts si elle ne l'était pas déjà...
mais il faut lui répondre).

Par contre Thunderbird stocke les mails en local en format texte, donc il
est possible d'extraire les adresses avec un traitement approprié de ces
fichier et de créer un CSV à partir de ça. Avec les outils unix je
saurais faire (en tatonnant), avec Windows moins.
Alf92
2019-11-21 10:35:13 UTC
Permalink
Post by pehache
Post by Alf92
Post by efji
Post by Alf92
Bonjour,
Pour une personne qui a mis un gros bazar dans son ordi je cherche à
récupérer les contacts et plus précisément les adresses mails.
La seule source dont je dispose c'est l'historique de ses mails depuis
5 ans dans un compte Gmail.
Tu peux préciser ce que tu entends par "historique de ses mails dans un
compte gmail" ? Elle a tous ses mail mais a perdu ses contacts ?
oui c'est ça
les mails ont été importés depuis un mail Orange, mais pas les
contacts.
Post by efji
Si c'est le cas tu peux utiliser tout simplement thunderbird: il
collecte toutes les adresses automatiquement dans ton courrier dans un
adressbook appelé "collected addresses". J'en ai 2053 actuellement dans
le mien :)
j'installe Thunderbird.
je le paramètre en POP3 ou en IMAP ?
je collecte tous les contacts.
Autant que je sache ça ne marchera pas aussi simplement. Thunderbird
collecte automatiquement les adresses, oui, mais sur les mails envoyés
adresse est ajoutée dans les contacts si elle ne l'était pas déjà...
mais il faut lui répondre).
Ok
ça Gmail sait le faire aussi
donc finalement pas la solution
Post by pehache
Par contre Thunderbird stocke les mails en local en format texte, donc il
est possible d'extraire les adresses avec un traitement approprié de ces
fichier et de créer un CSV à partir de ça. Avec les outils unix je
saurais faire (en tatonnant), avec Windows moins.
ça devient velu.
de plus il faut récupérer le nom du contact en plus du mail.
il y a une quantité énorme de mail (plus de 10000 ?).

quel outil permettrait de faire l'extration à partir d'un texte ?
pehache
2019-11-21 11:30:11 UTC
Permalink
Post by Alf92
Post by pehache
Post by Alf92
Post by efji
Post by Alf92
Bonjour,
Pour une personne qui a mis un gros bazar dans son ordi je cherche à
récupérer les contacts et plus précisément les adresses mails.
La seule source dont je dispose c'est l'historique de ses mails depuis
5 ans dans un compte Gmail.
Tu peux préciser ce que tu entends par "historique de ses mails dans un
compte gmail" ? Elle a tous ses mail mais a perdu ses contacts ?
oui c'est ça
les mails ont été importés depuis un mail Orange, mais pas les
contacts.
Post by efji
Si c'est le cas tu peux utiliser tout simplement thunderbird: il
collecte toutes les adresses automatiquement dans ton courrier dans un
adressbook appelé "collected addresses". J'en ai 2053 actuellement dans
le mien :)
j'installe Thunderbird.
je le paramètre en POP3 ou en IMAP ?
je collecte tous les contacts.
Autant que je sache ça ne marchera pas aussi simplement. Thunderbird
collecte automatiquement les adresses, oui, mais sur les mails envoyés
adresse est ajoutée dans les contacts si elle ne l'était pas déjà...
mais il faut lui répondre).
Ok
ça Gmail sait le faire aussi
donc finalement pas la solution
Post by pehache
Par contre Thunderbird stocke les mails en local en format texte, donc il
est possible d'extraire les adresses avec un traitement approprié de ces
fichier et de créer un CSV à partir de ça. Avec les outils unix je
saurais faire (en tatonnant), avec Windows moins.
ça devient velu.
de plus il faut récupérer le nom du contact en plus du mail.
il y a une quantité énorme de mail (plus de 10000 ?).
quel outil permettrait de faire l'extration à partir d'un texte ?
En ligne de commande unix : l'utilitaire "grep". En se plaçant dans le
dossier qui contient les mails et taper la commande :
grep "From:" * > ~/Desktop/liste1.txt

ça créerait sur le bureau un fichier liste1.txt qui contiendrait un
contact par ligne sous la forme (avec des doublons) :
From: nom du contact <email du contact>

En ligne de commande Windows PowerShell : l'utilitaire "findstr" (mais je
ne pratique pas)


A partir de là on peut continuer avec les outils unix (cut, sed, awk...)
pour convertir ce fichier en un fichier .csv approprié à importer dans
Gmail, mais on peut aussi le faire avec un tableur (Excel, LO, peu
importe) en important le fichier liste1.txt puis en utilisant le menu
"Text to Columns" (qui est d'ailleurs implicitement appelé à l'ouveture
d'un fichier texte). Pour savoir le format CSV attendu par Gmail, faire un
essai d'exportation CSV de contacts déjà dans Gmail.
Alf92
2019-11-21 15:13:38 UTC
Permalink
Post by pehache
Post by Alf92
Post by pehache
Post by Alf92
Post by efji
Post by Alf92
Bonjour,
Pour une personne qui a mis un gros bazar dans son ordi je cherche à
récupérer les contacts et plus précisément les adresses mails.
La seule source dont je dispose c'est l'historique de ses mails depuis
5 ans dans un compte Gmail.
Tu peux préciser ce que tu entends par "historique de ses mails dans un
compte gmail" ? Elle a tous ses mail mais a perdu ses contacts ?
oui c'est ça
les mails ont été importés depuis un mail Orange, mais pas les
contacts.
Post by efji
Si c'est le cas tu peux utiliser tout simplement thunderbird: il
collecte toutes les adresses automatiquement dans ton courrier dans un
adressbook appelé "collected addresses". J'en ai 2053 actuellement dans
le mien :)
j'installe Thunderbird.
je le paramètre en POP3 ou en IMAP ?
je collecte tous les contacts.
Autant que je sache ça ne marchera pas aussi simplement. Thunderbird
collecte automatiquement les adresses, oui, mais sur les mails envoyés
adresse est ajoutée dans les contacts si elle ne l'était pas déjà...
mais il faut lui répondre).
Ok
ça Gmail sait le faire aussi
donc finalement pas la solution
Post by pehache
Par contre Thunderbird stocke les mails en local en format texte, donc il
est possible d'extraire les adresses avec un traitement approprié de ces
fichier et de créer un CSV à partir de ça. Avec les outils unix je
saurais faire (en tatonnant), avec Windows moins.
ça devient velu.
de plus il faut récupérer le nom du contact en plus du mail.
il y a une quantité énorme de mail (plus de 10000 ?).
quel outil permettrait de faire l'extration à partir d'un texte ?
En ligne de commande unix : l'utilitaire "grep". En se plaçant dans le
grep "From:" * > ~/Desktop/liste1.txt
avec plus de 10000 fichiers (pour un total de plus de 8Go) ça peux le
faire ?
Post by pehache
ça créerait sur le bureau un fichier liste1.txt qui contiendrait un
From: nom du contact <email du contact>
En ligne de commande Windows PowerShell : l'utilitaire "findstr" (mais je
ne pratique pas)
A partir de là on peut continuer avec les outils unix (cut, sed, awk...)
pour convertir ce fichier en un fichier .csv approprié à importer dans
Gmail, mais on peut aussi le faire avec un tableur (Excel, LO, peu
importe) en important le fichier liste1.txt puis en utilisant le menu
"Text to Columns" (qui est d'ailleurs implicitement appelé à l'ouveture
d'un fichier texte). Pour savoir le format CSV attendu par Gmail, faire un
essai d'exportation CSV de contacts déjà dans Gmail.
Ok
pehache
2019-11-21 15:22:09 UTC
Permalink
Post by Alf92
Post by pehache
Post by Alf92
quel outil permettrait de faire l'extration à partir d'un texte ?
En ligne de commande unix : l'utilitaire "grep". En se plaçant dans le
grep "From:" * > ~/Desktop/liste1.txt
avec plus de 10000 fichiers (pour un total de plus de 8Go) ça peux le
faire ?
Aucun souci, ça va juste se résumer au temps de lecture de 8Go de
données.
Alf92
2019-11-22 14:04:48 UTC
Permalink
Post by pehache
Post by Alf92
Post by pehache
Post by Alf92
quel outil permettrait de faire l'extration à partir d'un texte ?
En ligne de commande unix : l'utilitaire "grep". En se plaçant dans le
grep "From:" * > ~/Desktop/liste1.txt
avec plus de 10000 fichiers (pour un total de plus de 8Go) ça peux le
faire ?
Aucun souci, ça va juste se résumer au temps de lecture de 8Go de
données.
Concernant la récupération des mails, je viens de cécouvrir une option
dans Gmail : la récupération des données
http://www.prodigemobile.com/tutoriel/sauvegarde-messagerie-gmail/
la sauvegarde se fait au format MBOX
https://fr.wikipedia.org/wiki/Mbox
il semble que ce soit du texte en clair.
ça m'évite deja l'installation et les manips sur Thunderbird !

une fois l'archive récupérée je me lancerais dans l'extraction des
adressses.
efji
2019-11-22 08:08:48 UTC
Permalink
Post by Alf92
Post by pehache
Post by Alf92
ça devient velu.
de plus il faut récupérer le nom du contact en plus du mail.
il y a une quantité énorme de mail (plus de 10000 ?).
quel outil permettrait de faire l'extration à partir d'un texte ?
En ligne de commande unix : l'utilitaire "grep". En se plaçant dans le
grep "From:" * > ~/Desktop/liste1.txt
avec plus de 10000 fichiers (pour un total de plus de 8Go) ça peux le
faire ?
Si tu as un unix sous la main, je te propose ça :
grep -w From: * | cut -d " " -f2- | sort

ou plutôt, à la place de "*" la liste explicite des fichiers contenant
les mails, car dans le répertoire de mail il y a des fichiers .msf qui
contiennent autre chose, et puis il y a probablement des
sous-répertoires aussi si tu as fait de sous dossiers.

Donc par exemple:

grep -w From: Inbox TataGinette Tata\ Michu Archives/TontonRené | cut -d
" " -f2- | sort

ici j'ai mis un fichier qui contient un espace (Tata\ Michu) pour lequel
il faut un \.

Le 'cut -d " " -f2-' permet de virer le From:
Le "sort" permet de classer le tout par ordre alphabétique.

Ensuite tu vas avoir bien sûr plein de doublons qu'il faudra traiter
d'une façon ou d'un autre. Mais le plus ennuyeux est que la plupart des
lignes seront :
Tata Ginette <***@gmail.com>
ce qui est ce que tu souhaites, mais certaines seront
***@gmail.com

Il faudra traiter ça aussi.

Bon courage
--
F.J.
efji
2019-11-22 08:29:32 UTC
Permalink
Post by efji
Post by Alf92
Post by pehache
Post by Alf92
ça devient velu.
de plus il faut récupérer le nom du contact en plus du mail.
il y a une quantité énorme de mail (plus de 10000 ?).
quel outil permettrait de faire l'extration à partir d'un texte ?
En ligne de commande unix : l'utilitaire "grep". En se plaçant dans le
grep "From:" * > ~/Desktop/liste1.txt
avec plus de 10000 fichiers (pour un total de plus de 8Go) ça peux le
faire ?
grep -w From: * | cut -d " " -f2- | sort
ou plutôt, à la place de "*" la liste explicite des fichiers contenant
les mails, car dans le répertoire de mail il y a des fichiers .msf qui
contiennent autre chose, et puis il y a probablement des
sous-répertoires aussi si tu as fait de sous dossiers.
grep -w From: Inbox TataGinette Tata\ Michu Archives/TontonRené | cut -d
" " -f2- | sort
ici j'ai mis un fichier qui contient un espace (Tata\ Michu) pour lequel
il faut un \.
Le "sort" permet de classer le tout par ordre alphabétique.
Ensuite tu vas avoir bien sûr plein de doublons qu'il faudra traiter
Je me réponds à moi même. Dans le temps j'avais écrit un petit programme
qui cherchait les doublons sans savoir que ça existait dans unix :) Donc
la solution :

grep -w From: liste_des_fichiers | cut -d " " -f2- | sort | uniq -i
--
F.J.
pehache
2019-11-22 09:55:31 UTC
Permalink
Post by efji
Post by Alf92
Post by pehache
En ligne de commande unix : l'utilitaire "grep". En se plaçant dans le
grep "From:" * > ~/Desktop/liste1.txt
avec plus de 10000 fichiers (pour un total de plus de 8Go) ça peux le
faire ?
grep -w From: * | cut -d " " -f2- | sort
ou plutôt, à la place de "*" la liste explicite des fichiers contenant
les mails, car dans le répertoire de mail il y a des fichiers .msf qui
contiennent autre chose, et puis il y a probablement des
sous-répertoires aussi si tu as fait de sous dossiers.
Pour inclure les sous-dossiers dans la recherche de grep, il faut lui
ajouter l'option -R.

Quant à donner la liste explicite des fichiers ça risque d'être
compliqué : TB stocke maintenant les mails au format maildir, c'est à
dire un fichier par mail. On peut peut-être le forcer à utiliser
l'ancien format mbox.
Post by efji
grep -w From: Inbox TataGinette Tata\ Michu Archives/TontonRené | cut -d
" " -f2- | sort
ici j'ai mis un fichier qui contient un espace (Tata\ Michu) pour lequel
il faut un \.
Le premier champs sera le nom du fichier (cas du grep sur plusieurs
fichiers). Donc pour virer ce nom et le From: il faut plutôt faire "-f3-"

Mais bon, si l'étape suivante c'est le tableur, ça ne sert pas à grand
chose de s'embêter à traiter les champs à ce stade.
Post by efji
Ensuite tu vas avoir bien sûr plein de doublons qu'il faudra traiter
d'une façon ou d'un autre.
GMail gère les doublons. Une fois les contacts extraits et importés dans
GMail, il suffira de lui faire chercher et fusionner les doublons.
Post by efji
Mais le plus ennuyeux est que la plupart des
ce qui est ce que tu souhaites, mais certaines seront
Il faudra traiter ça aussi.
Ca c'est plus embêtant. Ca pourrait se gérer avec un script (bash ou
autre), mais il faut voir comment le tableur va importer le fichier : si
on utilise les caractères ":" et "<" comme séparateurs, une absence de
nom va se traduire par une cellule contenant une espace au lieu du nom,
donc c'est bon (et il suffira en principe de recopier l'adresse email à
la place du nom absent).
pehache
2019-11-22 10:33:54 UTC
Permalink
Post by pehache
Post by efji
ou plutôt, à la place de "*" la liste explicite des fichiers contenant
les mails, car dans le répertoire de mail il y a des fichiers .msf qui
contiennent autre chose, et puis il y a probablement des
sous-répertoires aussi si tu as fait de sous dossiers.
Pour inclure les sous-dossiers dans la recherche de grep, il faut lui
ajouter l'option -R.
Quant à donner la liste explicite des fichiers ça risque d'être
compliqué : TB stocke maintenant les mails au format maildir, c'est à
dire un fichier par mail. On peut peut-être le forcer à utiliser
l'ancien format mbox.
Sinon il suffit d'exclure les fichier .msf de la recherche : ça se fait
en ajoutant à la commande grep l'option '--exclude "*.msf"'
--
"...sois ouvert aux idées des autres pour peu qu'elles aillent dans le
même sens que les tiennes.", ST sur fr.bio.medecine
efji
2019-11-22 18:26:27 UTC
Permalink
Post by pehache
Quant à donner la liste explicite des fichiers ça risque d'être
compliqué : TB stocke maintenant les mails au format maildir, c'est à
dire un fichier par mail. On peut peut-être le forcer à utiliser
l'ancien format mbox.
Ah bon? Tu es sûr?
Pas chez moi en tout cas et heureusement. Je dois avoir environ 100000
mails dans mes diverses boites, j'imagine même pas comment réagit un
répertoire à 100000 fichiers :)
--
F.J.
pehache
2019-11-22 23:48:25 UTC
Permalink
Post by efji
Post by pehache
Quant à donner la liste explicite des fichiers ça risque d'être
compliqué : TB stocke maintenant les mails au format maildir, c'est à
dire un fichier par mail. On peut peut-être le forcer à utiliser
l'ancien format mbox.
Ah bon? Tu es sûr?
Pas chez moi en tout cas et heureusement. Je dois avoir environ 100000
mails dans mes diverses boites, j'imagine même pas comment réagit un
répertoire à 100000 fichiers :)
C'est devenue le défaut l'année dernière je pense. Mais si tes comptes
ont été créés en mbox, ils ne sont pas convertis en maildir. Ca ne
concerne que les nouveaux comptes créés.

Tes 100000 mails ne sont pas dans un dossier unique j'imagine, donc sur
le disque les 100000 fichiers ne seraient pas non plus dans un dossier
unique. L'intérêt d'avoir un fichier par mail c'est d'une part pour les
sauvegardes incrémentales, et d'autre part pour faciliter le nettoyage
des mails supprimés ou déplacés.
--
"...sois ouvert aux idées des autres pour peu qu'elles aillent dans le
même sens que les tiennes.", ST sur fr.bio.medecine
Alf92
2019-11-22 23:55:56 UTC
Permalink
Post by pehache
Post by efji
Post by pehache
Quant à donner la liste explicite des fichiers ça risque d'être
compliqué : TB stocke maintenant les mails au format maildir, c'est à
dire un fichier par mail. On peut peut-être le forcer à utiliser
l'ancien format mbox.
Ah bon? Tu es sûr?
Pas chez moi en tout cas et heureusement. Je dois avoir environ 100000
mails dans mes diverses boites, j'imagine même pas comment réagit un
répertoire à 100000 fichiers :)
C'est devenue le défaut l'année dernière je pense. Mais si tes comptes
ont été créés en mbox, ils ne sont pas convertis en maildir. Ca ne
concerne que les nouveaux comptes créés.
Tes 100000 mails ne sont pas dans un dossier unique j'imagine, donc sur
le disque les 100000 fichiers ne seraient pas non plus dans un dossier
unique. L'intérêt d'avoir un fichier par mail c'est d'une part pour les
sauvegardes incrémentales, et d'autre part pour faciliter le nettoyage
des mails supprimés ou déplacés.
bon, j'ai mon fichier MBOX de 5Go.
rien ne veut/peut l'ouvrir....
Alf92
2019-11-23 01:21:43 UTC
Permalink
Post by Alf92
Post by pehache
Post by efji
Post by pehache
Quant à donner la liste explicite des fichiers ça risque d'être
compliqué : TB stocke maintenant les mails au format maildir, c'est à
dire un fichier par mail. On peut peut-être le forcer à utiliser
l'ancien format mbox.
Ah bon? Tu es sûr?
Pas chez moi en tout cas et heureusement. Je dois avoir environ 100000
mails dans mes diverses boites, j'imagine même pas comment réagit un
répertoire à 100000 fichiers :)
C'est devenue le défaut l'année dernière je pense. Mais si tes comptes
ont été créés en mbox, ils ne sont pas convertis en maildir. Ca ne
concerne que les nouveaux comptes créés.
Tes 100000 mails ne sont pas dans un dossier unique j'imagine, donc sur
le disque les 100000 fichiers ne seraient pas non plus dans un dossier
unique. L'intérêt d'avoir un fichier par mail c'est d'une part pour les
sauvegardes incrémentales, et d'autre part pour faciliter le nettoyage
des mails supprimés ou déplacés.
bon, j'ai mon fichier MBOX de 5Go.
rien ne veut/peut l'ouvrir....
je viens de trouver la bonne appli (glogg) et j'ai extrait une liste de
~16000 lignes commençant toutes par "From: "
le fichier fait 1,7Mo.
là je coince pour en faire un .CSV bien propre
pehache
2019-11-23 07:19:00 UTC
Permalink
Post by Alf92
Post by Alf92
Post by pehache
Post by efji
Post by pehache
Quant à donner la liste explicite des fichiers ça risque d'être
compliqué : TB stocke maintenant les mails au format maildir, c'est à
dire un fichier par mail. On peut peut-être le forcer à utiliser
l'ancien format mbox.
Ah bon? Tu es sûr?
Pas chez moi en tout cas et heureusement. Je dois avoir environ 100000
mails dans mes diverses boites, j'imagine même pas comment réagit un
répertoire à 100000 fichiers :)
C'est devenue le défaut l'année dernière je pense. Mais si tes comptes
ont été créés en mbox, ils ne sont pas convertis en maildir. Ca ne
concerne que les nouveaux comptes créés.
Tes 100000 mails ne sont pas dans un dossier unique j'imagine, donc sur
le disque les 100000 fichiers ne seraient pas non plus dans un dossier
unique. L'intérêt d'avoir un fichier par mail c'est d'une part pour les
sauvegardes incrémentales, et d'autre part pour faciliter le nettoyage
des mails supprimés ou déplacés.
bon, j'ai mon fichier MBOX de 5Go.
rien ne veut/peut l'ouvrir....
je viens de trouver la bonne appli (glogg) et j'ai extrait une liste de
~16000 lignes commençant toutes par "From: "
le fichier fait 1,7Mo.
là je coince pour en faire un .CSV bien propre
Importer dans un tableur...
Alf92
2019-11-23 11:25:20 UTC
Permalink
Post by pehache
Post by Alf92
Post by Alf92
Post by pehache
Post by efji
Post by pehache
Quant à donner la liste explicite des fichiers ça risque d'être
compliqué : TB stocke maintenant les mails au format maildir, c'est à
dire un fichier par mail. On peut peut-être le forcer à utiliser
l'ancien format mbox.
Ah bon? Tu es sûr?
Pas chez moi en tout cas et heureusement. Je dois avoir environ 100000
mails dans mes diverses boites, j'imagine même pas comment réagit un
répertoire à 100000 fichiers :)
C'est devenue le défaut l'année dernière je pense. Mais si tes comptes
ont été créés en mbox, ils ne sont pas convertis en maildir. Ca ne
concerne que les nouveaux comptes créés.
Tes 100000 mails ne sont pas dans un dossier unique j'imagine, donc sur
le disque les 100000 fichiers ne seraient pas non plus dans un dossier
unique. L'intérêt d'avoir un fichier par mail c'est d'une part pour les
sauvegardes incrémentales, et d'autre part pour faciliter le nettoyage
des mails supprimés ou déplacés.
bon, j'ai mon fichier MBOX de 5Go.
rien ne veut/peut l'ouvrir....
je viens de trouver la bonne appli (glogg) et j'ai extrait une liste de
~16000 lignes commençant toutes par "From: "
le fichier fait 1,7Mo.
là je coince pour en faire un .CSV bien propre
Importer dans un tableur...
Impec, je viens de finir, tout est nickel.
le tableur m'a aussi permis de faire des tris importants et de
poubelliser un paquet de trucs.
la dificulté a été ensuite de retrouver le bon tracé du fichier à
importer : j'ai importé le carnet d'adresses d'un autre Gmail puis j'ai
écraser ses données avec les bonnes.
l'import du fichier définitif (1340 contacts propres) s'est fait
ensuite sans difficulté particulière.

merci pour tout !
pehache
2019-11-22 12:31:48 UTC
Permalink
Post by pehache
En ligne de commande unix : l'utilitaire "grep". En se plaçant dans le
dossier qui contient les mails et taper la commande : grep "From:" * >
~/Desktop/liste1.txt
ça créerait sur le bureau un fichier liste1.txt qui contiendrait un
From: nom du contact <email du contact>
Ce à quoi j'arrive, en exécutant cette commande dans le dossier racine
du compte mail dans Thunderbird :

grep -R --exclude "*.msf" "^From:" * > ~/Desktop/liste.txt

-R pour qu'il parcoure tous les éventuels sous-dossiers
Exclusion des fichier .msf
Le '^' devant le From: permet de ne sélectionner que les lignes où From:
est en début de ligne, ce qui élimine tout un tas de lignes parasites.

Je n'ai pas réussi à faire fonctionner correctement les commandes sort
et uniq indiquées par efji, donc à ce stade il y a tous les doublons.

Ensuite j'importe ce fichier liste.txt dans le tableur LibreOffice, en
spécifiant comme séparateurs les caractères ":", "<" et ">", et en
ignorant les deux premiers champs. Ca me met en colonne A le nom et en
colonne B l'adresse email. Quand le nom est absent l'adresse se retrouve
en colonne A et la colonne B est vide. Donc je crée une colonne C avec
la formule :
=IF(B1="";A1;B1)
Ainsi la colonne C est remplie partout avec l'email, et on peut
supprimer la colonne B.

Il ne reste plus qu'à exporter le fichier au format CSV qui va bien.

Il reste néanmoins un problème : quand le nom comporte des caractères
accentués ou spéciaux, il est encodé sous une forme plus ou moins
cryptique dans le fichier texte. Je ne vois pas très bien comment gérer
ça...
--
"...sois ouvert aux idées des autres pour peu qu'elles aillent dans le
même sens que les tiennes.", ST sur fr.bio.medecine
Jo Engo
2019-11-25 08:08:10 UTC
Permalink
Post by pehache
grep -R --exclude "*.msf" "^From:" * > ~/Desktop/liste.txt
-R pour qu'il parcoure tous les éventuels sous-dossiers Exclusion des
fichier .msf Le '^' devant le From: permet de ne sélectionner que les
lignes où From: est en début de ligne, ce qui élimine tout un tas de
lignes parasites.
Je n'ai pas réussi à faire fonctionner correctement les commandes sort
et uniq indiquées par efji, donc à ce stade il y a tous les doublons.
grep -R --exclude "*.msf" "^From:" * |sort|uniq > ~/Desktop/liste.txt
Tout simplement
--
Quand on ne travailleras plus le lendemain des jours de repos, la
fatigue sera vaincue.
-+- Pierre Dac -+-
pehache
2019-11-25 09:02:31 UTC
Permalink
Post by Jo Engo
Post by pehache
grep -R --exclude "*.msf" "^From:" * > ~/Desktop/liste.txt
-R pour qu'il parcoure tous les éventuels sous-dossiers Exclusion des
fichier .msf Le '^' devant le From: permet de ne sélectionner que les
lignes où From: est en début de ligne, ce qui élimine tout un tas de
lignes parasites.
Je n'ai pas réussi à faire fonctionner correctement les commandes sort
et uniq indiquées par efji, donc à ce stade il y a tous les doublons.
grep -R --exclude "*.msf" "^From:" * |sort|uniq > ~/Desktop/liste.txt
Tout simplement
J'ai bien compris, mais outre que j'ai dû définir je ne sais plus quelle
variable d'environnement pour que 'sort' ça marche, ça n'a supprimé
aucun doublon.
Jo Engo
2019-11-25 21:28:13 UTC
Permalink
Post by pehache
J'ai bien compris, mais outre que j'ai dû définir je ne sais plus quelle
variable d'environnement pour que 'sort' ça marche, ça n'a supprimé
aucun doublon.
Il doit falloir enlever des champs et ne garder que Nom Prénom <adresse>
alors uniq devrait marcher
--
17:21 kk1 connait un bon bouquin sur la theorie des graphes ? pour
advandced user
17:23 advanced graph theory
Gigiair
2019-11-20 19:22:16 UTC
Permalink
Post by Alf92
Bonjour,
Pour une personne qui a mis un gros bazar dans son ordi je cherche à
récupérer les contacts et plus précisément les adresses mails.
La seule source dont je dispose c'est l'historique de ses mails depuis
5 ans dans un compte Gmail.
Question : comment récupérer les adresses mails de tous les mails reçus
pour les inclure dans le carnet d'adresses de Gmail ?
Un module complémentaire Gmail serait faire ça...?
Merci
FU2 : fr.comp.divers
Trouvé dans l'aide de gmail:

Aller dans google contacts, puis exporter
https://contacts.google.com/u/0/?cplus%3D0=#contacts
--
gigiair
Alf92
2019-11-20 23:51:06 UTC
Permalink
Post by Gigiair
Post by Alf92
Bonjour,
Pour une personne qui a mis un gros bazar dans son ordi je cherche à
récupérer les contacts et plus précisément les adresses mails.
La seule source dont je dispose c'est l'historique de ses mails depuis
5 ans dans un compte Gmail.
Question : comment récupérer les adresses mails de tous les mails reçus
pour les inclure dans le carnet d'adresses de Gmail ?
Un module complémentaire Gmail serait faire ça...?
Merci
FU2 : fr.comp.divers
Aller dans google contacts, puis exporter
https://contacts.google.com/u/0/?cplus%3D0=#contacts
non, justement je n'ai pas de contacts dans Gmail
Loading...