From 862f3fa8184d9f55b0ee5eb2479f22bc7889103b Mon Sep 17 00:00:00 2001 From: DiegoCaraballo Date: Thu, 8 Feb 2018 14:12:58 -0300 Subject: [PATCH] Sigo con el script --- .google-cookie | 4 ++-- EmailExtractor.py | 30 +++++++++++++++++------------- Emails.db | Bin 12288 -> 12288 bytes 3 files changed, 19 insertions(+), 15 deletions(-) diff --git a/.google-cookie b/.google-cookie index 347a579..f37d9e3 100644 --- a/.google-cookie +++ b/.google-cookie @@ -1,3 +1,3 @@ #LWP-Cookies-2.0 -Set-Cookie3: 1P_JAR="2018-02-08-14"; path="/"; domain=".google.com"; path_spec; domain_dot; expires="2018-03-10 14:18:35Z"; version=0 -Set-Cookie3: NID="123=Kf_eSUC-5Nm2gruDHL7dLcAoHL-HJ51gAucEd9vWyuOl2FTpEDlDLudOnMzIQTsEzfE44bf3zTFQhpwlH9woSnn3MlPYVw6CbLo77PX_P6Pg_MnNovC1sOJcXPQH_6Io"; path="/"; domain=".google.com"; path_spec; domain_dot; expires="2018-08-10 14:18:32Z"; HttpOnly=None; version=0 +Set-Cookie3: 1P_JAR="2018-02-08-16"; path="/"; domain=".google.com"; path_spec; domain_dot; expires="2018-03-10 16:30:20Z"; version=0 +Set-Cookie3: NID="123=QcI0paBYKkQ3uXI1_8gS7xU-mi-ozwMJ8FvHuHu14o8y8v6TqNQRwq7Wh6mrPndXvpJ9I0b-ODsolVzR1mG-jK5kcHqGuEzmP_rqei7P0orexavr7PjdyGgcTuv4-_4Z"; path="/"; domain=".google.com"; path_spec; domain_dot; expires="2018-08-10 16:30:20Z"; HttpOnly=None; version=0 diff --git a/EmailExtractor.py b/EmailExtractor.py index 21bded4..1b0840e 100644 --- a/EmailExtractor.py +++ b/EmailExtractor.py @@ -9,8 +9,7 @@ import time import sqlite3 from sqlite3 import Error -input("Presione una tecla para continuar") - +# MenĂº Principal def menu(): try: clear() @@ -35,24 +34,24 @@ def menu(): elif (opcion == "2"): frase = str(input("Ingrese una frase a buscar: ")) print ("*** Advertencia: La cantidad de resultados elejidos impacta el tiempo de ejecucion") - cantRes = input("Cantiad de resultados en Google: ") + cantRes = int(input("Cantiad de resultados en Google: ")) extractFraseGoogle(frase, cantRes) elif (opcion == "3"): print ("") - print ("1 - Seleccionar una categoria") + print ("1 - Seleccionar una frase") print ("2 - Todos los correos") opcListar = input("Ingrese Opcion: ") if (opcListar == "1"): - listarPorCategoria() + listarPorFrase() elif (opcListar == "2"): listarTodo("Emails.db") elif (opcion == "4"): print ("") - print ("1 - Guardar una categoria") + print ("1 - Guardar una correos de una frase") print ("2 - Guardar todos los correos") else: @@ -64,12 +63,12 @@ def menu(): except: "Error en funcion Menu" -# Insertar correo, categoria y Url en base de datos -def insertEmail(db_file, email, categoria, url): +# Insertar correo, frase y Url en base de datos +def insertEmail(db_file, email, frase, url): try: conn = sqlite3.connect(db_file) c = conn.cursor() - c.execute("INSERT INTO emails (categoria, email, url) VALUES (?,?,?)", (categoria, email, url)) + c.execute("INSERT INTO emails (frase, email, url) VALUES (?,?,?)", (frase, email, url)) conn.commit() conn.close() @@ -98,7 +97,7 @@ def crearTabla(db_file): sql = '''create table if not exists emails (ID INTEGER PRIMARY KEY AUTOINCREMENT, - categoria varchar(500) NOT NULL, + frase varchar(500) NOT NULL, email varchar(200) NOT NULL, url varchar(500) NOT NULL)''' @@ -110,8 +109,8 @@ def crearTabla(db_file): finally: conn.close() -# Lista correos por categoria -def listarPorCategoria(): +# Lista correos por frase +def listarPorFrase(): pass # Lista todos los correos @@ -125,12 +124,16 @@ def listarTodo(db_file): print ("") print ("Numero: " + str(i[0])) - print ("Categoria: " + str(i[1])) + print ("Frase: " + str(i[1])) print ("Email: " + str(i[2])) print ("Url: " + str(i[3])) print ("-------------------------------------------------------------------------------") c.close() + + print ("") + input("Presione una tecla para continuar") + menu() except Error as e: print(e) @@ -144,6 +147,7 @@ def extractUrl(url): # Extrae los correos de todas las Url encontradas en las busquedas # De cada Url extrae los correo - 2 niveles def extractFraseGoogle(frase, cantRes): + for url in search(frase, stop=cantRes): print(url) diff --git a/Emails.db b/Emails.db index caee84ed4d741f8a033af8fba0636b74a74693c3..12f3a2b4c4ab28579f9557b7551364118987b178 100644 GIT binary patch delta 140 zcmZojXh@hKEvUi3z`zW|Fd#Tl#~3K6`?rXf-