Musterol escribió:
Pero y eso? Que era broma lo de quién fue el desgraciado con quién hiciste equipo! Que no, hombre, que claro, apuntémonos. Nooo estés triste, viva la alergría.
rianxeira escribió:Juas, me da que ni siquiera has mirado el enlace.
Lo del proyecto es muy gonico, pero primero tendríais que definirlo. Y tal como yo lo veo habría que hacerlo en el lado servidor, con un tráfico de la leche, y eso suponiendo que los dueños de cada servidor den via libre. Aparte e mucho curro es que no le veo mucho sentido, la verdad. Pero tampoco se la veia al rss hace años.
Ni mirármelo, evidentemente.
Qué dius, tiu. Lado de servidor? Nonono.
Cucha: Verdad que esto que digo lo podrías hacer con un tío que se dedicara a hacerlo?
Pues programa al tío.
No es tan difícil. Verás, yo hice una cosa parecida: Se llamaba "CazaChollos", y era de cuando quería alquilar piso. Este bicho se dedicaba (desde cualquier sitio, lo podías hacer en cualquier ordenador conectado a internet) a, cada hora, conectarse a la web del colegio de alquiler de fincas de barcelona, con unos criterios de búsqueda determinados. Parseaba el resultado, paginando todo lo que hiciera falta, y de todos los resultados se quedaba con los datos clave (el importe, metros cuadrados, ubicación, etc), y los guardaba en una BD persistente. Simplemente, cada hora volvía a hacer lo mismo, y si encontraba alguno que no estaba antes, me enviaba un mail con los datos (al final incluso le puse un link al google maps, y tal... juas, en el mail ya venía hasta el mapa).
Esto qué hacía? Pues que si aparecía un piso bueno con condiciones buenas, yo fuera el primero en irlo a visitar.
Por cierto, funcionó.
A ver, definición ascendente (el método descendente, pero al revés, juas)
- Se hace un programilla que, dada una URL (estilo
Código: Seleccionar todo
http://www.todaviapordeterminar.com/viewtopic.php?f=5&t=14129
) lo parsee todo, se quede con lo importante de cada post (enlace a foto del avatar, nombre, foro, texto, etc etc), y además pagine (poniendo lo del start=xx al final de la URL). Eso no me digas que es difícil. Coño, si hasta le puedes decir a Excel que lo abra, y lo tratas con visual basic!!! lo has probado nunca?
Ejemplo: Abre Excel, dale a abrir, donde te pide nombre de archivo dile
Código: Seleccionar todo
http://www.todaviapordeterminar.com/viewtopic.php?f=5&t=14129
, dale a Alt-F11, dale a Control-G, y en la ventana inmediato dale a lo siguiente:
Código: Seleccionar todo
i=1:res="":while cells(i,1)<>"Traducción al español por Huan Manwë para phpbb-es.com":res=res & iif((cells(i,1)="Arriba"),vbcrlf & cells(i+5,1),""):i=i+1:wend:debug.Print res
Ves lo que sale? Pues eso. Ya acabas de parsear la primera página. Y todo, desde lanzar la página, parsear, quedarse con ello, guardarlo en BD, etc, ya se podría hacer desde visual basic for applications.
Incluso se puede lanzar ciego, que no se vea. Por ejemplo, creando un archivo llamado "parsea_forito.vbs", y usando Visual Basic Script, y poniéndole esto...
Código: Seleccionar todo
set excel=CreateObject("Excel.Application")
excel.Visible=False
excel.Workbooks.add("http://www.todaviapordeterminar.com/viewtopic.php?f=5&t=14129")
i=1
res=""
while excel.cells(i,1)<>"Traducción al español por Huan Manwë para phpbb-es.com"
if excel.cells(i,1)="Arriba" then
res = res & vbCrLf & excel.cells(i+5,1)
end if
i=i+1
wend
excel.Quit
MsgBox res
Y dale doble clic al parsea_forito.vbs.
Voila! Lo mismo. Y en silencio
Y esto, haces que vaya parseando bien (usando reglillas de busqueda de excel, por ejemplo) y que lo guarde en una BD... no os explicaré como va, pero vamos... set db=GetObject("c:\Mierda\PutaBaseDeDatos.mdb") y empezar la fiesta con los métodos DAO o ADO (db.CurrentDB.Execute "INSERT INTO..." ... todo esto no cuesta nada, se tiene hecho en una tarde. Lo metes en una tarea programada de cualquier ordenador que tengas encendido todo el día, y listo.
- Y la segunda parte es más chunga: Hacer un programilla que pueda meter un post. Es decir, en un ordenata donde ya tenga la cuki de conectarse al foro con el usuario escogido, que pueda lanzar peticiones POST con los datos. Tampoco es que cueste, también lo he hecho. Se genera el HTML con la llamada al form, los campos en HIDE, el submit en el document.load, y se lanza el HTML. Y suele funcionar.
Con estas dos cosas y un modelo de BD un poco currao, bingo.
Ala, iros apuntando a uno u al otro. Yo me animo a hacer el modelo de BD (Access mismo).
- Programa de parsear foro y meter en BD, quién lo hace? Venga, os lo he dao mascao. Aunque si alguien sabe de métodos mejores (que seguro que hay parsers HTML mejores que excel), mejor todavía. Pero ey, así, sencillito, coño. Que esto que he puesto ni necesita java, ni necesita hostias.
- Programa de meter post en un hilo cuando el ordenata ya tiene el usuario. Esto ya, cuesta un poco más, hay que investigar. Quién lo hace?