[SeWi] OFFTOPIC: Proyecto en PHP o Similar
S. Lazaro
raptitudes en gmail.com
Jue Jun 15 20:06:14 CEST 2006
Es un crawler recupera informacion de internet, la indexa en una BBDD
y despues se reutiliza en un buscador web, lo mismo que hace google.
Que pasa, que la indexacion tiene muchas "tonterias", que hacen que
tarde demasiado, control de entidades html, limpieza, contructor de
frases, comprobacion de la BBDD por si existe el dato... y si
calculado desde el mismo script son 12 horas y pico teniendo en cuenta
que todo vaya bien. Y ahora diras cuanta informacion es? es 1Gb, y
puedo meter 100Mb de informacion solo?, si pero aunque parezca mentira
el buscador no es lo funcional que deberia con tan poca informacion, y
si pudiera le hubiera metido >5Gb. La unica solucion era tirar de
beagle con inode para no indexar en la BBDD y hacer una "chapuza" tipo
fronted web para que me diera tiempo, pero un proyecto con 50 lineas
de codigo es de risa.. Vamos que lo pido por que es la unica salida
nada mas, gracias.
El 15/06/06, Jose Luis Colmena<joseluiscolmena en ya.com> escribió:
>
>
> Madre del amor hermoso!! Que tienes que indexar 400 Pb??? No será
> compilación? Aunque ni por esa. Ahora si es el renderizado en 3D de "Cars"
> pues mira, aceptamos 12 horas.
>
> Pero amos, digo yo. Los isi.. ya no te sirven, pero... i si lo hubieses
> empezado antes? i si lo hubieses pedido antes?
>
> Por otro lado lo mio es contestar por no callar (que lo iba a hacer), ni
> tengo trabajos desos raros ni na de na, como no te pase un proyecto en
> xcode...
>
> ¿Te sirve el código fuente de un Proyecto (el cual funciona aún) sobre un
> Widget Meteorológico?
>
> salu2
>
> P.D.: El gustazo de usar un Mac, no tiene precio.
>
> El 15/06/2006, a las 19:47, S. Lazaro escribió:
>
>
>
> ya que solo la indexacion tardara mas de 12 horas.
>
>
>
>
> ·····························································································
> jose luis colmena
> ·····························································································
> ichat joseluiscolmena aim
> ·····························································································
> www.joseluiscolmena.com · www.servesita.org
> ·····························································································
> sevilla · andalucía · españa
> ·····························································································
> el gustazo de usar un mac, no tiene precio
> ·····························································································
> _______________________________________________
> Lista de correo de Sevilla Wireless
> Lista en sevillawireless.net
> http://sevillawireless.net/mailman/listinfo/lista_sevillawireless.net
>
>
>
Más información sobre la lista de distribución Lista