¿Problemas en el cielo?
Mi padre decía el otro día que mientras seas pequeño, nadie te molesta, pero como crezcas un poco (empresarialmente, claro), enseguida vienen a llamar a tu puerta los poderes fácticos para ofrecerte una ridículez por tu trabajo, o unas veladas amenazas para que te quedes donde estas...
Así es el mundo de los negocios, quien se crea que en este mundo hay justicia, o que las cosas se hacen como dios manda, que abra los ojos y deje de mirar películas de Disney.
Llevemos esta situación al terreno de los buscadores, donde, por ejemplo, Google, desde Enero, está teniendo serios problemas. Que si las máquinas están llenas, que si la última actualización no fue tan buena como se esperaba... y ahora viene lo mejor "que es muy fácil crear contenido basura que engaña al buscador y..."
Este era uno de los problemas de la primera era de los buscadores: cómo indexar el inmenso contenido... Analizando las cabeceras se demostró que no era el mejor de los métodos, y llegó Google y se convirtió en el padre y en la madre de todas las cosas que existen y no existen.
Pero no perdamos de vista un detalle. Google se enfrenta ahora a su propia medicina. Ha creado un superalgoritmo que le permite diferenciarse del resto, pero... el propio algoritmo ha hecho que la gente se ponga a crear sistemas de generación de contenido automático para posicionar webs en el mítico buscador... ¿y qué ocurre? que los procesos en background del buscador no dan abasto, que tienen los discos llenos, y seguramente la cantidad de basura será muuuuy elevada.
Un ejemplo, una persona escribe en su blog pongamos que entre una y cinco veces a la semana. un sistema automático genera hasta 1400 páginas en un sólo día. Páginas además que ocupan un gran tiempo de proceso del indexador de Google. Además, y aquí está lo mejor del tema, la penalización que puede aplicar Google a los blogs o web de spam o contenido basura no es lo suficientemente flexible para lidiar con los encargados del posicionamiento... Pero, ¿Quien dijo que fuera una guerra justa?
Recordemos que Google se caracteriza por su obsesivo ocultismo de cualquier información sobre lo que sea referido a su empresa.
Sabemos, por ejemplo, que Technorati tiene gente que, como Kirai, se encarga de crear algoritmos para limpiar las bases de datos de spam, que luego hay gente que se encarga de ir revisando por si los algoritmos fallan, pero no perdamos de vista un problema: la escalabilidad.
Resulta que hoy en día, y eso Google lo sabe muy bien aunque juren y perjuren que no pueden decir nada al respecto, que la mejor forma de mantener los datos en un sistema de alta disponibilidad es replicarlos hasta la saciedad, y claro, por una parte tenemos gente quemandose las pestañas para encontrar mecanismos de posicionamiento ya sean legales o no. Por otro lado un indexador que indexa el contenido bueno, y el contenido basura, sistemas de replica que copian dicho contenido y algoritmos de limpieza... ¿Saben a que suean todo esto? a que se puede estar gestando el nuevo Google en aras de una indexación más justa y libre de porquería.
Por cierto, no me cansaré de recordarlo, para los cenizos que dicen que eso es imposible, que se pregunten cuanto hace que salio Technorati y qué lugar ocupa ahora mismo en el mercado. Pues eso, el negocio no es lo que está dentro de la verja, el negocio está en ser capaz de llevar la verja más lejos.
Así es el mundo de los negocios, quien se crea que en este mundo hay justicia, o que las cosas se hacen como dios manda, que abra los ojos y deje de mirar películas de Disney.
Llevemos esta situación al terreno de los buscadores, donde, por ejemplo, Google, desde Enero, está teniendo serios problemas. Que si las máquinas están llenas, que si la última actualización no fue tan buena como se esperaba... y ahora viene lo mejor "que es muy fácil crear contenido basura que engaña al buscador y..."
Este era uno de los problemas de la primera era de los buscadores: cómo indexar el inmenso contenido... Analizando las cabeceras se demostró que no era el mejor de los métodos, y llegó Google y se convirtió en el padre y en la madre de todas las cosas que existen y no existen.
Pero no perdamos de vista un detalle. Google se enfrenta ahora a su propia medicina. Ha creado un superalgoritmo que le permite diferenciarse del resto, pero... el propio algoritmo ha hecho que la gente se ponga a crear sistemas de generación de contenido automático para posicionar webs en el mítico buscador... ¿y qué ocurre? que los procesos en background del buscador no dan abasto, que tienen los discos llenos, y seguramente la cantidad de basura será muuuuy elevada.
Un ejemplo, una persona escribe en su blog pongamos que entre una y cinco veces a la semana. un sistema automático genera hasta 1400 páginas en un sólo día. Páginas además que ocupan un gran tiempo de proceso del indexador de Google. Además, y aquí está lo mejor del tema, la penalización que puede aplicar Google a los blogs o web de spam o contenido basura no es lo suficientemente flexible para lidiar con los encargados del posicionamiento... Pero, ¿Quien dijo que fuera una guerra justa?
Recordemos que Google se caracteriza por su obsesivo ocultismo de cualquier información sobre lo que sea referido a su empresa.
Sabemos, por ejemplo, que Technorati tiene gente que, como Kirai, se encarga de crear algoritmos para limpiar las bases de datos de spam, que luego hay gente que se encarga de ir revisando por si los algoritmos fallan, pero no perdamos de vista un problema: la escalabilidad.
Resulta que hoy en día, y eso Google lo sabe muy bien aunque juren y perjuren que no pueden decir nada al respecto, que la mejor forma de mantener los datos en un sistema de alta disponibilidad es replicarlos hasta la saciedad, y claro, por una parte tenemos gente quemandose las pestañas para encontrar mecanismos de posicionamiento ya sean legales o no. Por otro lado un indexador que indexa el contenido bueno, y el contenido basura, sistemas de replica que copian dicho contenido y algoritmos de limpieza... ¿Saben a que suean todo esto? a que se puede estar gestando el nuevo Google en aras de una indexación más justa y libre de porquería.
Por cierto, no me cansaré de recordarlo, para los cenizos que dicen que eso es imposible, que se pregunten cuanto hace que salio Technorati y qué lugar ocupa ahora mismo en el mercado. Pues eso, el negocio no es lo que está dentro de la verja, el negocio está en ser capaz de llevar la verja más lejos.


0 Comments:
Post a Comment
<< Home