NuBuMu

Tuesday, May 30, 2006

Como en las bibliotecas

En un post anterior hablábamos del vocabulario de nuestra web, vocabulario o palabras clave. Eso que los SEO, "oh, no... Otra vez ellos" se afanan por encontrar y exprimir hasta la saciedad. Pero no olvidemos que las palabras clave dependen del contexto, que es precisamente dicho contexto el que le da sentido a la palabra y no al revés.

Alguien recuerda los problemas del Ad-Sense a la hora de insertar anuncios desafortunados en lugares donde una persona con dos dedos de frente nunca pondría... Pues eso, la web es contextual, pero por desgracia los buscadores no... ¿Por qué maldita sea?

Vamos a poner un ejemplo de la vida real. Cuando uno va a la biblioteca en busca de un libro qué hace? pues primero va al ordenador a ver si lo tienen el ejemplar disponible y dónde se encuentra, luego va a la estantería pertinente y lo encuentra... o no.

Perfecto, ¿pero eso como se traduce en el mundo digital? pues para empezar con un sistema que gestiona cuando el libro está dentro o fuera del recinto. Luego con una ordenación lógica (aunque hay que reconocer que algunas veces es bastante ilógica) de las estanterías y una distribución a su vez lógica o no de los libros. Además tenemos la figura de la bibliotecaria que con mayor o menor simpatía, nos ayudará a encontrar el libro que buscamos. Si cogemos un caso más comercial, por ejemplo, una librería, tenemos un patrón muy parecido a la biblioteca: estantes, ordenación lógica o absolutamente ilógica, una dependienta dispuesta a vendernos un libro, un catálogo informatizado...

Bien, si de lo que se trata es de que la gente sea lo más autónoma posible, la preordenación, clasificación y distribución de los libros es muy importante. Lo mismo pasa en un entorno web: si tenemos todos nuestros capítulos bajo el directorio "Capítulos" le estamos dando una pista al buscador que luego hará llegar al usuario nuestros contenidos. Cierto que no depende sólo de la carpeta donde pongamos los archivos, pero carpetas con nombres o etiquetas útiles son uno de los primeros pasos. El siguiente es seguir cierta metodología. Tampoco hemos de olvidarnos de la primera ley universal del mundo sea online o no: Sentido común... Por que si lo que quiero es que la gente encuentre los videos de arte de forma sencilla me esmeraré por ponerlos todos juntitos y ordenaditos. Tenerlos repartidos por la tienda tal vez no sea la mejor forma de clasificar dichos contenidos... Pero la categorización de los contenidos es una de las tareas más árduas e inertes que existen, lo sé, pero preciamente por eso: sentido común, por favor. Los videos, en la carpeta de Videos, igualito que los tenemos en nuestra casa, por que a ver, que levante la mano el que tenga sus películas metidas entre sus libros ordenados de forma alfabetica y según el número de páginas...

Thursday, May 25, 2006

Jugar a las canicas... o al billar

Una de las cosas mas dificiles de explicar a la gente que no sabe del tema es "Por que encontrar lo que buscas es tan dificil". No se trata del proceso de buscar, que en si es muy sencillo, se trata del proceso de ordenar y relacionar que es lo que trae de cabeza a los ingenieros que se dedican a esto.

Un ejemplo muy claro: yo soy un verdadero desastre, de hecho, el concepto desorden esta muy arraigado a mi propio ser, podriamos decir por ejemplo, que soy una de las personas mas entropicas del universo. Pues bien, aun siendo desordenado y manteniendo mi desorden conmigo puedo encontrar lo que busco en mi mesa, o en mi piso de forma bastante facil. Por supuesto, dentro de mi desorden existe un orden y lo que ocurre es que mi mente y mi espacio se rigen por los mismos principios de ordenacion y relacion.

Muy bien, ahora viene mi madre, o cualquier persona y "reordena" mi espacio y lo que ocurre es muy sencillo: eres incapaz de encontrar absolutamente nada... Seguro que a muchos os ha pasado, y basicamente lo unico que ocurre es que han cambiado el sistena de ordenacion y relacion. Tu no encontraras nada, pero tu madre sabe perfectamente donde estan tus camisetas rojas. Recuerdo una vez que alguien se dedico a reordenar mi biblioteca... El caos fue inmenso. Cada vez que buscaba un libro tenia que mirar todas las estanterias, o antes de buscar preguntarme como habria ordenado esa persona la biblioteca.

Precisamente ese es uno de los problemas fundamentales de los datos de hoy en dia. Cada persona sigue sus propios patrones de relacion y ordenacion y busca en funcion a ellos. Por supuesto, los buscadores intentan implementar ciertos patrones generalizados, o busquedas especificas. Asi, por ejemplo, nos encontramos con que google tiene busquedas especificas para linux, o para la comunidad cientifica, al igual que Microsoft con su buscador live.

Para entender la complejidad del problema, pensad en las canicas, o el billar, y ahora pensad que se le pide a un grupo de personas que hagan carambolas. Cuantas carambolas seran iguales?

Ah, por cierto, uno de los principios basicos de la ordenacion es preguntarse que orden es mejor, y os puedo asegurar que el orden no tiene ningun sentido si no se busca en base a el... asi que, y esto es algo de sentido comun, pero que dificilmente se lleva a cabo, todos los buscadores deberian aprender como buscan sus usuarios para saber como mejorar sus procesos de ordenacion y relacion. Me consta que google lo hace, del resto, por desgracia no lo se...

Tuesday, May 23, 2006

Seo Seo, que sees?

Vale, después del post anterior en la que no dejábamos muy bien a los SEO, vamos a hablar de ellos un poquillo más. No, no es que estén de moda, es que parece que hayan descubierto la sopa de habichuelas. Hay quien ha insinuado que les tengo manía, pero no es cierto, son necesarios. Sin ellos no existiría una buena parte de internet. ¿Nadie se ha preguntado por qué internet avanza tan deprisa? Pues por que no hay muchas leyes que valgan y en este aparente reino de taifas parece que el que pega primero tiene las de ganar alguna que otra batallita.

Bien, la tarea de los SEO es posicionar webs. El problema, como siempre es diferenciar entre un buen SEO y uno de los que se ha subido al carro de la última moda por que "ha leído algo del tema" y por supuesto ya es un experto...

La tarea del SEO es proporcionar valor añadido a las webs sobre las que trabaja. Imaginemos que nosotros, pobrecitos pardillos, tenemos una estupenda web para vender, digamos maracas. Pero no tenemos mucho éxito en el sustancioso campo de la percusión distribuida sobre bases pluriatómicas. Así que contratamos a un SEO para que nos haga ganar dinero. Ea, ya ha aparecido el invitado de lujo. ¿Alguie dudaba que no estuviese detrás de todo este baile de siglas?

El SEO, el buen SEO, analizará nuestra web y después de algunas sugerencias, empezaremos a ganar dinero que parecerá que nos llueven los billetes de diez leuros del cielo. ¿Pero exactamente ése análisis en qué consiste? pues lo primero que hay que hacer es un estudio de usabilidad, otro para ver como llegan los visitantes a nuestra web, y por qué no se quedan. ¿Qué falla en nuestro mensaje que no engancha a nuestro público? bueno, primero habrá que ver qué público es ése que consideramos "nuestro".

Si alguien tiene un conocido que trabaja en una tienda puede preguntarle si simplemente mirando a la gente puede distinguir potenciales clientes de simples ojeadores. La respuesta en muchos casos es afirmativa... Pero, ¿y en las webs? pues lo primero que ocurre muchas veces es que no hay ningún mecanismo de análisis de visitas o los que hay son muy pobres. Es como si no supieramos quienes son nuestros clientes, y de hecho, no lo sabemos.

Luego, una vez tenemos identificado el cliente potencial, hemos de ver de qué forma interacciona con internet y sobre todo, y tal vez sea la parte más importante del SEO, averiguar qué vocabulario usa. Si nuestros potenciales clientes casi nunca (2%) se refieren a las maracas como instrumentos de percusión, aunque lo sean, mejor ajustarse a su vocabulario, ya que al fin y al cabo, somos nosotros los interesados en vender algo.

Esto que llamamos encontrar las palabras claves con las que nuestros clientes hablan es lo que se conoce como uno de los posibles "comportamientos de búsqueda". El comportamiento general de nuestros potenciales clientes, como SEOs es el objetivo, puesto que una vez lo tengamos, sabemos exactamente qué partes hay que potenciar.

Por ejemplo, la forma en la que se buscan imágenes, canciones o letras de canciones es completamente diferente. Pensar que el usuario pardillo va a seguir el ABC del buscador es un error. Pensar que nuestro objetivo final como SEOs es poner nuestra web en la posición número 1 de Google, Yahoo y compañía es, de lejos, el primer pecado capital del SEO. No nos engañemos. Un SEO busca que la web analizada tenga un incremento monetizable de visitas.

Si le preguntais a ese conocido que trabaja en una tienda si prefiere entre tener la tienda siempre llena a reventar con unas ventas del 15% o la tienda medio vacía con unas ventas del 100% me juego mucho a que muchos prefieren la segunda opción, por que no se trata de llegar primero, se trata de ganar dinero, pero ay, hijos mío, esa es la parte complicada del asunto.

Poner una web en las primeras posiciones es tarea sencilla con la árdua tarea de hacer que una, por ejemplo, tienda online mejore sus ventas en un, digamos 30%. Margen que entra dentro de lo razonable para un SEO. Vaya, que si viene un SEO y te dice que te garantiza una penetrabilidad inmensa y un incremento del 50% o es que está muy seguro que tu web es un desastre, o te está metiendo un farol.

Monday, May 22, 2006

SEO? creo que no...

En el amplio abanico de internet hay tres jugadores:
  • La gente que busca.
  • Los buscadores.
  • Los contenidos.
Evidentemente en los mundos de Yupi, la gente busca los contenidos a través de un buscador y... ¡Los encuentra!

Pero como el mundo es mundo, que ni siquiera es redondo del todo, pues claro, uno busca, encuentra un monton de cosas que no interesan, y maldice su suerte mientras prueba otras técnicas de búsqueda del santo grial, o un buscador que le dé lo que él busca.

Por que, si por ejemplo, uno quiere saber el título exacto de un libro de Camilo José Cela, no quiere que lo bombardeen con tiendas de libros con una gigantesco catálogo entre los que también, por supuesto, se encuentra nuestro querido Don Camilo. Yo busco una cosa muy concreta, y no puedo encontrarla. El cómo encontrar algo que busco lo dejo para más adelante, por supuesto lo mejor de todo es el corolario al teorema "busca, luego encuentra": si las empresas egocéntricas te dejan, claro.

Entre los buscadores, la gente y los resultados están unos expertos de esos que de lo que saben se pasan que bajo las siglas SEO, se dedican a buscar la mejor forma de posicionar contenidos en los buscadores.

Seo significa "Search Engine Optimization", y no se crean, no deja de ser gente que ha encontrado la forma de posicionar temporalmente algo en alguna parte... el problema esta en la raíz del problema.

Vamos a ver expertos del SEO, si lo que la gente quiere es encontrar lo que busca, no lo que ustedes, bajo esos contratos firmados, creen que la gente va a querer encontrar. Vale, estamos de acuerdo, a ustedes les importa un pimiento lo que la gente busque o encuentre, a ustedes les importa el dinero que se puede hacer a costa de buscadores que sí quieren ofrecer el resultado deseado a la gente que sí quiere encontrar el contenido tan ansiado...

O sea, que parecen los malos de la película. Ahí afuera están los buscadores que con mayor o peor fortuna, se esfuerzan por encontrar el algoritmo que devuelva a cada persona aquello que está buscando, dando un servicio, precisamente, a las personas que buscan. Entre medio ustedes, que saben mucho de buscadores, y como siempre, las empresas con todo ese goloso dinero para ser ellas las que aparezcan allí donde ellos creen que merecen estar. Muy triste, por que cuanto mas éxito tengan ustedes, menos éxito tendremos nosotros encontrando lo que buscamos y los buscadores intentando sugerirnos lo que creen que buscamos.

¿Por qué cuando intento encontrar el título de un libro sólo encuentro librerías electrónicas o no? Puede que piensen que bajo los términos de mi búsqueda lo que más aparece sean precisamente librerías, pero... Desde hace mucho tiempo hay una cosa que sí que sé: el usuario, o cliente, no se equivoca. Puede que nuestro programa, o sistema, no sea capaz de darle lo que él quiere, pero la culpa no es del usuario, es del sistema.

Nuestro tan querido buscador de colores con su soberbia y su secretismo ha creado una nueva raza: los SEO. Paguen y vean. Ahora lo que tú buscas lo controlo yo... por un tiempo al menos. (vale, es una exageracion, pero...)

Wednesday, May 17, 2006

Buscar sobre los Blogs

Los blogs son, desde el punto de vista del contenido, el paradigma de lo bueno-bonito-barato y ademas facil...

Cosa que hace que se pueda crear contenido a mansalva, y nos podamos olvidar de todas aquellas extravagantes sutilezas como el ftp o el ssh... Los sistemas de blogs hicieron del CMS algo realmente para todos los publicos.

Perfecto, ahora si que tenemos internet orientado al usuario, ahora el antes navegante, se ha convertido en creador de contenidos, y ale, ahora los buscadores tienen mas trabajo del que esperaban.

Pero no nos desviemos del tema. Los blogs tienen una estructura muy estricta, perfecto, al fin el xhtml y el css estan donde tenian que estar... Como curiosidad, resulta que las paginas personales ahora estan mejor formadas que las que han hecho las empresas dedicadas a eso del internet...

Bien, pues perfecto, no deberian ser los blogs perfectos candidatos para que los buscadores los indexaran a toda pastilla? er, si y no. Es cierto que un buscador cuando encuentra contenido en un blog lo analiza mucho mejor que una pagina web hecha a mano, pero resulta que precisamente por su estructura, muchos buscadores han tenido que modificar sus algoritmos para no clasificar los blogs como Spam.

Pero volvamos al contenido. Un blog se compone de titulo, conjunto de posts y secciones varias de lo mas variopinto. Un post de un titulo y texto. El titulo puede ser un enlace o no, y el texto puede contener imagenes, enlaces y otros objetos como videos o animaciones.

Si alguien, por ejemplo, intenta encontrar un blog por su nombre, se encuentra con que, "Oh, diablos!", la cosa no es tan sencilla. Resulta que los buscadores tienen mas exito llegando a los blogs mediante sus post mas famosos que por su nombre. Por supuesto, si uno se para a pensarlo, lo encuentra logico, pero a su vez... No es un poco absurdo? la respuesta es si, pero hay que tener en cuenta que aun no hay implementado nada que te refiera a un blog desde un post.

Basicamente es uno de los problemas mas complejos de resolver: como se interrelacionan los contenidos y como posicionarlos dentro del indice.

De momento no he encontrado un sistema fiable que me devuelva lo que busco cuando mi campo de busqueda son los blogs. Curioso, no? Un dia hablare de Technorati, por que merece un post para el solito, pero no dejo de pensar en precisamente la clave del asunto: tenemos unos contenidos perfectamente identificados, y las busquedas sobre esos contenidos tienen una calidad realmente baja...

Thursday, May 04, 2006

¿Problemas en el cielo?

Mi padre decía el otro día que mientras seas pequeño, nadie te molesta, pero como crezcas un poco (empresarialmente, claro), enseguida vienen a llamar a tu puerta los poderes fácticos para ofrecerte una ridículez por tu trabajo, o unas veladas amenazas para que te quedes donde estas...

Así es el mundo de los negocios, quien se crea que en este mundo hay justicia, o que las cosas se hacen como dios manda, que abra los ojos y deje de mirar películas de Disney.

Llevemos esta situación al terreno de los buscadores, donde, por ejemplo, Google, desde Enero, está teniendo serios problemas. Que si las máquinas están llenas, que si la última actualización no fue tan buena como se esperaba... y ahora viene lo mejor "que es muy fácil crear contenido basura que engaña al buscador y..."

Este era uno de los problemas de la primera era de los buscadores: cómo indexar el inmenso contenido... Analizando las cabeceras se demostró que no era el mejor de los métodos, y llegó Google y se convirtió en el padre y en la madre de todas las cosas que existen y no existen.

Pero no perdamos de vista un detalle. Google se enfrenta ahora a su propia medicina. Ha creado un superalgoritmo que le permite diferenciarse del resto, pero... el propio algoritmo ha hecho que la gente se ponga a crear sistemas de generación de contenido automático para posicionar webs en el mítico buscador... ¿y qué ocurre? que los procesos en background del buscador no dan abasto, que tienen los discos llenos, y seguramente la cantidad de basura será muuuuy elevada.

Un ejemplo, una persona escribe en su blog pongamos que entre una y cinco veces a la semana. un sistema automático genera hasta 1400 páginas en un sólo día. Páginas además que ocupan un gran tiempo de proceso del indexador de Google. Además, y aquí está lo mejor del tema, la penalización que puede aplicar Google a los blogs o web de spam o contenido basura no es lo suficientemente flexible para lidiar con los encargados del posicionamiento... Pero, ¿Quien dijo que fuera una guerra justa?

Recordemos que Google se caracteriza por su obsesivo ocultismo de cualquier información sobre lo que sea referido a su empresa.

Sabemos, por ejemplo, que Technorati tiene gente que, como Kirai, se encarga de crear algoritmos para limpiar las bases de datos de spam, que luego hay gente que se encarga de ir revisando por si los algoritmos fallan, pero no perdamos de vista un problema: la escalabilidad.

Resulta que hoy en día, y eso Google lo sabe muy bien aunque juren y perjuren que no pueden decir nada al respecto, que la mejor forma de mantener los datos en un sistema de alta disponibilidad es replicarlos hasta la saciedad, y claro, por una parte tenemos gente quemandose las pestañas para encontrar mecanismos de posicionamiento ya sean legales o no. Por otro lado un indexador que indexa el contenido bueno, y el contenido basura, sistemas de replica que copian dicho contenido y algoritmos de limpieza... ¿Saben a que suean todo esto? a que se puede estar gestando el nuevo Google en aras de una indexación más justa y libre de porquería.

Por cierto, no me cansaré de recordarlo, para los cenizos que dicen que eso es imposible, que se pregunten cuanto hace que salio Technorati y qué lugar ocupa ahora mismo en el mercado. Pues eso, el negocio no es lo que está dentro de la verja, el negocio está en ser capaz de llevar la verja más lejos.