19. Cómo realizar un diseño experimental, parte 1Siguiendo en el grupo de páginas "Métodos de trabajo" quizás os planteéis la cuestión... si necesito saber algo concreto, qué efecto tiene tal o cual medida en las visitas de mi web ¿cómo lo averiguo?
Siempre es posible buscar en google desde luego o recurrir a una web de edición web (webmastering), no obstante los efectos de algo cambiado en una web sobre las visitas cambian con el tiempo, por ejemplo, google no para de modificar su algoritmo de búsqueda, y también puede ocurrir que se nos ocurra algo nuevo o sobre lo que no encontramos información ¿Cómo conseguir una información fiable?
La respuesta es crear un "diseño experimental"
Pondré un ejemplo, queremos saber si dos webs nuestras de idéntico pagerank tienen las mismas visitas o distintas porque una de ellas tiene un número mayor de páginas (o texto).
Crearíamos un diseño experimental de la siguiente manera.
ANTES DE REALIZAR EL EXPERIMENTO...
Primero deberemos definir lo que vamos a medir elaborando una "Hipótesis nula" que intentaremos demostrar que es falsa
La hipótesis nula sería en este caso: "Dos webs con idéntico pagerank tienen el mismo número de visitas aunque sus páginas sean diferentes en número". Ahora intentaremos demostrar que esto es falso.
Segundo, deberemos tomar para el experimento dos webs en las que todas las demás condiciones sean iguales. El caso ideal es una web "A" que tiene idénticos enlaces a la web "B" y a la web "C". B y C son idénticas en pagerank si nadie las ha enlazado (por lo tanto conviene crearlas nuevas en servidores gratuitos). Al ser nuevas todas las condiciones son iguales excepto el número de páginas que en "C" será más adelante, no ahora, -por ejemplo- el doble que en "B".
Los contenidos de las páginas deben ser distintas pues de otra forma crearíamos problemas con la cuestión de los contenidos duplicados en google.
Nótese también que cuando una de las webs tenga más páginas el pagerank que le "reparte" su index será menor para cada página que contiene.... ¿Es sólo la suma de pagerank de todas las páginas lo que trae tal o cual cantidad de visitas desde google?
Tercero, Puesto que los contenidos de la web son distintos puede haber diferencias en el número de visitas debido a la naturaleza de esos contenidos. Esto es lo que se llama una "Variable extraña". Para neutralizarla la convertimos en parte del experimento tomando una medición de las visitas de B y C cuando ambas tienen el mismo número de páginas.
Así pues publicamos las webs con el mismo número de páginas después de un baile las enlazamos desde A y medimos las visitas que tienen después del baile siguiente (el segundo). Eso nos dará dos valores, uno de ellos mayor que el otro.
Cuarto. Aplicamos el tratamiento después del siguiente baile (el segundo), es decir, duplicamos las páginas de C después de un segundo baile y B lo dejamos intacto. B es lo que se llama el grupo control y C el grupo experimental
Quinto. Realizamos la medición después del siguiente (tercer) baile de las visitas conseguidas en ambas.
Comparamos la proporción de visitas que podría ser asi (los datos son ficticios):
Web--- Medicion 1---Tratamiento---medicion 2
B------- 204---------- ---No---------- 223
C------- 56----------- ---Sí----------- 106
Efectivamente la proporción de visitas en C después del tratamiento se ha duplicado (fijaros que miro los datos en porcentaje respecto a la medición anterior al tratamiento, no en números brutos).
Existen herrameintas matemáticas para comprobar si la diferencia "es significativa". No obstante si la diferencia es muy evidente a ojo de buen cubero nos vale: queda con esto falsada la hipótesis nula y podemos afirmar que un mayor número de páginas produce un mayor número de visitas a igualdad de todas las demás condiciones, inclusive la suma de pagerank de todas las páginas.
En metodología científica este diseño -lo digo como curiosidad- se formula así y es uno de los más simples
O1 - No X - O2
O1 - X - O2
Un saludo