xumarhu.net xumarhu.net Cursos Tópicos Selectos de Tecnologías Web

Práctica 7: Indexado de Páginas Web

Objetivo: Forma de trabajo: Desarrollo:

Interconectar equipos: Desarrollar software de búsqueda: Preprocesamiento de la Información:
Por cada sitio Web encontrado se recomienda hacer un preprocesamiento que consiste en: Procesamiento de la Información:
Por último ya que se tiene la información se puede hacer su análisis. Hay muchas técnicas y formas de hacer este análisis, en este caso se hará alguno muy sencillo que consistirá en: Indexado:
Una vez que se identificaron las palabras que mas se repiten, se indexa el sitio (se almacena en una base de datos), con su nombre de dominio, la palabra que mas se repitió y una puntuación o ranking, basada en la repetición de la palabra (esto es para hacer una comparación con otras páginas parecidas).

Búsqueda de información por el cliente:

Los anteriores pasos los hace el Servidor el cual construye una base de datos con la información de todas las páginas que indexó. A continuación se hace una página Web para que pueda ser accesada por el Cliente, donde el Cliente escribirá lo que quiere buscar, y el Servidor buscará dentro de su base de datos, regresando al Cliente los resultados de la búsqueda (al igual que lo hace el motor de búsqueda de Google o cualquier otro motor de búsqueda actual).

Reporte del alumno (resultados):
FECHA DE ENTREGA: viernes 24 de marzo


Portal de Tecnología desarrollado por: Rogelio Ferreira Escutia
Valid CSS Valid XHTML 5