Cómo buscar información en la caché web de Google (Instrucciones). Cómo conocer el historial de cambios de una página web Encuentre el caché de la página en Yandex

Quizás el sitio fue bloqueado debido a una violación de la ley, o quizás este sitio simplemente aún no responde a la solicitud. Cualquiera sea el motivo, a veces es necesario tomar información de un sitio que recientemente dejó de funcionar o fue pirateado y perdió todo su contenido. En la mayoría de los casos, la suerte puede volverse tu cara. ¿Puedes ver una versión en caché de este sitio en Google?

Sitios en caché: ¿qué es?

Para encontrar rápidamente todos estos sitios, Google y otros motores de búsqueda almacenan copias internas de estos sitios en servidores. Estos archivos guardados se denominan caché y Google le permite verlos si existe dicha copia. Anteriormente, este proceso era muy claro: sólo tenía que hacer clic en el enlace proporcionado debajo del resultado de la búsqueda. Las cosas son un poco más complicadas ahora, pero no tienes que preocuparte porque todavía existen sitios en caché.

Miramos el caché del sitio en Google.:

1. Intenta encontrar algo. En este caso, buscaremos la clave "almacenamiento en caché" y asumiremos que en algún siglo Wikipedia dejó de funcionar.

2. Pase el mouse sobre el resultado de la búsqueda, pero no haga clic.
3. Verá aparecer una flecha hacia la derecha al lado derecho del resultado. Haga clic en esta flecha.
4. Ahora puedes ver la miniatura del sitio. También verá un enlace en caché en la parte superior de la miniatura. Puedes hacer clic en este enlace.

De esta manera serás redirigido a la versión en caché del sitio. Y esta versión no necesariamente contendrá los datos más recientes. Esta es solo una copia del sitio en el estado en el que se encuentra el bot. Google más reciente Una vez lo rastreé y, de hecho, esta página está almacenada en un servidor de Google y, por lo tanto, el enlace comenzará desde webcache.googleusercontent.com y no desde Wikipedia.org. Google también le dirá qué tan reciente es la copia.

A veces sucede que a las páginas les faltan imágenes o fondos. Puede hacer clic en el enlace en la parte superior de la página y ver una versión de texto del sitio en el que se encuentra. en este momento estás leyendo. A veces esto le ayuda a encontrar la información que necesita. También puede hacer clic en un enlace que lo llevará a la página actual si alguna vez necesita comparar las dos versiones.

Si necesita encontrar un término específico, puede usar el método abreviado de teclado Ctrl+F y simplemente buscarlo usando su navegador.

Sitios que no están en caché

La mayoría de los sitios tienen copias en caché, pero hay excepciones. Los propietarios del sitio pueden utilizar el archivo robots.txt para solicitar motor de búsqueda no indexe el sitio ni elimine el caché. A veces esto sucede cuando el propietario quiere eliminar completamente el sitio y no quiere que su contenido aparezca en ninguna parte. Después de todo, hay bastantes sitios con contenido “negro” o que no necesariamente necesita ser indexado (foros privados, información de tarjetas de crédito o sitios con acceso pago al contenido).

Puede ver cómo ha cambiado su sitio utilizando una herramienta de Google llamada WebArchive, pero la funcionalidad de esta herramienta también puede estar bloqueada por robots.txt.

20 de junio de 2012 a las 18:28

Recuperar artículos perdidos del almacenamiento en línea

  • Desarrollo de sitios web

La solución se está considerando (por ahora) sólo para un sitio: aquel en el que nos encontramos. La idea surgió como resultado del hecho de que un usuario creó un script de usuario que redirigiría la página al caché de Google si en lugar del artículo veíamos "El acceso a la publicación está cerrado". Está claro que esta solución sólo funcionará parcialmente, pero aún no existe una solución completa. Puede aumentar la probabilidad de encontrar una copia seleccionando un resultado entre varios servicios. El script HabrAjax comenzó a hacer esto (junto con otras tres docenas de funciones). Ahora (a partir de la versión 0.859), si el usuario ve una página medio vacía desde la que sólo puede ir a la página principal, a la página personal del autor (si tiene suerte) y viceversa, el script del usuario proporciona varios enlaces alternativos en que puedes intentar encontrar la pérdida. Y aquí comienza la diversión, porque ningún servicio está diseñado para el archivado de alta calidad de un sitio.

Por cierto, el artículo y la investigación fueron generados por una interesante encuesta y un guión de usuario: un comentario.

Por supuesto, se requiere un servicio de mayor calidad, por lo tanto, además de describir la modesta funcionalidad actual (probablemente encontrada en el caché de Google y en varios sitios de copia), plantearemos cuestiones de crowdsourcing en el artículo, para que "el mundo entero" pueda resolver el problema y llegar a una solución de alta calidad, por lo que además, la solución parece cercana a quienes tienen un servicio de copia de contenidos. Pero hablemos de todo en orden, consideremos todas las soluciones propuestas actualmente.

caché de google

A diferencia del caché de Yandex, se puede acceder a él directamente a través de un enlace; no es necesario pedirle al usuario que "luego haga clic en el botón 'copiar'". Sin embargo, todos los cachers, como el famoso archive.org, tienen una serie de características innecesarias.

1) simplemente no tienen tiempo para copiar instantánea y repetidamente los enlaces que aparecen. Aunque hay que rendir homenaje al hecho de que acceden con frecuencia a sitios populares y en 2 o más horas almacenan en caché nuevas páginas. Cada uno a su debido tiempo.

3) entonces el resultado del almacenamiento en caché depende de tu suerte. Puede omitir todos esos enlaces de almacenamiento en caché si realmente lo necesita, pero también debe copiar la información de allí usted mismo, porque pronto puede desaparecer o ser reemplazada por una copia sin sentido "más relevante" de una página en blanco.

Caché de Archive.org

Funciona para todo Internet con una capacidad menor que la de los motores de búsqueda, por lo que rara vez rastrea las páginas de algún sitio distante en ruso. La frecuencia se puede ver aquí:
Y el propósito del sitio es capturar fragmentos de la historia de la web, y no todos los eventos de cada sitio. Por tanto, rara vez encontraremos información útil.

caché de Yandex

No hay un enlace directo, por lo que debe pedirle (lo más simple) al usuario que haga clic en el enlace "copiar" en la página de búsqueda, que contendrá este artículo solo (si Yandex logró verlo).

La experiencia demuestra que un artículo que ha estado publicado durante un par de horas y que el autor lo cerró se guarda con bastante éxito en los cachés de los motores de búsqueda. Posteriormente, lo más probable es que sea sustituido con bastante rapidez por uno vacío. Todo esto, por supuesto, no conviene a los usuarios de la web, que, por definición, deben almacenar la información que llega a ella.

De los vivos he encontrado 4 hasta el momento, algunos que existen desde hace mucho tiempo (itgator) no funcionan en este momento. En general, por ahora son casi inútiles, porque obligan a buscar un artículo por título o palabras clave, y no en la dirección a la que llegó el usuario pagina cerrada(y según las palabras, Yandex busca bien y no solo en uno de sus sitios). Incluido en el script para obtener información útil.

Tarea

La comunidad se enfrenta a la tarea, sin molestar a los organizadores del sitio, de llevar el producto a un recurso de alta calidad que no pierda información. Para ello, como correctamente se señala en los comentarios de la encuesta, es necesario archivador de artículos completos actuales(y les comenta al mismo tiempo).

Actualmente, una solución incompleta, como se describe anteriormente, se ve así:

Si busca en Yandex, la dirección seleccionada mostrará un solo enlace (o nada):


Al hacer clic en el enlace "copiar", veremos (si tenemos suerte) una copia guardada (la página se seleccionó únicamente para el ejemplo actualmente relevante):

En Google es algo más sencillo: inmediatamente llegamos a la copia, si también tenemos suerte, y Google logró guardar exactamente lo que necesitamos, y no un duplicado de la página que falta.

Es curioso que el guión ofrezca ahora una “selección de servicios alternativos” en este caso (“mantenimiento preventivo”):

Espero sugerencias para agregar servicios y fotocopiadoras (o al menos proyectos) (para los no autorizados, envíe un correo electrónico a spmbt0 en un recurso conocido de Google y luego elegiremos un formato conveniente).

UPD 23:00: empíricamente para correo.ru Se aclaró la estructura de un enlace directo al caché:
"http://hl.mailru.su/gcached?q=cache:"+ window.location Expertos o expertos, díganos qué tipo de enlace es este, qué tan estable es (¿cambiará el dominio de tercer nivel, por ejemplo?) , ¿Qué significa el prefijo "g" en caché? ¿Esto significa caché de Google o es caché del motor Gogo?

Instrucciones

Si estás usando un navegador Explorador de Internet, para ver el caché, abra la pestaña "Herramientas", seleccione "Opciones de Internet" - "General". Busque la sección "Archivos temporales de Internet", haga clic en el botón "Opciones". En la ventana que se abre, seleccione "Ver archivos".

Cuando utiliza el navegador Opera, puede ver el caché de varias formas. Primero: escriba opera:cache en la barra de direcciones, verá. Segunda opción: utilice la utilidad gratuita OperaCacheView. Le permite ver el caché de una forma conveniente, obtener información sobre el tamaño del archivo, el tiempo de almacenamiento, la fecha del recurso, etc.

Usuarios del navegador Mozilla Firefox Para ver el caché, debe ir al directorio donde se encuentra. Normalmente, la ruta se ve así: C:Documentos y configuracionesAdminConfiguración localDatos de aplicaciónMozillaFirefoxProfilesfolder_with_alphanumeric_nameCache La ruta exacta se puede obtener fácilmente ingresando about:cache en la barra de direcciones del navegador y haciendo clic en el botón Ir.

Para ver más cómodamente el caché del navegador Mozilla Firefox, utilice la extensión CacheViewer. Puede descargarlo desde el sitio oficial de soporte del navegador: https://addons.mozilla.org/ru/firefox/addon/cacheviewer/

en el navegador Google Chrome Los archivos de caché se encuentran en la carpeta: C: Documentos y configuraciones $nombre de usuario Configuración localDatos de aplicaciónGoogleChromeDatos de usuarioDefaultCache. Pero están en un formato inaccesible para una visualización normal, por lo que es mejor escribir about:cache en la barra de direcciones del navegador y presionar Enter. Para una visualización aún más cómoda, utilice la utilidad Google Chrome Cache View, que es fácil de encontrar en Internet.

No olvide que la memoria caché de su navegador almacena mucha información sobre su actividad en línea. Si no desea que alguien acceda a su computadora (por ejemplo, una computadora de trabajo) y comience a analizar su trabajo en Internet, borre periódicamente su caché y . Puede configurar el caché para que se borre automáticamente cuando apague el navegador.

Una caché es un almacenamiento lógico de registros de los nombres más recientes de recursos remotos. Se trata de una especie de búfer intermedio que contiene la información que probablemente tendrá mayor demanda. El caché es necesario para optimizar el rendimiento de la computadora: al registrar dinámicamente las últimas solicitudes, el caché, al acceder nuevamente a ellas, acelera significativamente el tiempo de la siguiente solicitud.

Instrucciones

El archivo de caché también se denomina archivo de enlace raíz porque los registros de los recursos visitados más recientemente almacenan información sobre los servidores raíz. Esto se utiliza para redirigir rápidamente la solicitud cuando se accede posteriormente a recursos remotos. Si bien realiza una importante función de optimización, la memoria caché puede degradar significativamente el rendimiento. Esto puede deberse a que el caché esté lleno de información innecesaria e innecesaria.

¿Qué pasa con el caché si es necesario borrar este archivo o realizar otras manipulaciones en él? El caché se encuentra en carpetas del sistema que están ocultas para el usuario, por lo que para ver el archivo de caché primero debe configurar la visualización. carpetas del sistema y extensiones de archivos.

Luego busque en la carpeta System32, busque la carpeta Dns donde se encuentra el archivo Cache.dns. este archivo es un caché.

La caché del navegador es un portapapeles de información que recuerda las páginas visitadas con frecuencia en Internet. Para ahorrar tiempo y reducir el tráfico, el navegador no carga estas páginas al ingresar, sino que las copia de la memoria caché.

Instrucciones

En trabajo frecuente En Internet, la memoria caché del navegador se llena y se consume el espacio libre en el disco duro. Por lo tanto, el caché debe borrarse periódicamente para garantizar el correcto funcionamiento del sistema. Para saber cuánto caché ocupa actualmente en Opera y borrarlo, haga clic en el botón "Menú" ubicado en panel superior navegador.

En las opciones del menú, seleccione la pestaña Herramientas. En la ventana que se abre, haga clic en "Preferencias".

En "Preferencias" selecciona "Historial y caché". Verá el tamaño de la memoria ocupada actualmente por el caché.

Si se excede el tamaño de la caché y desea borrarlo, solicite a su navegador el comando "Borrar inmediatamente".
Espere el tiempo requerido hasta que el sistema haga frente a la tarea.

En el menú de configuración, haga clic en el botón "Avanzado".

Seleccione la pestaña Red. Verás que el navegador te pide que decidas qué tamaño de caché (en megabytes) es aceptable para tu cómodo trabajo en Mozilla Firefox. De forma predeterminada, la cantidad está establecida en 50 MB. Cámbielo si es necesario.

Para borrar el caché de su navegador, seleccione Borrar ahora. Espere a que el navegador termine este trabajo.

Descubra el caché en navegador de google Chrome se puede hacer de la siguiente manera. Abre Google Chrome. Vaya a configuración haciendo clic en el botón de llave ubicado a la derecha de la barra de direcciones.

Marque la casilla junto a la función "Borrar caché", luego haga clic en el botón "Eliminar datos de navegación".

Vídeo sobre el tema.

El navegador escribe archivos de las páginas vistas en la memoria caché y los almacena allí durante un tiempo determinado, para que luego, cuando regrese a esta pagina, no pierdas tiempo y recursos en una nueva descarga. Si necesita ver el contenido del caché, puede hacerlo de dos maneras: busque directamente la carpeta con los archivos en su computadora (en el directorio Documentos y Configuración) o realice una serie de manipulaciones simples en un navegador en ejecución.

necesitarás

  • computadora

Instrucciones

Habilitar la visualización de archivos. Para hacer esto, abra cualquier carpeta de ventanas y seleccione "Opciones de carpeta" en el menú "Herramientas". En la ventana que se abre, seleccione la pestaña "Ver", en la lista que aparece, marque la línea "Mostrar archivos ocultos y carpetas" y haga clic en el botón "Aplicar a todas las carpetas".

Busque el directorio donde su navegador almacena los datos de caché:

Internet Explorer C:\Documentos y configuraciones\su nombre de usuario\Configuración local\Archivos temporales de Internet

Google Chrome C:\Documentos y configuraciones\su nombre de usuario\Configuración local\Datos de aplicación\Google\Chrome\Datos de usuario\Default\Cache

Mozilla Firefox C:\Documentos y configuraciones\su nombre de usuario\Configuración local\Datos de programa\Mozilla\Firefox\Profiles\kbthds8h.default\Cache

Opera C:\Documentos y configuraciones\su nombre de usuario\Configuración local\Datos de programa\Opera\Opera\cache

Los archivos guardados en el caché están a tu disposición.

Correr Navegador Mozilla Firefox. Para ver el contenido de la memoria caché, escriba barra de direcciones Comando del navegador “about:cache”, en la página que se abre, haga clic en el enlace Listar entradas de caché.

Si desea borrar el caché, seleccione "Configuración" en el menú "Herramientas" y luego seleccione la pestaña "Privacidad". Haga clic en "borrar" historia reciente" Puede configurar los ajustes de ahorro de caché allí, en la pestaña "Avanzado" en el menú "Red".

Correr navegador ópera. Para ver el caché, escriba línea de comando comando del navegador “opera:cache”. Es posible ver tanto el contenido completo de la memoria como seleccionar archivos por categorías individuales.

Para configurar los ajustes y borrar el caché, seleccione el elemento del menú "Configuración" " Configuraciones generales"o presione la combinación de teclas Ctrl+F12. En la ventana que aparece, seleccione la pestaña "Avanzado" y en ella el elemento "Historial".

Inicie el navegador Internet Explorer. Seleccione "Opciones de Internet" en el menú Herramientas. En la ventana que se abre, puede configurar los ajustes para guardar las páginas que está viendo y ver el contenido de las páginas ya guardadas haciendo clic en el botón "Mostrar archivos".

Inicie el navegador Google Chrome. Para ver el contenido del caché, escriba "about:cache" en la barra de direcciones de su navegador. Para borrar la memoria, haga clic en el botón de configuración en la esquina superior derecha de la ventana del navegador (tiene dibujada una llave inglesa) y seleccione "Opciones", y en él el menú "Avanzado". En el apartado “Datos Personales”, haga clic en el botón “Eliminar datos de navegación”.

Vídeo sobre el tema.

tenga en cuenta

Recuperar archivos de audio y vídeo del caché para guardarlos en su disco duro, no se olvide de los requisitos legales para la protección de derechos de autor.

A menudo, después de ver un vídeo en el navegador, existe el deseo de guardarlo en el disco para verlo más tarde sin conexión. Para no volver a descargar el archivo mediante programas de descarga, puede extraerlo de la carpeta de caché, donde los navegadores colocan toda la información que descargan.

Para encontrar después de descargar archivo requerido, abra la carpeta de caché y configure la vista de tabla de su contenido. Después de esto, todas las carpetas y archivos se presentarán en una tabla con columnas: nombre, fecha de modificación, tipo, tamaño. En Opera y Firefox, el caché contiene no solo archivos, sino también carpetas. Es en este último donde se guardará el archivo descargado, el cual se debe buscar por fecha de modificación y tamaño. El primer parámetro debe corresponder al momento en que cargó el archivo; su tamaño suele ser significativamente mayor que el tamaño de otros archivos en la carpeta; generalmente supera 1 MB. Abra cada carpeta en el caché por turno y busque el archivo que necesita.

Una vez que lo encuentre, cópielo a otra carpeta (para evitar pérdidas, ya que los navegadores a veces borran automáticamente la información del caché) y haga doble clic en él para ejecutarlo. Dado que estos archivos no tienen extensión, aparecerá un cuadro de diálogo que le dará la opción de elegir el programa para abrir el archivo. Selecciona cualquier jugador ( Windows Media Player, Media Player Classic Home Cinema, etc.) e intente reproducir el archivo con ellos. Si su elección fue correcta, aparecerá una imagen de video en la ventana del reproductor.

tenga en cuenta

Las rutas de almacenamiento para la carpeta de caché están indicadas para Windows 7. Si tiene Windows XP instalado, las rutas serán las siguientes: X:/Documentos y configuraciones/Nombre de usuario/Configuración local/Datos de aplicación/Opera/Opera/cache – para Opera y X:/Documentos y configuraciones/Nombre de usuario/Configuración local/Datos de aplicación/Mozilla\Firefox\Profiles\o60fmf02.default\Cache – para Firefox.

La caché de Google Chrome es un almacenamiento para archivos temporales. En él se colocan fotos, secuencias de audio y vídeo, textos e imágenes animadas durante el proceso de carga de la página web solicitada por el usuario. Cuando necesites abrirlo nuevamente, Google Chrome “moverá” sus elementos del caché a la pestaña, sin perder tiempo y tráfico de red para volver a descargarlos desde el servidor del sitio.

En Google Chrome, a veces los usuarios necesitan saber dónde se encuentra el almacenamiento caché, cómo verlo (encontrar los datos necesarios en él), desactivarlo y cómo moverlo a otro directorio (partición de disco, carpeta). Continúe leyendo para obtener más información sobre cómo se realizan estas acciones y configuraciones.

¿Dónde se almacena el caché?

Para abrir el directorio que contiene los archivos de caché, siga estas instrucciones:

1. Cierra tu navegador.

2. Presione las teclas "Win" y "R" juntas.

3. Copie y pegue esta ruta en la línea "Abrir" en el panel "Ejecutar":

%userprofile%\Configuración local\Datos de aplicación\Google\Chrome\Datos de usuario\Default\Cache

4. Haga clic en "Aceptar".

5. La caché del navegador (un grupo de archivos de datos) se mostrará en una nueva ventana.

¿Cómo eliminar el caché?

Para actualizar el caché y eliminar toda la información cargada anteriormente, llame al panel de configuración y realice una limpieza (actualización) usando la combinación de teclas "Ctrl + Shift + Supr". Obtenga más información sobre cómo se realiza este procedimiento.

¿Cómo ver el contenido del almacenamiento?

1. En la barra de direcciones de Chrome, escriba la solicitud: chrome://cashe. Presione "Entrar".

2. Todos los datos guardados en el caché se mostrarán en una nueva pestaña (en forma de enlaces).

3. Para buscar rápidamente en la lista información necesaria, presione las teclas “Ctrl + F” simultáneamente. En el minipanel que aparece en la parte superior derecha, ingrese la solicitud requerida (nombre de dominio, nombre de archivo) y presione “Entrar”.

4. Los datos encontrados se resaltarán en la lista.

¡Consejo! También acceso rápido Se puede acceder al caché utilizando el complemento Click&Clean. En su menú hay un botón “Ver caché…”.

¿Cómo mover la carpeta de almacenamiento a otro directorio?

Si necesita mover archivos de caché a otra unidad o carpeta debido a poco espacio en disco o problemas de seguridad o privacidad de datos, siga estos pasos:

1. Cierra la ventana de Chrome.

2. Abra el panel Ejecutar (Win + R).

3. En la línea "Abrir", ingrese:

%userprofile%\\configuración local\\datos de aplicación\\google\\chrome

4. Presione "Entrar".

5. Se abrirá una ventana del sistema con la carpeta Datos de usuario. Cópialo: haz clic derecho → Copiar.

6. Pegue la carpeta copiada en el directorio donde desea colocarla. Espere a que se complete la transferencia de datos.

7. Haga clic derecho en el acceso directo del navegador en su escritorio.

8.B menú contextual Haga clic en Propiedades.

9. En la línea "Objeto" después de la ruta a archivo ejecutable Sangrado con un espacio, agregue un comando en el formato:

--user-data-dir="C:\\Datos de usuario"

Donde C:\\Datos de usuario es la ruta a la nueva ubicación de almacenamiento de caché (¡es posible que tenga un valor diferente!).

10. Haga clic en "Aplicar" y "Aceptar".

Usando el mismo método de agregar comandos adicionales a las propiedades de acceso directo, puede crear otros complementos para caché de google Cromo. Por ejemplo:

disk-cache-size= - cambiar (aumentar/disminuir) el tamaño de la caché (si establece el valor en "0", se desactivará);

Incluso una página que ha desaparecido de Internet puede tener una copia guardada en la caché del servicio de búsqueda.

Cómo ver el caché de Google

En primer lugar, utilizando el menú "En caché":

Además, puede utilizar una dirección especial:

Http://webcache.googleusercontent.com/search?q= cache:url_page_ without_"http://"

La siguiente consulta devuelve una versión en caché de la página de inicio de StackOverflow.com:

Http://webcache.googleusercontent.com/search?q= caché:stackoverflow.com

Como resultado, obtenemos una "instantánea" de la página tomada por Google en una fecha específica. Un texto de advertencia como el siguiente se coloca encima del contenido de la página:

Este es el caché de Google de http://stackoverflow.com/. Es una instantánea de la página tal como apareció el 28 de abril de 2016 a las 11:33:38 GMT. La página actual podría haber cambiado mientras tanto.

Si desea ver la versión de texto de la página, es decir, la página sin imágenes, animación flash, etc., agregue &strip=1 al final de la solicitud. En nuestro ejemplo obtenemos lo siguiente:

Webcache.googleusercontent.com/search?q= cache:stackoverflow.com& strip = 1

También puede utilizar los servicios cachedview.com o www.cachedpages.com. En general, además de las búsquedas en caché de Google, también brindan acceso a otros servicios de archivo web, pero, por regla general, sólo Google funciona de manera confiable.

Caché de Yandex

En Yandex, se puede obtener una versión en caché de una página utilizando el menú "Copia guardada" en los resultados de búsqueda.

archivo web

Los cachés del servicio de búsqueda tienen una limitación común: solo puede ver la versión guardada más reciente de la página y no el historial de cambios de la página. El archivo web The Internet Archive Wayback Machine llena este vacío. Este es el archivo web más antiguo y conserva copias de sitios que datan de 1996. Lo hace automáticamente, en ciertos intervalos, lo que le permite ver el historial de cambios de página.

Internet Archive Wayback Machine admite varias API, en particular la API JSON, que permite a los desarrolladores crear aplicaciones que recuperan datos de este archivo.

Conexión