Cerrar menu
Tutoriales En Linea
  • Tutoriales
    • Aprendizaje
    • Video Tutorial
    • Manuales
    • Hagalo usted mismo
    • Explorar todo
  • Adobe
    • After Effects
    • Dreamweaver
    • Premiere Pro CC
    • Photoshop
    • Photoshop Mix
    • Lightroom
    • Illustrator
    • Adobe Muse
    • Creative Cloud
  • Android
    • Developer Android
    • Aplicaciones
    • Android Studio
    • Android Wear
    • Desarrolladores
    • SDK Platform-Tools
    • ADB...depuración Bridge
    • Fastboot
    • Root
    • Recovery
  • Apple
    • iPhone y iPad
    • iPhone
    • iPad
    • Mac OS
    • iCloud
    • iTunes
  • Cursos
    • Actívate
    • Autoempleo
    • Idiomas
    • Curso De HTML
    • Curso de C++
    • Javascript
    • jQuery
    • Matematicas
    • Programacion
    • Python
    • Udacity
    • Diseño Web adaptativo
  • Ciberseguridad
    • Malware
    • Ransomware
    • Virus
    • Troyano
    • Dorkbot
    • Filecoders
    • keylogger
    • Spyware
    • Jackware
    • DDoS
    • HackerOne
    • Interpol
  • Criptomonedas
    • Blockchain
    • Mineria de Criptomonedas
    • Bitcoin (BTC)
    • Bitcoin Cash (BCH)
    • DASH (Dash)
    • Dogecoin (Doge)
    • Ethereum (ETH)
    • Litecoin (LTC)
    • Monero (XMR)
    • Ripple (XRP)
    • Zcash (ZEC)
    • Forex
    • Trading
  • Desarrollo Web
    • Sistema de gestion de contenidos
    • AMP
    • Datalife Engine
    • Blogger
    • WordPress
    • Joomla
    • Bootstrap
    • Plantillas
    • @font-face
    • Schema
    • Website
    • Desarrolladores
    • Lenguaje Web
  • Diseño Web
    • Web Responsive
    • Lenguaje Web
    • Datos estructurados
    • HTML
    • CSS3
    • JavaScript
    • Ajax
    • jQuery
    • PHP
  • Entretenimiento
  • Encuestas
    • GlobalTestMarket
    • Centro de opinion
    • Ipsos i-Say
    • Triaba
    • opinea
    • Toluna
    • YouGov
    • ClixSense
    • ySense
    • Cint
    • Beruby
  • Electricidad
  • Electronica
  • Ganar dinero comprando
    • CashbackDeals
    • Cashback
    • Por ir de compras
    • Aklamio
    • Intercambio de tráfico
    • Justificante de pagos
    • Webs estafas
  • Google
    • Google Pay
    • Adsense
    • Gmail
    • Google Apps
    • Google Chrome
    • Google Cloud Platform
    • Google Consumer Surveys
    • Google Desarrolladores
    • Google Fit
    • Google Maps
    • Google Photos
    • Google Play
    • Google Translation
    • DoubleClick
    • YouTube
    • Chromebooks
  • Marketing
    • SEM
    • SEO
    • Posicionamiento
    • Contenido
    • Publisuites
    • Space Content
    • Coobis
    • Marketing
  • Computadora u ordenador
    • Sistemas operativos
      • Windows
      • Mac OS
      • Android
      • Linux
      • Ubuntu
      • Kali Linux
      • Wifislax
    • hardware
    • Software
    • BIOS
    • Unidad de disco duro
    • Programacion
    • Dispositivos
    • Internet
  • Ofimática
    • Microsoft
    • Suite Ofimatica
    • Access
    • Word
    • Excel
    • Powerpoint
    • Outlook
    • Microsoft Publisher
  • PTC
    • No pierdas tiempo con estas web
  • Redes Sociales
    • Delicious
    • Facebook
    • Instagram
    • linkedin
    • Snapchat
    • TikTok
    • Twitter
    • Pinterest
    • Spotify
    • Vkontakte - VK
    • WhatsApp
  • Smartphone
    • Telefonos
    • Telefonia movil y telecomunicaciones
    • Desbloquear
    • Códigos NCK
    • Liberar
    • Tarjeta SIM
    • Tablet
  • Sitio Web
    • Dominios
    • Hosting
    • Servidores
    • Demo DLE
    • Documentación sobre Datalife Engine
    • Modulos DLE
    • Hack
    • Optimizacion
    • Google Adsense
    • Plantillas
  • Tips
    • Cabello
    • Consejos
    • Cremas
    • Cosmético
    • Cuerpo
    • Dieta
    • Exfoliantes
    • Entrenamiento
    • Ejercicio
    • Estilo
    • Fitness
    • Habitos
    • Hidratante
    • Look
    • Maquillaje
    • Moda
    • Piel Radiante
    • Recetas
    • Ropa
    • Rutina
    • Salud
    • Tratamientos
  • Trabajos
    • Atencion al cliente
    • Asistente virtual
    • Transcripcíon
    • Transcripcíones medica
    • Entrada de datos
    • De edicion y correccion
    • Mystery Shopping
    • Micro trabajos
    • Contabilidad
    • Tutoria y aprendizaje
    • Mas ingresos extras
    • Git
    • GitHub
    • Criptografia
    • Deep Web
    • Hacker
    • FTP
    • Indexar
    • Newsletter
    • Redes y VPN
    • Herramientas online
  • Windows
    • Skype
    • Windows
    • Windows 11
    • Windows 10
    • Windows 8
    • Windows 7
    • Puerta trasera de Windows
    • Microsoft Edge
Facebook X (Twitter) Instagram
  • Sobre nosotros
  • Últimos artículos
  • Herramientas SEO
  • Ver mas temas
  • Más sitios que te gustarán
Facebook X (Twitter) Instagram Pinterest Youtube
  • Secciones
    1. Android
    2. Adobe
    3. Bricolaje
    4. Bachillerato
    5. Cursos
    6. Criptomonedas
    7. Criptografia
    1. Diseño Web
    2. Encuestas
    3. Empleo
    4. Electricidad
    5. Electronica
    6. Forex
    7. Fisica
    1. Google
    2. Hardware
    3. Herramientas Ofimaticas
    4. Herramientas
    5. Internet
    6. Idiomas
    7. IPTV
    1. Programacion
    2. Libros
    3. Microsoft
    4. Manuales
    5. Matematica
    6. Newsletter
    7. Optimizacion
    1. Redes Sociales
    2. Software
    3. Seguridad
    4. Telefonia
    5. WebSite
    6. Ver todas las categorias
    7. Post promocionado
  • Smartphone

    Comprendre les Différences entre les Chargeurs USB et les Chargeurs USB-C : Un Guide Complet

    Huawei Smartphones: Las Mejores Ofertas del Black Friday para Aprovechar

    Gadgets imprescindibles para tu configuración de oficina en casa

    ¡Descubre las tendencias más emocionantes en el mundo de los videojuegos!

    Tendencias en sistemas operativos en smartphone

  • Tecnología
    1. Móviles
    2. Ordenadores
    3. Software
    4. Hardware
    5. Seguridad
    6. Ver todo

    Comprendre les Différences entre les Chargeurs USB et les Chargeurs USB-C : Un Guide Complet

    Huawei Smartphones: Las Mejores Ofertas del Black Friday para Aprovechar

    Gadgets imprescindibles para tu configuración de oficina en casa

    ¡Descubre las tendencias más emocionantes en el mundo de los videojuegos!

    Cómo limpiar la unidad C de archivos innecesarios

    Descubre el misterioso mundo del hash de archivos: ¡todo lo que necesitas saber!

    Los componentes fundamentales que todo PC debería tener

    Que es la tecla TAB

    Cifrado | Seguridad Local

    Maximiza tu productividad: Descubre el sistema interactivo que revolucionará la gestión de proyectos en tu empresa

    Cómo limpiar la unidad C de archivos innecesarios

    Como jugar online y resolver un sudoku

    Que es la tecla TAB

    Cómo deshabilitar la desfragmentación de SSD y HDD en Windows 10 y 11

    Benefits Of Vertical Dual Monitors For Coding And Programming

    AMD ha identificado la causa de la quema de los procesadores Ryzen 7000 y ha lanzado un nuevo AGESA para corregir el problema

    Cifrado | Seguridad Local

    Descubre el misterioso mundo del hash de archivos: ¡todo lo que necesitas saber!

    Virus en el sistema DataLife Engine (DLE) y cómo tratarlos

    La ciberseguridad: Vital Para Las Apuestas Online en España

    ¡Descubre las tendencias más emocionantes en el mundo de los videojuegos!

    ¿Aburrido de tu viejo televisor? Descubre las últimas tendencias en televisores

    Generador de Video IA: La Revolución en la Creación Audiovisual

    Los últimos celulares para que estés a la última

  • Estilo de vida
    1. Entrenamiento
    2. Maquillaje
    3. Dieta
    4. Moda
    5. Trucos y tips
    6. Ver todo

    Desarrolla un cuerpo fuerte y saludable

    ¿Qué es la forma física?

    Mejora los resultados de tu entrenamiento de estabilidad y fuerza

    Consejos para maximizar las caminatas diarias

    ¿Por qué es importante preparar la piel antes de maquillarla?

    Consejos para aplicar pestañas postizas

    Consejos para una piel perfecta este invierno

    La nutrición y un cabello saludable

    Cosas que le pasan a tu cuerpo cuando comes salmón todos los días

    Batidos de proteínas pueden ayudar a mejorar sus hábitos alimenticios

    Batidos de proteinas - Una guía para principiantes

    Snacks nutritivos para cada antojo

    Inspiración de traje de otoño

    La dura verdad sobre las modelos de talla grande

    Razones por las que las marcas de moda de lujo son tan caras

    Cuales son las mejores frutas para adelgazar

    Como enseñar a leer y a escribir

    Como generar cuentas Disneyplus

    Calcular porcentajes con la Calculadora de Windows 10

    Bricolaje para la decoración del hogar

    Top 10 de posturas de yoga

    ¿Por qué es importante preparar la piel antes de maquillarla?

    Inspiración de traje de otoño

    Consejos de belleza para lucir fresca en el verano

  • Marketing

    ¿Sirven de algo los diseñadores Web?… ¿y los redactores de contenido?

    ¿Qué es un Link Dofollow?

    ¿Qué es Nofollow?

    ¿Qué es el remarketing?

    ¿Qué es el posicionamiento web (SEO) y lo necesito para mi sitio web?

  • Juegos

    Para qué se pueden usar las Gafas VR PS4

    La nueva generación de realidad virtual de PlayStation®VR2 y PlayStation®5

    Colaboración entre Sony INZONE y EXCEL Esports

    Sony prohíbe cuatro juegos de terceros en Xbox

    Prepárate para el futuro: Project Trinity llega a finales de 2024

  • Herramientas
Búsqueda extendida

Escriba arriba y presione Enter para buscar.

¡Bienvenido de nuevo!

Inicie sesión o Regístrate ahora

VK

o con Email

¿Has olvidado tu contraseña?

Google » Encabezados y compresión del robot de Google

Encabezados y compresión del robot de Google


1 Mayo 30, 2015
Compartir

Compartir
Twitter Pinterest LinkedIn Tumblr WhatsApp Email
Encabezados y compresión del robot de GoogleGooglebot: qué sueño. Es como si nos conociera <head>, <body> y soul. Probablemente no esté buscando nada exclusivo; ve miles de millones de otros sitios (aunque también compartimos nuestros datos con otros bots :), pero esta noche realmente nos conoceremos como sitio web y rastreador.
Que Es El Robots.txt o Googlebot
Lo sé, nunca es bueno analizar en exceso una primera cita. Vamos a conocer Googlebot un poco más lentamente, en una serie de publicaciones:

Nuestra primera cita (esta noche): encabezados que envía el robot de Google, formatos de archivo que "nota", si es mejor comprimir datos
Juzgando su respuesta: códigos de respuesta (301s, 302s), cómo maneja las redirecciones y If-Modified-Since

Próximos pasos: seguir los enlaces, hacer que se arrastre más rápido o más lento (para que no se ponga demasiado fuerte)
Y esta noche es solo la primera cita...

***************
Googlebot:  ACK
Website:  Googlebot, you're here!
Googlebot:  I am.

GET / HTTP/1.1
Host: example.com
Connection: Keep-alive
Accept: */*
From: googlebot(at)googlebot.com
-Agent: Mozilla/5.0 (compatible; Googlebot/2.1; +https://www.google.com/bot.html)
Accept-Encoding: gzip,deflate

Sitio web: ¡Esos encabezados son tan llamativos! ¿Se arrastraría con los mismos encabezados si mi sitio estuviera en los EE. UU., Asia o Europa? ¿Alguna vez usaste diferentes encabezados?

Googlebot: mis encabezados suelen ser consistentes en todo el mundo. Estoy tratando de ver cómo se ve una página para el idioma y la configuración predeterminados para el sitio. A veces, el -Agent es diferente, por ejemplo, las búsquedas de AdSense usan "Mediapartners-Google":

  • -Agent: Mediapartners-Google
O para la búsqueda de imágenes:Or for image search:

  • -Agent: Googlebot-Image/1.0
Las recuperaciones inalámbricas a menudo tienen agentes de específicos del operador, mientras que las recuperaciones RSS de Google Reader incluyen información adicional, como el número de suscriptores.


Por lo general, evito las cookies (así que no el encabezado "Cookie:") ya que no quiero que el contenido se vea afectado demasiado por la información específica de la sesión. Y, si un servidor usa una identificación de sesión en una URL dinámica en lugar de una cookie, generalmente puedo resolver esto, de modo que no termine rastreando su misma página un millón de veces con un millón de identificadores de sesión diferentes.

Sitio web: soy muy complejo. Tengo muchos tipos de archivos. Sus encabezados dicen "Aceptar: * / *". ¿Indiza todas las URL o ciertas extensiones de archivo se filtran automáticamente?

Googlebot: Eso depende de lo que esté buscando.

Si estoy indexando para una búsqueda web regular y veo enlaces a MP3 y videos, probablemente no los descargue. Del mismo modo, si veo un webp, lo trataré de manera diferente a un enlace HTML o PDF. Por ejemplo, es mucho menos probable que webp cambie con frecuencia que HTML, por lo que revisaré webp para ver los cambios con menos frecuencia para ahorrar ancho de banda. Mientras tanto, si busco enlaces como Google Scholar, me interesará mucho más el artículo PDF que el archivo webp. Descargar garabatos (como webp) y videos de perros que andan en patineta es una distracción para un erudito. ¿Estás de acuerdo?

Sitio web: Sí, pueden ser una distracción. Estoy asombrado de tu dedicación. Me encantan los garabatos (webp) y los encuentro difíciles de resistir.

Googlebot: yo también; No siempre soy tan erudito. Cuando me arrastro para buscar imágenes, estoy muy interesado en los webp. Y para las noticias, principalmente estoy viendo HTML e imágenes cercanas.

También hay muchas extensiones (exe, dll, zip, dmg ...), que tienden a ser grandes y menos útiles para un motor de búsqueda.


Sitio web: Si vio mi URL, www.example.com/page1.LOL111, ¿lo rechazaría (whimper whimper) solo porque contiene una extensión de archivo desconocida?

Googlebot: sitio web, déjame darte un poco más de información. Después de descargar un archivo, utilizo el encabezado Content-Type para verificar si realmente es HTML, una imagen, texto u otra cosa. Si se trata de un tipo de datos especial, como un archivo PDF, un documento de Word o una hoja de cálculo de Excel, me aseguraré de que esté en el formato válido y extraeré el contenido del texto. Tal vez tiene un virus; nunca sabes. Si el documento o tipo de datos es realmente confuso, generalmente no hay mucho que hacer además de descartar el contenido.

Entonces, si estoy rastreando www.example.com/page1.LOL111 con una extensión de archivo desconocida, es probable que comience a descargarlo. Si no puedo descifrar el tipo de contenido del encabezado, o es un formato que no indexamos (por ejemplo, mp3), entonces se dejará de lado. De lo contrario, procedemos a indexar el archivo.

Sitio web: Mis disculpas por examinar su estilo, Googlebot, pero noté que sus encabezados de codificación de aceptación dicen:
Aceptar-codificación: gzip, desinflar

¿Me puede explicar estos encabezados?

Googlebot: claro. Todos los principales motores de búsqueda y navegadores web iten la compresión gzip de contenido para ahorrar ancho de banda. Otras entradas que puede ver aquí incluyen "x-gzip" (igual que "gzip"), "desinflar" (que también itimos) e "identidad" (ninguna).

Sitio web: ¿Puede hablar más sobre la compresión de archivos y "Accept-Encoding: gzip, deflate"? Muchas de mis URL consisten en grandes archivos Flash e imágenes impresionantes, no solo HTML. ¿Te ayudaría a gatear más rápido si comprimo mis archivos más grandes?

Googlebot: no hay una respuesta simple a esta pregunta. En primer lugar, muchos formatos de archivo, como swf (Flash), webp, webp, webp y pdf ya están comprimidos (también hay optimizadores Flash especializados).

Sitio web: ¿Quizás he estado comprimiendo mis archivos Flash y ni siquiera lo sabía? Obviamente soy muy eficiente.

Googlebot: tanto Apache como IIS tienen opciones para habilitar gzip y desinflar la compresión, aunque hay un costo de U involucrado por el ancho de banda guardado. Por lo general, solo está habilitado para contenido HTML / CSS / PHP de texto fácilmente comprimible. Y solo se usa si el navegador del o yo (un rastreador de motores de búsqueda) lo permitimos. Personalmente, prefiero "gzip" sobre "desinflar". Gzip es una codificación ligeramente más robusta: siempre hay una suma de verificación y un encabezado completo, lo que me da menos conjeturas que con desinflar. De lo contrario, son algoritmos de compresión muy similares.

Si tiene alguna U de repuesto en sus servidores, puede valer la pena experimentar con la compresión (enlaces: Apache, IIS). Pero, si está sirviendo contenido dinámico y sus servidores ya están muy cargados de U, es posible que desee esperar.

Sitio web: gran información. Me alegro mucho de que hayas venido esta noche. Gracias a Dios, mi robots.txt lo permitió. ¡Ese archivo puede ser como un padre sobreprotector!

Googlebot: Ah sí; conociendo a los padres, el robots.txt. He conocido a muchos locos. En realidad, algunas son solo páginas de error HTML en lugar de robots.txt válidos. Algunos tienen redireccionamientos infinitos en todo el lugar, tal vez a sitios totalmente no relacionados, mientras que otros son enormes y tienen miles de URL diferentes enumeradas individualmente. Aquí hay un patrón desafortunado. El sitio normalmente está ansioso por que rastree:

  Agente de : *
  Permitir: /

Luego, durante un momento pico con alto tráfico de s, el sitio cambia el archivo robots.txt a algo restrictivo:

  # ¿Puedes irte por un tiempo? Te dejare volver
  # de nuevo en el futuro. Realmente, lo prometo!
  Agente de : *
  No permitir: /

El problema con el intercambio de archivos robots.txt anterior es que una vez que veo el restrictivo robots.txt, es posible que deba comenzar a tirar el contenido que ya rastreé en el índice. Y luego tengo que volver a rastrear una gran cantidad de contenido una vez que se me permite volver al sitio. Al menos un código de respuesta 503 habría sido temporal.

Por lo general, solo vuelvo a verificar el archivo robots.txt una vez al día (de lo contrario, en muchos sitios de alojamiento virtual, gastaría una gran parte de mis búsquedas solo para obtener el archivo robots.txt, y ninguna fecha quiere "conocer a los padres" tan a menudo) . Para los , tratar de controlar la frecuencia de rastreo a través del intercambio de robots.txt generalmente es contraproducente. Es mejor establecer la velocidad en "más lenta" en las Herramientas para de Google.

Googlebot: sitio web, gracias por todas sus preguntas, ha sido maravilloso, pero voy a tener que decir "FIN, mi amor".

Sitio web: Oh, Googlebot ... ACK / FIN. :)
Síguenos en
Google News Flipboard
  • 100
  • 1
  • 2
  • 3
  • 4
  • 5
Guía SEO de Google para principiantes
Posicionamiento en buscadores: El SEO
omegayalfa
omegayalfa
  • Website
  • Facebook
  • Twitter
  • LinkedIn
  • Pinterest
  • Instagram

Sobre mi: ¡Aprende los trucos de tutoriales online y cursos gratis con Tutoriales En Linea! Con manuales paso a paso para desarrollar tu conocimiento, Tutoriales En Linea te ayudará a mejorar tus habilidades y lograr tus metas.
Un tutorial está diseñado con pasos secuenciales que aumentan gradualmente el entendimiento. Por lo tanto, es importante que se sigan los pasos en su orden lógico para que el comprenda todos los elementos. Para optimizar los resultados, se recomienda seguir de forma profesional las instrucciones del tutorial.

Artículos Relacionados


Posicionamiento de nuestra web

Posicionamiento de nuestra web

Guía SEO de Google para principiantes

Guía SEO de Google para principiantes

Qué Hacer Para Que Google Indexe Tu Web

Qué Hacer Para Que Google Indexe Tu Web


Comentarios

      1. J.A.M.A
        omegayalfa Mayo 30, 2015 05:05 33

        Click Derecho traducir a español :smile:



Información
s que no esten registrados no pueden dejar comentarios, te invitamos a que te registre!

Destacados

Lista IPTV con canales para colombia

Mayo 23 43 466

Como instalar SS IPTV en una Smart Tv Samsung

Ene 22 10 366

Como podemos conseguir proxies

Jun 21 11 592

Historia de los sistemas operativos

Mayo 16 31 047

Lo mas leidos

Herramientas SEO para posicionamiento de nuestra web 2024

Por 17-06-24

Herramienta online de generador de datos estructurados

Por Tutoriales En Linea 17-06-24

Las 7 mejores páginas para descargar películas en .torrent en español

Por 26-09-24

Etiquetas

Indexar




Sobre nosotros

Tutoriales En Linea

¡Bienvenidos a Tutoriales En Línea, el sitio web perfecto para encontrar todas las herramientas necesarias para mejorar tus habilidades de forma gratuita! En Tutoriales En Linea se encuentran tutoriales, cursos online y aprendizaje de calidad, muy útiles para desarrollar tus capacidades... Leer mas...

Tiene una pregunta? ar...

Enlaces

  • Sobre nosotros
  • Ultimos tutoriales
  • Publicar tutorial
  • Ver mas temas
  • Ultimos comentarios
  • ¿Preguntas Frecuentes?
  • Derechos de autor
  • Politica de cookies
  • Nuestro equipo
  • Normas

Herramientas online

  • Buscador de recetas
  • Prueba de diseño web
  • Codificar en binarios, hexadecimales...
  • Cual es mi IP
  • Test de velocidad
  • Editor HTML
  • Test de escritura
  • Test de nutricion
  • Descargar Videos
  • Generador de datos estructurados

Recursos

  • Analisis de tus problemas de SEO
  • Herramientas SEO
  • Generar palabras claves
  • Referencia de CSS3
  • Convertir HTML a XML
  • Acortador de URL
  • Selector de colores
  • Contador de palabras
  • Comprimir imagenes
  • Conversor a URI de datos
  • Suscribirse
Facebook Twitter Instagram Pinterest Linkedin Youtube
  • Anunciarse
  • Socios externos
  • Política de privacidad
  • Términos y Condiciones
  • Sobre nosotros
  • ar
© Tutoriales En Linea. Reservados todos los derechos, queda prohibida la reproducción parcial o total sin previa autorización.