Cómo acceder a un sitio web sin utilizar su URL o un motor de búsqueda

Las URL se inventaron al mismo tiempo que la World Wide Web, en 1989. Pero la web se concibió como un método para vincular muchos tipos de archivos, no solo los nuevos documentos HTML, de modo que un navegador web pudiera acceder a PostScript o documentos de texto, por ejemplo. instancia, desde un servidor ftp que usa una URL de FTP como ftp://ftp.example.org. También podría acceder a documentos de un servidor Gopher con URL como gopher: // xxx. Si se pudo acceder a un documento en el sistema de archivos local, o a un recurso compartido en red como NFS o AFS en una computadora diferente, se podría acceder a él con una URL de archivo como file: ///home/docs/foobar.txt. Gopher se ha eliminado, pero las URL de archivos y ftp aún funcionan. Un navegador reconocerá una ruta de archivo local como /home/docs/foobar.txt o c: \ users \ fred \ MyDocs y la traducirá a un archivo: // URL. Sin embargo, aunque el transporte HTTP admite Content-Type (etiquetar un objeto generado dinámicamente como HTML o PNG, por ejemplo, y asignar los sufijos del sistema operativo local para los documentos estáticos), otros esquemas de URL no lo hacen, y deben basarse en los sufijos. Todos están bastante de acuerdo, ahora, con la IANA registrando sufijos de archivos comunes, pero cuando la Web era nueva, no era así, los archivos .doc del Equipo Digital eran diferentes de los archivos .doc de Microsoft, por ejemplo, y tendrían diferentes tipos de contenido. Para que ambos puedan existir en la misma web.

Como han dicho otros, puede acceder a un sitio web moderno (protocolo HTTP) manualmente, sin necesidad de escribir una URL completa. Sin embargo, equivale a lo mismo: solo está haciendo el análisis de URL en su cabeza sin escribirlo en realidad, “http: //” es solo una abreviatura de “conectarse al host en el puerto 80 y usar el protocolo HTTP”

$ telnet www.ietf.org 80
Intentando 2400: cb00: 2048: 1 :: 6814: 55 …
Conectado a www.ietf.org.
El carácter de escape es ‘^]’.
GET /secretariat.html HTTP / 1.0
Anfitrión: www.ietf.org

HTTP / 1.1 200 OK
Fecha: viernes, 10 de febrero de 2017 20:33:09 GMT
Tipo de contenido: texto / html
etc …

para “wget ​​http://www.ietf.org/secretariat….

La respuesta de Jonah Snider explica cómo acceder a una página web sin un nombre de host, pero eso es solo una parte de una URL. Cuando se contacta con el servidor solo con la parte del host de la URL, intenta completarlo agregando un nombre de archivo predeterminado a la IP / nombre del host. Intentará varios, index.html, index.htm y si está configurado para PHP index.php. Si no se encuentra ninguno de estos y el servidor está configurado para permitir la indexación, mostrará una lista de los archivos en la raíz del documento del servidor. Si no está configurado para permitir la indexación y no se encuentra ninguna de las páginas predeterminadas, verá la página de bienvenida predeterminada para el servidor o una página de error 404 no encontrada.

En resumen, no accedes a un servidor web sin una URL. Sin un nombre de host sí. Puede sustituir una dirección IP por un nombre de host en una URL.

Una dirección IP es una ubicación numérica de un servidor que puede contener muchos hosts. La declaración “Puede sustituir una dirección IP por un nombre de host en una URL” NO siempre es cierta.

La relación de uno a uno de un host con una dirección IP solo funciona si hay un solo host, un solo sitio web, en un servidor asignado a una sola dirección IP. Es por eso que escribir una dirección IP y obtener un sitio web solo funciona para una pequeña cantidad de ejemplos, generalmente en los que participa una gran corporación.

Muchas de las respuestas aquí intentan explicar el DNS, pero realmente no responden a su pregunta de cómo llegar a un sitio web específico en un servidor. DNS, Sistema de nombres de dominio, asigna nombres a los números, por lo que DNS le dirá que ” www. Site1. Com “, ” www. Site2. Com “, y ” www. Site3. Com “, todos residen en un servidor con una IP Dirección del 123.45.67.89.

(A propósito, puse espacios en los nombres de ejemplo para que este sitio no reformatee los nombres de mis ejemplos para vincular direcciones)

Si tengo muchos sitios web, muchos nombres de host, en un solo servidor, es posible que pueda acceder a mis sitios utilizando la dirección IP junto con información adicional sobre la dirección.

Por ejemplo, si tengo un servidor con la dirección IP 123.45.67.89 y tengo muchos sitios alojados allí, es posible que pueda acceder a ellos utilizando un método como 123.45.67.89/~site1 y 123.45.67.89/~site2 y 123.45 .67.89 / ~ sitio3

El software que aloja los servidores web se traduce:

www. site1. com ” = a 123.45.67.89/~site1
www. site2. com ” = a 123.45.67.89/~site2
www. site3. com ” = a 123.45.67.89/~site3

El concepto del Localizador Uniforme de Recursos (URL) es lo que dirige la solicitud de su navegador de ” www. Site1. Com / mypage.htm ” a ” 123.45.67.89/~site1/mypage.htm

(De nuevo, he puesto espacios en los nombres de ejemplo a propósito, por lo que este sitio no reformatearía mis nombres de ejemplo para vincular direcciones en esta publicación)

Te hace apreciar la URL ¿no?

Los localizadores uniformes de recursos se definieron en la Solicitud de comentarios (RFC) 1738 en 1994 por Tim Berners-Lee. El formato combina el sistema preexistente de nombres de dominio (creado en 1985) con la sintaxis de la ruta del archivo, donde las barras diagonales se usan para separar los nombres de directorios y archivos.

Solicitud de comentarios (RFR) 1738 en 1994: un formato de URL de Gopher

Un sitio web es una colección de documentos de hipertexto en la World Wide Web. La World Wide Web es la recopilación de todos los recursos web identificados mediante URL en la Internet pública. Se debe acceder a todos estos recursos a través del protocolo HTTP o HTTPS. Y las URL son una parte fundamental de HTTP / HTTPS. Así que nunca hubo un momento en que existieran sitios web, pero las URL no.

No puede acceder a nada a través de estos protocolos web sin un URI (la diferencia entre las URL y los URI). Si escribe una URN en el navegador, adivinará el protocolo y construirá una URL a partir de él. Se intentará con HTTP y / o HTTPS. Si ninguno de los dos funciona, le dirá que no se puede acceder al sitio.

Incluso si tuviera que codificar su propio navegador, todavía necesita todos los componentes de una URL para intentar acceder a un sitio. Puede que no lo construyas en una sola cadena, pero aún debes saber, como mínimo:

  • el host (una computadora en red)
  • el protocolo (la interfaz para acceder al host)
  • la ruta (la ubicación relativa al host del documento / recurso que desea)

Sin los 3, no puedes acceder a un sitio web.

Además, esto no tiene nada que ver con el hardware de la computadora. Comprender las URL es algo que se implementa en el software (normalmente un navegador web). Cualquier computadora capaz de conectarse a Internet puede tener un navegador codificado para que comprenda qué es una URL y qué hacer con ella.

Un navegador que no entienda las URL también sería muy inútil. Los navegadores son principalmente para navegar por los documentos de hipertexto que comprenden los sitios web. Hipertexto significa que incluyen más que contenido de texto estándar. A saber, estos documentos (normalmente escritos en HTML o lenguajes de marcado relacionados) incluyen hipervínculos a otras páginas o recursos web, así como a medios directamente incrustados, como imágenes o videos.

Aquí hay un ejemplo de documento HTML:



Mi página de inicio


Inicio

Bienvenido a mi maravilloso sitio web sobre https://en.wikipedia.org/wiki/Cats“> cats


Notará que hay una URL completa allí, así como varias URL relativas a la raíz. Así es como se vincula a otras páginas / archivos o incrusta imágenes y otro contenido dentro de una página web. Así que incluso si su navegador pudiera encontrar una página web sin una URL, no podría mostrar ninguna de las imágenes o multimedia incrustada dentro de la página. Y tampoco podría hacer clic en ninguno de los enlaces para navegar a cualquier otra página.

Eso no es un navegador muy útil, ¿verdad?

Hubo un momento en que las URL no existían, pero eso era antes de que existiera la web, por lo que no había sitios web a los que pudiera acceder.

Sólo la dirección IP. Por ejemplo: intente 172.217.17.78 en su navegador. No te asustes, eso es google.com.

El método utilizado se llama DNS, Sistema de nombres de dominio / Servicio. Para obtener más información, consulte Sistema de nombres de dominio – Wikipedia.

No todos los sitios web son accesibles utilizando la dirección. Wikipedia y Quora no, mientras que Google te devuelve al nombre.

Usted va a la barra de su navegador y escribe su dirección IP. Para encontrar una dirección IP para un sitio web, use el comando ping:

ping google.com

El resultado serán varias líneas de un número que se verá así:

123.456.789.000

Por supuesto, no tiene que ser tantos números, pero ese es el tiempo más largo que obtendrá una IP.

Pruebe la página de configuración de su enrutador en casa, generalmente

192.168.0.1

Para añadir al resto de las respuestas:

Haga esto en un indicador de comando / ventana de terminal

Windows: telnet 216.58.192.164 80

Linux: telnet 216.58.192.164:80

Ahora escribe algo y pulsa enter. Volverá a la página html por error 400 (Solicitud incorrecta)

Si busca y descubre el protocolo http, puede enviar solicitudes manualmente y recuperar páginas html. Esto es todo lo que hacen los navegadores web para obtener una página web estándar. Las páginas seguras (https) requieren más trabajo.

Una URL es solo un protocolo estándar para solicitar una página específica de una computadora específica en un protocolo específico:

Entonces, para la línea:

http://216.58.192.164/index.html

protocolo http (usa el puerto 80 por defecto)

216.58.192.164 <- Dirección IP de la computadora

archivo index.html solicitado desde la computadora

Ahora si escribes

http://www.google.com/index.html

Luego, lo primero que sucede es que su computadora le pregunta a su Servidor de nombres cuál es el número para http://www.google.com y le devuelve un número como 216.58.192.164 y luego se sigue el resto del protocolo.