Download Práctica 5: Servidor web concurrente en Java
Document related concepts
no text concepts found
Transcript
Práctica 5: Servidor web concurrente en Java Esta práctica pretende familiarizar al alumno con la programación de servidores que emplean sockets TCP. Para ello partiremos del servidor web básico visto como ejemplo en las clases de teoría (incluido como anexo al final del capítulo), y lo modificaremos para obtener un servidor web concurrente, capaz de admitir conexiones simultáneamente con varios clientes. Nuestro servidor seguirá la versión 1.0 del protocolo HTTP definida en el RFC 1945 (http://www.ietf.org/rfc/rfc1945.txt), aunque no permitirá todas sus posibilidades de intercambio de información, sino sólo un subconjunto reducido de las mismas. Como ya hemos estudiado, esta versión emplea conexiones no persistentes, es decir, el cliente realiza una conexión TCP distinta para cada uno de los objetos que componen la página web. Por lo tanto, cada petición se tratará de forma independiente y no es necesario mantener información de estado de una petición a la siguiente, lo que simplifica la implementación del servidor. Por otra parte, nuestro servidor debe ser capaz de atender varias peticiones concurrentemente, por lo que debe ser multihilo. Esto nos permitirá estudiar un ejemplo sencillo de servidor concurrente y ver las diferencias en la estructura con respecto al caso iterativo. P5-2 Prácticas de Redes de Computadores En los siguientes apartados abordaremos diferentes aspectos que deben resolverse para la correcta implementación del servidor propuesto. 1. Clases para comunicaciones Como sabemos el servicio de web utiliza para transferir sus mensajes el protocolo de nivel de transporte TCP. Por ello, en este apartado veremos las clases básicas para comunicar un cliente y un servidor mediante sockets TCP. La información que proporcionamos sobre las clases java que hay que emplear y sus métodos es bastante limitada. Para ver los detalles es aconsejable consultar la página web de Sun con información sobre java (http://java.sun.com/javase/6/docs/api). También puede ser de interés consultar el documento: http://www.ulpgc.es/otros/tutoriales/java. Como mínimo necesitaremos dos clases pertenecientes al paquete java.net.*, las clases Socket y ServerSocket. 1. Socket permite establecer una conexión entre un cliente y un servidor TCP. El cliente crea un socket e inicia la conexión con el servidor. Una vez conectado al otro extremo utiliza este socket para el envío y la recepción de información. 2. ServerSocket permite a un servidor escuchar en un puerto a la espera de una conexión TCP. Al establecerse ésta, en el programa servidor se crea un objeto de la clase Socket que se emplea para el intercambio de información posterior entre ambos extremos. Nuestro servidor esperará las conexiones de los clientes escuchando en un puerto previamente determinado. Como nuestro proceso no tiene privilegios de administrador, el puerto con el que trabaje el servidor deberá ser uno mayor que el 1023. Por ejemplo, podemos elegir el 8000. Para esperar la conexiones hay que invocar el método accept() de la clase ServerSocket. Este método bloquea la ejecución del programa a la espera de una conexión. Al recibir una petición, accept() crea un nuevo objeto de la clase Socket, que se usará durante el resto de la comunicación con el cliente. El empleo del método accept() puede generar una excepción IOException, por lo que, o bien habrá que capturarla mediante una cláusula try, tal y como se hizo en la práctica anterior, o bien puede lanzarse (throws) al programa o función que llamó al método que genera la Servidor web concurrente en Java P5-3 excepción. De esta manera no será necesario programar una cláusula try. En nuestro caso, dado que es la máquina virtual Java quien llamó al método main, esta excepción se lanzará hacia ella. 2. Gestión de la entrada/salida Una vez conectado con un cliente, con el fin de comprobar y depurar el funcionamiento del servidor, éste VISUALIZARÁ POR PANTALLA LAS CADENAS DE CARACTERES que reciba del cliente. Para manejar la transferencia de información a través del socket, la clase Socket dispone de dos métodos: getInputStream() y getOutputStream(), que proporcionan un flujo de entrada y uno de salida, respectivamente. Como ya vimos en una práctica anterior, es mejor no manejar estos flujos directamente, sino anidados a través de otras clases como Scanner y PrintWriter y, al igual que hicimos allí, serán las que empleemos. A continuación se muestra, de forma breve, un ejemplo de uso de estas clases y algunos de sus métodos: Scanner recibe = new Scanner (cliente.getInputStream()); System.out.println(recibe.nextLine()); PrintWriter envia = new PrintWriter(cliente.getOutputStream()); envia.println(“GET / HTTP/1.0”); donde cliente es un objeto de la clase Socket conectado con un cliente. 3. Descripción del protocolo e implementación del servidor El servidor que vamos a realizar sigue la versión 1.0 del protocolo HTTP. No obstante, nuestro servidor no implementará todo el protocolo, sino únicamente un subconjunto de éste. En este apartado vamos a explicar qué parte implementaremos. Para ello necesitamos conocer, qué peticiones debe ser capaz de servir y cómo responderá a esas peticiones. HTTP emplea dos tipos de mensajes: peticiones de los clientes a los servidores y respuestas de los servidores a los clientes. Ambos poseen una estructura similar formada por tres campos: una línea inicial que se incluye siempre, a continuación puede haber una o más cabeceras (en la versión 1.0 ninguna es obligatoria), y por último, un cuerpo que no siempre estará presente. Tras finalizar las cabeceras (o después de la línea inicial, en el P5-4 Prácticas de Redes de Computadores caso de que no haya ninguna cabecera) debe haber una línea en blanco, formada por los caracteres ASCII: CR y LF (retorno de carro y salto de línea, respectivamente). Mensaje de petición del cliente En los mensajes de petición la línea inicial contiene la orden deseada por el cliente. Aunque el estándar especifica varias órdenes posibles, la más habitual es la orden GET, que será la única que implementaremos. Esta orden permite al cliente solicitar objetos almacenados en el servidor. Comienza con la palabra reservada GET, le sigue el objeto solicitado por el cliente y finaliza con la versión del protocolo empleado. En el caso de la versión 1.0 tiene la forma: GET objeto HTTP/1.0 CR LF CR LF Donde, como se ha indicado, CR LF son los caracteres de retorno de carro y salto de línea, respectivamente. Por ejemplo, para poder obtener la página web correspondiente a http://www.upv.es/index.html, un navegador se conectará al puerto 80 del servidor www.upv.es y enviará la orden: GET /index.html HTTP/1.0 ← línea en blanco enviada también por el navegador. Nuestro servidor sólo analizará la línea inicial de los mensajes de petición y no se preocupará del resto. Para interpretar la línea de petición, el servidor necesita analizar cada una de las palabras que la componen. Esta tarea podemos resolverla fácilmente mediante la clase java Scanner que nos permite leer el siguiente elemento (String) de un flujo de entrada, mediante el método next(). Como ya hemos mencionado, la descripción de dicha clase se puede consultar en la página web de Sun. Como nosotros sólo vamos a implementar la orden GET, nuestro servidor sólo tiene que comprobar si la primera palabra de la cadena es “GET”, y en caso afirmativo identificar qué fichero ha solicitado el cliente. Para comprobar que la petición es un GET podemos emplear cualquiera de los métodos que tiene la clase String para comparar dos objetos de ese tipo, como equals, equalsIgnoreCase o startsWith. Si el servidor tiene el fichero solicitado (y el cliente dispone de los permisos necesarios para acceder a él), el servidor debe enviárselo al cliente, y en caso contrario responder con un mensaje de error. Servidor web concurrente en Java P5-5 Mensaje de respuesta del servidor La respuesta a una petición GET incluye los tres campos que hemos mencionado antes, y es necesario que nuestro servidor los emplee todos. Veamos que información debemos poner en cada uno de ellos: Campo 1: la línea inicial En el caso de la respuesta de un servidor esta línea se denomina línea de estado y emplea el formato siguiente: versión num cadena donde versión es la versión del protocolo utilizada, num es un código numérico de tres cifras que expresa el resultado de la petición realizada por el cliente, y por último, cadena es una cadena de caracteres que también indica el resultado de la operación pero ahora en un formato fácilmente comprensible por los programadores. Algunos de los valores de los últimos dos campos son: Num Cadena 200 OK 304 Not Modified 400 Bad Request 401 Unauthorized 404 Not Found 501 Not Implemented La línea de estado típica de la versión 1.0 para indicar que se envía el objeto pedido por el cliente es: HTTP/1.0 200 OK Si, por el contrario, el servidor no dispone del objeto solicitado responderá con: HTTP/1.0 404 Not Found Estas son las dos líneas de estado que nuestro servidor debe implementar. Campo 2: las líneas de cabecera Aunque la versión 1.0 no establece ninguna cabecera obligatoria lo habitual es que los servidores envíen varias líneas de cabecera en sus respuestas. Estas líneas permiten a los servidores incluir información sobre P5-6 Prácticas de Redes de Computadores el objeto que van a enviar en el cuerpo del mensaje, así como avisar al cliente en el caso de vayan a cerrar la conexión una vez finalizado el envío del mensaje al cliente. El orden de las distintas cabeceras es irrelevante. El formato de las líneas de cabecera es: Etiqueta: valor donde la Etiqueta indica el tipo de información que se envía y valor su valor asociado. Las líneas siguientes muestran algunas líneas típicas de cabecera: Content-Type: text/html Content-Length: 3453 Content-Encoding: x-gzip Date: Tue, 15 Nov 2004 08:12:31 GMT Expires: Tue, 12 Oct 2005 06:22:41 GMT Nuestro servidor deberá enviar, al menos, las líneas de cabecera del Content-Type y el Content-Length. La primera de ellas indica el tipo MIME del objeto que se va a enviar. Por ejemplo, un fichero *.htm tiene como tipo MIME text/html. Algunos de los tipos MIME más usados pueden encontrarse en la siguiente tabla: Extensión del fichero Tipo MIME .htm .html text/html .txt text/plain .gif image/gif .jpg .jpeg image/jpeg .pdf application/pdf * application/octet-stream La clase String posee el método endsWith(String) que podemos utilizar para comprobar la extensión del fichero. En el caso en el que el servidor no pueda asociar la extensión del fichero con una de las específicas que tiene definidas, empleará como tipo por defecto el último mostrado en la tabla: application/octet-stream. En nuestro caso, hay que implementar como mínimo los tipos: text/html, image/gif y application/octet-stream. Por otra parte, la etiqueta Content-Length hace referencia al tamaño del objeto que se va a enviar. Para calcular ese tamaño se puede utilizar la Servidor web concurrente en Java P5-7 clase File (perteneciente al paquete java.io.*) ya que uno de sus métodos (length()) permite obtener este dato. Por último, las líneas de la cabecera y el cuerpo están separados mediante una línea en blanco, que en nuestro caso se puede generar con el método println() de la clase PrintWriter. Campo 3: el cuerpo de mensaje El cuerpo es el objeto que había solicitado el cliente. El servidor tiene que buscarlo en su sistema de ficheros local, para lo que puede utilizar la clase FileInputStream. Al constructor de esta clase se le pasa como parámetro el nombre del fichero (o bien un objeto de la clase File) y, si no existe generará la excepción FileNotFoundException. Capturando dicha excepción podemos averiguar si existe o no el fichero. Como lo habitual es que las peticiones vengan de un navegador, éste intentará visualizar cualquier respuesta del servidor. Por ello, incluso aunque no haya encontrado el objeto solicitado y devuelva un mensaje de error, el servidor suele incluir una página html informando del suceso. Nuestro servidor también debe seguir ese comportamiento habitual, y aunque el fichero no exista devolverá una respuesta completa: línea de estado, cabecera y cuerpo. En este caso la cabecera identificará al cuerpo como text/html y el cuerpo será un mensaje de error en formato html como el siguiente: <html><body><h1>404 Not Found</h1></body></html> Ejercicio 1: Completa el servidor web del anexo para que se ajuste a la versión 1.0 del protocolo HTTP conforme a lo descrito en este apartado. Respecto a los tipos MIME, sólo es necesario implementar los tipos text/html, image/gif y application/octet-stream. En caso de recibir una orden diferente a GET, el servidor debe contestar con la línea de estado ”HTTP/1.0 501 Not Implemented”. Por lo tanto, los cambios que hay que realizar con respecto al servidor del anexo son: 1. Comprobar que la petición es un “GET”. 2. Añadir la línea de estado (HTTP/1.0 …). 3. Comprobar la extensión del fichero y añadir las cabeceras correspondientes, relacionadas con su extensión y su longitud (Content-Length y ContentType). P5-8 Prácticas de Redes de Computadores Recuerda que el servidor debe visualizar por pantalla todo lo que reciba del cliente. 4. Comprobación del funcionamiento del servidor Una vez que hayamos programado el servidor web necesitamos una página de muestra para comprobar que nuestro servidor atiende correctamente las peticiones de sus clientes. Para ello podemos utilizar la web de la asignatura de redes, por ejemplo. La copiamos a nuestro ordenador local mediante la instrucción wget –r –nH http://www.redes.upv.es/redes/ desde el directorio donde esté nuestro programa. A continuación, lanzaremos el servidor en nuestro ordenador local y nos conectaremos a él mediante el navegador, usando el URL siguiente: http://localhost:8000/redes/index.html Se supone que, como se ha recomendado en el apartado 1, el servidor escucha en el puerto 8000. En otro caso, habría que sustituir el 8000 que aparece en el URL por el número de puerto correspondiente. Si el proceso servidor pudiera lanzarse con privilegios de administrador y escuchar en el puerto 80 (puerto estándar para el servicio web) no sería necesario indicar el número de puerto en el URL del navegador. Si nuestro servidor no funciona correctamente al primer intento, puede resultar útil para realizar la depuración emplear el programa telnet. Si tecleamos: ¾ telnet localhost 8000 ¾ GET /redes/index.html http/1.0 ¾ CR LF Veremos en pantalla, a continuación, la respuesta del servidor y podremos comprobar si es la esperada. 5. Implementación de la concurrencia Dado que el servidor debe ser capaz de atender varias peticiones simultáneamente, vamos a convertir el servidor iterativo en un servidor concurrente usando varios hilos de ejecución. En el hilo principal, el servidor permanecerá a la espera de que se conecte algún cliente. Cuando se Servidor web concurrente en Java P5-9 reciba una petición de conexión TCP, el servidor aceptará la conexión y se la pasará a un nuevo hilo para ser atendida mientras el hilo principal del servidor queda a la espera de nuevos clientes. El hilo principal tendrá un aspecto parecido al siguiente: public class ServidorWebConcurrente { public static void main(String argv[]) throws UnknownHostException, IOException { int puerto=8000; ServerSocket servidor=new ServerSocket(puerto); while (true) { //Espero un cliente Socket cliente=servidor.accept(); // Código para lanzar un hilo que atienda la petición // Hay que pasarle el socket “cliente” al hilo } } } Java ofrece varias posibilidades para crear un hilo de ejecución. La más sencilla es declarar una subclase de la clase Thread. Cada objeto de esta subclase permite lanzar un nuevo hilo de ejecución. La sintaxis para crear una nueva subclase a partir de la clase Thread es: class PeticionHTTP extends Thread La clase Thread (y por extensión la subclase creada a partir de ella) siempre incluye un método run() que contiene el código que debe ejecutarse concurrentemente con el resto del programa. Poniendo juntos todos estos detalles, nuestra nueva clase tendrá un aspecto parecido a: class PeticionHTTP extends Thread { //atributos... public PeticionHTTP(Socket s) { // Código a ejecutar durante la creación del hilo } public void run() { // Código del nuevo hilo que atiende al cliente http P5-10 Prácticas de Redes de Computadores } } Después de haber visto cómo se declara una subclase de la clase Thread, vamos a ver cómo utilizarla. El primer paso es crear un objeto de la subclase nueva, en nuestro ejemplo, la clase PeticionHTTP. A conti- nuación hay que arrancar el hilo. Esto se hace invocando el método start(), que a su vez llamará al método run(). PeticionHTTP pethttp=new PeticionHTTP(); pethttp.start(); En nuestro caso, cada objeto de la clase PeticionHTTP deberá atender una petición HTTP a través de la conexión TCP que se acaba de realizar tras la ejecución del método accept(). El socket devuelto por el método accept()se crea en el hilo principal, pero debe ser accesible desde los nuevos hilos que se van lanzando. Esto se puede hacer a través del constructor de la clase PeticionHTTP, pasándole como parámetro el socket conectado con el cliente. El hilo principal creará un nuevo objeto de la clase PeticionHTTP, le pasará como parámetro el socket conectado con el cliente, y después invocará el método start(): PeticionHTTP pethttp=new PeticionHTTP(cliente); pethttp.start(); Ejercicio 2: Copia el servidor web iterativo del ejercicio anterior a un fichero llamado ”ServidorWebConcurrente.java”. Modifica este nuevo programa para convertir el servidor iterativo en servidor concurrente. 6. Anexo En este anexo se incluye el código del micro-servidor web iterativo visto en clase. Las principales diferencias entre este servidor y el que hay que realizar en esta práctica son dos. La primera es que el servidor mostrado como ejemplo más abajo no sigue el estándar HTTP/1.0, ya que no devuelve siempre la línea de estado ni la cabecera de respuesta. La segunda diferencia es que no es concurrente. import java.net.*; import java.util.Scanner; Servidor web concurrente en Java P5-11 import java.io.*; class ServidorWebIterativo { public static void main(String args[]) throws UnknownHostException, IOException { byte[] buffer = new byte[1024]; int bytes; int Puerto=8000; ServerSocket servidor=new ServerSocket(puerto); while(true) { // espero a que venga un cliente Socket cliente=servidor.accept(); // nos aseguramos de que el fin de línea se ajuste al estándar System.setProperty("line.separator","\r\n"); Scanner lee=new Scanner (cliente.getInputStream()); PrintWriter escribe=new PrintWriter(cliente.getOutputStream(),true); // esto debe ser el lee.next(); "GET" // esto es el fichero String fichero = "." + lee.next(); // comprobamos si existe FileInputStream fis = null; boolean existe = true; try { fis = new FileInputStream(fichero); } catch (FileNotFoundException e) { existe = false; } if (existe && fichero.length()>2) while((bytes = fis.read(buffer)) != -1 ) // enviar fichero cliente.getOutputStream().write(buffer, 0, bytes); else {escribe.println("HTTP/1.0 404 Not Found"); escribe.println(); } cliente.close(); } } } P5-12 Prácticas de Redes de Computadores