Download el computador
Document related concepts
no text concepts found
Transcript
1. EL COMPUTADOR 1 EL COMPUTADOR 1. El Pasado 2. El Presente 3. Estructura Básica 4. Rendimiento 5. Disipación de Potencia 2 EL COMPUTADOR 1. El Pasado 3 El Pasado Los precursores Pascalina Ábaco Máquina de Leibniz El Computador Máquina analítica 4 El Pasado ENIAC 1946 El Computador 5 El Pasado ENIAC 1946 El Computador 6 El Pasado ESPAÑA 1954 El Computador 7 El Pasado Esta foto es falsa pero refleja las ideas de la época. Supuesta predicción hecha en 1954 sobre el aspecto de un computador personal en 2004 El Computador 8 El Pasado “Where a calculator on the ENIAC is equipped with 18,000 vaccuum tubes and weighs 30 tons, computers in the future may have only 1,000 vaccuum tubes and perhaps weigh 1.5 tons.” Popular Mechanics, March 1949 “Mientras que el ENIAC está equipado con 18.000 válvulas de vacío y pesa 30 toneladas, los computadores del futuro pueden tener sólo 1.000 válvulas de vacío y quizás pesen 1.5 toneladas” El Computador 9 El Pasado Es evidente que la previsión no fue muy acertada… ¿Por qué se alejaron tanto de la realidad? Principalmente por la revolución tecnológica que supusieron el transistor y la integración de circuitos a gran escala. El Computador 10 El Pasado ENIAC en un chip 1997 7,44 mm 5,29 mm El Computador Tecnología de 500 nm 11 El Pasado El grado de integración ha ido en aumento: Intel 4004 1971 El Computador Tecnología de 8 µm = 8000 nm ENIAC en un chip 1997 Tecnología de 500 nm Intel Core i7 2008 Tecnología de 45 nm 12 El Pasado Pero . . . ¿de qué tamaños estamos hablando? Cabello humano 100 µm Tecnología de 8 µm (1971) El Computador 13 El Pasado Pero . . . ¿de qué tamaños estamos hablando? Tecnología de 8 µm (1971) Bacteria Escherichia Coli 1 µm x 3 µm Tecnología de 500 nm (1997) Tecnología de 45 nm (2008) Virus HIV 100 nm . . . y sigue aumentando el grado de integración. El Computador 14 El Pasado Intel 4004 1971 El Computador 15 El Pasado Intel 4004 El Computador 16 El Pasado Intel 4004 El Computador 17 El Pasado Intel 4004 El Computador 18 El Pasado Generador de 8 fases de reloj Intel 4004 Pila y contador de programa ALU Decodificación de instrucciones El Computador Registros índice 19 EL COMPUTADOR 2. El Presente 20 El Presente Intel Core i7 2008 El Computador 21 El Presente Intel Core i7 2008 El Computador 22 El Presente Intel Core i7 Núcleos 2008 Caché L3 común El Computador 23 El Presente Intel Core i7 Núcleos 2008 Caché L3 común El Computador 24 El Presente Intel Core i7 2008 Núcleos Unidades de Ejecución Planificador de ejecución fuera de orden Decodificación Caché L1 de datos Caché L1 de instrucciones Caché L3 común Predicción de salto El Computador Caché L2 25 El Presente Intel Core i7 Núcleos 2008 Caché L3 común El Computador 26 El Presente POWER 7 (IBM 2010) Ceramic module El Computador 27 El Presente POWER 7 (IBM 2010) 45 nm 1200 millones de transistores 4,6 y 8 núcleos Por núcleo: • 4 hilos de ejecución por núcleo • L1 32K (instrucciones) + 32K (Datos) • L2 256K • L3 4M (máximo 32 MB) Potencia Teórica de cálculo para 8 núcleos y reloj a 4 Ghz • Por núcleo 33,12 GFLOPS • Por procesador 264,96 GFLOPS El Computador 28 El Presente POWER 7 (IBM 2010) 300.000 núcleos POWER 7 L3 caché 32MB Reloj a 4.0 GHz Memoria principal 1 petabyte (1015) Disco más de10 petabytes Conexión a Internet 400 Gbit/s 10 PETAFLOPS Aplicaciones El Computador National Center for Supercomputing Applications University of Illinois at Urbana-Champaign Completed in 2011 http://www.ncsa.illinois.edu/BlueWaters/ • Biología • Evolución del cosmos • Investigación en nuevos materiales • Fenómenos climatológicos 29 El Presente CELL (Sony-Toshiba-IBM) El Computador 30 El Presente CELL (Sony-Toshiba-IBM) El Computador 31 El Presente CELL (Sony-Toshiba-IBM) El Computador 32 El Presente CELL (Sony-Toshiba-IBM) El Computador 33 EL COMPUTADOR 3. Estructura Básica 34 Estructura Básica Niveles de máquina Lenguajes de alto nivel Lenguaje ensamblador Sistema operativo Es lo que define la “arquitectura” El Computador Máquina convencional 35 Estructura Básica Soporte de los niveles Interpretación Programa fuente Nivel 2 Intérprete Nivel 1 El Computador 36 Estructura Básica Soporte de los niveles Traducción Programa fuente Nivel 2 Traductor Programa objeto Nivel 1 El Computador 37 Estructura Básica Soporte de los niveles Programa fuente Nivel 2 Traducción Traductor Programa objeto Nivel 1 Ensamblador: 1 instrucción fuente 1 instrucción objeto Traductor Compilador: 1 instrucción fuente varias instrucciones objeto El Computador 38 Estructura Básica Arquitecturas CISC Máquina convencional (Complex Instruction Set Computer) Ventajas de tener instrucciones muy potentes: • Los programas ocupan menos (La memoria era muy cara) • Hay menos accesos a memoria (La memoria era muy lenta) • Puede facilitar la construcción compiladores Con la microprogramación era muy fácil implementar instrucciones complejas El Computador Máquina convencional Microprograma 39 Estructura Básica Arquitecturas CISC Máquina convencional (Complex Instruction Set Computer) Características de las instrucciones: • Número elevado • Muchos modos de direccionamiento • Longitud variable • Formato irregular • Muchas instrucciones operan con la memoria El Computador 40 Estructura Básica Arquitecturas RISC Máquina convencional (Reduced Instruction Set Computer) Ventajas de tener instrucciones sencillas: • Se ejecutan más rápido • Acceso a memoria más rápido • Procesadores más simples, lo que permite mejorarlos El Computador 41 Estructura Básica Arquitecturas RISC Máquina convencional (Reduced Instruction Set Computer) Características de las instrucciones: • Número más reducido • Menos modos de direccionamiento • Longitud fija (Optimiza la extracción) • Formato regular (Optimiza la decodificación) • Filosofía Load / Store •Memoria separada •Cauce segmentado El Computador 42 Estructura Básica El Computador Simple Múltiple Simple Flujo de datos SISD SIMD Múltiple Flujo de instrucciones Taxonomía de Flynn MISD MIMD 43 Estructura Básica Arquitectura de Von Newman CPU El Computador MEMORIA E/S 44 Estructura Básica Chipset típico CPU FSB Tarjeta Gráfica Puente Norte (MCH) Memoria Principal Puente Sur (ICH) Ratón El Computador Teclado Disco USB 45 Estructura Básica Chipset para Intel Core i7 El Computador 46 Estructura Básica Placa base de CPU Intel Core i7 X58 ICH10 El Computador 47 Estructura Básica Placa base de X58 CPU Intel Core i7 ICH10 El Computador 48 EL COMPUTADOR 4. Rendimiento 49 Rendimiento Programa : move r1,r2 add Tiempo de ejecución r3,r4 move r1,r5 : Rendimiento = El Computador 1 Tiempo de ejecución 50 Rendimiento Programa A Programa B : : move r1,r2 xor add move r4,r5 r3,r4 move r1,r5 r4,r1 sub : r1,r2 : Si Tiempo de ejecución de A < Tiempo de ejecución de B diremos que A es n veces más rápido que B, siendo… n= Tiempo de ejecución de B Tiempo de ejecución de A El Computador = Rendimiento de A Rendimiento de B 51 Rendimiento Ecuación de rendimiento del procesador Programa : move r1,r2 add Ciclos Por Instrucción r3,r4 move r1,r5 : CPI = Ciclos de reloj para el programa Número de instrucciones ejecutadas Tej. = I x CPI x T = El Computador I x CPI F I : Instrucciones ejecutadas T : Periodo del reloj F : Frecuencia del reloj 52 Rendimiento Ley de Amdhal Permite calcular la ganancia en el rendimiento que obtendríamos al mejorar una parte del computador. Establece que la ganancia está limitada por la fracción de tiempo en la que puede ser utilizada la mejora. Seguidamente vamos a definir algunos conceptos a partir de los cuales definiremos la ley. El Computador 53 Rendimiento Aceleración (speedup) Nos indica el aumento de rendimiento o mejora del tiempo de ejecución tras haber introducido la mejora. S= S= El Computador Tiempo de ejecución sin la mejora Tiempo de ejecución con la mejora Rendimiento con la mejora Rendimiento sin la mejora 54 Rendimiento Fracción mejorable Indica la parte del tiempo total de ejecución que puede ser reducida mediante la mejora. F= Tiempo que se puede mejorar Tiempo total Mejora Indica cuantas veces es más rápida la parte mejorada respecto a la versión sin la mejora. M= El Computador Tiempo sin mejora Tiempo con mejora 55 Rendimiento El nuevo tiempo de ejecución se puede calcular como: Tnuevo = TAntiguo x (1 - F) + F 1 M Con lo que la aceleración tras la mejora será: S= El Computador TAntiguo TNuevo = 1 (1 - F) + F M 56 Rendimiento Medición del rendimiento ¿Cómo medir el comportamiento de los computadores? • Información del S.O. • Kernels • Conjuntos de benchmarks • Monitores hardware Los más utilizados son los conjuntos de benchmarks de la organización SPEC El Computador 57 Rendimiento SPEC Standard Performance Evaluation Corporation • Consiste en un conjunto de programas que se pasan en la máquina a evaluar. • Los resultados se comparan con los obtenidos en una máquina de referencia. • Hay distintos tipos de test según las características que se quieran evaluar. El Computador 58 Rendimiento Ejemplo de SPEC El Computador 59 Rendimiento El Computador 60 Rendimiento El Computador 61 Rendimiento El Computador 62 Rendimiento El Computador 63 Rendimiento El Computador 64 Rendimiento El Computador 65 Rendimiento El Computador 66 Rendimiento El Computador 67 Rendimiento El resto son indicaciones sobre las opciones de compilación usadas, flag de optimización, etc … El Computador 68 EL COMPUTADOR 5. Disipación de Potencia 69 Disipación de Potencia La disipación de calor es uno de los grandes problemas en el diseño de los procesadores y de los circuitos integrados en general. El calor es generado por la potencia disipada y ésta ha ido en aumento con el paso de los años: 0,45 W El Computador 160 W 70 Disipación de Potencia El intercambio de calor con el aire exterior se realiza a través de la superficie del chip. Por lo tanto conviene: • Lograr una gran superficie de intercambio. • Renovar rápidamente el aire que se va calentando. El Computador 71 Disipación de Potencia El aumento de la superficie de disipación se obtiene acoplando estructuras de materiales que conduzcan fácilmente el calor y una gran superficie. El Computador 72 Disipación de Potencia La rápida renovación del aire se logra acoplando ventiladores a las estructuras de disipación. El Computador 73 Disipación de Potencia En casos extremos se utilizan métodos más sofisticados: Refrigeración por agua Hielo seco Célula Peltier El Computador 74 Disipación de Potencia Potencia total disipada Potencia dinámica El Computador + Potencia de cortocircuito + Potencia estática 75 Disipación de Potencia Potencia dinámica Se produce por la conmutación de los transistores. Pd = A x C x V 2 x F A : Coeficiente de actividad C : Capacidad V : Voltaje de funcionamiento F : Frecuencia de conmutación El Computador 76 Disipación de Potencia Potencia de cortocircuito Es debida a la corriente que fluye durante un tiempo t entre la alimentación y la tierra cuando las puertas conmutan. Pc = A x t x V x Ic A : Coeficiente de actividad t : Tiempo V : Voltaje de funcionamiento Ic : Corriente de cortocircuito El Computador 77 Disipación de Potencia Potencia estática Es provocada por la corriente de pérdida que fluye por el transistor aunque éste no funcione. Aunque es muy pequeña, adquiere la suficiente importancia cuando el número de transistores es elevado. Pe = V x Ie V : Voltaje de funcionamiento Ie : Corriente estática de fuga El Computador 78 Disipación de Potencia Para disminuir el consumo de potencia se puede: • Disminuir la tensión de alimentación (V) (Ha pasado de 5 V a poco más de 1 V) • Disminuir la frecuencia (F) La capacidad (C) depende del número de transistores, la tecnología y su interconexión. Algunos procesadores reducen su actividad de forma automática cuando se calientan demasiado. También pueden desconectar el reloj de los módulos que no se están utilizando (por ejemplo, la unidad F.P.) El Computador 79