Download el computador

Document related concepts
no text concepts found
Transcript
1. EL COMPUTADOR
1
EL COMPUTADOR
1. El Pasado
2. El Presente
3. Estructura Básica
4. Rendimiento
5. Disipación de Potencia
2
EL COMPUTADOR
1. El Pasado
3
El Pasado
Los precursores
Pascalina
Ábaco
Máquina de Leibniz
El Computador
Máquina analítica
4
El Pasado
ENIAC
1946
El Computador
5
El Pasado
ENIAC
1946
El Computador
6
El Pasado
ESPAÑA
1954
El Computador
7
El Pasado
Esta foto es falsa pero refleja las ideas de la época.
Supuesta predicción
hecha en 1954
sobre el aspecto de
un computador
personal en 2004
El Computador
8
El Pasado
“Where a calculator on the ENIAC is equipped with 18,000
vaccuum tubes and weighs 30 tons, computers in the future may
have only 1,000 vaccuum tubes and perhaps weigh 1.5 tons.”
Popular Mechanics, March 1949
“Mientras que el ENIAC está equipado con 18.000 válvulas de
vacío y pesa 30 toneladas, los computadores del futuro pueden
tener sólo 1.000 válvulas de vacío y quizás pesen 1.5 toneladas”
El Computador
9
El Pasado
Es evidente que la previsión no fue muy acertada…
¿Por qué se alejaron tanto de la realidad?
Principalmente por la revolución tecnológica que supusieron
el transistor y la integración de circuitos a gran escala.
El Computador
10
El Pasado
ENIAC en un chip
1997
7,44 mm
5,29 mm
El Computador
Tecnología
de 500 nm
11
El Pasado
El grado de integración ha ido en aumento:
Intel 4004
1971
El Computador
Tecnología de 8 µm = 8000 nm
ENIAC en un chip
1997
Tecnología de 500 nm
Intel Core i7
2008
Tecnología de 45 nm
12
El Pasado
Pero . . . ¿de qué tamaños estamos hablando?
Cabello humano
100 µm
Tecnología de
8 µm
(1971)
El Computador
13
El Pasado
Pero . . . ¿de qué tamaños estamos hablando?
Tecnología de
8 µm
(1971)
Bacteria Escherichia Coli
1 µm x 3 µm
Tecnología de
500 nm
(1997)
Tecnología de
45 nm
(2008)
Virus HIV
100 nm
. . . y sigue aumentando el grado de integración.
El Computador
14
El Pasado
Intel 4004
1971
El Computador
15
El Pasado
Intel 4004
El Computador
16
El Pasado
Intel 4004
El Computador
17
El Pasado
Intel 4004
El Computador
18
El Pasado
Generador de 8 fases de reloj
Intel 4004
Pila y contador de programa
ALU
Decodificación de instrucciones
El Computador
Registros índice
19
EL COMPUTADOR
2. El Presente
20
El Presente
Intel Core i7
2008
El Computador
21
El Presente
Intel Core i7
2008
El Computador
22
El Presente
Intel Core i7
Núcleos
2008
Caché L3
común
El Computador
23
El Presente
Intel Core i7
Núcleos
2008
Caché L3
común
El Computador
24
El Presente
Intel Core i7
2008
Núcleos
Unidades de
Ejecución
Planificador de
ejecución fuera
de orden
Decodificación
Caché L1
de datos
Caché L1 de
instrucciones
Caché L3
común
Predicción
de salto
El Computador
Caché L2
25
El Presente
Intel Core i7
Núcleos
2008
Caché L3
común
El Computador
26
El Presente
POWER 7
(IBM 2010)
Ceramic module
El Computador
27
El Presente
POWER 7
(IBM 2010)
 45 nm
 1200 millones de transistores
 4,6 y 8 núcleos
 Por núcleo:
• 4 hilos de ejecución por núcleo
• L1 32K (instrucciones) + 32K (Datos)
• L2 256K
• L3 4M (máximo 32 MB)
Potencia Teórica de cálculo para 8 núcleos y reloj a 4 Ghz
• Por núcleo 33,12 GFLOPS
• Por procesador 264,96 GFLOPS
El Computador
28
El Presente
POWER 7
(IBM 2010)
 300.000 núcleos POWER 7
 L3 caché 32MB
 Reloj a 4.0 GHz
 Memoria principal 1 petabyte (1015)
 Disco más de10 petabytes
 Conexión a Internet 400 Gbit/s
 10 PETAFLOPS
Aplicaciones
El Computador
National Center for Supercomputing Applications
University of Illinois at Urbana-Champaign
Completed in 2011
http://www.ncsa.illinois.edu/BlueWaters/
• Biología
• Evolución del cosmos
• Investigación en nuevos materiales
• Fenómenos climatológicos
29
El Presente
CELL
(Sony-Toshiba-IBM)
El Computador
30
El Presente
CELL
(Sony-Toshiba-IBM)
El Computador
31
El Presente
CELL
(Sony-Toshiba-IBM)
El Computador
32
El Presente
CELL
(Sony-Toshiba-IBM)
El Computador
33
EL COMPUTADOR
3. Estructura Básica
34
Estructura Básica
Niveles de máquina
Lenguajes de alto nivel
Lenguaje ensamblador
Sistema operativo
Es lo que define
la “arquitectura”
El Computador
Máquina convencional
35
Estructura Básica
Soporte de los niveles
Interpretación
Programa fuente
Nivel 2
Intérprete
Nivel 1
El Computador
36
Estructura Básica
Soporte de los niveles
Traducción
Programa fuente
Nivel 2
Traductor
Programa objeto
Nivel 1
El Computador
37
Estructura Básica
Soporte de los niveles
Programa fuente
Nivel 2
Traducción
Traductor
Programa objeto
Nivel 1
Ensamblador:
1 instrucción fuente  1 instrucción objeto
Traductor
Compilador:
1 instrucción fuente  varias instrucciones objeto
El Computador
38
Estructura Básica
Arquitecturas CISC
Máquina convencional
(Complex Instruction Set Computer)
Ventajas de tener instrucciones muy potentes:
• Los programas ocupan menos (La memoria era muy cara)
• Hay menos accesos a memoria (La memoria era muy lenta)
• Puede facilitar la construcción compiladores
Con la microprogramación
era muy fácil implementar
instrucciones complejas
El Computador
Máquina convencional
Microprograma
39
Estructura Básica
Arquitecturas CISC
Máquina convencional
(Complex Instruction Set Computer)
Características de las instrucciones:
• Número elevado
• Muchos modos de direccionamiento
• Longitud variable
• Formato irregular
• Muchas instrucciones operan con la memoria
El Computador
40
Estructura Básica
Arquitecturas RISC
Máquina convencional
(Reduced Instruction Set Computer)
Ventajas de tener instrucciones sencillas:
• Se ejecutan más rápido
• Acceso a memoria más rápido
• Procesadores más simples, lo que permite mejorarlos
El Computador
41
Estructura Básica
Arquitecturas RISC
Máquina convencional
(Reduced Instruction Set Computer)
Características de las instrucciones:
• Número más reducido
• Menos modos de direccionamiento
• Longitud fija (Optimiza la extracción)
• Formato regular (Optimiza la decodificación)
• Filosofía Load / Store
•Memoria separada
•Cauce segmentado
El Computador
42
Estructura Básica
El Computador
Simple
Múltiple
Simple
Flujo de datos
SISD
SIMD
Múltiple
Flujo de instrucciones
Taxonomía de Flynn
MISD
MIMD
43
Estructura Básica
Arquitectura de Von Newman
CPU
El Computador
MEMORIA
E/S
44
Estructura Básica
Chipset típico
CPU
FSB
Tarjeta
Gráfica
Puente
Norte
(MCH)
Memoria
Principal
Puente
Sur
(ICH)
Ratón
El Computador
Teclado
Disco
USB
45
Estructura Básica
Chipset para
Intel Core i7
El Computador
46
Estructura Básica
Placa base de
CPU
Intel Core i7
X58
ICH10
El Computador
47
Estructura Básica
Placa base de
X58
CPU
Intel Core i7
ICH10
El Computador
48
EL COMPUTADOR
4. Rendimiento
49
Rendimiento
Programa
:
move r1,r2
add
Tiempo de ejecución
r3,r4
move r1,r5
:
Rendimiento =
El Computador
1
Tiempo de ejecución
50
Rendimiento
Programa A
Programa B
:
:
move r1,r2
xor
add
move r4,r5
r3,r4
move r1,r5
r4,r1
sub
:
r1,r2
:
Si Tiempo de ejecución de A < Tiempo de ejecución de B
diremos que A es n veces más rápido que B, siendo…
n=
Tiempo de ejecución de B
Tiempo de ejecución de A
El Computador
=
Rendimiento de A
Rendimiento de B
51
Rendimiento
Ecuación de rendimiento del procesador
Programa
:
move r1,r2
add
Ciclos Por Instrucción
r3,r4
move r1,r5
:
CPI =
Ciclos de reloj para el programa
Número de instrucciones ejecutadas
Tej. = I x CPI x T =
El Computador
I x CPI
F
I : Instrucciones ejecutadas
T : Periodo del reloj
F : Frecuencia del reloj
52
Rendimiento
Ley de Amdhal
Permite calcular la ganancia en el rendimiento que
obtendríamos al mejorar una parte del computador.
Establece que la ganancia está limitada por la fracción
de tiempo en la que puede ser utilizada la mejora.
Seguidamente vamos a definir algunos conceptos a
partir de los cuales definiremos la ley.
El Computador
53
Rendimiento
Aceleración (speedup)
Nos indica el aumento de rendimiento o mejora del
tiempo de ejecución tras haber introducido la mejora.
S=
S=
El Computador
Tiempo de ejecución sin la mejora
Tiempo de ejecución con la mejora
Rendimiento con la mejora
Rendimiento sin la mejora
54
Rendimiento
Fracción mejorable
Indica la parte del tiempo total de ejecución que puede
ser reducida mediante la mejora.
F=
Tiempo que se puede mejorar
Tiempo total
Mejora
Indica cuantas veces es más rápida la parte mejorada
respecto a la versión sin la mejora.
M=
El Computador
Tiempo sin mejora
Tiempo con mejora
55
Rendimiento
El nuevo tiempo de ejecución se puede calcular como:
Tnuevo = TAntiguo x (1 - F) + F
1
M
Con lo que la aceleración tras la mejora será:
S=
El Computador
TAntiguo
TNuevo
=
1
(1 - F) +
F
M
56
Rendimiento
Medición del rendimiento
¿Cómo medir el comportamiento de los computadores?
• Información del S.O.
• Kernels
• Conjuntos de benchmarks
• Monitores hardware
Los más utilizados son los conjuntos de benchmarks de
la organización SPEC
El Computador
57
Rendimiento
SPEC
Standard Performance Evaluation Corporation
• Consiste en un conjunto de programas que se pasan en
la máquina a evaluar.
• Los resultados se comparan con los obtenidos en una
máquina de referencia.
• Hay distintos tipos de test según las características que
se quieran evaluar.
El Computador
58
Rendimiento
Ejemplo de SPEC
El Computador
59
Rendimiento
El Computador
60
Rendimiento
El Computador
61
Rendimiento
El Computador
62
Rendimiento
El Computador
63
Rendimiento
El Computador
64
Rendimiento
El Computador
65
Rendimiento
El Computador
66
Rendimiento
El Computador
67
Rendimiento
El resto son indicaciones
sobre las opciones de
compilación usadas, flag
de optimización, etc …
El Computador
68
EL COMPUTADOR
5. Disipación de Potencia
69
Disipación de Potencia
La disipación de calor es uno de los grandes problemas en
el diseño de los procesadores y de los circuitos integrados
en general.
El calor es generado por la potencia disipada y ésta ha ido
en aumento con el paso de los años:
0,45 W
El Computador
160 W
70
Disipación de Potencia
El intercambio de calor con el aire exterior se realiza a
través de la superficie del chip.
Por lo tanto conviene:
• Lograr una gran superficie de intercambio.
• Renovar rápidamente el aire que se va calentando.
El Computador
71
Disipación de Potencia
El aumento de la superficie de disipación
se obtiene acoplando estructuras de
materiales que conduzcan fácilmente el
calor y una gran superficie.
El Computador
72
Disipación de Potencia
La rápida renovación del aire se
logra acoplando ventiladores a las
estructuras de disipación.
El Computador
73
Disipación de Potencia
En casos extremos se utilizan métodos más sofisticados:
Refrigeración por agua
Hielo seco
Célula Peltier
El Computador
74
Disipación de Potencia
Potencia total disipada
Potencia
dinámica
El Computador
+
Potencia
de cortocircuito
+
Potencia
estática
75
Disipación de Potencia
Potencia
dinámica
Se produce por la conmutación de los
transistores.
Pd = A x C x V 2 x F
A : Coeficiente de actividad
C : Capacidad
V : Voltaje de funcionamiento
F : Frecuencia de conmutación
El Computador
76
Disipación de Potencia
Potencia
de cortocircuito
Es debida a la corriente que fluye durante
un tiempo t entre la alimentación y la
tierra cuando las puertas conmutan.
Pc = A x t x V x Ic
A : Coeficiente de actividad
t : Tiempo
V : Voltaje de funcionamiento
Ic : Corriente de cortocircuito
El Computador
77
Disipación de Potencia
Potencia
estática
Es provocada por la corriente de pérdida
que fluye por el transistor aunque éste
no funcione.
Aunque es muy pequeña, adquiere la suficiente importancia
cuando el número de transistores es elevado.
Pe = V x Ie
V : Voltaje de funcionamiento
Ie : Corriente estática de fuga
El Computador
78
Disipación de Potencia
Para disminuir el consumo de potencia se puede:
• Disminuir la tensión de alimentación (V)
(Ha pasado de 5 V a poco más de 1 V)
• Disminuir la frecuencia (F)
La capacidad (C) depende del número de transistores, la
tecnología y su interconexión.
Algunos procesadores reducen su actividad de forma
automática cuando se calientan demasiado.
También pueden desconectar el reloj de los módulos que
no se están utilizando (por ejemplo, la unidad F.P.)
El Computador
79