Exponentes de Liapunov no nulos. Billares caóticos. · PDF fileExponentes de Liapunov...

69
Exponentes de Liapunov no nulos. Billares caóticos. José Juan Hernández Aguliar. 10 de Julio de 2002

Transcript of Exponentes de Liapunov no nulos. Billares caóticos. · PDF fileExponentes de Liapunov...

Exponentes de Liapunov no nulos. Billarescaóticos.

José Juan Hernández Aguliar.

10 de Julio de 2002

Índice general

1. Nociones Preliminares 41.1. Teoría de la Medida. . . . . . . . . . . . . . . . . . . . . . . . 4

1.2. Espacios Lp(µ). . . . . . . . . . . . . . . . . . . . . . . . . . . 61.3. Teoremas de Convergencia y Teorema de Recurrencia de Poincaré. 61.4. Existencia de Medidas Invariantes. . . . . . . . . . . . . . . . 9

2. Ergodicidad. 172.1. Teorema ergódico de Birkhoff. . . . . . . . . . . . . . . . . . . 172.2. Ergodicidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . 252.3. Ejemplos de transformaciones ergódicas . . . . . . . . . . . . 282.4. Transformaciones Mezcladoras. . . . . . . . . . . . . . . . . . 302.5. Entropía. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332.6. Exponentes de Liapunov. Teoría de Pesin. . . . . . . . . . . . 35

2.6.1. Exponentes de Liapunov. . . . . . . . . . . . . . . . . 352.6.2. Teoría de Pesin. . . . . . . . . . . . . . . . . . . . . . 382.6.3. Caos y Orden. . . . . . . . . . . . . . . . . . . . . . . 40

3. Billares. 423.1. Billares Planos. . . . . . . . . . . . . . . . . . . . . . . . . . . 423.2. Medida invariante y función generadora para billares planos.

Formulación variacional. . . . . . . . . . . . . . . . . . . . . . 503.3. Billares convexos. . . . . . . . . . . . . . . . . . . . . . . . . . 51

3.3.1. Geometría elemental. . . . . . . . . . . . . . . . . . . . 513.3.2. Tres aplicaciones geométricas. . . . . . . . . . . . . . . 553.3.3. Trayectorias periódicas. . . . . . . . . . . . . . . . . . 58

3.4. Billares Hiperbólicos . . . . . . . . . . . . . . . . . . . . . . . 61

1

Introducción.

Supongamos que una masa puntual se mueve sin fricción en una regiónacotada de Rd. La partícula choca elásticamente con los bordes o cuan-do se encuentra algunos obstáculos. En dos dimensiones estas colisiones sedescriben por una bien conocida ley de óptica geométrica: el ángulo de in-cidencia es igual al ángulo de reflexión. Así la teoría de billares y la teoríade óptica geométrica tienen muchas características en común.

El movimiento es muy complicado y las trayectorias no varian con con-tinuidad (si ellas son tangentes a uno de los bordes) o no están definidaspara todo tiempo (si ellas encuentran un vértice de la mesa de billar). Ahíel comportamiento puede ser mas inesperado; por ejemplo trayectorias quetienen un número infinito de rebotes en un tiempo finito o trayectorias quese acercan tanto como se quiera al borde de un billar convexo en un tiempoinfinito. Aún más, podemos construir billares con bordes razonablementeregulares (C1, por ejemplo) que no verifican buenas propiedades globalespara casi todas sus trayectorias.

Para evitar el último caso debemos añadir una fuerte condición de regu-laridad en los arcos del borde, y si no queremos tomar en cuenta trayectoriasanormales debemos usar teoría de la medida y así entrar en el campo de lateoría ergódica.

Hay motivaciones muy diferentes para estudiar billares y sus aplicaciones,ya que están en un proceso acelerado de expansión. Las razones mas signi-ficativas para buscar el primer resultado en billares son:

a) Estudio del movimiento periódico en billares convexos, como aplica-ciones de la geometría teorema de Poincaré.

b) Estudio de las propiedades ergódicas del modelo de gases de Boltzmann-Gibbs [17].

En esta tesis se presentan resultados conocidos de propiedades ergódicasde billares planos no poligonales. Los resultados en billares poligonales (to-dos los arcos del borde son segmentos de línea) son menos explícitos: estáprobado que en el conjunto de polígonos convexos con n lados (considera-

2

dos como un conjunto de R2n) hay un subconjunto denso, intersección de unnúmero numerable de conjuntos abiertos, tal que su transformación de billares ergódica; pero no se conoce la descripción de cualquier billar poligonalergódico. Billares de más dimensiones fueron estudiados solo en el caso debillares semidispersores cuya geometría esta basada en el modelo de gasesde bolas duras. La prueba final de la ergodicidad de tal modelo no ha sidoobtenida todavía, pero hay resultados parciales muy importantes.

Todo lo anterior se presenta en este trabajo en el capítulo 3, el capítulo 1contiene definiciones básicas así como teoremas importantes relacionados conTeoría de la medida, Teoremas de Convergencia, Teorema de Recurrenciade Poincaré, etc. y el capítulo 2 esta dedicado a diversos fundamentos de laTeoría Ergódica, demostración del Teorema ergódico de Birkhoff, así comoejemplos de transformaciones ergódicas, transformaciones mezclantes, etc.

3

Capítulo 1

Nociones Preliminares

En este capítulo introduciremos nociones básicas de Teoría de la medida,que serán de utilidad para los siguientes capítulos (Lema de Fatou, Teoremade la Convergencia Dominada, Teorema de Recurrencia de Poincaré, etc.).Las demostraciones pueden ser consultadas en: [22] y [29].

1.1. Teoría de la Medida.

Definición 1.1 Si X es cualquier espacio, A es un álgebra de conjuntos deX si:

i) X ∈ A;ii) A,B ∈ A implica A ∪B ∈ A;iii)A ∈ A implica Ac(relativo a X) ∈ A;Si además Ai ∈ A i = 1, 2, ...; implica

∞Si=1

Ai ∈ A, entonces decimos queA es una σ-álgebra.

Proposición 1.2 Dada una colección C de subconjuntos de X, existe unaσ-álgebra A la cual contiene a C y tal que si B es cualquier σ-álgebra quecontiene a C, entonces A ⊂ B. A es llamada la σ-álgebra generada por C.

Definición 1.3 Si A es un álgebra de subconjuntos de X, decimos que unafunción µ : A −→ [0,∞] es una medida sobre A si µ(∅) = 0 y µ (∪iAi) =P

µ (Ai) para cualquier familia de conjuntos disjuntos Ai ∈ A, i = 1, 2, ....

Si µ(X) <∞ se dice que la medida es finita y podemos definir una nuevamedida dada por: ν (A) = µ (A) /µ (X) para todo A ∈ A.

4

Si µ(X) = 1 se dice que µ es una medida de probabilidad o simplementeuna probabilidad.

Si X es un espacio topológico, llamamos, σ-álgebra de Borel de X, a laσ-álgebra generada por la familia de subconjuntos abiertos de X. A esta σ-álgebra la denotaremos por B(X) y a los elementos de B(X) los llamaremosBorelianos.

Definición 1.4 Sean A una σ-álgebra de conjuntos de X y µ una medi-da en A tal que µ (X)=1, entonces se dice que (X,A,µ) es un espacio deprobabilidad.

Teorema 1.5 (de Extensión de Hahn-Kolmogorov) Sea A0 un álgebra deconjuntos de X y ν una medida de probabilidad. Entonces existe una únicamedida µ definida sobre la σ-álgebra A generada por A0 tal que µ(A) = ν(A)para todo A ∈ A0 (µ es una extensión de ν: µ|A0 = ν).

Definición 1.6 a) Dos conjuntos A1, A2 ⊂ X son equivalentes (mod 0) sisu diferencia simétrica A1 4 A2 = (A1\A2) ∪ (A2\A1)es un conjunto demedida cero.

b) Si S es una familia de subconjuntos de X decimos que A ∈ S (mod 0)si existe A1 ∈ S equivalente (mod 0) a A.

c) Decimos que S1 = S2 (mod 0) si para cualquier A1 ∈ S1 y A2 ∈ S2tenemos A1 ∈ S2 (mod 0) y A2 ∈ S1 (mod 0).

d) Finalmente, S (mod 0)-genera O si O =_S (mod 0) donde

_S es la

σ-álgebra generada por SDefinición 1.7 Sean X, Y dos conjuntos y sean A y B σ-álgebras de sub-conjuntos de X y Y respectivamente. f :X−→Y es medible con respecto a Ay B si f−1(B) ∈ A para todo B ∈ B.Teorema 1.8 (Lusin) Sean X y Y espacios métricos separables, B los bore-lianos de X y (X,B,µ) un espacio de probabilidad. Dado ε > 0, para cadaA ∈ B existe K ⊂ A, compacto, tal que µ(A \ K) < ε. Si f : X−→Y esmedible (respecto de los borelianos de ambos espacios) ∃ K1 compacto, talque µ(K1) > 1− ε y f restringida a K1 es continua.

Definición 1.9 Sean (X,A,µ) un espacio de medida y T :X−→X. Decimosque T preserva µ o que µ es T -invariante si para todo A ∈ A, T−1(A)∈ Ay µ(A) = µ(T−1(A)).

Recordemos que una propiedad se dice que se cumple en casi todo punto(c.t.p.) si el conjunto de puntos donde falla la propiedad es de medida cero.

5

Definición 1.10 Decimos que dos transformaciones Ti; i = 1, 2 de espaciosde medida (Xi,Bi, µi) i = 1, 2, respectivamente, son equivalentes, si existeF que preserva medida de (X1,B1, µ1) en (X2,B2, µ2) que satisface:

a) F es invertible, i.e.

∃G : (X2,B2, µ2) −→ (X1,B1, µ1)

tal que G ◦ F (x) = x c.t.p. x ∈ X1 y F ◦G(x) = x c.t.p. x ∈ X2Definición 1.11 b) T2 ◦ F = F ◦ T1 c.t.p.

Observación 1.12 a) ⇒ G preserva medida de

(X2,B2, µ2)sobre(X1,B1, µ1)

yb) ⇒ G ◦ T2 = T1 ◦G c.t.p.

1.2. Espacios Lp(µ).

Sea p ≥ 1, denotamos por Lp(X,A,µ) o simplemente Lp(µ) al conjuntode todas las funciones f :X−→ R medibles tales que

R |f |p dµ < ∞, identi-ficando las funciones que coinciden salvo en un conjunto de medida 0. EnLp(µ) definimos la norma k·kp de f como:

kfkp = (∫X|f |p dµ) 1p .

También definimos L∞(X,A,µ) o L∞(µ) al conjunto de funciones f :X−→R tales que existe K > 0 tal que |f(x)| < K para casi todo punto x ∈X,identificando las funciones que coinciden salvo en un conjunto de medida 0.Al ínfimo de tales K le llamamos la norma infinito k·k∞.

1.3. Teoremas de Convergencia y Teorema de Re-currencia de Poincaré.

Recordemos que una función f :X−→ R es simple si se puede escribir

de la forma f =NPi=1

λiXAi , λi ∈ R Ai ∈ A, i = 1, ...,N. Decimos que una

6

función simple es integrable siNPi=1

λiµ(Ai) < +∞ en este caso definimos la

integral de f como: ZX

fdµ =NXi=1

λiµ(Ai).

Se puede probar que este número es independiente de la forma de expresarf como una combinación lineal de funciones características.

Teorema 1.13 (Lema de Fatou): Sea fn :X−→ R una sucesión de fun-ciones integrables positivas tales que n→ +∞lıminf RX fndµ < +∞ y con-vergente c.t.p. a f :X−→ R. Entonces f es integrable y n→ +∞lım inf RX fndµ ≥RX fdµ.

Teorema 1.14 (Teorema de la Convergencia Monótona): Sea fn :X−→ Runa sucesión de funciones integrables tales que para casi toda x la suce-sión {fn(x)} es monótonamente creciente y nsup

RX fndµ < ∞. Entonces

la función f(x) = n→ +∞lımfn(x) es integrable y n→ +∞lım RX fndµ =RX fdµ.

Teorema 1.15 (Teorema de la Convergencia Dominada): Sea fn :X−→ Runa sucesión de funciones integrables dominada por una función integrablef :X−→ R, i. e. |fn(x)| ≤ f(x) para toda n y c.t.p. x. Entonces si lasucesión fn(x), n ≥ 1 converge para casi toda x, la función límite f(x) =n→ +∞lımfn(x) satisface

Rfdµ = n→ +∞lım R fndµ.

Lema 1.16 Las siguientes proposiciones son equivalentes:1. µ es una medida T -invariante.2.Rf◦ T dµ =

Rfdµ para cualquier f ∈ L1(X,A,µ).

Demostracion2)⇒1) Sea B ∈ A y tomemos f = XB la función característica de B,

entonces

µ(B) =

ZXBdµ =

ZXB ◦ Tdµ = µ(T−1(B)),

es decir µ es una medida T -invariante.1)⇒2) Si µ es T -invariante entoncesZ

XB ◦ Tdµ =ZXBdµ,

para todo boreliano B ∈ A. Puesto que cualquier función f ∈ L1(X,A,µ) sepuede aproximar mediante sumas finitas de funciones características obten-emos el resultado.

7

Definición 1.17 Si µ y ν son dos medidas de probabilidad en (X,A), deci-mos que µ es absolutamente continua con respecto a ν y lo denotamos µ¿ νsi A ∈ A tal que ν(A)= 0 implica que µ(A)= 0. Decimos que las dos medidasson equivalentes si µ¿ ν y ν ¿ µ.

Teorema 1.18 (Radon-Nikodym): Sean ν y µ dos medidas de probabilidaden (X,A). Entonces ν ¿ µ si y sólo si existe f ∈ L1(µ) tal que f ≥ 0,RX fdµ = 1 y tal que ν(B) =

RB fdµ para todo B ∈ A. Esta función es única,

cualquier otra función que lo cumpla difiere de ésta sólo en un conjunto demedida cero.

A esta función la llamaremos la derivada de Radon-Nikodym de ν conrespecto a µ y la denotamos por: dν

dµ .

Teorema 1.19 (Teorema de Recurrencia de Poincaré): Sean (X,A,µ) unespacio de probabilidad y T :X−→X que preserva la medida µ. Para cualquierconjunto medible B ∈ A el conjunto

B0 = {b ∈ B :{n ∈ N:Tn(b) ∈ B} es infinito} pertenece a A y µ(B0) =µ(B).

DemostraciónSea

Cn = {b ∈ B : T k(b) /∈ B para todo k ≥ n}.Es claro que B0 = B \n∪Cn. Por lo tanto el teorema estará demostrado

si probamos que Cn ∈ A y que µ(Cn) = 0 para todo n ≥ 1.Para todo n observemos que

Cn = B \ k ≥ n∪T−k(B)Lo que prueba que Cn ∈ A y como

Cn = B \ k ≥ n∪T−k(B) ⊂ k ≥ 0∪T−k(B) \ k ≥ n∪T−k(B)resulta

µ(Cn) ≤ µ(k ≥ 0∪T−k(B))− µ(k ≥ n∪T−k(B))Más aún

k ≥ n∪T−k(B) = T−n(k ≥ 0∪T−k(B))de modo que

µ(k ≥ n∪T−k(B)) = µ(T−n(k ≥ 0∪T−k(B)))lo que implica µ(Cn) = 0.

8

1.4. Existencia de Medidas Invariantes.

En esta sección empezaremos por demostrar la existencia de medidasinvariantes. Sea X un espacio métrico completo, cabe señalar que se haráuso de la estructura topológica del espacio, dicha demostración incluirá lademostración de que M(X) es un espacio métrico completo.

Donde M(X)={µ ∈ (X,A) : µ es una probabilidad}.Dada una función continua denotamos MT (X) a el conjunto de probabil-

idades T -invariantes (T es una transformación continua en espacios métricoscompletos).

Proposición 1.20 MT (X) es no vacío.

Antes de probar la proposición introduciremos una topología en M(X) yprobaremos algunos lemas simples pero importantes

Sea la topología en M(X), definida por la siguiente base de vecindades:

Vε,Φ(µ) = {ν ∈M(X) :

¯ZXΦdν −

ZXΦdµ

¯≤ ε}

donde ε > 0 y Φ : X−→ R es continua.Sea C0(X) el espacio de funciones continuas con la norma

kfk = x ∈ Xsup |f (x)| .

Lema 1.21 M(X) es un espacio métrico completo.

Como X es métrico completo ∃{gn : n ∈ N} denso en la bola unitaria

B := {f ∈ C0(X) : kfk ≤ 1}.

Consideremos en M(X) la métrica:

d(µ, ν) =∞Xj=1

1

2j

¯ZXgjdµ−

ZXgjdν

¯No es difícil verificar que efectivamente d es una métrica:Demostracióni)d(µ, ν) ≥ 0. Esto se cumple ya que estamos sumando números mayores

o iguales a 0.ii)d(µ, ν) = 0⇔ µ = ν

9

d(µ, ν) = 0 ⇔∞Pj=1

12j

¯RX gjdµ−

RX gjdν

¯= 0 ⇔ ¯R

X gjdµ−RX gjdν

¯= 0

para cada j⇔ R

X gjdµ−RX gjdν = 0⇔

RX gjdµ =

RX gjdν ⇔ µ = ν.

iii)d(µ, ν) = d(ν, µ)También es claro, ya que

¯RX gjdµ−

RX gjdν

¯=¯RX gjdν −

RX gjdµ

¯para

cada j.iv)d(µ, ν) ≤ d(µ,α) + d(α, ν)

d(µ, ν) =∞Xj=1

1

2j

¯ZXgjdµ−

ZXgjdν

¯

=∞Xj=1

1

2j

¯ZXgjdµ−

ZXgjdν +

ZXgjdα−

ZXgjdα

¯

=∞Xj=1

1

2j

¯ZXgjdµ−

ZXgjdα+

ZXgjdα−

ZXgjdν

¯

≤∞Xj=1

1

2j

¯ZXgjdµ−

ZXgjdα

¯+

∞Xj=1

1

2j

¯+

ZXgjdα−

ZXgjdν

¯= d(µ,α) + d(α, ν)

Para la prueba del Lema 1.20 probaremos antes los siguientes Lemas.

La demostración de este Lema nos permite probar que M(X) es metriz-able, la idea es demostrar que la métrica d(·, ·) genera la topología de M(X)arriba descrita.

Lema 1.22 Sea {µn} una sucesión en M(X) las siguientes proposicionesson equivalentes:

a) n→∞lımd(µn, µ)= 0.b)n→∞lım RX gjdµn = RX gjdµ para toda j ≥ 1.c)n→∞lım RX gdµn = RX gdµ para toda g ∈ C0(X).

Demostracióna)⇒b) se cumple, ya que¯Z

Xgjdµn −

ZXgjdµ

¯≤ 2jd(µn, µ).

b)⇒c) kgk = 0 es inmediato.

10

Dados g ∈ C0(X) y ε > 0 ∃j tal que°°°°gj − g

kgk°°°° ≤ ε

3 kgk .

Sea N tal que n ≥ N ⇒¯ZXgjdµn −

ZXgjdµ

¯≤ ε

3 kgk .

Entonces para n ≥ N¯ZXgdµn −

ZXgdµ

¯≤ kgk

¯ZX(g

kgk − gj)dµn

¯+ kgk

¯ZXgjdµn −

ZXgjdµ

¯+ kgk

¯ZX(gj − g

kgk)dµ¯

≤ kgk ε

3 kgk + kgkε

3 kgk + kgkε

3 kgk = ε.

c)⇒a) Sea j0 tal que∞P

j=j0+1

12j≤ ε

4 entoces para n ≥ N

d(µn, µ) ≤j0Xj=1

1

2j

¯ZXgjdµn −

ZXgjdµ

¯

+∞X

j=j0+1

1

2j(

ZX|gj| dµn +

ZX|gj | dµ)

≤j0Xj=1

1

2j

¯ZXgjdµn −

ZXgjdµ

¯+ 2

ε

4

como µn satisface c) podemos encontrar N tal que n ≥ N ⇒¯ZXgjdµn −

ZXgjdµ

¯≤ ε

2

entonces para cualquier j tal que 1 ≤ j ≤ j0 implica que para cualquiern ≥ N tenemos:

d(µn, µ) ≤ε

2+

ε

2= ε.

Para probar que es completo, utilizaremos el siguiente teorema llamadoTeorema de la representación de Riesz.

11

Teorema 1.23 Sea ϕ : C0(X)−→ R lineal tal que ϕ(f) ≥ 0 si f ≥ 0 yϕ(1) = 1 (donde 1 es la función constante 1). Entonces ∃µ ∈M(X) tal queRX fdµ = ϕ(f) para todo f ∈ C0(X).

Como M(X) es metrizable, probar la completes de M(X) equivale a pro-bar que toda sucesión en M(X) tiene una subsucesión convergente.

Lema 1.24 Toda sucesión en M(X) admite una subsucesión convergente.

DemostraciónSea {µn} una sucesión en M(X) y sea

_µn: N −→ [−1, 1] definida por:

_µn (j) =

RX gjdµn.

Como [-1,1]N provisto de la topología producto es un espacio métricocompacto ∃ una subsucesión {µnm} tal que {

_µnm (j)} converge para toda

j ≥ 1 o sea que {RX gjdµnm} converge para todo j ≥ 1 y así {RX gdµnm}converge para todo g ∈ C0(X).

Definamos ϕ : C0(X)−→ R mediante ϕ(g) = m→∞lım RX gdµnm .Por el Teorema de Riesz y dado que ϕ es una función real positiva ∃µ ∈

M(X) tal que ϕ(g) =RX gdµ para todo g ∈ C0(X), o sea que {d(µnm , µ)}

converge a 0.Demostración de la Proposición 1.19:Sea µ ∈ M(X) la medida de Dirac concentrada en x0 ∈ X,

µ(A) =

½1 si x0 ∈ A0 si x0 /∈ A

¾Sea

µn =1

n(µ+ µ ◦ T−1 + ...+ µ ◦ T−n+1).

Por el Lema 1.23, existe una subsucesión convergente {µnm}. Llamamosν = m→∞lımµnm , entonces:

ν ◦ T−1 = m→∞lım 1

nm(µ ◦ T−1 + ...+ µ ◦ T−nm)

= m→∞lım 1

nm(µ+ µ ◦ T−1 + ...+ µ ◦ T−nm − µ) = ν.

Puede pasar que un mapeo continuo de un espacio métrico completotenga exactamente una probabilidad invariante. Tales mapeos son llamadosúnicamente ergódicos. El ejemplo más común es la traslación irracional deTn = S1 × ...× S1.

12

Vamos a introducir el concepto de ergodicidad. Sean (X,A,µ) un espaciode probabilidad y T : X→ X que preserva la medida. La órbita de un puntox ∈ X es la sucesión x, T (x), T 2(x), .... Si f :X→ R es una función integrableconsideremos sus promedios sobre los segmentos de órbita x, T (x), ..., Tn(x),esto es los números:

1

n+ 1

nXj=0

f(T j(x)). (1)

Uno de los resultados fundamentales de la teoría ergódica, es el teorema deBirkhoff (que se demostrará en el siguiente capítulo), que establece que lasucesión (1) de los promedios de funciones integrables sobre segmentos deórbita converge c.t.p. x ∈ X, a un número denominado promedio orbital def en el punto x, y que la función ef : X → R definida por

ef(x) = n→∞lım 1

n+ 1

nXj=0

f(T j(x)).

es integrable y ZX

efdµ = ZX

fdµ. (2)

Un caso especialmente interesante es cuando f es la función característicaXA de un conjunto A ∈ A. Entonces es inmediato ver que:

fXA(x) = n→∞lım1n#{0 ≤ j ≤ n− 1 : T j(x) ∈ A}.

Este valor se denomina tiempo promedio de estadía de x en A y es el por-centaje de órbita que se encuentra en A. Por (2)Z

X

fXAdµ = ZX

XAdµ = µ(A). (3)

Decimos que T es una transformación ergódica si para toda función f : X→ R vale ef (x) = Z

X

fdµ. (4)

para c.t.p. x ∈ A. Es fácil ver que esto equivale a exigir que ef sea constanteen casi todo punto: (2) implica que esta constante tiene que estar dada porla igualdad (4). Si aplicamos (4) a la función característica XA obtenemos:fXA(x) = µ(A) c.t.p. x ∈ X.

13

Ahora daremos un resultado que caracteriza las transformaciones con-tinuas únicamente ergódicas en términos de promedios orbitales.

Teorema 1.25 Sea X un espacio métrico completo y T : X−→X una trans-formación continua. Entonces las siguientes propiedades son equivalentes:

1) T es únicamente ergódica.2) Para cualquier f ∈ C0(X) el límite:

n→∞lım 1

n+ 1

nXj=0

f(T j(x)).

existe para cualquier x y no depende de x.3) Para cualquier f ∈ C0(X) la sucesión de funciones:

1

n+ 1

nXj=0

f ◦ T j

converge uniformemente a una constante.

Demostración1)⇒3) Si 3) no se cumple entonces ∃f ∈ C0(X) tal que la sucesión

1

n+ 1

nXj=0

f ◦ T j

no converge uniformemente aRXfdµ, donde µ es el único elemento de MT (X).

Entonces existen ε > 0, una sucesión divergente de enteros {ni}i≥1 y unasucesión {xi}i≥1 de puntos de X tal que¯

¯ 1

ni + 1

niXj=0

f(T j(xi))−ZX

fdµ

¯¯ ≥ ε

para cualquier i. Sea µni ∈ M(X) tal que:ZX

gdµni =1

ni + 1

niXj=0

g(T j(xi))

para cualquier g ∈ C0(X); la existencia de esta medida es garantizadapor el teorema de la representación de Riesz.

14

Como M(X) es espacio métrico completo, podemos suponer que la suce-sión {µni} converge a ν ∈ M(X). Ahora probaremos que ν ∈ MT (X). Seag ∈ C0(X); entonces:Z

X

(g ◦ T )dν = ni →∞lımZX

(g ◦ T )dµni

= ni →∞lım 1

ni + 1

niXj=0

g(T j+1(xi))

= ni →∞lımZX

gdµni − ni →∞lım 1

ni + 1g(xi)

+ni →∞lım 1

ni + 1g(Tni+1(xi))

=

ZX

gdν.

así que ν ∈ MT (X). Pero¯¯ZX

fdµ−ZX

fdν

¯¯ = ni →∞lım

¯¯ZX

fdµni −ZX

fdµ

¯¯

= ni →∞lım¯¯ 1

ni + 1

niXj=0

f(T j(xi))−ZX

fdµ

¯¯ ≥ ε

⇒ ν 6= µ contradiciendo el hecho de que T es únicamente ergódico.3)⇒2) Trivial.2)⇒1) Sea φ : C0(X) −→ R una función definida por:

φ(f ) = n→∞lım 1

n+ 1

nXj=0

f(T j).

Entonces si µ ∈ MT (X)ZX

fdµ =1

n+ 1

nXj=0

ZX

(f ◦ T j)dµ

porque ZX

fdµ =

ZX

(f ◦ T j)dµ

15

para cualquier j.

Como la sucesión 1n+1

nPj=0

f (T j) es acotada por kfk0 se sigue por teoremade la convergencia dominada que:Z

X

fdµ = n→∞lım 1

n+ 1

nXj=0

ZX

(f ◦ T j)dµ

=

ZX

n→∞lım( 1

n+ 1

nXj=0

(f ◦ T j))dµ

=

ZX

φ(f)dµ = φ(f)

Así el único elemento de MT (X) es la medida asociada con la funciónlineal positiva φ.

16

Capítulo 2

Ergodicidad.

2.1. Teorema ergódico de Birkhoff.

En este capítulo se demostrará el teorema ergódico de Birkhoff y se daránejemplos de mapeos ergódicos una referencia para estecapítulo es [22].

Teorema 2.1 (ergódico de Birkhoff): Sean (X,A,µ) un espacio de probabil-idad y T : X−→X que preserva medida. Entonces:

1) Si f ∈ L1(µ), el siguiente límite existe para µ-casi todo x ∈ X:n→∞lım 1

n

n−1Pj=0

f◦ T j(x).

2) Si f ∈ Lp(µ), 1 ≤ p <∞, la función definida por_f (x) = n→∞lım 1

n

n−1Pj=0

f◦T j(x) pertenece a Lp(µ) y satisface:

i)n→∞lım°°°°°_f − 1

n

n−1Pj=0

f ◦ T j(x)

°°°°°p

= 0

ii)_f (T (x)) =

_f (x) c.t.p.

3)RX

_f dµ =

RX fdµ para toda f ∈ Lp(µ).

La propiedad i) es la mas importante y difícil de probar, ya que las otrasdos se deducen de propiedades de integrabilidad.

Para hacer la demostración recurriremos al siguiente Lema conocido co-mo el Teorema ergódico maximal.

Lema 2.2 Sea f ∈ L1(µ) y definimos:

E(f) = {x : n ≥ 0supnX

j=0

f ◦ T j(x) > 0}

17

entoncesR

E(f)

fdµ ≥ 0.

DemostraciónDefinimos la siguiente función:

fn(x) = 0 ≤ m ≤ nmax{mXj=0

f ◦ T j(x)}

como

E(f ) =∞[n=0

{x : fn(x) > 0}

basta demostrar que para toda n ∈ NZ{x:fn(x)≥0}

fdµ ≥ 0.

SeaE = {x : fn(x) ≥ 0}.

Observemos que si 0 ≤ m ≤ n entonces

fn(x) ≥mXj=0

f ◦ T j(x)

es decir:

fn(T (x)) + f(x) ≥ 0 ≤ m ≤ nmax{m+1Xj=0

f ◦ T j(x)}.

En particular, sifn(T(x)) + f(x) ≥ f(x)

entoncesfn(T (x)) + f (x) ≥ fn(x).

De hecho, esto se cumple cuando fn(T (x)) ≥ 0.Dado queZ

E

fdµ(x) =

ZE∩{fn◦T (x)<0}

fdµ(x) +

ZE∩{fn◦T (x)≥0}

fdµ(x)

18

y comofn(T (x)) + f(x) ≥ fn(x)sifn(T (x)) ≥ 0,

entoncesZE

fdµ(x) ≥Z

E∩{fn◦T (x)<0}fdµ(x) +

ZE∩{fn◦T (x)≥0}

fdµ(x)

−Z

E∩{fn◦T (x)≥0}(fn ◦ T )dµ(x).

Afirmamos que

fn(x) ≥ 0yfn(T (x)) < 0⇒ fn(x) = f(x)yf(x) > 0.

Por definición, si fn(T (x)) < 0 equivale a

m+1Xj=1

f ◦ T j(x) =mXj=0

f ◦ T j+1(x) < 0,

para toda 0 ≤ m ≤ n.Además, si fn(x) ≥ 0 ∃m ∈ {1, ..., n} tal que

mXj=0

f ◦ T j(x) ≥ 0.

Por lo tanto

f(x) ≥ 0yfn(x) = 0 ≤ m ≤ nmax{mXj=0

f ◦ T j(x)} = f(x).

Entonces:ZE

fdµ ≥Z

E∩{fn◦T (x)<0}

fdµ+

ZE∩{fn◦T (x)≥0}

fdµ

−Z

E∩{fn◦T (x)≥0}

(fn ◦ T)dµ

≥ZE

fdµ−Z

E∩{fn◦T (x)≥0}

(fn ◦ T )dµ

=

ZT−1(E)

(fn ◦ T )dµ−Z

E∩{fn◦T (x)≥0}

(fn ◦ T )dµ.

19

Pero como

T−1(E) = {fn ◦ T ≥ 0} ⊂ E ∩ {fn ◦ T(x) ≥ 0},

entonces ZT−1(E)

(fn ◦ T )dµ−Z

E∩{fn◦T (x)≥0}

(fn ◦ T)dµ. ≥ 0

Por lo tanto, para cada n ∈ N RE fdµ ≥ 0.

Corolario 2.3 Si A ⊂ E(f), A ∈ A y T−1(A) = A entonces:RA fdµ ≥ 0.

Demostración Como T−1(A) = A, entonces E(f ◦ XA) = A, y por elT. E. M.

0 ≤ RE(f◦XA)

f ◦XAdµ =RA

f ◦ XAdµ =RA

fdµ.

Demostración (Teorema de Birkhoff): Supongamos que se cumple 1)para demostrar 2) y 3)

Dem. 2): Observemos que

¯_f (x)

¯≤ n→∞lım1

n

n−1Xj=0

¯f ◦ T j(x)

¯en c.t.p.x ∈ X.

y por tanto, si f ∈ Lp(µ) y 1 ≤ p <∞

¯_f (x)

¯p≤ n→∞lım

1n

n−1Xj=0

¯f ◦ T j(x)

¯p

(1).

Como¯_f¯pes una función positiva, para demostrar que es integrable

basta mostrar que el límite define una función integrable, que por el Lemade Fatou, se reduce a que

n→∞lım infZX

1n

n−1Xj=0

f ◦ T j

p

dµ <∞

20

Pero ZX

1n

n−1Xj=0

f ◦ T j

p

dµ =

°°°°°° 1nn−1Xj=0

¯f ◦ T j(x)

¯°°°°°°p

p

≤1n

n−1Xj=0

°°f ◦ T j°°p

p

=

1n

n−1Xj=0

kfkp

p

= kfkpp

Ya que°°f ◦ T j

°°pp= kfkpp por que T preserva medida.

Por lo tanto el límite:

n→∞lım1n

n−1Xj=0

¯f ◦ T j(x)

¯p

define una función integrable cuya integral es menor o igual que kfkpp.Por lo tanto

¯_f (x)

¯pes integrable

_f∈ Lp(µ) y su integral también es menor

o igual que kfkpp. En particular°°°_f°°°p≤ kfkp (2).

Por lo tanto_f∈ Lp(µ).

Para probar el inciso i) de 2), consideremos el caso en que f ∈ L∞(µ).Por 1), la sucesión de funciones:¯

¯_f (x)− 1nn−1Xj=0

f ◦ T j(x)

¯¯p

(3).

converge a 0 en casi todo punto x ∈ X. Además en casi todo punto:¯_f (x)

¯≤ n→∞lım1

n

n−1Xj=0

¯f ◦ T j(x)

¯ ≤ n→∞lım1n

n−1Xj=0

kfk∞ = kfk∞

Entonces:¯¯_f (x)− 1n

n−1Xj=0

f ◦ T j(x)

¯¯p

≤¯¯°°°_f°°°∞ + 1

n

n−1Xj=0

°°f ◦ T j(x)°°∞

¯¯p

≤ 2p kfk∞

21

Por lo tanto, la sucesión definida en (3) está dominada por una constantey por el teorema de la convergencia dominada, concluimos que:

n→∞lımZX

¯¯_f − 1n

n−1Xj=0

f ◦ T j

¯¯p

dµ = 0

Esto demuestra i) para f ∈ L∞(µ).Si tomamos f ∈ Lp(µ), dado ε > 0 tomamos f0 ∈ L∞(µ) tal que

kf − f0kp ≤ε

3

y N ∈ N tal que:°°°°°°_f0 −

1

n

n−1Xj=0

f0 ◦ T j

°°°°°°p

≤ ε

3(4).

Entonces:°°°°°°_f −1

n

n−1Xj=0

f ◦ T j

°°°°°°p

≤ kf − f0kp +°°°°°°_f0 −

1

n

n−1Xj=0

f0 ◦ T j

°°°°°°p

+

°°°°°°1nn−1Xj=0

(f − f0) ◦ T j

°°°°°°p

Pero_f −

_f 0= (f − f0), entonces por (2).°°°_f − _

f0

°°°p≤ °°(f − f0)

°°p≤ kf − f0kp ≤

ε

3

También:°°°°°° 1nn−1Xj=0

(f − f0) ◦ T j

°°°°°°p

≤ 1

n

n−1Xj=0

kf − f0kp = kf − f0kp ≤ε

3

por (4) si n ≥ N implica°°°°°°_f 0 −

1

n

n−1Xj=0

f0 ◦ T j

°°°°°°p

≤ ε

3

22

Por lo tanto si n ≥ N°°°°°°_f − 1

n

n−1Xj=0

f ◦ T j

°°°°°°p

≤ ε,

por lo tanto i) está demostrado.Demostraremos primero 3) y luego la propiedad ii) de 2).

Como 1n

n−1Pj=0

f◦ T j converge en L1(µ) a_f , luego

ZX

_f dµ = n→∞lım1

n

n−1Xj=0

ZX

f◦T jdµ = n→∞lım1n

n−1Xj=0

ZX

fdµ =

ZX

fdµ.

Ya que T preserva medida.Finalmente probaremos la propiedad enunciada en ii)

_f (T (x)) =

_f (x).

En c.t.p. x ∈ X (i.e._f es T -invariante), esto se sigue de:

_f (T (x)) = n→∞lım1

n

n−1Xj=0

f ◦ T j(T (x))

= n→∞lım1n

nXj=0

f ◦ T j(x)− 1nf(x)

= n→∞lımn+ 1

n

1

n+ 1

nXj=0

f ◦ T j(x)− n→∞lım1nf(x)

= n→∞lım 1

n+ 1

nXj=0

f ◦ T j(x) =_f (x).

Finalmente demostraremos 1). Si f ∈ L1(µ) definimos:

E+α (f) =

x : n→∞lımsup1n

nXj=0

f ◦ T j(x) > α

E−α (f) =

x : n→∞lımsup1n

nXj=0

f ◦ T j(x) < α

Observemos que:

E+α (f) = E+0 (f − α) (5)

E−α (f) = E+−α(−f) (6)

23

Entonces, es cierto que:ZE+α (f )

fdµ ≥ αµ(E+α (f)) (7)

ya que: ZE+α (f)

fdµ =

ZE+α (f )

(f − α)dµ+ αµ(E+α (f))

=

ZE+0 (f−α)

(f − α)dµ+ αµ(E+α (f))

y como

T−1(E+0 (f − α)) ⊂ E+0 (f − α)yE+0 (f − α) ⊂ E(f − α)

entonces, por el corolario anteriorZE+0 (f−α)

(f − α)dµ ≥ 0

Por lo tanto: ZE+α (f )

fdµ ≥ αµ(E+α (f))

Entonces, si A ∈ A, tal que T−1(A) = A.ZA

fdµ =

ZA

f ◦ XAdµ =

ZE+α (f◦XA)

f ◦XAdµ

≥ αµ(E+α (f ◦ XA)) = αµ(A) (8).

De manera análoga podemos concluir que si A ∈ A, tal que A ⊂ E−β (f)y T−1(A) = A, entonces:Z

A

fdµ = βµ(A) (9).

24

Sean α < β. Si tomamos A = E+α (f)∩E−β (f) y aplicamos la desigualdad(8) obtenemos, Z

E+α (f )∩E−β (f)

fdµ ≥ αµ(E+α (f) ∩E−β (f))

y si aplicamos la desigualdad (9)ZE+α (f)∩E−β (f )

fdµ ≤ βµ(E+α (f )∩ E−β (f))

como α < β, por lo tanto

µ(E+α (f) ∩E−β (f)) = 0 (10)

Tomemos {αn ∈ R} una sucesión densa en R, entonces:

α

x : n→∞lımsup 1n

n−1Xj=0

f ◦ T j(x) > n→∞lım inf 1n

n−1Xj=0

f ◦ T j(x)

= 0

ya quex : n→∞lımsup 1n

n−1Xj=0

f ◦ T j(x) > n→∞lım inf 1n

n−1Xj=0

f ◦ T j(x)

=

[αn>αm

E+αn(f) ∩E−αm(f )

que por (10) es la unión de conjuntos de medida 0.

Por lo tanto el límite de 1n

n−1Pj=0

f ◦ T j(x) existe en c.t.p. x ∈ X.

2.2. Ergodicidad.

Definición 2.4 Si (X,A,µ) es un espacio de probabilidad y T : X−→Xuna transformación que preserva medida, decimos que T es ergódica si paracualquier A ∈ A, T -invariante, resulta que: µ(A) = 0 ó 1.

25

Proposición 2.5 Las siguientes propiedades son equivalentes:i) T es µ-ergódica.ii)Si f◦ T = f , f ∈ L1(µ) entonces f es constante c.t.p. x ∈ X.iii)Si f◦ T = f , f ∈ Lp(µ) entonces f es constante c.t.p. x ∈ X.iv) Para cualquier A,B ∈ A tenemos:

n→∞lım1n

n−1Xj=0

µ(T−j(A)∩B) = µ(A)µ(B)

v) Para cualquier f ∈ L1(µ) tenemos:_f=

RXfdµ, la

_f definida en el

teorema de Birkhoff.

Demostracióni)⇒ii) Si suponemos que existe f ∈ L1(µ) no constante tal que f◦ T = f ,

entonces podemos encontrar alguna c ∈ R de tal manera que el conjunto B= {x ∈ X : f(x) > c} tiene medida 0 < µ(B) < 1. Ahora f◦ T = f implicaque B es T -invariante, es decir T−1(B) = B. Por lo tanto µ(B) = 0 ó 1 locual es una contradicción, por lo tanto f es constante casi donde quiera.

iii)⇒i) Si A ∈ A es T -invariante su función característica XA es T -invariante y esta en Lp(µ). Por hipótesis XA es constante casi donde quierai.e. µ(B) = 0 ó 1. Por lo tanto T es µ-ergódica.

ii)⇒v) Como demostramos antes_f ∈ L1(µ) y es T -invariante, entonces

tiene que ser una función constante. Por lo tanto

_f=

ZX

_f dµ =

ZX

fdµ.

v)⇒iv) Por el teorema de Birkhoff

n→∞lım1n

n−1Xj=0

XA ◦ T j(x) = XA =

ZX

XAdµ = µ(A)

26

casi donde quiera. Por el Teorema de la Convergencia Dominada

µ(A)µ(B) =

ZX

n→∞lım1n

n−1Xj=0

XA ◦ T j(x) ◦ XBdµ

= n→∞lım1n

ZX

n−1Xj=0

XA ◦ T j(x) ◦ XBdµ

= n→∞lım1n

n−1Xj=0

µ(T−j(A) ∩B).

iv)⇒i) SiA es T -invariante, aplicamos iv) a el conjuntoA yAc. Entonces:

µ(A)µ(Ac) = n→∞lım1n

n−1Xj=0

µ(T−j(A)∩ Ac).

así µ(A) = 0 ó 1.i)⇒iii) Es claro ya que Lp(µ) ⊂ L1(µ).Sea (X,A,µ) un espacio de probabilidad y T : X−→X una transforma-

ción que preserva medida, tal que existe un conjunto B, T -invariante, esdecir T−1(B) = B, de hecho, también es cierto que su complemento es T -invariante, entonces podemos estudiar la dinámica de la transformación porseparado T |B y T |Bc . Esto nos lleva a analizar aquellas transformaciones queno se pueden descomponer de esta forma, las transformaciones ergódicas.

Por esto, podemos interpretar las transformaciones ergódicas como aque-llas que, dado un conjunto A ∈ A no trivial (µ(A) > 0), su órbita

{T−n(A)}∞n=1 se esparce por todo el espacio X.

Teorema 2.6 Si T es ergódica respecto a µ y ν otra medida T -invariante,las siguientes propiedades son equivalentes

i) ν 6= µii) ν no es absolutamente continua con respecto a µiii)∃A ∈ A T -invariante tal que µ(A) = 0 y ν(A) > 0

Demostracióni)⇒ii) Si ν ¿ µ, entonces dν

dµ es una función T-invariante, puesto que ν

es T -invariante. Como T es ergódica entonces dνdµ es constante. Por lo tanto

ν = µ.

27

ii)⇒iii) Si ν no es absolutamente continua con respecto a µ, existeA0 ∈ Atal que µ(A0) = 0 y ν(A0) > 0. Entonces el conjunto A=

Sn∈N

T−n(A0) es

T -invariante y satisface iii)iii)⇒i) Si ∃ A ∈ A, tal que µ(A) = 0 y ν(A) 6= 0, es claro que ν 6= µ.Dado un subconjunto convexo C de un espacio vectorial topológico V

definimos el conjunto de puntos extremos de C como.Ext(C) = {u ∈ V : u = (1− α)x+ αy, α ∈ [0, 1], x 6= y ⇒ α = 0, 1}.Si C 6= ∅, entonces Ext(C) 6= ∅.

Lema 2.7 Los puntos extremos de MT (X) son las medidas T -ergódicas.

DemostraciónSea µ punto extremo de MT (X) y supongamos que ∃ A ∈ A tal que

T−1(A) = A y µ(A) 6= 0, 1. Definamos µA y µAc mediante

µA(B) =µ(B ∩ A)µ(A)

, µAc(B) =µ(B \A)1− µ(A)

,

entonces µA , µAc ∈ MT (X) y

µ = µ(A)µA + (1− µ(A))µAc

Contradiciendo el hecho de que µ es punto extremo de MT (X)Recíprocamente supongamos que µ es ergódica y µ = (1 − α)µ1 + αµ2

con 0 < α < 1, µ1, µ2 ∈ MT (X). Entonces µ(A) = 0 ⇒ µi(A) = 0, es decirµi ¿ µ y así ∃fi ∈ L1(µ) tal que fi ≥ 0 y µi(A) =

RA

fidµ como T preserva

µ y µi se tiene que fi◦ T = fi. Como µ es ergódica fi es constante y asíµ = µi.

Donde (µ+ ν)(A) = µ(A) + ν(A) para µ y ν probabilidades.

2.3. Ejemplos de transformaciones ergódicas

Lema 2.8 Sea (X,A,µ) un espacio de probabilidad, con X espacio métricocompacto y A la σ-álgebra de Borel, tal que µ(U) > 0 para todo abierto novacío U . Sea T : X−→X continua y ergódica. Entonces la órbita {Tm(x) :m ∈ N}es densa para casi todo x ∈ X.

Demostración Sea {Um}base numerable para la topología de X.{Tm(x) : m ∈ N}es densa⇐⇒ ∀ m ∃ nm con Tnm(x) ∈ Um ⇐⇒ x ∈T

m∈N

Sn≥0

T−n(Um).

28

Sea Bm =Sn≥0

T−n(Um) es abierto y T−n(Bm) ⊂ Bm.

Como T es ergódica, µ(Bm) = 0 ó 1. En efecto sea B∗m =Tn≥0

T−n(Bm),

entonces T−1(B∗m) = B∗m y µ(B∗m) = n→∞lımT−n(Bm) = µ(Bm).Como µ(Bm) ≥ µ(Um) > 0, µ(Bm) = 1 y así Bm es denso.Por inducción Ak =

Tm≥k

Bm es abierto no vacío y T−1(Ak) ⊂ Ak.

Así µ(Ak) = 1 y

µ

µ Tm∈N

Bm

¶= n→∞lımµ(Ak) = 1.

Proposición 2.9 Consideremos la rotación Ra : Tn −→ Tn definida por

Ra(x+ Zn) = x+ a+ Zn. Son equivalentes:a) Ra es ergódica.b) La órbita {Rm

a (Zn) : m ∈ N} es densa.c) ∀k ∈ Zn \ {0} hk, ai /∈ Z.

Demostración Utilizaremos series de Fourier: Para k ∈ Zn definimosϕk : T

n −→ S1 medianteϕk(x+ Zn) = exp(2πi hk, xi). Entonces ϕk◦ Ra = exp(2πi hk, ai)ϕka)⇒b) Es consecuencia del Lema anterior.b)⇒c) Si hk, ai ∈ Z, entonces ϕk◦ Rm

a (Zn) = exp(2mπi hk, ai) = 1∀m ∈ N. Como ϕk es continua y {Rm

a (Zn) : m ∈ N} es densa,ϕk ≡ 1 y así k = 0.

c)⇒a) Sea f ∈ L2(Tn) entonces f =Pk∈Zn

bkϕk

Si f◦ Ra = f entonces bk = exp(2πi hk, ai)bk ∀k ∈ ZnSi bk 6= 0 entonces hk, ai ∈ Z, luego k = 0 y así f es constante.

Una aplicación sencilla del teorema ergódico es la siguiente:Tomando f = XB para B ∈ A (Recordemos que si T es µ-ergódica

entonces n→∞lım 1n

n−1Pj=0

f◦ T j(x) =Rfdµ) tenemos que si T : X−→X es

ergódica entonces para casi todo x ∈ XτB(x) = n→∞lım 1

n#{0 ≤ j ≤ n− 1 : T j(x) ∈ B} = µ(B)

Ejemplo 2.10 Para casi todo x ∈ [0, 1] (con respecto a la medida de Lebesgue)el número promedio de ceros en la expansión decimal x = 0.x1x2..... es 1

10 .En efecto, consideremos T : S1 −→ S1, T (z) = z10. T es ergódica. SeaB = { e2πix : x ∈ [0, 110 )} xi = 0⇔ T j( e2πix) ∈ B y µ(B) = 1

10 .

29

2.4. Transformaciones Mezcladoras.

Definición 2.11 Un automorfismo T : X−→X es mezclador si para todosA,B ∈ A se tiene que:

n→∞lımµ(T−n(A) ∩B) = µ(A)µ(B).

Lema 2.12 Las transformaciones mezcladoras son ergódicas.

DemostraciónSea A cualquier conjunto medible T -invariante, entonces T−n(A) = A.Puesto que si T−n(A) = A, para toda n ∈ N se cumple que:

µ(A)µ(Ac) = n→∞lımµ(T−n(A) ∩ Ac) = µ(A ∩Ac) = 0.

Por lo tanto µ(A) = 0 ó µ(Ac) = 0.Recordemos que en L2(µ) está definido un producto interior de la sigu-

iente manera:

hf, gi =ZX

f · gdµ

y por lo tanto para cada transformación T : X−→X, está asociado a Tel operador UT : L2(µ) −→ L2(µ), definido por UT (f ) = f◦ T . Puesto queT preserva medida resulta que UT es una isometría de L2(µ)

kUT (f )k22 =ZX

|f ◦ T |2 dµ =ZX

|f |2 ◦ Tdµ =ZX

|f |2 dµ = kfk22 .

A este operador se le llama el operador espectral asociado a T .

Definición 2.13 Sean (Xi,Ai, µ), i = 1, 2, espacios de medida y Ti : Xi −→Xi transformaciones que preservan medida con operadores lineales asocia-dos UTi. Decimos que T1 y T2 son espectralmente equivalentes si existe unaisometría invertible L : (X1,A1, µ)−→(X2,A2, µ) tal que LUT2 = UT1L.

Si T1 y T2 son equivalentes, son espectralmente equivalentes ya que elmapeo F : X1 −→X2 dado por la definición de equivalencia permite definiruna isometría UF : L

2(X2,A2, µ) −→ L2(X1,A1, µ) la cual satisface la condi-ción UFUT2 = UT1UF .

30

Teorema 2.14 Un automorfismo T es mezclador si y sólo si

n→∞lım hUnT f, gi = hf, 1i hg, 1i (11)

para toda f, g ∈ L2(µ) (11)

Demostración ⇐) Si T satisface (11), entonces tomamos XA y XB lasfunciones características de A y B ∈ A y obtenemos:

n→∞lımµ(T−n(A) ∩ (B)) = n→∞lım hUnT (XA),XBi

= hXA, 1i hXB , 1i = µ(A)µ(B).

⇒) De la misma manera, si T es mezcladora, obtenemos que:n→∞lım hUn

T f, gi = hf, 1i hg, 1i (12)

para f, g funciones características.Puesto que UT es un operador lineal, (12) se cumple para funciones

simples (combinaciones lineales de funciones características). Y el conjuntode estas funciones es denso en L2(µ). Así que, dados ε > 0 y f y g ∈ L2(µ),existen f0 y g0 funciones simples tales que:

a) kf − f0k2 < εb) kg − g0k2 < εc) n→∞lım hUn

T f0, g0i = hf0, 1i hg0, 1iEntonces:

hUnT f, gi = hUn

T f0, g0i+ hUnT f, g − g0i+ hUn

T (f − f0), g0iDe manera que:

|hUnT f, gi− hf, 1i hg, 1i| ≤ |hUn

T f0, g0i+ hUnT f, g − g0i+ hUn

T (f − f0), g0i||hUn

T f, gi− hf, 1i hg, 1i| ≤ |hUnT f0, g0i+ hUn

T f, g − g0i+ hUnT (f − f0), g0i|

≤ |hUnT f0, g0i− hf0, 1i hg0, 1i|+ kfk2 kg − g0k2

+ kg0k2 kf − f0k2 + |hf0, 1i hg0 − g, 1i|+ |hf0 − f, 1i hg0, 1i| (13)

≤ |hUnT f0, g0i− hf0, 1i hg0, 1i|

+ε (kfk2 + kg + εk2 + kf + εk2 + kgk2)ya que:

hUnT f, g − g0i ≤ kfk2 kg − g0k2

hUnT (f − f0), g0i ≤ kg0k2 kf − f0k2

hf0, 1i hg0 − g, 1i+ hf0 − f, 1i hg0, 1i = hf0, 1i hg0, 1i− hf, 1i hg, 1i

31

y si n es suficientemente grande, el primer sumando de (13) es menorque ε.

Por lo tanto|hUn

T f, gi− hf, 1i hg, 1i| < kε

donde k solo depende de kfk2 y kgk2 .De hecho, la igualdad (11) se cumple para: f una función característica

y g ∈ L1(µ), dado que está bien definida y L2(µ) es denso en L1(µ).

Teorema 2.15 Sea (X,A, µ) un espacio de probabilidad y T : X−→X unautomorfismo mezclante respecto a µ. Si existe ν otra medida de probabili-dad, absolutamente continua respecto a µ, entonces:

n→∞lımν(T−n(A)) = µ(A), para todo A ∈ A.

Demostración Sea A ∈ A y f = dνdµ , donde f ∈ L1(µ), entonces

ν(T−n(A)) =

ZT−n(A)

fdµ =

ZA

(f ◦ Tn)dµ =

ZX

XA(f ◦ Tn)dµ

= hXA, UnT f i −→ hXA, 1i hf, 1i = µ(A).

Este es un resultado muy importante, ya que muestra como las medidasmezcladoras son límite de las medidas que son absolutamente continuas.

Definición 2.16 Si X es un espacio topológico, una transformación T :X−→X es topológicamente mezcladora si para cualquier par de conjuntosabiertos, U, V ⊂ X existe N ∈ N tal que T−n(U) ∩ V 6= ∅ para cualquiern ≥ N.

Proposición 2.17 Sean X espacio topológico y µ una medida de probabil-idad sobre los borelianos de X tal que µ(U) > 0 para todo U abierto novacío. Supongamos que T : X−→X preserva µ y es mezcladora. Entonces Tes topológicamente mezcladora.

Demostración Sean U,V abiertos no vacíos, entonces

n→∞lımµ(T−n(U) ∩ V ) = µ(U)µ(V ) > 0

Así que existe N tal que µ(T−n(U) ∩ V ) > 0 para n > N . Por lo tantoT−n(U)∩ V 6= ∅ para n > N .

32

2.5. Entropía.

En esta sección se presentan solo los enunciados de los resultados quepermiten definir entropía.

Definición 2.18 Sea (X,A, µ) un espacio de probabilidad.a) Una partición de (X,A, µ) es una familia P ⊂ A de conjuntos de

medida positiva tales que X =SP (mod 0) y µ(A ∩ B) = 0 si A,B ∈ P ,

A 6= B. En tal caso P es una familia numerable. Los elementos de P sellaman átomos.

b) Si P y Q son particiones decimos que Q es un refinamiento de P loque denotamos P ≤ Q si todo átomo de Q esta contenido en un átomo deP (mod 0). Esto implica que todo átomo de P es la unión de átomos de Q(mod 0).

Definición 2.19 Sean P y Q particiones finitas del espacio de probabilidad(X,A, µ). Sea φ(x) = x log x si 0 < x ≤ 1, φ(0) = 0.

a) Definimos la entropía de P como:

H(P ) = Hµ(P ) = −XA∈P

φ(µ(A)).

b) Definimos la entropía condicional de P dado Q como:

H(P |Q) =X

A∈P,B∈Qµ(B)φ

µµ(A ∩B)µ(B)

¶.

c) φ es convexa y φ(x) < 0 si 0 < x < 1.b) Si I es la partición trivial {X} entonces H(P |I) = H(P )

Proposición 2.20 Sean P,Q,M particiones de (X,A, µ). Denotamos porP ∨Q la partición cuyos átomos son los conjuntos A∩B con medida positivay A ∈ P , B ∈ Q. Entonces:

a) H(P ∨Q|M) = H(P |M) +H(Q|M ∨ P )b) Si P ≤ Q, H(M |P ) ≥ H(M |Q) y H(P |M) ≤ H(Q|M)c) H(Q) ≤ H(P ) +H(Q|P )d) H(P ∨Q|M) ≤ H(P |M) +H(Q|M)e) Si T : X−→X preserva µ entonces H(T−1P |T−1Q) = H(P |Q)f) H(P |Q) = 0⇔ P ≤ Q

33

Definición 2.21 Supongamos que T : X−→X preserva medida y sea P unapartición, definimos la entropía h(T ,P ) de T respecto a P como:

h(T,P ) = n→∞lım1nH(P ∨ T−1P ∨ ... ∨ T−(n−1)P )

Proposición 2.22 Se tiene que:

Definición 2.23 a) h(T ,P )− h(T ,Q) ≤ H(P |Q)b) Si P ≤ Q entonces h(T ,P ) ≤ h(T ,Q)c) h(T, T−1P ) = h(T ,P )d) ∀n ≥ 0, h(T,P ∨ T−1P ∨ ... ∨ T−nP ) = h(T ,P )e) h(T ,P ) = n→∞lımH(P |T−1P ∨ ... ∨ T−nP ).f) La sucesión { 1nH(P∨ T−1P ∨ ... ∨ T−(n−1)P )} es decreciente

Definición 2.24 La entropía de una transformaciónT : (X,A, µ)−→(X,A, µ) que preserva medida se define como: h(T ) =

hµ(T ) = sup{h(T ,P ) : P es partición finita}

Observación 2.25 h(T ) = sup{h(T ,P ) : H(P ) <∞}

Definición 2.26 Si An es una familia de subconjuntos de X ∀n ∈ N,∞Wn=1

An

es la σ-álgebra generada porS∞n=1An

Teorema 2.27 Sean P1 ≤ P2 ≤ ... y sea P una partición con H(P ) <∞.Entonces P ⊂ W∞i=1 Pi (mod 0) si y sólo si n→∞lımH(P |Pn) = 0.

Corolario 2.28 Si P1 ≤ P2 ≤ ... es una sucesión de particiones con en-tropía finita tal que A = W∞n=1 Pn, entonces

h(T) = nsuph(T ,Pn)

Definición 2.29 Sea (X,A, µ) un espacio de probabilidad supongamos queT : X−→X es invertible y preserva µ. Una partición P con H(P ) < ∞ sellama T -generador si

W∞n=1 T

nP = A

Corolario 2.30 (Kolmogorov-Sinai) Si P es T -generador entonces:h(T,P ) = h(T )

Corolario 2.31 Si P es una partición tal que H(P ) <∞ yW∞n=1 T

nP = A,entonces h(T,P ) = h(T ).

34

2.6. Exponentes de Liapunov. Teoría de Pesin.

2.6.1. Exponentes de Liapunov.

Sea p un punto fijo del difeomorfismo f : A −→ A, de un conjuntoabierto A ⊂ Rd. Queremos estudiar el comportamiento de fn (n ∈ Z) enuna vecindad de p. Como una primera aproximación a f consideremos suparte lineal (es decir, la derivada) (f)0p : Rd −→ Rd.

Sean α1, α2, ..., αr, αr+1, αr+1, ..., αs, αs todas las raíces distintas del poli-nomio característico de (f)0p. En esta secuencia suponemos que α1, ..., αr sonnúmeros reales y las raíces conjugadas complejas (como αs, αs) aparecen conel mismo subíndice. Sean también emj, 1 ≤ j ≤ s sus respectivas multiplici-dades. El teorema de Jordan (en su forma canónica real) establece que estasraíces (eigenvalores de (f)0p) están asociadas a eigenespacios generalizados(f)0p-invariantes eEj, 1 ≤ j ≤ s, cuyas dimensiones son emj respectivamente

para 1 ≤ j ≤ r y 2emj para r < j ≤ s (en este último caso el espacio eEjesta

asociado al par αj, αj). Además Rd =rL

i=1

eEj. Note que como f es un difeo-

morfismo, entonces det (f )0p 6= 0, de aquí tenemos que αj 6= 0 para todaj.

Si vi es un eigenvector de eEi entonces (fn)0p vi = αni vi, y de esto tenemos

log°°°(fn)0p vi°°° = n log |αi|+ log kvik

para todo n ∈ Z. Esto no es cierto para cualquier vector vi ∈ eEi, pero escierto que

n→ ±∞lım1nlog°°°(fn)0p vi°°° = log |αi| (1)

para cualquier 0 6= vi ∈ eEi. Esto muestra que cuando |αi| > 1, el vector(fn)0p vi crece con rapidez exponencial cuando n → ∞ y decrece exponen-cialmente cuando n→−∞. Si |αi| < 1, entonces se cumple lo contrario. Si|αi| = 1, entonces no hay crecimiento o contracción exponencial, pero puedehaber crecimiento o contracción de una forma moderada del vector (fn)0p vi.

La ecuación (1) sugiere que no estudiemos los eigenvalores αi, pero sí ellogaritmo de sus módulos, λi = log |αi| los cuales son llamados exponentesde Liapunov del mapeo f en el punto fijo p. Notamos que algunos eigen-valores distintos αi 6= αj corresponden al mismo exponente de Liapunov si|αi| = |αj| . En este caso cada vector no cero de la suma directa del espa-cio correspondiente eEi ⊕ eEj satisface (1). Así, tenemos una descomposición

35

de Rd como una suma directa de subespacios eE1 ⊕ · · · ⊕ eEm(p) tal que si

0 6= vi ∈ eEi, entonces

n→ ±∞lım1nlog°°°(fn)0p vi°°° = λi(p) (2)

donde λi(p) es el exponente de Liapunov asociado a p.Además, si no hay exponentes de Liapunov nulos en el punto fijo p (dire-

mos que tal punto es hiperbólico), podemos sumar todos los subespacios conexponentes de Liapunov negativos y todos los subespacios con exponentesde Liapunov positivos para obtener, respectivamente, subespacios Eu y Es,tal que:

1)Rd = Eu ⊕Es,2) f 0p(Es) = Es y f 0p(Eu) = Eu

3)Existe λ > 0 y n0 ≥ 1 tal que para todo |n| ≥ n0

1

nlog°°°(fn)0p v°°° ≤ −λ v ∈ Es, kvk = 1

y1

nlog°°°(fn)0p v°°° ≥ λ v ∈ Eu, kvk = 1

Esto significa que los vectores de Es son contraídos por iteraciones haciaadelante de f 0p y se expanden por interaciones hacia atrás de f 0p. Y vicev-

ersa para los vectores de Eu. Notamos que puede pasar que Eu = {−→0 } oEs = {−→0 }. Estaremos primeramente interesados en el estudio de puntoshiperbólicos.

El teorema de Grobman-Hartman [28] asegura que en un punto fijo hiper-bólico el comportamiento de f es similar a su parte lineal. Precisamente, parasubespacios

¡f 0p¢-invariantes Eu , Es les corresponden subvariedadesW s(p),

Wu(p) ⊂ A f-invariantes (inmersas diferenciables en A) tales que:1)TpW s(p) = Es y TpWu(p) = Eu,2) Hay una vecindad U(p) ⊂ A tal que

f(W s(p)\

U(p)) ⊂W s(p)yf(Wu(p)\

U(p)) ⊂Wu(p)

y3) Tenemos:

n→∞lımfn(y) = p y ∈W s(p)

yn→∞lımf−n(y) = p y ∈Wu(p)

36

Es necesario para nuestro estudio subsecuente especificar la velocidadde convergencia en 3). Denotemos por dist(·, ·) la distancia en la variedadRiemanniana M. Sea λ > 0 tal que no hay exponentes de Liapunov en elintervalo (−λ, λ) . Así podemos especificar 3) como:

3’) Tenemos

dist(fn(y), p) ≤ C exp−λn y ∈W s(p)

ydist(f−n(y), p) ≤ C exp−λn y ∈Wu(p)

para todo n ≥ 0 y alguna constante C > 0.Si p no es un punto fijo, pero sí periódico, con periodo k, todos estos

resultados se aplican al mapeo fk : A→ A.Si p no es un punto periódico, podemos definir exponentes de Liapunov

de manera similar.

Definición 2.32 Sea el mapeo fn diferenciable en un punto p ∈ M paratodo n ∈ Z. Supongamos que el espacio tangente TpM es una suma directade subespacios E1 ⊕ · · ·⊕Em(p) tal que si 0 6= vi ∈ Ei, entonces

n→ ±∞lım1nlog°°°(fn)0p vi°°° = λi(p)

Entonces los valores λi(p) son llamados exponentes de Liapunov en el puntop, cuyas multiplicidades son dimEi.

Para un punto hiperbólico p ∈M , tenemos TpM = Esp ⊕ Eu

p , donde

Esp = ⊕λi(p)<0Ei y Eu

p = ⊕λi(p)>0Ei (4)

Definición 2.33 SeaM una unión finita de variedades Riemannianas com-pactasM1,M2, ...,Ms, todas de la misma dimensión d ≥ 2, pegadas a lo largode un número finito de C1 subvariedades de codimensiones positivas. Estassubvariedades están contenidas en G, la unión de un número finito de C1

subvariedades compactas de codimensiones positivas en M1,M2, ...,Ms. En-tonces V = M\G es un subconjunto abierto denso de M. Por último, seaN ⊂ V un conjunto abierto y f : N → V un Cr difeomorfismo (r ≥ 1)entre N y su imagén, es decir, un difeomorfismo inmerso de N sobre V .Llamamos a f un mapeo suave con singularidades.

37

Note que el mapeo inverso f−1 está bien definido en el conjunto abiertof(N). De aquí, f−1 es también un mapeo suave con singularidades. Denote-

mos por H =∞T

n=−∞fnN el conjunto de puntos donde todas las iteraciones

de f están definidas.

Teorema 2.34 (Oseledec)Supongamos que el mapeo f : N → V preservala medida de probabilidad Borel µ en M y µ(H) = 1. SiZ

µlog+

°°(f )0p°° dµ(p) <∞y Z

µlog+

°°(f−1)0p°°dµ(p) <∞donde log+ s = max{log s, 0}, entonces existe un conjunto E ⊂ H

f-invariante, µ(E) = 1, tal que para cualquier punto p ∈ E todos losexponentes de Liapunov existen.

2.6.2. Teoría de Pesin.

El teorema de Oseledec implica que µ-c.t.p. x ∈ H tiene todos sus expo-nentes de Liapunov λ1(x) < · · · < λm(x)(x). El conjunto de todos los puntoshiperbólicos en N son a menudo llamados región de Pesin de f :

Σ(f) = {x ∈ H : λi(x) 6= 0, para cualquier i = 1, ...,m(x)} .

Notamos que la región de Pesin Σ(f) es invariante bajo f . En cualquierpunto x ∈ H tenemos los subespacios usuales Es

x y Eux definidos por (4), y

sea

λ+(x) = mın{λi(x) > 0} y λ−(x) = max{λi(x) < 0}

el más pequeño (en valor absoluto) exponente positivo y negativo, respecti-vamente.

Agregando algunas condiciones técnicas que no explicaremos en este tra-bajo se puede probar:

Teorema 2.35 Para µ-c.t.p. x ∈ Σ(f) existe una δ(x) ∈ (0, r(x,N)) talque para cualquier ε > 0 pequeña y una vecindad V el conjunto

W s(x) =©y ∈ Vδ(x)(0) : n→∞lımsup log dist(fn(x), fn(y)) ≤ λ−(x) + ε

ª38

es una variedad Cr diferenciable (estable). Similarmente.

Wu(x) =©y ∈ Vδ(x)(0) : n→ −∞lımsup log dist(fn(x), fn(y)) ≥ λ+(x)− ε

ªes una variedad Cr diferenciable (inestable). También tenemos

TxWs(x) = Es

x y TxWu(x) = Eu

x

Notamos que estas variedades son transversales en x, es decir, ellas seintersectan en el punto x y el ángulo entre ambas es positivo.

Las variedades estable e inestable,W s(y) yWu(y), son transversales unaa la otra en cualquier y ∈ Σ(f), (y, de hecho, su límite esta lejos de cero enuna vecindad de x). Note también que dimW s(y) + dimWu(y) = dimMpor hiperbolicidad.

Teorema 2.36 (Pesin) Sea µ(Σ(f )) > 0. Entonces existen conjuntos Σi ⊂Σ(f), i = 0, 1, 2, ..., J (J ≤ +∞) tal que

i) ΣiTΣj = ∅ para i 6= j y

SΣi = Σ(f);

ii) µ(Σ0) = 0 y µ(Σi) > 0 para i > 0;iii) f (Σi) = Σi para i ≥ 0;iv) f |Σies ergódica con respecto a µΣi para i > 0.Además, para cualquier i > 0 tenemos Σi = Σi,1

S · · ·SΣi,J(i) con algún1 ≤ J(i) <∞ tal que

v) Σi,jTΣi,k = ∅ para j 6= k;

vi) f (Σi,j) = Σi,j+1 para 1 ≤ i < J(i) y f(Σi,J(i)) = Σi,1;vii) el mapeo fJ(i) restringido a Σi,j es mezclador para cualquier 1 ≤

j < J(i).

Definición 2.37 Si µ(Σ(f)) = 1, esto es, si la región de Pesin tiene medidatotal en N , diremos que el mapeo f es hiperbólico no uniforme, o que tienecomportamiento caótico.

Agregando algunas condiciones técnicas que no explicaremos en este tra-bajo se puede probar:

Teorema 2.38 (Fórmula de Pesin) Supongamos que la medida µ es abso-lutamente continua con respecto a la medida de Lebesgue en N, y supong-amos que existe C3 > 0 y c > 0 tal que para cualquier x ∈ N tenemoskf 0xk < C3d(x, s)−c. Entonces la entropía de f con respecto a la medida µ es

hµ(f) =

ZH

Xλi(x)>0

λi(x) dimEi(x)dµ

es decir, la entropía es igual a la suma promedio de todos los exponentes deLiapunov positivos, contando sus multiplicidades.

39

2.6.3. Caos y Orden.

Finalmente discutiremos las relaciones entre las tres propiedades masimportantes en la teoría de sistemas dinámicos suaves.

1. Hiperbolicidad (todos los exponentes de Liapunov son no nulos, cuan-do µ(Σ(f)) = 1).

2. Entropía positiva: hµ(f) > 0;3. Ergodicidad ( y su versión fuerte mezclador).Cada una de estas propiedades de alguna forma representa caos en sis-

temas dinámicos. Sin embargo no hay una definición común adoptada parael término caos, cada una de las propiedades arriba mencionadas se puedever como una posible definición formal de caos.

Aunque estas propiedades no son equivalentes, y de hecho, ninguna deellas implica lógicamente a ninguna de las otras dos (bajo algunas condi-ciones, la hiperbolicidad implica entropía positiva, como en el teorema dePesin). Pero es mas importante para nuestros propósitos que estas trespropiedades caractericen aspectos diferentes de comportamiento caótico desistemas dinámicos. La entropía positiva es la característica mas local detodas -un pequeño subconjunto E ⊂ M f-invariante de medida pequeña,µ(E) > 0, puede ser usado para hacer hµ(f) > 0, mientras en el restodel espacio M\E el mapeo f puede no ser caótico en algún sentido. Lahiperbolicidad es también una condición local (esto caracteriza la separaciónde trayectorias próximas), pero por lo menos debe mantenerse casi dondequiera, ya que se requiere µ(Σ(f)) = 1. Sin embargo no hay garantía de queun mapeo hiperbólico f sea ergódico o mezclador, la región de Pesin Σ(f)puede ser descompuesta hasta en un número numerable de subregiones queno se intersectan.

La ergodicidad es la propiedad mas global de las tres. Aún así, sóloergodicidad no implica hiperbolicidad, o caos para esta materia.

Una observación final. El fracaso de la ergodicidad en sistemas con en-tropía positiva y región de Pesin grande es un fenómeno bastante común ensistemas Hamiltonianos. Esto fue extensamente estudiado por Kolmogorov,Arnold yMoser, cuya teoría es ahora llamada teoría KAM. Ellos descubrieronque para mapeos Hamiltonianos típicos f : M → M, hay algunas regionesD ⊂M f-invariantes de medida positiva donde la dinámica es muy estable.Esto significa que todos los exponentes de Liapunov en D son cero y cadaregión D contiene un subconjunto de medida positiva, el cual es la unión decurvas f-invariantes, una característica que hace a la dinámica dentro de Dcasi integrable. Tal región estable ocurre alrededor de un punto periódicop ∈ M, fn(p) = p, cuando el espectro de la derivada (fn)0p : TpM → TpM

40

está situado en el círculo unitario (hay algunas otras condiciones técnicasque omitiremos). Tales puntos periódicos son llamados elípticos (opuestosa hiperbólicos), y las regiones estables alrededor de estos puntos son lla-madas islas elípticas o islas estables. En un sistema Hamiltoniano típico, lasislas estables coexisten con grandes regiones de Pesin Σ(f) de medida posi-tiva. La región de Pesin es algunas veces llamada mar caótico. En este mar,uno puede encontrar pequeñas islas estables separadas de Σ(f) por algunascurvas f-invariantes. Tal ilustración es típica como muestran varios experi-mentos númericos. El fenómeno de coexistencia de comportamiento establey caótico en sistemas dinámicos no está muy bien entendido todavía, y éstees uno de los mas intrigantes asuntos en la física-matemática moderna.

En este sentido (existencia de regiones estables), presentaremos una ver-sión del teorema de KAM en dimensión 2. Empezamos definiendo la rotaciónde una función en R2: en coordenadas polares tienen la siguiente forma(r, θ)→ (r, θ+α0+α1r), α0, α1 6= 0 constantes reales. Así como la rotaciónde la función mantiene invariantes las circunferencias r = constante, y pro-duce rotación de ángulos que dependen de r.

Ahora sea r ≥ 4, x0 un punto fijo elíptico (los eigenvalores de f 0x0 soncomplejos conjugados, λ1, λ2 que satisfacen λ1 λ2 = 1), no degenerado(argλ1 = α0,−+0,−+π/2, π,−+3π/2), y f localmente conjugada a unmapeo de la rotación. La última condición significa que existe una vecin-dad U de x0, y un difeomorfismo C4, h : U → R2, h(x0) = 0 tal que¡h ◦ f ◦ h−1¢ (r, θ) = (r, θ+ α0 +α1r) + F, donde (r, θ) son las coordenadaspolares de h(U ∩ f−1(U)) y las derivadas de F hasta el tercer orden, en 0,son nulas. La expresión del segundo miembro es conocida como la formanormal de Birkhoff.

En estas condiciones el teorema de KAM establece que dado ε > 0, existeuna vecindad V de x0 y un conjunto V0 ⊂ V tal que µ(V \ V0) ≤ εµ(V ).V0 es la unión de curvas invariantes simples de clase Cr−1, x0 ∈ intV0 yla restricción de f para estas curvas es topológicamente equivalente a unarotación irracional.

En resumen, el teorema de KAM establece que si f es C4 y x0 es unpunto fijo elíptico no degenerado (recuerda que f es µ− invariante), entoncesexiste una familia de curvas invariantes, que cubre a un conjunto de medidapositiva. En esta región hay exponentes de Liapunov que se anulan: f no esergódica ya que V0 contiene conjuntos invariantes de medida positiva y nototales.

41

Capítulo 3

Billares.

3.1. Billares Planos.

Un billar plano es un sistema dinámico descrito por el movimiento librede una masa puntual en el interior de una región acotada Q (que llamaremos”mesa del billar”)contenida en el plano, la cual choca elásticamente con elborde. Éste consiste de un conjunto finito de arcos cerrados ∂Qi que sonde clase C3 sin curvatura nula, o segmentos de recta. En ambos casos elvalor absoluto de la curvatura |K| es acotada: Las componentes regularesdel borde

◦∂Qi= ∂Qi ∪j 6=i ∂Qj pueden tener curvatura positiva (compo-

nente focalizador), negativa (dispersor) o cero (neutral). La dirección de la

parametrización de◦

∂Qi y el signo de K son determinados por el vector nor-

mal: si n(q) es el vector normal unitario interior a◦

∂Qi en q, entoces q(s) es

la parametrización de◦

∂Qi mediante la longitud de arco tal que q00(s) = K,n(q) = Kiq0(s) donde i es el operador π/2−rotación, q(s) = q.

La referencia estándar acerca de la formalización de la teoría de billareses [9] cap. 6.

La forma más simple de parametrizar el espacio de fase es medir lalongitud de arco de ∂Q y considerar el ángulo θ que forma el vector desalida con la normal n(q) a ∂Q en q, que será el mismo que el de entrada. SiL es la longitud total de ∂Q resulta que el espacio de fase es el rectángulo[0, L]× [−π/2, π/2] al que hay que sacarle las verticales que corresponden alos vértices

◦∂Qi

T ◦∂Qj .

En esta sección probaremos algunas propiedades de la transformación debillar (diferenciabilidad, medida invariante, Teorema de Oseledec).

42

Definimos el conjunto

M1 =

½(q, v) : q ∈

◦∂Qi, kvk = 1, hv, n(q)i > 0

¾de parejas formadas por un punto en una componente regular y un vectorunitario interior. Dado x1 = (q1, v1) ∈M1, Tx1 (si está definido) se obtienecon un movimiento hacia adelante en la tabla de billar, en la dirección v1,

una distancia (tiempo) t1 hasta la intersección con◦

∂Qj en q2. FormalmenteTx1 = (q2,v2) donde v2 = v1−2 < n(q2), v1 > n(q2). Ver fig.1. Sean s1, s2 las

longitudes de arco de◦

∂Qi,◦∂Qjen una vecindad de q1, q2, respectivamente:

q2(s2) = q1(s1)+t1(s1)v1(s1) : Kj(sj) la curvatura en qj(sj); θj(sj) el ángulode vj(sj) con n(qj(sj)), j = 1, 2.

Si la variable (·) no está indicada, significa que estamos en un puntobase, por ejemplo K2 = K2(s2(0)).

Teorema 3.1 Si x1 = (q1, v1) ∈ M1, Tx1 = x2 = (q2,v2) ∈ M1 y q1, q2están en una componente regular de clase Cr+1 del borde (r ≥ 1), entoncesT es un difeomorfismo local de clase Cr en alguna vecindad de x1.

DemostraciónSea (F1(s1),G1(s1)) , (F2(s2),G2(s2)) la representación paramétrica de◦

∂Qi,◦

∂Qj, respectivamente, en una vecindad de q1 = q1(s1) y q2 = q2(s2) enun sistema cartesiano ortogonal xOy.

Sean α, γ1, γ2 como en la fig.1.

Figura. 1.

43

Los ángulos son medidos empezando en el eje positivo x. Esto resulta

θ1 = α− γ1 − π/2,

θ2 = γ2 − α− π/2

Si es necesario podemos rotar Q en el plano; entonces podemos suponerque F 01(s1), F

02(s2) 6= 0 en una vecindad suficientemente pequeña de q1, q2,

y

tgγi =G0i(si)F 0i (si)

i = 1, 2,

tgα =G2(s2)−G1(s1)

F2(s2)− F1(s1)

(omitimos variables si), y así

θ1 = ArctgG2 −G1F2 − F1

−ArctgG01F 01− π

2= L(s1, s2)

θ2 = ArctgG02F 02−Arctg

G2 −G1F2 − F1

− π

2=M(s1, s2)

Estas dos funciones definen la transformación de billar T de clase Cr, dex1 = (s1, θ1) a x2 = (s2, θ2), con H(x1, T (x1)) = 0 si (teorema de la funciónimplícita)

det

µ∂H

∂x2

¶6= 0

donde

H =

µL(s1, s2)− θ1 = 0M (s1, s2)− θ2 = 0

¶y

∂H

∂x2=

µLs2 0Ms2 −1

¶−Ls2 = −

µG02(F2 − F1)− F 02(G2 −G1)

(F2 − F1)2 + (G2 −G1)2

¶=cos θ2t1

Ya que q2 6= q1, el denominador es diferente de cero y cos θ2 será diferentede cero si el vector tangente (F 02,G02) en q2 y el vector de la trayectoria

44

v1 = (F2−F1, G2−G1) 1t1 son linealmente independientes; esto sucede ya queestamos suponiendo x2 ∈M1 y entonces las trayectorias no son tangentes alas curvas del borde.

Un argumento similar prueba que T−1, definida en una vecindad de x2es tambien una función Cr.

Derivando H tenemos

∂H

∂x1+

∂H

∂x2T 0(x1) = 0

de aquí

T 0(x1) =

µ∂H

∂x2

¶−1µ−∂H

∂x1

¶=

Ã1

Ls20

Ms2Ls2

−1

!µ −Ls1 1−Ms1 0

=

−Ls1Ls2

1Ls2

−Ms2Ls1Ls2

+Ms1Ms2Ls2

y

¡T 0(x1)

¢−1=

µ−∂H∂x1

¶−1 µ∂H

∂x2

¶=

Ã0 − 1

Ms1

1 − Ls1Ms1

!µLs2 0Ms2 −1

=

−Ms2Ms1

1Ms1

−Ms2Ls1Ms1

+Ls2Ls1Ms1

por lo tanto tenemos el siguiente teorema.

Teorema 3.2 Si en alguna vecindad de q1, q2 ∈ M1, las curvas del bordeson C2, entonces para todo (s1, θ1) en una vecindad del valor correspondientede x1, es válido

T 0(s1, θ1) =

−Ls1Ls2

1Ls2

−Ms2Ls1Ls2

+Ms1Ms2Ls2

.

Teorema 3.3 Si en la hipótesis del teorema anterior consideramos unavecindad suficientemente pequeña U de x1, entonces T restringida a U preser-va la medida definida por dµ = cos θdsdθ.

Demostración Tenemos que

detT 0 = −Ls1Ms2

L2s2+

Ms2Ls1

L2s2− Ms1

Ls2

= −Ms1

Ls2

=cos θ1cos θ2

45

De aquí, cambiando las variables de integración , tenemos

µ(T (S)) =

ZT (S)

cos θ2ds2dθ2 =

ZS

cos θ2cos θ1cos θ2

ds1dθ1

=

ZS

cos θ1ds1dθ1 = µ(S)

Para todo conjunto de Borel S ⊂ U.

Observación 3.4 a) Damos el mismo nombre a la medida normalizada (sidµ = cos θdsdθ entonces µ =

R π/2−π/2 cos θdsdθ = 2ds, µ(M1) =

R L0 2ds = 2L

por lo tanto la medida de toda la frontera es 2L donde L es la longitud dearco y con esto encontramos la medida normalizada), y de aquí ésta seráusada: µ(M1) = 1. Esta medida es absolutamente continua con respecto a lamedida de Lebesgue en M1.

b) En vez del difeomorfismo T podemos considerar el flujo T t, que actúaen el conjunto M0 de las parejas (q, v), q ∈ Q, kvk = 1. Se define como T t

(q, v) = (q + tv, v) si q + sv /∈◦

∂Qi para 0 < s ≤ t y T t (q, v) = (qt, vt)

si hay único s tal que q + sv ∈◦

∂Qi, con vt = v − 2 hn, vin, n = n(q + sv)y qt = q + sv + (t − s)vt. Entonces si (q, v) ∈ M0, sea γ > 0 tal quex = T−γ(q, v) ∈ M1; podemos introducir coordenadas en M0 tomando elnúmero γ y las coordenadas de x enM1. Entonces dν = dµdγ es una medidainvariante para T t :

ν(T t(A)) = ν(A)

para cualquier conjunto de Borel A de M0. Ver [9].c) H+ es el conjunto de puntos de M1 tal que T k está definida y es

continua para todo k ∈ N. Este no incluye los puntos que en un futuro van aun vértice o cuyas trayectorias son tangentes (dispersoras) a una curva del

46

borde (ver fig.2). Definimos H−, tomando k negativa en T k.

Figura 2.

d) F− es el conjunto de puntos cuyas trayectorias tienen infinitos rebotesen tiempo finito.

Sea Nij el conjunto de elementos (q, v) deM1 tal que q+ tv ∈◦

∂Qi ∩◦

∂Qj

para algún t ∈ R, y C el conjunto de elementos x1 = (q1, v1) ∈ M1 tal queTx1 = (q2, v2) verifica hv2, n(q2)i = 0 (observe que en este caso v1 = v2).Resulta que ∪i 6=jNij ∪ C = D es la unión de un conjunto numerable decurvas en M1. Así su medida de Lebesgue es cero, y µ(D) = 0.

Teorema 3.5 Sea V = ∪k≥0T−k(D) y F+ = {x ∈ H+ =M1ÂV :P

ti(x) <∞} donde ti(x) = d(T i+1x, T ix). Entonces µ(V ) = µ(F+) = 0. (d es la dis-tancia euclideana en R2).

DemostraciónV tiene medida nula por que es la unión numerable de conjuntos de

medida cero.Si t(x) = d(x, Tx) resulta que t(x) > 0 µ-casi todo x ∈ M1. Sea Am =

{x ∈ H+ : t(x) > 1/m}, m = 1, 2, .... El conjunto de puntos x ∈ Am queregresan a Am infinitas veces (teorema de recurrencia de Poincaré) tienemedida total. Ellos satisfacen

Pt(T ix) = +∞, pero ∪∞m=1Am = H+Â F+,

entonces en un conjunto de medida nula se verifica queP

t(T ix) <∞.

Corolario 3.6 En H = (H+∩H−)Â (F+∪F−), que tiene medida total, Tes biyectiva, medible y preserva µ. Además, T es un difeomorfismo de clase

Cr (si los arcos◦

∂Qi son de clase Cr+1) en un conjunto abierto de M1 quecontiene H. De aquí en adelante consideraremos T : H → H.

47

Teorema 3.7 Si la longitud total del borde de un billar es finita, sus arcos◦

∂Qi son C3 y el valor absoluto de la curvatura es uniformemente acotado,entonces el teorema de Oseledec puede ser aplicado a la transformación debillar.

Demostración De la observación pasada y del hecho que

°°T 0(x1)°° ≤°°°°°µ∂H

∂x2

¶−1°°°°°°°°°µ−∂H

∂x1

¶°°°°=

°°°°°Ã

1Ls2

0Ms2Ls2

−1

!°°°°°°°°°µ −Ls1 1−Ms1 0

¶°°°°≤ C

cos θ2

y

°°°¡T 0(x1)¢−1°°° ≤°°°°°µ−∂H

∂x1

¶−1°°°°°°°°°µ∂H

∂x2

¶°°°°=

°°°°°Ã0 − 1

Ms1

1 − Ls1Ms1

!°°°°°°°°°µ Ls2 0

Ms2 −1¶°°°°

≤ C1cos θ1

ya qu la curvatura y t1 son uniformemente acotados, basta probar queZH

log+°°T 0(s, θ)°° cos θdsdθ <∞ (log+ s = max{0, log s})

(el caso paraRH log

+°°°(T 0(x1))−1°°° cos θdsdθ <∞ es analogo). EntoncesZ

Hlog+

°°T 0(s, θ)°° cos θdsdθ ≤ZHlog+(

C

cos θ2) cos θdsdθ

≤ZH

¯log

C

cos θ2

¯cos θdsdθ

≤ |logC|ZHcos θdsdθ

−ZHlog cos θ2 cos θdsdθ

48

Ya queRH cos θdsdθ = µ(H) = 1, debemos probar que el otro término

es tan grande como −∞. Como µ es T−invarianteZH

log cos θ2 cos θdsdθ =

ZH

log cos θ cos θdsdθ

y esta integral es acotada por queZ π/2

−π/2log cos θ cos θdθ = log 4− 2,

y la longitud de la curva es finita.

Observación 3.8 a) En [15], parte V, es dado un ejemplo de un billarsimplemente conexo cuyo borde es C1 (todavía mas es C∞ excepto en unpunto), que verifica Z

Hlog+

°°T 0(s, θ)°° cos θdsdθ = +∞.

b) Muchas propiedades geométricas y ergódicas para difeomorfismos envariedades compactas son deducidas de la no anulación de los exponentesde Liapunov aplicando teoría de Pesin. Para deducir estas propiedades paranuestra transformación de billar podemos probar algunas condiciones en lasderivadas de T . Como fue observado al principio de esta sección omitiremostales consideraciones.

Una trayectoria que hace un número infinito de rebotes en un intervalo detiempo finito, puede ocurrir igual para un billar plano estrictamente convexocuyos bordes son tres veces diferenciables (pero esta tercera derivada es noacotada). Un ejemplo tal fue construido por B. Halpern. Su construcciónmas bien involucra estimaciones meticulosas, su idea es, de cualquier modo,completamente transparente.

Consideremos una sucesión de puntos pn del círculo unitario que conver-gen monótonamente a un punto del círculo (en el ejemplo las coordenadasangulares de pn son iguales a n1/2). Los puntos pn son los puntos consec-utivos de la reflexión de una trayectoria de billar en la curva de billar γconstruída. Uniendo los puntos pn obtenemos una trayectoria poligonal. Laley de reflexión determina la dirección de γ en los puntos pn. Uno construyeporciones pequeñas γn de γ a través de cada punto pn y entonces uniendoγn en forma suave obtener γ. Omitimos los detalles; pero se puede consultaren [13]. Vale la pena mencionar que, en un sentido, el ejemplo de Halpern esel mejor posible. A saber, Halpern probó el siguiente teorema: si una curvade billar tiene una tercera derivada acotada y en ninguna parte se anula lacurvatura, entonces el flujo de billar está definido para todos los tiempos.

49

3.2. Medida invariante y función generadora parabillares planos. Formulación variacional.

Esta es otra prueba de la invarianza de la medida.Sea Q una mesa de billar plana acotada. Considera la variedad V de

vectores tangentes unitarios (q, v) con la dirección de v hacia adentro yel punto base q en el borde ∂Q. Si el borde consiste de una componenteentonces V es el anillo S1 × I. Ahora definimos la transformación de billarT de V. Un vector (q, v) se mueve a lo largo de la línea a través de q en ladirección de v a el próximo punto q1 de su intersección con ∂Q, y entoncesv reflejado en ∂Q a un nuevo vector v1: T (q, v) = (q1, v1) .

Una propiedad muy notable de la transformación de billar T es la exis-tencia de una forma de área invariante. Parametrizamos ∂Q por la longituddel parámetro s y sea θ el ángulo entre v y la dirección del borde en el puntoq(s). Use (s, φ) como las coordenadas en V , φ ∈ [0, π].

Lema 3.9 La forma de área sinφdφ ∧ ds es T − invariante.

Demostración Sea T (s, φ) = (s1, φ1) . Uno quiere probar que

sinφ1dφ1 ∧ ds1 = sinφdφ ∧ ds.

Sea f (s, s1) la distancia entre los puntos q(s) y q(s1) que es lo quevenimos llamando t. Se sigue de geometría elemental que

∂f (s, s1)

∂s= − cosφ y ∂f (s, s1)

∂s1= cosφ1

de aquí

cosφ1ds1 − cosφds =∂f (s, s1)

∂s1ds1 +

∂f (s, s1)

∂sds = df

y tomando derivadas

sinφ1dφ1 ∧ ds1 − sinφdφ ∧ ds = 0

Consideremos tres puntos consecutivos T (s, θ) = (s1, φ1) , T (s1, φ1) =(s2, φ2) . Se sigue de la prueba previa que

∂f (s, s1)

∂s1= cosφ1,

∂f (s1, s2)

∂s1= − cosφ1

50

De aquí∂f (s, s1)

∂s1+

∂f (s1, s2)

∂s1= 0

Esta fórmula tiene la siguiente interpretación. Supongamos que unoquiere comenzar la bola de billar en el punto q si después de reflejar enel borde en algún punto q1 este llega al punto dado q2. ¿Cómo encuentrauno el punto no conocido q1? respuesta: este punto es un punto crítico de lafuncional dist(q, q1) + dist(q1, q2). Este principio variacional juega un papelimportante en el estudio de billares.

3.3. Billares convexos.

3.3.1. Geometría elemental.

La tabla de billar mas simple es una circular. No hay mucho que deciracerca de este: cada trayectoria hace un ángulo constante con el borde ypermanece tangente a un círculo concéntrico (ver Fig.3).

Figura 3.

La transformación inducida en este círculo tangente es una rotación através de un ángulo fijo, esto es una traslación.

Si un segmento de una trayectoria en un círculo forma un ángulo con lanormal cuya magnitud es racional, entonces la trayectoria es cerrada y en elespacio de fase se ve como en la frigura 4, si el ángulo tuviera una magnitudirracional la trayectoria nunca cierra y en el espacio de fase se vería como

51

en la figura 5 (una hilera densa de puntos horizontal).

Figura 4.

Figura 5

Definición 3.10 Una cáustica de un billar plano es una curva tal que siuna trayectoria es tangente a ésta, entonces vuelve a ser tangente a estadespués de toda reflexión.

Así los billares circulares tienen una familia de cáusticas, consistente decírculos concéntricos.

Ahora demos un vistazo a las elipses. Recordemos que una elipse consistede puntos cuya suma de distancias a dos puntos dados es constante; estosdos puntos son llamados los focos de la elipse. Existen diferentes formas deconstruir una elipse, una de ellas es usar una cuerda cuyos extremos estanfijos a dos puntos.

Una propiedad óptica muy conocida sobre elipses es la siguiente.

52

Un rayo de luz, que sale de un foco, llega al otro foco después de unareflexión en la elipse. En otras palabras, los segmentos que unen un punto dela elipse con los focos hacen igual ángulo con la elipse. No es difícil verificaresta propiedad.

Consideremos el siguiente problema: dada una línea l y dos puntos F1y F2 en un lado de ésta, encuentra un punto X en l tal que la distancia esmínima.

Solución: refleja F1 en la línea y una con F2 por una línea recta. El puntode intersección con l es X. Se sigue que los ángulos hechos por F1X y F2Xcon l son iguales. Ver fig. 6.

Figura 6.

Otra propiedad de la trayectoria de billar que pasa por los focos es queconverge al eje mayor de la elipse. Veamos, considere segmentos consecutivosde la trayectoria. El punto A2 es mas próximo al eje mayor que A1, etc. Así,se puede demostrar que existe el límite A∞ de la sucesión A1, A2, ...; y, dela misma manera, se ve la existencia del límite B∞ de la sucesión B1, B2, ....El segmento A∞B∞ es por si mismo trayectoria del billar . La bola debillar va de A∞ a B∞ y viceversa infinitas veces. Así el segmento A∞B∞ esperpendicular a la elipse en ambos extremos.

Este tipo de trayectoria se muestra en el espacio de fase figura 7, comose puede apreciar los puntos se van acumulando en dos puntos y el ángulo

53

va tendiendo a cero.

Figura 7.

Elipses e hipérbolas con el mismo foco son llamadas confocales. En lascoordenadas cartesianas (x, y) ellas están dadas por la ecuación:

x2

a2 + λ+

y2

b2 + λ= 1, 0 < a < b

Aquí λ es un parametro variable; para −b2 < λ < −a2 la curva es unahipérbola, y para −a2 < λ la curva es una elipse.

El principal resultado en billares elípticos dice que ellos son completa-mente integrables.

Teorema 3.11 Una mesa de billar elíptica tiene una familia de cáusticas,que consisten de elipses e hipérbolas confocales. Mas precisamente, si unsegmento de una trayectoria de billar no intersecta el segmento determinadopor los focos F1 y F2, entonces todos los segmentos de esta trayectoria nointersectan F1F2 y son todos tangentes a la elipse con focos F1 y F2; si unsegmento de una trayectoria intersecta F1 F2, entonces todos los segmen-tos de esta trayectoria intersectan F1F2 y son todos tangentes a la mismahipérbola con focos F1 y F2.

Demostración SeanA0A1 yA1A2 segmentos consecutivos de una trayec-toria, ver figura 8. Supongamos que A0A1 no intersecta el segmento F1F2(el otro caso es totalmente análogo), se sigue de la propiedad óptica que losángulos A0A1F1 y A2A1F2 son iguales.

Reflejando F1 en A0A1 da F01, y F2 en A1A2 da F

02, y sean

B = F01F2 ∩ A0A1, C = F

02F1 ∩A1A2.

54

Considere la elipse con focos F1 y F2, que es tangente a A0A1. Ya que losángulos F2BA1 y F1BA0 son iguales, esta elipse toca a A0A1 en el punto B.Asimismo una elipse con focos F1 y F2 toca A1A2 en el punto C. Uno quieremostrar que estas dos elipses coinciden, o equivalentemente, que F1B +BF2 = F1C + CF2 lo cual nos llevaría a F

01F2 = F1F

02.

Figura 8.

Para tener esto observe que los triángulos F01A1F2 y F1A1F

02 son con-

gruentes: F01A1 = F1A1, A1F2 = A1F

02 por simetría y los ángulos F

01A1F2 y

F1A1F02 son iguales. De aquí F

01F2 = F1F

02.

Entoces recordemos que billares acotados por diferentes cónicas confo-cales son integrables, por que sus cáusticas son cónicas confocales.

3.3.2. Tres aplicaciones geométricas.

La primera es un resultado muy elemental de la geometría euclidiana, siAB +BF = AD +DF , entonces AC + CF = AE + EF. Ver fig. 9.

Figura 9.

Este teorema tiene una prueba sintética; sin embargo, se deducirá deintegrabilidad de billares elípticos.

El teorema establece que si B y D pertenecen a una elipse con focos Ay F , entonces C y E pertenecen a una elipse confocal.

55

Considere dos elipses confocales. Los billares en estas tienen la mismacolección de cáusticas que como sabemos consisten de elipses confocales. Lafamilia de rayos, tangentes a una cáustica, es una curva invariante de latransformación de billar del conjunto de rayos. En [32] página 16 se demues-tra que esto implica que las dos transformaciones de billar conmutan.

Construimos las elipses Γ1 y Γ2 con focos A y F, que contienen los puntosB y C, respectivamente. La anterior elipse contiene a D; uno quiere mostrarque la otra contiene a E. La reflexión de billar en Γ2, y entonces en Γ1envía el rayo AB a DA. Entonces la reflexión, primero en Γ1, y entonces enΓ2 envía AB otra vez a DA. Esto significa que los puntos de intersecciónBF ∩ Γ2 y AD ∩ Γ2 coinciden. De aquí E = BF ∩ AD esta en Γ2. Fig.10.

Figura 10.

La segunda es una construcción de una trampa para un rayo de luz,esto es, una curva reflejante tal que una colección de rayos paralelos de luz,reflejados en él, permanecen atrapados, esto fue resuelto por varias personas.Describimos la trampa construida por R. Peirone.

La curva γ es una parte de una elipse con focos F1 y F2; la curva Γ es unaparábola con foco F2 ver fig. 11. Estas curvas son unidas de manera suavepara producir una trampa: se sigue de las propiedades antes mencionadaspara cónicas, que un rayo v paralelo a el eje de la parábola entrando a lacurva a través de una ”ventana”, tenderá al eje mayor de la elipse y por lo

56

tanto nunca escapa.

Figura 11.

Cambiemos el problema ligeramente, intentemos atrapar un conjuntode rayos suficientemente cerca a uno dado en el espacio de rayos (en otraspalabras permitir que los rayos hagan un ángulo pequeño con uno dado).Sin embargo en este caso la trampa no existe, esto se sigue del teorema derecurrencia de Poincaré.

Veamos, sea U una vecindad en el espacio de rayos, que uno quiereatrapar. Cerramos la ventana de la trampa y consideremos el billar dentrode esta curva cerrada. Existe un rayo en U , que regresa a U después de uncierto número de reflexiones. El único camino para regresar a U es tenerreflexiones en la parte de la curva que constituye la ventana, de aquí estosrayos no son atrapados.

La tercera aplicación concierne a un trabajo de iluminación. Sea unahabitación con paredes de espejo; ¿es posible iluminar este con un puntocomo origen de luz, que emite rayos en todas direcciones?

Un ejemplo de un cuarto que no puede ser iluminado desde cualquiera desus puntos, es mostrado en la figura 12. Las curvas superiores e inferiores sonmitades de elipses con focos F1F2 y G1G2. Ya que un rayo, que pase entrelos focos, se refleja y pasa otra vez entre los focos, un rayo no puede entraren el área sombreada de entre las líneas F1F2 y G1G2, y viceversa. Unamodificación de esta construcción produce una región que, para cualquierpositivo n, requiere al menos n faros para su iluminación. Asimismo uno

57

construye una región acotada, cuyo borde es suave en todo menos en unpunto, que no puede ser iluminado por un número finito de faros.

Figura 12.

3.3.3. Trayectorias periódicas.

¿Dada una curva de billar suave estrictamente convexa C1, el mapeo debillar tiene trayectorias periódicas, esto es, puntos en el espacio fase queregresan después de un cierto número de iteraciones?. Llamaremos rotaciónde una órbita periódica al número de vueltas que se da alrededor de la curvaborde al volver a llegar al punto de partida Tn(x) = x. Estas trayectoriasperiódicas son poligonos inscritos, cuyos lados consecutivos hacen ángulosiguales con la curva del billar. Distinguimos la estrella formada por n-puntoscon rotación r ver fig.13.

Figura 13.

La respuesta a la pregunta de arriba esta dada por el siguiente teoremadado por G. Birkhoff.

Teorema 3.12 Para cualquier n ≥ 2 y r ≤ 12n, coprimo con n, existen dos

trayectorias n-periódicas geométricamente distintas con rotación r.

58

DemostraciónConsidere el conjunto M de n puntos inscritos x1, ..., xn. EntoncesM es

un toro n-dimensional. Sea f la función longitud |x1xr+1| + |xr+1x2r+1| +· · ·. Esta función es suave fuera del conjunto singular M0 =

S{xi = xi+1}(adoptando la convención n + 1 = 1). Sabemos de la sección 3.1 que lospuntos críticos de la función f son trayectorias de billar.

Probaremos que para cualquier n existe una trayectoria n-periódica. Elespacio M es compacto, f consigue su máximo en éste. Este máximo no sealcanza en M0: el perímetro de un k polígono k < n puede ser incremen-tado por la introducción de un nuevo vértice ver fig. 14. Así este máximocorresponde a la trayectoria n poligonal.

Figura 14.

Para probar el resultado por completo considere el conjunto de n-puntoscon rotación r. Llamémosle N . Este conjunto es el ”producto” de un círculoy un disco (n − 1)-dimensional, y su borde consiste de polígonos degener-ados de M0. La función f tiene por lo menos n máximos en N , obtenidospor permutaciones cíclicas de los vértices del mismo polígono de perímetromáximo en N.

Use el argumento mínimo-máximo para mostrar, que hay otro puntocrítico de f dentro de N. Conectando dos máximos por una curva dentrode N y considerando el mínimo de f en ésta. Tomando el máximo de estosmínimos de todas las curvas posibles. Este es también un punto crítico def, que no es el máximo. Algo difícil es establecer su existencia.

La razón para considerar r coprimo con n, es que, de lo contrario, el argu-mento de arriba puede producir un polígono con pocos vértices, transversala si mismo varias veces.

Se sigue, que hay al menos φ(n) órbitas n-periódicas distintas, dondeφ(n) es el número de enteros, menores que n y coprimos con n.

El siguiente caso particular puede ilustrar un poco la prueba de esteteorema. Considere trayectorias 2-periódicas de una parte a otra, esto es, lacuerda de la curva de billar, perpendicular a ésta en ambos extremos. Una detales curvas es fácilmente encontrada: es el diámetro; es decir, la cuerda masgrande de la curva. Ya que la curva del billar es estrictamente convexa hayuna única cuerda de longitud máxima en cada familia de cuerdas paralelas.

59

Así uno tiene una familia paramétrica de las longitudes de estas cuerdas,parametrizadas por sus direcciones, cuyo elemento inicial es el diémetro, ycuyo elemento final es el mismo diámetro con el punto final intercambiado.En esta familia existe una cuerda mas corta, y esta cuerda es perpendiculara la curva en ambos extremos. Esta es la segunda trayectoria de billar 2-periódica deseada.

Después de establecer la existencia de trayectorias periódicas, a uno legustaría aprender acerca de su estabilidad.

Definición 3.13 Un punto fijo p de un mapeo T es estable (en el sentidode Liapunov) si para cualquier vecindad U de x existe una vecindad V talque la órbita

S−∞<i<∞

T i(V ), esta contenida en U.

Dada una trayectoria n-periódica de la bola de billar, considere un puntofijo del mapeo Tn. La derivada de Tn en un punto fijo es una transformaciónlineal que preserva el área del plano; de aquí su determinante es igual a 1.Generalmente dos casos son posibles: los eigenvalores son reales recíprocosdistintos, o son números complejos conjugados distintos con norma igual a1. En el primer caso llamado hiperbólico el mapeo lineal es una rotaciónhiperbólica; el punto fijo no es estable (igual que en la aproximación lineal).En el último caso llamado elíptico el mapeo lineal es una rotación, y el puntofijo es estable en la aproximacón lineal. Se sigue de la teoría de KAM, que enla posición general, existen curvas invariantes del mapeo Tn cerca del puntofijo. Así una trayectoria elíptica periódica es generalmente estable.

La condición de estabilidad para una órbita 2-periódica se estudia comosigue. Sea t la longitud del segmento de una trayectoria, y r1, r2 son losradios de curvatura (con signo) de la frontera en los puntos de rebote.

Lema 3.14 Una orbita 2-periódica es elíptica si y sólo si

r1 + r2 − t

r1r2> 0 y

(t− r1)(t− r2)

r1r2> 0.

Ya que una trayectoria periódica es un punto crítico de la funcional delongitud, otra aproximación al problema de estabilidad es vía el estudio dela matriz Hessiana en este punto crítico.

En un billar elíptico la trayectoria a lo largo del eje menor es estable.Y la trayectoria del eje mayor es hiperbólica (inestable). El conjunto derayos a través de uno y otro foco constituye una curva, invariante bajola transformación de billar, que une los dos puntos de esta trayectoria 2-periódica (esta curva es llamada una separatriz) ver la figura. Cualquier

60

punto de la separatriz va a uno de los dos puntos (B en la figura 15) bajoiteraciones positivas del mapeo de billar, y al otro (punto A) bajo negativas.

Figura 15.

Hacer una perturbación pequeña de la curva de billar. La trayectoriahiperbólica 2-periódica persistirá (todavía será el diámetro de la curva), sinembargo las curvas construídas arriba para los nuevos puntos A y B nocoincidirán necesariamente. De manera mas precisa, sea SA la curva queconsiste de puntos x con T−nx → A cuando n → ∞, y SB = {x : Tnx →B,n→∞}. Si las curvas SA y SB se intersectan una vez, ellas se intersectaninfinitas veces por que ambas son invariantes bajo el mapeo de billar. Lasdos curvas constituyen una telaraña complicada, cuya existencia no va deacuerdo con la integrabilidad.

Levallois y Tabanov analizaron el corte de separatrices en el caso cuandola perturbación de la mesa de billar es la siguiente curva de grado 4:

x = a cosα, y = b sinα(1 + ε cos2 α), α es un parametro pequeño.

Ellos prueban que para toda ε suficientemente pequeña las separatricesse intersectan transversalmente, y estima los ángulos hechos por estas enlos puntos de intersección. V. Donnay obtuvo un resultado similar paraperturbaciones pequeñas de una elipse en una vecindad de un punto; estaperturbación cambia la curvatura, pero preserva el punto y la direccióntangente en este.

3.4. Billares Hiperbólicos

Llamaremos billares hiperbólicos o caóticos a aquellos cuya transformadade billar tiene exponentes de Liapunov no nulos en µ-casi todo punto delespacio de fase.

Avances mas recientes en el estudio de propiedades ergódicas de bil-lares planos son descritos por el Teorema general sobre la no anulación de

61

exponentes de Liapunov. Este teorema se refiere a la construcción de famil-ias invariantes de conos o formas cuadráticas crecientes de Liapunov. Am-bos métodos son escencialmente equivalentes y fueron introducidos por Wo-jtkowski [34,35] y Markarian [23,25], respectivamente [10 años antes Pesiny Sinai (1981) escribieron que el estudio de propiedades ergódicas de bil-lares vía la teoría de sistemas dinámicos discontinuos (funciones suaves consingularidades) condujeron al problema no muy simple de checar que la car-acterística de los exponentes de Liapunov del sistema son diferentes de cero.Hasta ahora el único método efectivo (pero no riguroso) para checar es elcálculo de exponentes característicos usando una computadora digital].

Fue probada la existencia de una clase grande de billares planos con com-ponentes regulares focalizadores del borde los cuales tienen comportamientoscaóticos.

Se demostró que los siguientes tipos de componentes focalizadores C4

pueden ser parte del borde de billares caóticos:a) Arcos de curvas que satisfacen d2r

ds2< 0 [35]. En este grupo están las

epicicloides, las hipocicloides, la cicloide y en particular, la cardioide (curvacerrada cuya ecuación en coordenadas polares es r(t) = 1 + cos t, −π ≤ t ≤π). El arco de elipse x = a cos t, y = b sin t, b2 > a2, con −π/4 ≤ t ≤ π/4también satisface esta condición.

b) Arcos que satisfacen L2(t1 + t2) < 2t1t2 para sucesivos rebotes en elmismo componente focalizador. Esta condición se verifica localmente (trayec-

torias con segmentos cortos) si d2(r1/3)ds2

> 0 (donde L es la longitud de latrayectoria dentro del cí rculo de semicurvatura). Para trayectorias largasotras condiciones deben ser agregadas. Por ejemplo en la elipse previa debeser sin2 t > b2

b2+a2que corresponde a un arco disjunto con el anterior. Ver

[23], p.93.c) Cualquier arco focalizador corto, donde la brevedad está definida por

la negatividad del desarrollo de Taylor en una vecindad de uno de sus puntos.El primer término de este desarrollo tiene orden par e implica la cuartaderivada de la curva. Ver [24,25] y [10].

Como cerrar una mesa de billar con arcos neutrales o dispersores y curvasfocalizadoras fueron discutidas en los libros mencionados en a) y b). En [23]se da una descripción que incluye todo lo mencionado previamente. Las dossiguientes familias de billares tienen comportamiento caótico:

1. Componentes C3 del borde pueden ser de cualquier tipo excepto queel focalizador debe ser C4 y satisfacer a) o c). Referente a componentesno adyacentes el círculo de semicurvatura en cada punto de cada compo-nente focalizador no contiene puntos de cualquier otra componente regular

62

o del círculo de semicurvatura de otros componentes focalizadores. Compo-nentes focalizadores adyacentes que forman ángulos interiores mas grandesque π. Componentes adyacentes focalizadores y dispersores forman ángu-los no menores que π, y componentes adyacentes focalizadores y neutralesforman ángulos mas grandes que π/2. Los ángulos entre componentes ady-acentes es siempre no cero.

2. Componentes regulares C3 del borde pueden ser de cualquier tipoexcepto que el focalizador debe ser C4 y satisfacer b) o c). Los círculos decurvatura de componentes focalizadores no pueden contener puntos de otrascomponentes. Condiciones en arcos adyacentes son como en el caso 1.

En [10] se define una clase de curvas (llamadas arcos focalizadores) quepueden ser parte de billares caóticos si ellas son unidas por segmentos sufi-cientemente largos, cerrando regiones convexas. Un arco focalizador es unacurva C∞ γ(s), 0 ≤ s ≤ s con

R s0 K(s)ds < π. Se prueba que en la elipse

referida arriba, su mitad con x ≥ 0 es un arco focalizador si y solo sia/b <

√2.

En [35], apendice c, se describe un billar con comportamiento caótico ytres componentes ergódicos, por lo menos.

Curvas que satisfacen las igualdades a) y b) pueden ser partes de billaresde tipo 1 o 2. Arcos de circunferencias estan en los bordes de ambas condi-ciones. Pero si estos son perturbados las propiedades ergódicas pueden fallar.Este es el caso de billares de Bunimovich con mas de una semicircunferen-cia o el billar ”cacahuate” estudiado numericamente en [14] que satisface la

descripción 1 o 2 con d2rds2=

d2(r1/3)ds2

= 0.En [25] se prueba que arcos mas pequeños que semicircunferencias pueden

ser C4 perturbados manteniendo comportamiento caótico. En particular, elejemplo mas conocido de tipo billar de Bunimovich, el estadio (ver fig. 16)puede tener ambas de sus semicircunferencias perturbadas si mantenemoslos segmentos y la tangencia de ellos con los arcos perturbados en los puntos

63

de contacto.

Figura 16. Arcos de circunferencias unidos por rectas.

Ahora, teniendo variedades locales invariantes, podemos adaptar el ar-gumento que Hopf usó para probar la ergódicidad de flujos geodésicos (loscuales también fueron usados en conjuntos hiperbólicos compactos). Dos di-ficultades aparecen inmediatamente, cuando intentamos extender a fibrasestables e inestables.

a) Hay cambios en la pendiente de las fibras invariantes debido a laexistencia de ángulos en los bordes así como trayectorias que son tangentesa los bordes.

b) La longitud de las componentes suaves de la variedad invariantepueden ser muy pequeñas.

Estas dificultades fueron resueltas estudiando la probabilidad de que lascomponentes suaves de la variedad invariante fueran muy pequeñas. Masprecisamente se estudia la medida del conjunto de los puntos donde lasvariedades locales tienen longitud pequeña menor que δ, cuando δ → 0.

Este es el contenido del Teorema Fundamental para Billares Dispersores[4]. Este permite probar ergodicidad local y global. La ergódicidad localsignifica que cualquier vecindad pequeña de todo ”punto bueno” esta con-tenido en un componente ergódico de T (en este caso, T verifica una fuertepropiedad ergódica en este conjunto: es un sistema de Kolmogorov).

En [30] y [18] fue presentada una mejor versión del Teorema Fundamen-tal, ahora para billares semi-dispersores.

La base de estas ideas fue probar que billares dispersores (todos loscomponentes regulares del borde tienen K < 0) o semidispersores (K ≤ 0)los cuales tienen casi todas sus trayectorias pasando por puntos con K <

0, son ergódicos. La siguiente condición debe ser también satisfecha:◦

∂Qi

64

,◦

∂Qj no tienen normal común en◦

∂Qi ∩◦

∂Qj; esto es, ellos deben tenerintersecciones transversales.

Estas construcciones también simplifican el estudio de órbitas periódicas,pero hay estimaciones de su número para billares semidispersores hecho en[31] usando métodos completamente independientes.

En [3] fue probado que la ergodicidad se mantiene si:a) En una vecindad de cada ángulo de un billar dispersor ambos arcos

del borde son substituidos por un arco de circunferencia Γi;b) Γi y Γj son arcos de circunferencias diferentes si i 6= j;c) La parte de la circunferencia Γi que no esta en el borde del nuevo

billar esta completamente contenido en la superficie del billar.Bunimovich mostró en [5] que billares ergódicos pueden ser construidos

con arcos de circunferencias y segmentos (sin componentes dispersores). Lafigura mas conocida de este tipo es el estadio. El da una versión mejorada deeste resultado en [6]. En este trabajo probó que un billar plano es ergódicosi su borde verifica todas las condiciones dadas al principo de la sección 3.1y

i) Hay por lo menos un componente regular focalizador y uno no focal-izador del borde;

ii) Todos los componentes regulares focalizadores son arcos de circunfer-encia Γi tal que Γi/∂Q es no vacío y contenido en el interior de Q;

iii) Los componentes dispersores del borde se intersectan uno al otro ylos componentes neutrales se intersectan transversalmente.

iv) La parte neutral del borde consiste de a lo más dos componentesregulares.

65

Bibliografía

[1] Arnold, V. I. & Avez, A. (1967), Problèmes ergodiques de la MècaniqueClassique. Paris: Gauthier-Villars.

[2] Baryshnikov, Yu. Indices for Extremal Embeddings of 1-Complexes,Adv. in Soviet Math., Amer. Math. Soc., t. 1,1990, p. 137-144.

[3] Bunimovich, L.A. (1974), On billiards close to dispersing. Math. USSR.Sb. 23, No. 1, 45-67.

[4] Bunimovich, L.A.& Sinai, Ya. G. (1973), On a fundamental theorem inthe theory of dispersing billiards, Math. USSR. Sb. 19. 407-423.

[5] Bunimovich, L.A. (1979), On ergodic properties of nowhere dispersingbilliards. Commun. Math. Phys. 65, 295-312.

[6] Bunimovich, L.A. (1990), A Theorem on Ergodicity of Two-Dimensional Hyperbolic Billiards. Commun. Math. Phys. 130, 599-621.

[7] Carmo, Manfredo do (1979), Geometría Riemanniana. Río de Janeiro:IMPA.

[8] Chernov, N & Markarian, R., Introduction to the Ergodic Theory of

Chaotic Billiards. IMCA, Lima (2001)

[9] Cornfeld, I. P.; Fomin, S. V. & Sinai, Ya. G. (1982), Ergodic Theory(Berlin, Heidelberg, New York: Springer).

[10] Donnay, V. Perturbations of Elliptic Billiards. Preprint.

[11] Douady, R. (1982), Applications du Théoéme des tores invariants.These. Université Paris VII.

[12] Gallavotti, G. & Ornstein, D.S.(1974), Billiards and Bernoulli Schemes.Commun Math. Phys. 38, 83-101.

66

[13] Halpern B. 1977, Strange Billiard Table, Trans. Amer. Math. Soc., p.297-305.

[14] Hayli, A. & Dumont, Th. (1986), Experiences numeriques sur les bil-liards C1 formés de quatre arcs de cercles. Celestial Mechanics 38, 23-66.

[15] Katok, A. & Strelcyn, J. M. in collaboration with Ledrappier F., Przy-tycki, F. (1986), Smooth maps with singularities. Invariant Manifolds.Entropy and Billiards. Lecture Notes in Mathematics 1222, Berlin, Hei-delberg, New York: Springer.

[16] Katok, A., Periodic and Quasi-Periodic Orbits for Twits Maps, Lect.Notes in Phys., t. 179, 1983, p. 47-65.

[17] Khinchin, A. I. (1949), Mathematical Foundations of Statistical Me-chanics (New York: Dover).

[18] Krámli, A.; Simányi, N. & Szász, D. (1991), A ”transversal” funda-mental theorem for Semi-Dispersing Billiards. Commun Math. Phys.535-560.

[19] Lazutkin, V. F. (1973), On the existence of caustics for the billiard ballproblem in a convex domain. Math. USSR Izv. 7, 185-215.

[20] Levallois, Ph., Tabanov, M. Séparation des séparatrices du billiard el-liptique pour une perturbatin algébrique et symétrique de l’ellipse, C.R.Acad. Sci., t. 316, 1993, p. 589-592.

[21] Mackay, R., Meises, J., Linear Stability of Periodic Orbits in LagrangianSystems, Phys. Lett., 98 A, 1983, p. 92-94.

[22] Mañe, R. (1983) Introducao à Teoria Ergódica. Rio de Janeiro, IMPA.

[23] Markarian, R (1988), Billiards with Pesin region of measure one. Com-mun Math. Phys. 118, No. 1, 87-97.

[24] Markarian, R (1989), Non Uniform Hyperbolicity. Billiards. In Work-shop on Dynamical Systems, ICTP, Trieste, 1988. Edited by Z. Coelhoand E. Shiels. Longman, 129-135.

[25] Markarian, R (1990), Non Uniform Hyperbolicity billiards. Tese dedoutoramento. Rio de Janeiro, IMPA.

[26] Markarian, R (1991), The Fundamental Theorem of Sinai-Chernov fordynamical systems with singularities

67

[27] Markarian, R (1993), Introduction to the ergodic theory of plane bil-liars. Dynamical Systems, Santiago de Chile 1990. Edited by R. Bamón,R. Labarca, J. Lewowicz and J. Pallis (Harlow, Longman) pp. 327-439.

[28] Perko, Lawrence. Differential equations and dynamical systems, Newyork : Springer-verlag, c1991.

[29] Royden, H L, Real analysis, New York : Macmillan, c1963

[30] Sinai. Ya. G. & Chernov, N. I. (1987), Ergodic Properties of two dimen-sional discs and three dimensional balls. Russ. Math. Surv. 42:3,181-207.

[31] Stojanov, L. (1989), An Estimate from above of the numbre of periodicorbits for semi-dispersed billiards. Commun. Math. Phys. 124, 217-227.

[32] Tabachnikov, Serge (1995), Billiards [Paris] Societe Mathematique deFrance.

[33] Walters, P. (1982), An Introduction to Ergodic Theory. Berlin, Heidel-berg, New York: Springer.

[34] Wojtkowski, M. (1985), Invariant families of cones and Lyapunov ex-ponents. Ergod. The & Dynam. Sys. 5, 145-161.

[35] Wojtkowski, M. (1986), Principles for the desing of billiards with non-vanishing Lyapunov exponents. Commun. Math. Phys. 105, 391-414.

68