Tesis de Licenciatura Sobre el trabajo no publicado …Resumen Esta tesis esta basada en el...

54
Tesis de Licenciatura Sobre el trabajo no publicado de Alan M.Turing “A note on normal numbers” Rafael Eduardo Picchi LU:647/92 - [email protected] Directora: Dra. Ver´ onica Becher [email protected] Codirector: Lic. Santiago Figueira sfi[email protected] Universidad de Buenos Aires Facultad de Ciencias Exactas y Naturales Departamento de Computaci´ on Buenos Aires - Argentina Diciembre de 2005

Transcript of Tesis de Licenciatura Sobre el trabajo no publicado …Resumen Esta tesis esta basada en el...

Tesis de Licenciatura

Sobre el trabajo no publicadode Alan M.Turing

“A note on normal numbers”

Rafael Eduardo Picchi

LU:647/92 - [email protected]

Directora: Dra. Veronica Becher

[email protected]

Codirector: Lic. Santiago Figueira

[email protected]

Universidad de Buenos AiresFacultad de Ciencias Exactas y Naturales

Departamento de Computacion

Buenos Aires - Argentina

Diciembre de 2005

A mi viejo,y

a Cecilia.

II

Agradecimientos:

A Veronica Becher, mi directora de tesis, por su infinita predisposicion,su optimismo constante y su inagotable aliento.

Al codirector de mi tesis, Santiago Figueira, por su enorme voluntad y suvaliosa ayuda en las distintas etapas de este trabajo.

A Mariela Sued, por su asesoramiento y colaboracion, que se ve reflejadoen la seccion 5.

A Max Dickmann y a Pablo Jacovkis, por sus participaciones en distintasdiscusiones que nos permitieron visualizar otros enfoques.

A mis hermanos, Conrado y Silvana, por sus aportes desde los primerospasos de este trabajo.

A Graciela, mi companera en la vida, por su apoyo incondicional, sin elcual me hubiera sido imposible realizar esta tesis.

III

Resumen

Esta tesis esta basada en el manuscrito no publicado de Alan Turing titulado“A note on normal numbers”. El manuscrito de Turing tiene tiene por obje-tivo dar dos teoremas. El primero es una demostracion constructiva de quela mayorıa (en el sentido de la medida de Lebesgue) de los numeros realesson absolutamente normales. Este teorema fue probado con anterioridad porBorel en 1909, pero de una manera no constructiva. El segundo teorema esun algoritmo para generar instancias de numeros absolutamente normales.En el manuscrito de Turing ninguna de las dos demostraciones estan comple-tamente desarrolladas. En esta tesis damos una reconstrucion completa delTeorema 1 de Turing.

El interes de este trabajo es conocer las tecnicas que utilizo Turing en relaciona los numeros normales, especialmente porque actualmente no se cuenta conmetodos que permitan demostrar la normalidad de numeros reales, ni seconocen algoritmos rapidos para dar instancias de numeros normales.

IV

Indice

1. Introduccion 2

2. La definicion de normalidad 4

3. Reconstruccion del Teorema 1 de Turing 53.1. Comparando las cotas . . . . . . . . . . . . . . . . . . . . . . . . . 13

4. Version fiel del Teorema 1 de Turing 15

5. Una cota alternativa 19

6. Conclusiones 22

7. Apendice 1Manuscritos Originales de A.M.Turing 24

8. Apendice 2Version transcripta por J.L.Britton 43

1

1. Introduccion

En este trabajo hacemos una revision del manuscrito de Alan M. Turing titu-lado “A note on normal numbers”, trabajo que ha permanecido inedito hasta sureciente aparicion en las obras completas de Alan Turing en la coleccion “CollectedWorks of A.M.Turing”, editada por J.L.Britton (1992) [11], pp. 117-119, con notasdel editor en pp. 263-265 1. Britton destaca las dificultades para la transcripciondel manuscrito de Turing debido a que los originales son bastante ilegibles y estanincompletos.

Hay una version “scaneada”del manuscrito original de Turing que puede verseen la direccion de internet http://www.turingarchive.org 2.

Nuestra motivacion para abordar este trabajo fue conocer las tecnicas que uti-lizo Turing en relacion a los numeros normales, especialmente porque actualmenteno se cuenta con metodos que permitan demostrar la normalidad de numerosreales. Por ejemplo es aun una conjetura que la constante π es normal en base 10.Tampoco se conocen algoritmos rapidos para construir numeros absolutamentenormales ([3, 4, 5]).

En su manuscrito, Turing enuncia dos resultados, con insuficientes detalles de de-mostracion. El primero, su Teorema 1, es una demostracion constructiva efectivade que que casi todos los numeros reales son absolutamente normales.

Teorema 1 (Turing). Podemos dar una funcion recursiva c : N × N → P(R) yun k0 ∈ N tales que, para k ≥ k0: c(k, n + 1) j c(k, n) y

E(k) =⋂n≥1

c(k, n)

tiene medida 1 -1/k y contiene unicamente reales absolutamente normales.

El segundo resultado es un metodo para generar constructivamente numerosabsolutamente normales particulares. Es decir, un algoritmo para producir numerosabsolutamente normales. Este Teorema 2 utiliza el Teorema 1.

Nuestro trabajo ha sido reconstruir el Teorema 1 de Turing y dar todos los de-talles de su demostracion. Naturalmente nuestro interes en el Teorema 1 es indagarque herramientas utiliza Turing, ya que el resultado de que los numeros normales

1Observamos que las notas [1] y [2] del editor no son correctas2Este archivo digital contiene principalmente papeles personales no publicados y fo-

tografıas de Alan Turing de 1923 a 1972. Los originales se encuentran en el archivo Turingen King’s College Cambridge.

2

tienen medida 1, se debe a Emil Borel y data del ano 1909 [2], mediante una de-mostracion no constructiva. Una demostracion constructiva pero no recursiva delmismo resultado se debe a Sierpinski [9]. Aunque toman como punto de partidadistintas –pero equivalentes– definiciones de normalidad, la demostracion de Tur-ing y la de Sierpinski tienen un espıritu similar; y por otro lado, la construccionde Turing tiene cotas mas ajustadas que las de Sierpinski.

El trabajo esta organizado de la siguiente manera. En la Seccion 2 damos lasdistintas definiciones equivalentes de normalidad. En la seccion 3 hacemos unareconstruccion completa del Teorema 1 de Turing. En la seccion 4 desarrollamosla demostracion del Teorema 1 de Turing siguiendo fielmente la demostracion quefigura en el manuscrito. Lamentablemente hay un lema central que no pudimosdemostrar. Por ultimo, en la seccion 5, damos una cota alternativa que utilizamosen nuestra reconstruccion del Teorema 1 de Turing.

En los apendices 1 y 2, incluimos las paginas “scaneadas”de los manuscritos orig-inales y la version transcripta por Britton.

3

2. La definicion de normalidad

Sea t un entero mayor o igual que 2. Una palabra en base t de longitud Res una secuencia de R sımbolos en el afabeto {0, ..., t − 1}. La longitud de unapalabra w la denotamos: |w|. Indistintamente, en diferentes partes de nuestro tra-bajo, utilizaremos el termino dıgito (en base t) o bien para nombrar a una palabraen base t de longitud 1, o bien, para referirnos a un sımbolo del afabeto {0, ..., t−1}.

Todo numero real α > 0 tiene una expansion fraccionaria unica en base t dela forma

α = [α] +∞∑

n=1

ant−n

donde [ ] denota parte entera, 0 ≤ an < t y an < t− 1 para infinitos valores de n.Esta ultima condicion sobre an se introduce para asegurar la representacion unicade ciertos racionales.

Definicion 2. Sea α un numero real en (0, 1), y γ una palabra en base t. DefinimosS(α, t, γ,R) como el numero de ocurrencias de γ en los primeros R dıgitos despuesdel punto decimal, en la expansion de α en base t.

La definicion de la propiedad de normalidad para numeros reales es de Borel,del ano 1909 [2].

Definicion 3. Sean α un numero real en (0, 1), t ∈ N, t > 1, ∀ dıgito d en base t.α is simplemente normal en base t si

lımR→∞

S(α, t, d,R)R

=1t

α es absolutamente normal si es simplemente normal en toda base t ≥ 2.

Borel indica que los numeros absolutamente normales tienen una propiedad quelos caracteriza: la propiedad de que todos los bloques de igual tamano aparecen conla misma frecuencia, en cada base posible. Esta propiedad da lugar a la Definicion 4que tiene la apariencia de ser mas exigente que la definicion de absoluta normalidaddada por la Definicion 3. Las dos definiciones son equivalentes. La demostracionde la equivalencia se puede ver en el libro de Harman. [7] (Teorema 1.3, pag 7).

Definicion 4. Sea α un numero real en (0, 1).α es normal si para toda base t, y para cada palabra γ en base t, ∀t > 1,

lımR→∞

S(α, t, γ,R)R

= t−|γ|

En su manuscrito Turing utiliza esta Definicion 4 de normalidad basada enbloques de dıgitos. Nuestra reconstruccion del Teorema 1 utiliza la Definicion 3,en el sentido que la construcciones estan basadas en dıgitos.

4

3. Reconstruccion del Teorema 1 de Turing

En su demostracion del Teorema 1 Turing utiliza una cota superior de la can-tidad de palabras de una longitud dada en las que un bloque de dıgitos dado tienedemasiadas, o demasiado pocas ocurrencias con respecto a su valor esperado. Tur-ing no demuestra esta cota .

Nosotros reformulamos la demostracion del Teorema 1 de Turing y evitamos ası elresultado faltante. En vez de basarnos en la Definicion 4 de normalidad lo hacemosen la Definicion 3, por lo que requerimos una cota para la cantidad de palabras deuna longitud dada en la que un dıgito dado aparece en defecto o en exceso respectode la cantidad de veces esperada. Esta cota se prueba en el Lema 8 de esta seccion.Observaremos que la cota obtenida en el Lema 8 es apenas mayor que la utilizadapor Turing instanciada para dıgitos (bloques de longitud 1).

Definicion 5. Sea t ∈ N, t > 1, n ∈ N0, R ∈ N y γ una palabra en base t.Definimos N(t, γ, n,R) como el numero de palabras en base t de longitud R, enlas que γ ocurre exactamente n veces (incluyendo superposiciones, si las hubiera).

A modo de ejemplo, las siguientes tablas muestran la cantidad de aparicionesdel dıgito 0 y la palabra 11 para cada cadena binaria de longitud 3 y los valoresde N(t = 2, γ = 0, n,R = 3) y N(t = 2, γ = 11, n,R = 3), respectivamente.

Palabra γ = 0 γ = 11000 3 0001 2 0010 2 0011 1 1100 2 0101 1 0110 1 1111 0 2

n N(2, 0, n, 3) N(2, 11, n, 3)0 1 51 3 22 3 13 1 0

Como ya dijimos, Turing da una cota para la cantidad de palabras de unalongitud dada en las que un bloque de dıgitos dado aparece en exceso o en de-fecto respecto de la cantidad esperada. En particular, la cota de Turing se puedeinstanciar para bloques de longitud 1, es decir, para un dıgito. Se puede ver facil-mente, que la cantidad media de apariciones de cualquier dıgito d en una palabrade longitud R en base t es R/t. La cota de Turing instanciada para dıgitos, es lasiguiente:

5

Misterioso Lema 6 (Turing). Sea t ∈ N, t > 1 y ∀d dıgito en base t. ∀R ∈N, k ∈ R tales que: kt

R < 0.3:∑n:|n−R/t|>k

N(t, d, n,R) < 2tRe−k2t4R

Damos ahora el siguiente Lema 8 que usaremos en lugar del no demostradoMisterioso Lema 6. Este Lema surgio de completar los detalles faltantes y expresarconvenientemente el Lema 1.1 de Harman [7] .

Observacion 7. Por un argumento elemental de combinatoria,

N(t, d, n,R) =(

Rn

)(t− 1)R−n

Lema 8. Sea t ∈ N, t > 1. Sea d un dıgito en base t. Para todo R ∈ N, ε ∈ R talesque 6

R ≤ ε ≤ 1t : ∑

|n−R/t|>εR

N(t, d, n,R) < 2 (1− εt/3)bεR/2c tR.

Demostracion.

∑|n−R

t |>εR

N(t, d, n,R) ≤bR

t−εRc∑

n=0

N(t, d, n,R) +R∑

n=bRt+εRc

N(t, d, n,R)

Sea Y =∑bR

t−εRc

n=0 N(t, d, n,R) =∑bR

t−εRc

n=0

(Rn

)(t− 1)R−n.

Claramente, ∀R :∑R

n=0

(Rn

)(t− 1)R−n = tR.

Sea an =(

Rn

)(t − 1)R−n los terminos en la suma Y . Sabemos que para todo

n menor que bRt c, los terminos son estrictamente crecientes. Esto es, an < an+1 o

anan+1

< 1 .

6

an

an+1=

(Rn

)(t− 1)R−n(

Rn + 1

)(t− 1)R−n−1

=(n + 1)(t− 1)

R− n

y reemplazando n = bRt − θc, con θ > 0

=(t− 1)(bR

t − θc+ 1)R− bR

t − θc

≤(t− 1)(R

t − θ + 1)R− R

t + θ

= 1− tθ − t + 1R− R

t + θ

= 1− t(θ − 1) + 1R(1− 1/t) + θ

para θ ≤ Rt

< 1− t(θ − 1)R

para θ ≥ εR/2

≤ 1− εt

2+

t

R

Usando las hipotesis: 6R ≤ ε ≤ 1

t tenemos que para cada n tal que 0 ≤ n < Rt −εR/2

an

an+1≤ 1− εt

3< 1

Damos ahora una cota superior para Y “desplazando la suma hacia la derecha”bεR/2cposiciones. Usamos que para cada 0 ≤ n ≤ R

t − εR,

an =an

an+1

an+1

an+2. . .

an+bεR/2c

an+bεR/2c+1an+bεR/2c+1 < (1− εt

3)bεR/2can+bεR/2c+1

Y =bR

t−εRc∑

n=0

an <

bRt−εRc∑

n=0

(1− εt

3)bεR/2cabεR/2c+n+1

= (1− εt

3)bεR/2c

bRt−εRc∑

n=0

abεR/2c+n+1

< (1− εt

3)bεR/2ctR (porque

R∑n=0

an = tR)

7

La misma cota se obtiene para Z =∑R

n=bεR+RtcN(t, d, n,R) de la siguente

manera. Sean an los terminos en esa suma. Sabemos que ∀n > bRt c+1, an > an+1,

o sea que los terminos son estrictamente decrecientes, y an+2

an+1< an+1

an. Demos una

cota para estos cocientes:

an+1

an=

(R

n + 1

)(t− 1)R−n−1(

Rn

)(t− 1)R−n

=R− n

(n + 1)(t− 1).

y reemplazando n = bRt + θc, con θ > 0

=R− bR

t + θc(t− 1)(bR

t + θc+ 1)

≤R− R

t − θ + 1(t− 1)(R

t + θ)

=(t− 1)(R

t + θ)− tθ + 1(t− 1)(R

t + θ)

= 1− (tθ − 1)(t− 1)(R

t + θ)

< 1− θRt + θ

El mayor de los cocientes de la forma an+1

an, cuando n >= bR

t + θc, y con

εR/2 ≤ θ ≤ R − Rt es:

abRt +θ+1c

abRt +θc

para θ = εR2 . Por lo tanto, usando la hipotesis

ε ≤ 1t obtenemos:

1− θRt + θ

= 1− εR/2Rt + εR/2

= 1− ε

2/t + ε≤ 1− εt

3

Ahora damos una cota superior para Z desplazando la suma a la izquierda bεR/2cposiciones.

an =an

an−1

an−1

an−2. . .

an−bεR/2c+1

an−bεR/2can−bεR/2c < (1− εt

3)bεR/2can−bεR/2c

8

Z =R∑

n=bRt+εRc

an <R∑

n=bRt+εRc

(1− εt

3)bεR/2can−bεR/2c

= (1− εt

3)bεR/2c

R∑n=bR

t+εRc

an−bεR/2c

< (1− εt

3)bεR/2ctR (porque

R∑n=0

an = tR)

Ahora definiremos una serie de conjuntos que capturaran los numeros realesdel intervalo (0,1) candidatos a ser absolutamente normales, y veremos algunasproposiciones que acotan las medidas de dichos conjuntos.

Recordemos la Def. 2, pero instanciada para dıgitos en lugar de palabras. Seaα un real del intervalo (0, 1), d un dıgito en base t. S(α, t, d,R) es el numero deocurrencias de d en los primeros R dıgitos despues del punto decimal, en la expre-sion de α en base t.

Diremos que s es candidata a ser absolutamente normal cuando la cantidad deapariciones de d en s (denotada con n) esta “cerca”de la media.

Para probar que casi todos los reales en el intervalo [0, 1] son absolutamente nor-males, probaremos que hay “pocos” reales, en el sentido de la teorıa de la medida,que son candidatos a no ser absolutamente normales. Toda vez que nos refiramosa la medida de un conjunto X, estaremos hablando de la medida de Lebesgue, ylo notaremos µ (X).

El resultado dado en el lema 8 muestra que podemos acotar superiormente lacantidad de palabras en base t de longitud R, que son candidatas a no ser absolu-tamente normales.

Definicion 9. Sea t ∈ N, t > 1, d un dıgito en base t, R ∈ N, ε ∈ R.Llamaremos B(ε, d, t, R) al conjunto de reales α ∈ (0, 1) tales que

|S(α, t, d,R)− R

t| < εR

Informalmente, los reales del conjunto B(ε, γ, t, R) seran los candidatos a ser nor-males en base t. La siguiente Proposicion acota inferiormente la medida de talescandidatos.

9

Proposicion 10. Sea t ∈ N, t > 1, y sea d un dıgito en base t. Para todo R ∈N, ε ∈ R tales que: 6

R ≤ ε ≤ 1t :

µ (B(ε, d, t, R)) > 1− 2(1− εt

3)b

Rε2c

Demostracion. La medida de los α ∈ (0, 1) tales que sus primeros R dıgitos de suexpresion fraccionaria en base t corresponden a una secuencia dada, es t−R.

Luego,

µ

({α ∈ (0, 1) : |S(α, t, d,R)− R

t| ≥ εR}

)= t−R

∑|n−R

t|≥εR

N(t, d, n,R)

y por el Lema 8, tenemos:

µ (B(ε, d, t, R)) = µ

({α ∈ (0, 1) : |S(α, t, d,R)− R

t| < εR}

)> 1− 2(1− εt

3)b

Rε2c

Definimos A(ε, T, R) como el conjunto de reales α ∈ (0, 1) que son candidatosa ser normales en toda base t tal que 2 ≤ t ≤ T :

Definicion 11. Sea T ∈ N, T > 1. Para todo R ∈ N, ε ∈ R :

A(ε, T, R) =T⋂

t=2

⋂d∈{0,...,t−1}

B(ε, d, t, R)

En la siguiente Proposicion acotamos inferiormente la medida de A(ε, T, R):

Proposicion 12. Para todo R ∈ N, T ∈ N, T > 1, ε ∈ R tales que: 6R ≤ ε ≤ 1

T :

µ (A(ε, T, R)) > 1− T (T + 1)− 2

eRε2−2ε

3

Demostracion. Tomando complemento, obtenemos las siguientes desigualdades:

µ ((0, 1) \A(ε, T, R)) = µ

T⋃t=2

⋃d∈{0,...,t−1}

(0, 1) \B(ε, d, t, R)

T∑t=2

∑d∈{0,...,t−1}

µ ((0, 1) \B(ε, d, t, R))

< (T (T + 1)− 2)(1− 2ε

3)b

Rε2c

< (T (T + 1)− 2)e−Rε2−2ε

3

10

La anteultima desigualdad surge de la Proposicion 10 y de la observacion de queel numero de conjuntos B(ε, d, t, R) que se intersecan es

∑Tt=2 t = T (T+1)−2

2 . Laultima proviene del hecho que ∀x > 0 y ∀y : (1 + y/x)x < ey.

Turing define los conjuntos Ak, especializando los conjuntos A para ciertosvalores de ε, T y R. En esta seccion, hacemos una variacion a esas asignaciones,dado que estamos trabajando con otra cota inicial.

Definicion 13. Ak es el conjunto A(ε, T, R) especializando ε = 1bk1/4c , T = bk1/4c

y R = k. Es decir,

Ak = A(1

bk1/4c, bk1/4c, k)

Proposicion 14. ∃k0 tal que, ∀k ≥ k0 tenemos

µ (Ak) ≥ 1− 1k(k − 1)

Demostracion. De la definicion de Ak y por la Proposicion 12, tenemos

µ (Ak) = µ

(A(

1bk1/4c

, bk1/4c, k))

> 1− bk1/4c(bk1/4c+ 1)− 2

e

k( 1

bk1/4c)2−2 1

bk1/4c3

Se puede ver con facilidad que ∃k1 ∈ N tal que, ∀k ≥ k1

µ (Ak) > 1− 2√

k

e√

k−23

Vemos ahora que ∃k0 ∈ N que cumple que ∀k ≥ k0:

2√

k

e√

k−26

≤ 1k(k − 1)

concluımos que: ∃k0 tal que, ∀k ≥ k0, µ (Ak) ≥ 1− 1k(k−1)

Desde aquı, k0 sera el determinado en la Proposicion 14

Definicion 15. Para cualquier natural k ≥ k0 y n ≥ 0, c(k, n) ⊆ (0, 1) se definede la siguiente manera:

c(k, n + 1) =

{(0, 1) si n = 0Ak+n+1 ∩ c(k, n) ∩ (βn, 1) si no

donde βn es un numero racional, elegido de forma tal que la medida de c(k, n + 1)es 1− 1

k + 1k+n+1 .

Si k < k0, definimos c(k, n) = c(k0, n).

De esta manera, c(k, n) es una interseccion finita de intervalos con extremosracionales, para cada k y n.

11

Observacion 16. Para n ≥ 0, siempre es posible encontrar βn, pues

µ (Ak+n+1 ∩ c(k, n)) ≥ 1− 1k

+1

k + n + 1.

para k ≥ k0. En efecto, si n = 0, µ (Ak+n+1 ∩ c(k, n)) = µ (Ak+n+1) ≥ 1 − 1k(k+1)

la propiedad claramente vale. Para n > 0,

µ ((0, 1) \ (Ak+n+1 ∩ c(k, n))) = µ (((0, 1) \Ak+n+1) ∪ ((0, 1) \ c(k, n)))≤ µ (((0, 1) \Ak+n+1)) + µ (((0, 1) \ c(k, n)))

≤ 1(k + n + 1)(k + n)

+1k− 1

k + n

=1k− 1

k + n + 1

de modo que

µ (Ak+n+1 ∩ c(k, n)) ≥ 1− 1k

+1

k + n + 1.

Definicion 17. Definimos Ec(k,n) como el conjunto c(k, n) habiendo removido lospuntos extremos de cada intervalo.

Terminamos esta seccion con la prueba del teorema principal, el Teorema 1 deTuring. Reescribimos el Teorema 1 con la funcion Ec(k,n) introducida en la defini-cion anterior. Aunque no es necesaria, la incluımos ya que Turing la utiliza en sudemostracion.

Demostracion del Teorema 1 de Turing . Tenemos que ver que para k ≥ k0,el conjunto

E(k) =⋂n≥1

Ec(k,n)

tiene medida 1− 1/k y contiene unicamente reales absolutamente normales.

La funcion c(k, n) es recursiva, de modo que los conjuntos Ec(k,n) tambien lo son.Observemos que µ

(Ec(k,n)

)= 1− 1

k + 1k+n+1 , para k ≥ k0. Ec(k,n+1) ⊆ Ec(k,n),

de modo que

µ (E(k)) = lımn→∞

µ(Ec(k,n)

)= lım

n→∞1− 1

k+

1k + n + 1

= 1− 1/k

Para ver que E(k) solo tiene reales absolutamente normales, vamos a ver quecualquier α ∈ E(k)(k > k0) es simplemente normal para toda base t (ver nota alpie en la Definicion 3).

12

Sea α ∈ E(k) y d ∈ {0, . . . , t− 1}.Probaremos que:

lımq→∞

S(α, t, d, q)q

=1t

α ∈ E(k) ⇒ α ∈ Ec(k,n)∀n ∈ N, n > 0⇒ α ∈ c(k, n),∀n(n > 0)⇒ α ∈ Ak+n+1∀n > 0

⇒ α ∈ A(1

bq1/4c, bq1/4c, q),∀q ≥ k + 2

Por la Definicion 11, ∀d (0 ≤ d ≤ t− 1);∀t(2 ≤ t ≤ bq1/4c) :(Notar que q > ko ⇒ 6

q ≤ ε = 1bq1/4c

α ∈ B(1

b√qc, d, t, q)

Por la Definicion 9, ∀d (0 ≤ d ≤ t− 1);∀t(2 ≤ t ≤ bq1/4c) :

|S(α, t, d, q)− q

t| < q

bq1/4c

⇒ |S(α, t, d, q)q

− 1t| < 1

bq1/4c

⇒ lımq→∞

|S(α, t, d, q)q

− 1t| = 0

⇒ α es simplemente normal en toda base t : (2 ≤ t ≤ bq1/4c),∀q ≥ k + 2⇒ α es absolutamente normal (definicion 3).

Con esto queda demostrado el Teorema 1 de Turing.

3.1. Comparando las cotas

Nos interesa comparar las cotas del Misterioso Lema 6 y la obtenida en el Lema8. Repetimos el Lema 8:

Sea t ∈ N, t > 1. Sea d un dıgito en base t. Para todo R ∈ N, ε ∈ R talesque 6

R ≤ ε ≤ 1t : ∑

|n−Rt|>εR

N(t, d, n,R) < 2 (1− εt/3)bεR/2c tR.

Usando que ∀y y ∀x > 0 : ((1 + y/x)x < ey , vemos que:

13

(1− εt/3)bεR/2c < e−εt3bεR/2c

< e−ε2Rt−2εt

6

La cota de Turing, es apenas menor que la cota obtenida del Lema 8, ya que:

2tRe−k2t4R < 2tRe−

ε2Rt−2εt6

si tomamos k = εR, porque

2tRe−ε2Rt

4 < 2tRe−ε2Rt−2εt

6

Turing da su cota para ktR < 0.3. Tomando k = εR, dice ε < 0.3

t , mientras quenuestra cota, pide 6

R ≤ ε < 1t .

14

4. Version fiel del Teorema 1 de Turing

En su manuscrito original Turing utiliza el siguiente resultado en la demostraciondel Teorema 1, y menciona que es posible probarlo, pero no da la demostracion.

Misterioso Lema 18. Sea t ∈ N, t > 1. Sea γ una palabra en base t, con | γ |= r.Si ktr

R < 0.3: ∑|n−Rt−r|>k

N(t, γ, n,R) < 2tRe−k2tr

4R

Dado que no pudimos reconstruir esta demostracion, la asumiremos comohipotesis en esta seccion.

Daremos ahora una version extendida para palabras de cualquier longitud, dela Definicion 9.

Definicion 19. Sea t ∈ N, t > 1, γ una palabra en base t con longitud r, R ∈N,∆ ∈ R.Llamaremos B(∆, γ, t, R) al conjunto de reales α ∈ (0, 1) tales que

| S(α, t, γ,R)−Rt−r |< R

∆tr

El primer paso en direccion a la demostracion del Teorema 1 de Turing, es lasiguiente proposicion, analoga a la Proposicion 10.

Proposicion 20. Sea t ∈ N, t > 1, γ una palabra en base t con longitud r,R ∈ N,∆ ∈ R. Si ∆−1 < 0.3:

m B(∆, γ, t, R) > 1− 2e−Rt−r

4∆2

Demostracion. Siguiendo la misma idea que en la demostracion de la Proposicion10, sabemos que:

µ (B(∆, γ, t, R)) = 1− t−R∑

|n−Rt−r|≥ R∆tr

N(t, γ, n, R)

Como ∆−1 < 0.3, por la Proposicion 18 tenemos

µ (B(∆, γ, t, R)) > 1− t−R2tRe−R2

∆2t2r tr

4R

= 1− 2e−Rt−r

4∆2 .

La definicion de A cambia levemente con respecto a la Definicion 11

15

Definicion 21. Sea T ∈ N, t > 1, L ∈ N, R ∈ N,∆ ∈ R.

A(∆, T, L, R) =T⋂

t=2

⋂1≤|γ|≤L

B(∆, γ, t, R)

Proposicion 22. La cantidad de conjuntos B(∆, γ, L,R) que aparecen en la defini-cion de A(∆, T, L, R) es a lo sumo TL+1.

Demostracion. No es difıcil de ver que el numero de conjuntos B(∆, γ, L,R) queaparece en

⋂|γ|≤L B(∆, γ, t, R) es

L∑i=1

ti =tL+1 − 1

t− 1.

Por lo tanto, el numero de estos conjuntos en A(∆, T, L, R) =⋂T

t=2

⋂|γ|≤L B(∆, γ, t, R)

esT∑

t=2

tL+1 − 1t− 1

≤ TL+1

(la ultima desigualdad sale sin problemas usando induccion en T ).

Probamos ahora un resultado similar a la Proposicion 12:

Proposicion 23. Sea T ∈ N, t > 1, L ∈ N, R ∈ N,∆ ∈ R.Si ∆−1 < 0.3:

µ (A(∆, T, L, R)) > 1− 2TL+1e−RT−L

4∆2

Demostracion. Tal como hicimos en la demostacion de la Proposicion 12, tomamoscomplemento, y obtenemos las siguientes desigualdades:

µ ((0, 1) \A(∆, T, L, R)) = µ

T⋃t=2

⋃1≤|γ|≤L

(0, 1) \B(∆, γ, t, R)

T∑t=2

∑1≤|γ|≤L

µ ((0, 1) \B(∆, γ, t, R))

< 2TL+1e−RT−L

4∆2 .

La ultima desigualdad sale de las proposiciones 20 y 22.

Tal como hicimos en la Definicion 13, asignamos valores para las variables ∆,T , L y R en A(∆, T, L, R). Turing utiliza otras asignaciones, (∆ = bk1/4c, T =be√

ln kc, L = b√

ln k − 1c, R = k) que comprobamos que no son apropiadas. Sinembargo, las asignaciones que utilizamos respetan que todos los parametros crecencon k y recorren todos los valores posibles, al igual que las utilizadas por Turing:

16

Definicion 24. Ak es el conjunto A(∆, T, L, R) especializando ∆ = bk1/8c, T =b(ln k)1/4c, L = b(ln k)1/4 − 1c y R = k. Es decir,

Ak = A(bk18 c, b(ln k)1/4c, b(ln k)1/4 − 1c, k)

Con estas especializaciones de ∆, T , L y R, podemos probar un resultadosimilar a la Proposicion 14.

Proposicion 25. Existe un k0 tal que ∀k ≥ k0

µ (Ak) ≥ 1− 1k(k − 1)

Demostracion. De la Definicion 24 y por la Proposicion 23, tenemos que para ksuficientemente grande

µ (Ak) = µ(A(bk

18 c, b(ln k)1/4c, b(ln k)1/4 − 1c, k)

)> 1− 2b(ln k)1/4cb(ln k)1/4−1c+1

e

k

4bk18 c

2b(ln k)1/4cb(ln k)1/4−1c

> 1− 2√

k

ek1/4

4

Tambien se puede ver que para k suficientemente grande,

1− 2√

k

ek1/4

4

> 1− 1k(k − 1)

.

Las definiciones 15 y 17 y la observacion 16 se siguen cumpliendo.

Demostracion del teorema 1 de Turing. Tenemos que ver que para k ≥ k0,el conjunto

E(k) =⋂n≥1

Ec(k,n)

tiene medida 1−1/k y contiene unicamente reales normales (de acuerdo a la Defini-cion 4 que usa Turing).

Para ver que este conjunto tiene medida 1 − 1/k, usamos los mismos argumen-tos que vimos en la seccion anterior.

Para ver que E(k) solo tiene reales normales, vamos a ver que cualquier α ∈E(k)(k > k0) es normal para toda base t.

17

Sea α ∈ E(k) y γ una palabra en base t, con | γ |= r. Probaremos que

lımq→∞

S(α, t, γ, q)q

=1tr

α ∈ E(k) ⇒ α ∈ Ec(k,n)∀n ∈ N, n > 0⇒ α ∈ c(k, n),∀n(n > 0)⇒ α ∈ Ak+n+1∀n > 0

⇒ α ∈ A(bq18 c, b(ln q)1/4c, b(ln q)1/4 − 1c, q),∀q ≥ k + 2

Por la Definicion 21,∀t(2 ≤ t ≤ b(ln q)1/4c);∀γ palabra en base t con | γ |= r y r ≤ b(ln q)1/4 − 1c:(Notar que q > ko ⇒ 1

∆ ≤ 0.3)

α ∈ B(1

bq1/8c, γ, t, q)

Por la Definicion 19,∀t(2 ≤ t ≤ b(ln q)1/4c);∀γ palabra en base t con | γ |= r :

|S(α, t, γ, q)− q

tr| < q

bq1/8ctr<

q

bq1/8c

⇒ |S(α, t, γ, q)q

− 1tr| < 1

bq1/8c

⇒ lımq→∞

|S(α, t, γ, q)q

− 1tr| = 0

⇒ α es normal (Definicion 4) en toda base t : (2 ≤ t ≤ b(ln q)1/4c),∀q ≥ k + 2.

Queda demostrado el Teorema 1 de Turing.

18

5. Una cota alternativa

En esta seccion, presentaremos una cota alternativa a la dada en el Lema 8.Este camino, fue propuesto por la Dra. Mariela Sued, a quien le agradecemosenormemente su aporte.

Si bien la cota que daremos aquı, no es mas fina que la que utilizamos en laSeccion 3, la incluiremos para dar otro enfoque al mismo problema y que tambiennos permite hacer la reconstruccion del Teorema 1 deTuring, en una manera simi-lar a la realizada en la seccion 3.

La notacion utilizada en esta seccıon, es la siguiente: P (x) es la funcion de Prob-abilidad, E(x) es la esperanza matematica, y B(n,p) representa la funcion de dis-tribucion binomial, donde n representa el numero de pruebas y p la probabilidadde exito en cada prueba.

Para desarrollar esta cota, utilizaremos el siguiente resultado, cuya demostracionse encuentra en el libro de D.Pollard [8] (Hoeffding’s Inequality y Corollary 3, pag191/192):

Proposicion 26 (Desigualdad de Hoeffding). Sean Y1, Y2, ..., YR variablesaleatorias independientes, con media 0 y rangos acotados: ai ≤ Yi ≤ bi. Paracada k real, k > 0

P (Y1 + ... + YR ≥ k) ≤ e−(2k2/∑R

i=1(bi−ai)2)

Corolario 27. Bajo las mismas condiciones que la Proposicion anterior, se cumpleque:

P (| Y1 + ... + YR |≥ k) ≤ 2e−(2k2/∑R

i=1(bi−ai)2)

La siguiente proposicion, demuestra la cota alternativa, que presentamos enesta seccion:

Proposicion 28. Sea t ∈ N, t > 1. Sea d un dıgito en base t.∑|n−R

t|>k

N(t, d, n,R) < 2tRe−2k2

R

Demostracion. Se puede ver que: N(t,d,n,R)tR

tiene distribucion Binomial de para-metros: B(R, 1/t). En este modelo, cada prueba representa la ocurrencia o no ded, en cada uno de los R dıgitos de cada palabra. De esta manera, las pruebasson independientes, (el hecho que aparezca d en una posicion dada, no afecta laprobabilidad de que aparezca en las siguientes) y la probabilidad de exito de cadaprueba es 1/t.

19

Sean Xi variables aleatorias independientes, con distribucion Binomial de parame-tros: B(1, 1/t). De esta manera, vemos que:

∑Ri=1 Xi = n y E(Xi) = 1/t

Cada Xi representa a cada una de las R pruebas involucradas en N(t,d,n,R)tR

Ahora definimos: Yi variables aleatorias independientes, de la siguiente manera:Yi = Xi − 1/tObservemos que:ai = −1/t ≤ Yi ≤ bi = t−1

t y E(Yi) = (−1/t) t−1t + 1/t t−1

t = 0

Vemos que:∑R

i=1 Yi =∑R

i=1(Xi − 1/t) = n − Rt y tambien que: E(

∑Ri=1 Yi) =∑R

i=1 E(Yi) = 0 y∑R

i=1(bi − ai)2 = R

Usando el Corolario 27 (que se deduce la desigualdad de Hoeffding, Prop.26),obtenemos:

P (| n− R

t|> k) ≤ 2e

−2k2

R

con lo que:∑

|n−Rt|>k N(t, d, n,R) < 2tRe−

2k2

R

A continuacion, veremos que esta cota es mayor que la que la obtenida en ellema 8, (y por lo tanto, mayor que la utilizada por Turing, como vimos en la sec-cion 3). Recordemos la cota del Lema 8:

Sea t ∈ N, t > 1. Sea d un dıgito en base t. Para todo R ∈ N, ε ∈ R talesque 6

R ≤ ε ≤ 1t : ∑

|n−Rt|>εR

N(t, d, n,R) < 2 (1− εt/3)bεR/2c tR.

Si tomamos k = εR, estamos sumando los mismos terminos, y podemos ver que:

2 (1− εt/3)bεR/2c tR < 2tRe−2k2

R ⇔ (1− εt/3)bεR/2c < e−2k2

R

Luego, usando que ((1 + y/x)x < ey, ∀x > 0, vemos que:

(1− εt/3)bεR/2c < e−εt3bεR/2c < e−

ε2Rt−2εt6

Como k = εR, vemos que:

e−ε2Rt−2εt

6 < e−2k2

R ⇔ e−ε2Rt−2εt

6 < e−2ε2R ⇔ ε2Rt− 2εt

6> 2ε2R ⇔ εR >

2t

t− 12Y como la cota del lema 8, vale para ε ≥ 6/R, esta cota es mejor para todo t tal que:

6 >2t

t− 12, o sea,∀t > 18

20

Por lo tanto, para la mayor parte de los casos, la cota del Lema 8 se comportamejor que la dada aquı.

21

6. Conclusiones

El interes del Teorema 1 es el hecho de que da una construccion recursiva parademostrar que el conjunto de numeros normales tiene medida de Lebesgue igual a 1.

A pesar de que no hemos conseguido reconstruir la demostracion del teorema conla estrategia original de Turing, nuestra estrategia tambien da una construccionrecursiva.

Cabe senalar que las notas del editor ([11], pp. 263-365) sobre el manuscrito origi-nal son insuficientes para la comprension del trabajo, inclusive, hay algunas notasincorrectas.

Con esta tesis, hemos conseguido identificar las herramientas utilizadas por Turingen la demostracion del Teorema 1. Creemos que es posible dar una demostraciondel Misterioso Lema en su version basada en palabras, cambiando levemente la co-ta dada por Turing. Y por supuesto, queda por estudiar el Teorema 2, el algoritmopara generar numeros normales, que utiliza la construccion del Teorema 1.

22

Referencias

[1] V. Becher, S. Figueira. An example of a computable absolutely normal number,Theoretical Computer Science, Vol.270, pp. 947-958, 2002.

[2] E. Borel. Les probabilites denombrables et leurs applications arithmetiques.Rend. Circ. Mat. Palermo, 27:247–271, 1909.

[3] David H. Bailey and Richard E. Crandall. On the Random Character of Fun-damental Constant Expansions, Experimental Mathematics, vol. 10, no. 2 , pp.175-190, 2001.

[4] David H. Bailey and Richard E. Crandall. Random Generators and NormalNumbers, Experimental Mathematics, vol. 11, no. 4 , pp 527-546, 2004.

[5] J. Borwein, D. Bailey, Mathematics by Experiment: Plausible Reasoning in the21st Century. Natick, MA: A. K. Peters, p. 143, 2003.

[6] G. Chaitin. A Theory of Program Size Formally Identical to InformationTheory, Journal of the ACM (JACM), v.22 n.3, p.329-340, July 1975.

[7] G.Harman. Metric Number Theory. London Mathematical Society Mono-graphs. Oxford Universaity Press, 1998.

[8] D. Pollard, Convergence of Stochastic Processes. Springer Verlag New York,1984.

[9] M. W. Sierpinski. Demonstration elementaire du theoreme de M. Borel sur lesnombres absolument normaux et determination effective d’un tel nombre. Bull.Soc. Math. France, 45:127–132, 1917.

[10] M. W. Sierpinski. Elementary Theory of Numbers, Warszawa, 1964.

[11] A. Turing. A Note on Normal Numbers. Collected Works of Alan M. Turing,Pure Mathematics, edited by J. L. Britton, pp. 117-119. North Holland, 1992.

23

7. Apendice 1

Manuscritos Originales de A.M.Turing

24

8. Apendice 2

Version transcripta por J.L.Britton

43