Aplica»c~ao da Teoria dos Grupos µa...

46
Aplica¸c˜ ao da Teoria dos Grupos `a F´ ısica J.N.Urbano Ano lectivo de 2006/2007

Transcript of Aplica»c~ao da Teoria dos Grupos µa...

Aplicacao da Teoria dos Grupos a Fısica

J.N.Urbano

Ano lectivo de 2006/2007

Capıtulo 1

Introducao aos princıpios de simetria

1.1 Transformacoes e princıpios de simetria

As transformacoes de simetria sao mudancas de pontos de vista que nao alteram nemas leis teoricas do comportamento dos sistemas fısicos, nem as respectivas verificacoesexperimentais.

Uma transformacao tanto pode incidir sobre o proprio sistema que e observado sem ecom a pertinente alteracao, como sobre o referencial e os respectivos meios de observacao.No primeiro caso diz-se que estamos em presenca duma transformacao activa (incide sobreo observado), no segundo duma transformacao passiva.

Ha transformacoes de simetria que so podem ser realizadas passivamente. Por exem-plo, se certas propriedades dum sistema forem simetricas relativamente a inversao dotempo, nao existe maneira de realizar esta transformacao activamente, ela tem de serrealizada ao nıvel das estruturas matematicas que representam os observaveis, invertendoo sentido do eixo do tempo.

A mudanca do sentido do tempo e um exemplo duma trasformacao que nao podeser realizada continuamente a partir da transformacao identidade, ou seja, da nao-transformacao. Ha outras transformacoes do mesmo generos, tal como a que consisteem inverter o sentido dos eixos das coordenadas espaciais ou o sinal das cargas electricas.Todas estas transformacoes apenas podem ser realizadas passivamente. Mas aquelas quepodem ser realizadas continuamente a partir da transformacao identidade, podem se-lotanto passiva como activamente. Assim, por exemplo, a transformacao, activa para umobservador, que leva um sistema fısico de um estado de repouso para um estado comvelocidade ~v uniforme, pode ser tambem realizada passivamente actuando, nao sobre osistema fısico, mas sobre o sitema de observacao, imprimindo-lhe a velocidade −~v. Defacto, as estruturas matematicas E e E ′ com que o observador O descreve, respectiva-mente, o sistema fısico F e o sistema fısico F ′ em tudo semelhante a F excepto que

1

2 CAPITULO 1. INTRODUCAO AOS PRINCIPIOS DE SIMETRIA

se move relativamente a este com velocidade ~v uniforme, sao as mesmas com que osobservadores O e O′, respectivamente, descrevem o sistama fısico F , usando sistemas deobservacao em tudo identicos, excepto que o do observador O′ se desloca com velocidade−~v relativamente ao de O.

Quando as propriedades dos sistemas fısicos sao simetricos (ou invariantes, o quesignifica a mesma coisa) relativamente a todas as transformacoes duma certa classe,dizemos que estamos em presenca dum princıpio de simetria restrito a essa classe.

1.2 Importancia dos princıpios de simetria

Ha princıpios de simetria sem os quais a Fısica nao seria possıvel. Outros ha que a tornammais simples. Todos eles limitam a classe de leis possıveis, podendo por isso assumir umpapel determinante na construcao de novas teorias.

Na verdade, a Fısica e um sistema (que se pretende) coerente de teorias e de metodose processos de observacao,experimentacao, validacao e generalizacao.

As teorias fısicas sao representacoes matematicas da natureza sugeridas pela ob-servacao e pela reflexao, e validadas pela observacao e pela experimentacao, de acordocom os criterios do metodo cientıfico moderno.

As teorias fısicas sao constituıdas: por estruturas matematicas, que representamos constituintes, as interaccoes entre os constituintes, as accoes do exterior sobre e asgrandezas fısicas do sistema em estudo; por equacoes que relacionam entre si as estru-turas matematicas que representam as grandezas fısicas, traduzindo dessa forma as leisda natureza; e ainda por codigos de regras de correspondencia entre o ”mundo real”dosobjectos observados e o ”mundo virtual”das suas imagens matematicas.

A observacao pressupoe a utilizacao de aparelhos de medida que fornecem conjuntosde numeros reais. Sempre que possıvel, a observacao e realizada laboratorialmente, sobcontrole.

O objectivo da Fısica e estabelecer relacoes de nexo causal entre os conjuntos denumeros obtidos nas observacoes, atraves de equacoes que relacionam entre si as es-truturas matematicas que representam as grandezas observaveis do sistema fısico cujocomportamento fenomenologico se pretende conhecer. Entre essas relacoes destacam-seas equacoes de movimento.

As equacoes de movimento, associadas a um codigo de regras de correspondenciaadequado, permitem prever o resultado de medicoes efectuadas num certo instante, emfuncao do resultado das mesmas ou de outras medicoes efectuadas em instantes anteriores.Por outras palavras, permitem prever o comportamento futuro das partes do universoacessıveis a observacao, a partir do conhecimento do seu estado actual. Permitem tambem

1.2. IMPORTANCIA DOS PRINCIPIOS DE SIMETRIA 3

fazer conjecturas sobre o passado a partir do conhecemento do estado actual.

A validade duma teoria fısica mede-se pelo acerto das suas previsoes e pela variedadedos fenomenos a que podem ser aplicadas. A validade das teorias testa-se aumentando aprecisao das medicoes e alargando o ambito da sua aplicacao. Quando uma teoria falhaem qualquer destas condicoes, melhora-se, alterando ou acrescentando os seus ingredi-entes (ou seja, as respectivas estruturas matematicas). Em casos extremos, e necessarioinventar uma nova teoria, um processo que pode exigir o postulado dum novo codigointerpretativo. Mas as teorias assim melhoradas ou alteradas continuam a ser validasnos limites em que foram validadas pela observacao. E neste sentido que se pode dizerque, contrariamente aos outros tipos de saber, o conhecimento cientıfico experimental eacumulavel. A confianca que se tem actualmente no seu poder preditivo leva-nos tambema conjecturar sobre o passado do universo.

O conhecimento sobre o mundo fısico divide-se em duas partes distintas:

1 - O estado actual do mundo que nos rodeia.

2 - As teorias fısicas e as respectivas leis da natureza.

O estado actual desempenha o papel das condicoes iniciais que permitem encontrara evolucao mais provavel dentre a infinidade de possibilidades admitidas pelas teorias.

Ora a descoberta de correlacoes universais no aparente caos fenomenologico so setornou possıvel gracas a certas circunstancias que se verificam no mundo que nos estamais proximo, e que podem ou nao verificar-se nas regioes longıncuas do universo. Entreelas destacamos as seguintes:

A - A possibilidade de se separ o universo em partes, os chamados sistemas fısicosque, dentro de certos limites, se podem considerar independentes uns dos outros, peloque experiencias realizadas a distancias suficientemente grandes umas das outras devemproduzir resultados desconexos (Princıpio da decomposicao em agregados).

B - A possibilidade de se isolar, para cada sistema fısico, um conjunto manejavel decondicoes iniciais relevantes;

C - O facto das caracterısticas do movimento originado num conjunto particularde condicoes iniciais relevantes, serem independentes do local e do instante em queas condicoes iniciais sao realizadas (Princıpio da homegeneidade do espaco e dotempo).

Sem a primeira destas circunstancias, so faria sentido observar o Universo no seutodo, o que tornaria a sua observacao impossıvel. Sem a segunda, as teorias fısicas quefossem eventualmente formuladas seriam inuteis, dada a ambiguidade das suas previsoes.Finalmente, sem a ultima cada observador teria de descobrir as suas proprias leis, o queimpossibilitaria a comunicacao dos cientistas entre si e com os das geracoes passadas efuturas, pondo em causa aquela que e talvez a mais importante caracterıstica da ciencia

4 CAPITULO 1. INTRODUCAO AOS PRINCIPIOS DE SIMETRIA

experimental, a saber a acumulabilidade do conhecimento.

O Princıpio da homogeneidade do espaco e o princıpio da homegeneidade do temposao dois exemplos de princıpios de simetria basilares que tornam a Fısica possıvel. Mas,alem de ser homogeneo, o espaco e tambem isotropico. Na verdade, a experiencia permiteconcluir que a orientacao de um sistema fısico no espaco - determinada, por exemplo,pela sua orientacao relativamente as estrelas fixas - e irrelevante para o seu comporta-mento. Este facto designa-se por Princıpio da isotropia do espaco , que pode tambemenunciar-se dizendo que o comportamento dos sistemas fısicos - tal como e observado apartir de experiencias que preparam as condicoes iniciais e que comprovam os estadosque delas evoluem - pode depender da orientacao relativa dos sistemas de preparacao ede deteccao, mas nao da sua rotacao como um todo no espaco. A isotropia do espaco eum exemplo dos princıpios de simetria que tornam a Fısica mais facil, pelas leis geraisde conservacao que permitem enunciar, sem necessidade de se conhecerem as solucoesparticulares das equacoes de movimento.

Alem disso, ha muitas situacoes em que se conhecem ou se julga conhecer as equacoesde movimento, mas em que estas sao intrataveis matematicamente. Pode entao acon-tecer que determinados princıpios de simetria permitam classificar as solucoes possıveis,excluindo certas famılias. Estas regras de exclusao chamam-se regras de seleccao eregras de super-seleccao, e tem-se revelado de grande utilidade no descoberta dosconstituintes ultimos do universo.

Finalmente, quando existe um princıpio de simetria, varias leis da natureza sao invari-antes relativamente ao mesmo tipo de transformacoes. E, tal como uma lei correlacionavarios fenomenos, um princıpio de simetria estabelece relacoes entre varias leis da na-tureza. Como consequencia, os princıpios de simetria restrigem grandemente a classedas leis possıveis, aspecto este que se torna particularmente util quando se pretendemconstruir teorias novas.

Os tres princıpios de simetria ja enunciados - a saber: o da homogeneidade e isotropiado espaco, e o da homogeneidade do tempo - referem-se todos a propriedades estrutu-rantes da representacao matematica do espaco e do tempo. Mas ha princıpios de simetriaque nada tem a ver com a geometria do espaco-tempo e que sao igualmente importantes.Estao neste caso,para dar apenas dois exemplos, a simetria que existe entre as cargaspositivas e negativas da Electrodinamica e a simetria entre as tres cores fundamentais daCromodinamica Quantica.

1.3 Postulados das Invariancias

Ao nıvel macroscopico, que e o ambito de aplicacao da Fısica Classica, o conceito deinvariancia pode explicitar-se rigorosamente com a ajuda do conceito de descricao com-pleta de um sistema fısico . Esta descricao completa consiste na especificacao das

1.3. POSTULADOS DAS INVARIANCIAS 5

trajectorias de todas as partıculas e na descricao completa de todos os campos em todosos pontos do espaco e em todos os instantes do tempo. As equacoes de movimento per-mitem entao determinar se uma dada uma descricao completa e compatıvel com elas, istoe, fornecem um criterio para saber se se o sistema fısico poderia ter evoluıdo da maneiraespecificada pela descricao completa.

Segundo Haag, em monografia nao publicada, mas citada por E. P. Wigner(1956),uma invariancia origina tres postulados:

I Postulado. - E sempre possıvel transcrever uma descricao completa dum sistemafısico de um sistema de coordenadas para todos os sistemas de coordenadas equivalentes.

II Postulado. - A transcricao de uma descricao dinamicamente possıvel deve sertambem dinamicamente possıvel.

III Postulado. - Os criterios de possibilidade dinamica de uma descricao completadevem ser identicos para observadores equivalentes.

O I Postulado implica que e sempre possıvel relacionar entre si as coordenadas espaco-temporais dos componentes dum sistema fısico em referenciais equivalentes e que, usandoessas relacoes, se sabe transcrever as estruturas matematicas das teorias fısicas perti-nentes a descricao do comportamento do sistema considerado, de um referencial paraqualquer outro equivalente.

O II Postulado significa que uma sucessao de acontecimentos que parecem possıveispara um observador, devem parecer tambem possıveis para qualquer outro observador.

O III Postulado equivale a dizer que as equacoes de movimento devem apresentar-secom a mesma forma para diferentes observadores equivalentes.

Quando se passa para o ambito da Fısica Quantica, o 10 Postulado mantem-se talqual, com as necessarias adaptacoes. Concretamente, ele implica que existe uma corre-spondencia bem definida entre as designacoes atribuıdas aos pontos x do espaco-tempopor cada um dos observadores equivalentes, entre os raios R com que cada um delesdescreve os estados de um dado sistema fısico, e entre os operadores A com que repre-sentam os observaveis desse sistema. Particularizando, para dois observadores O e O′ asreferidas correspondencias podem exprimir-se da seguinte forma:

xO ←→ xO′

RO ←→ RO′

AO ←→ AO′

No caso do princıpio de simetria nao se referir a propriedades do espaco-tempo, aprimeita destas correspondencias nao se aplica, mas mantem-se as duas seguintes.

O II Postulado e formulado em termos de probabilidades de transicao. Se um sistemaesta num estado representado pelo raio Ri e se se realiza uma experiencia para verificar

6 CAPITULO 1. INTRODUCAO AOS PRINCIPIOS DE SIMETRIA

em qual dos diferentes estados representados pelos raios ortogonais R1 , R2 , ... ele vaiser encontrado, a probabilidade de ele ser encontrado no estado Rf e dada, de acordocom os postulados da Mecancia Quantica, por

P (Ri →Rf ) = |(Ψi, Ψf )|2, (1.3.1)

em que Ψi e Ψf sao dois vectores unimodulares quaisquer pertencentes aos raios Ri eRf , respectivamente. Agora, se um observador O ve um sistema no estado representadopor um raio R1 , ou R2 , ou ..., outro observador equivalente, O′,vera o mesmo sistemanum estado diferente, representado por um raio R′

1 , ou R′2 ou ..., respectivamente.

Mas, se houver um princıpio de simetria relativamente ao qual os dois observadores saoequivalentes, eles deverao fazer as mesmas predicoes sobre o resultado de uma experienciarealizada sobre o mesmo sistema fısico, isto e deverao achar as mesmas probabilidadesde transicao:

P (Ri →Rf ) = P (R′i → R′

f ). (1.3.2)

Repare-se que a condicao (1.3.2) e apenas uma condicao necessaria para que a trans-formacao dos raios seja de simetria. Outras condicoes serao discutidas mais tarde.

Note-se que um mesmo sistema fısico devera estar relacionado de maneira diferentecom dois observadores diferentes: o observador O atribuira o raio RO ao estado do sis-tema, enquanto que o obervador O′ descrevera esse mesmo estado fısico por um raiodiferente RO′ . Supoe-se, no entanto, que se dois sistema fısicos diferentes, S e S′ , seencontram identicamente relacionados com dois observadores distintos O e O′ ,respecti-vamente, isto e, se os valores dos observaveis de S medidos por O sao os mesmos que osvalores dos observaveis de S′ medidos por O′ , entao os dois observadores descreverao osestados dos respectivos sistemas pelo mesmo raio.

O II Postulado traduz-se pois matematicamente dizendo que se Ψ1 e Ψ2 sao doisvectores do espaco de Hilbert pertencentes respectivamente aos raios R1 e R2 com que oobservador O descreve dois estados dum sistema; e Ψ′

1 e Ψ′2 sao dois vectores pertencentes

respectivamente aos raios transformadosR′1 eR′

2 que o observador O′ atribui aos mesmosestados fısicos, entao deve verificar-se a seguinte igualdade:

|(Ψ1, Ψ2)|2 = |(Ψ′1, Ψ

′2)|2 (1.3.3)

Note-se que (Ψ1, Ψ2) e a amplitude de transicao entre os estados Ψ2 e Ψ1 .

O teorema de Wigner, cuja demonstracao apresentaremos na seccao 4, permite afirmarque entre os vectores do espaco de Hilbert que verificam a condicao (1.3.3) se podeestabelecer uma relacao de unitaridade ou de anti-unitaridade, isto e:

Ψ′ = U(O′, O)Ψ, (1.3.4)

em que U(O′, O) e um operador unitario ou anti-unitario que depende dos sistemas decoordenadas dos observadores O e O′.

1.4. COVARIANCIA, INVARIANCIA E CONSERVACAO 7

O III Postulado permite afirmar que que o operador U(O′, O) so depende da relacaoentre os sistemas de coordenadas - ou da transformacao entre os dois pontos de vista- enao dos particulares de cada um. Isto e, se o observador O′ estiver relacionado com oobservador O da mesma forma que o observador O′′′ esta relacionado com o observadorO′′ , entao

U(O′′′, O′′) ≡ U(O′, O).

Por exemplo, designado genericamente por L a relacao entre as coordenadas espaco-temporais usadas por dois observadores, isto e

x′µ = Lµνx

ν ; µ, ν = 0, 1, 2, 3,

entao o operador U depende apenas de L e nao dos sistemas de coordenadas em simesmos:

U = U(L).

1.4 Covariancia, Invariancia e Conservacao

O princıpio da homogeneidade do espaco e do tempo traduz-se matematicamente na co-variancia das equacoes que representam as leis, relativamente a deslocamentos da origemdos eixos das coordenadas e da origem do tempo:

xi → x′i = xi − ai; i = 1, 2, 3;

et → t′ = t− τ,

respectivamente. No primeiro conjunto de equacoes de transformacao, o trivector (a1, a2, a3)do espaco euclideano ordinario representa a posicao deslocada da origem dos eixos carte-sianos relativamente a posicao inicial. Na equacao de transformacao do tempo, τ e umreal qualquer que representa o tempo marcado no relogio do sistema inicial quando seiniciou a contagem dos tempos no sistema deslocado.

Por sua vez, o princıpio da isotropia do espaco traduz-se na covariancia das equacoesa rotacoes dos eixos cartesianos:

x′i = Rijxj; i, j = 1, 2, 3,

em que R = [Rij] e uma matriz de rotacao, isto e um elemento do grupo SO(3) dosautomorfismos do espaco afim euclideano E3.

Por covariancia entende-se a variacao conjunta das estruturas matematicas que rep-resentam tanto as grandezas fısicas como os estados dos sistemas, por tal forma quese mantem inalteradas as equacoes que as relacionam na formulacao das leis. As leisdizem-se entao invariantes relativamente as transformacoes da simetria considerada.

8 CAPITULO 1. INTRODUCAO AOS PRINCIPIOS DE SIMETRIA

As leis duma teoria incluem as que determinam a variacao com o tempo dos ob-servaveis e dos estados. A existencia dum princıpio de simetria pode manifestar-setambem pela conservacao do valor de alguns dos observaveis dos sistemas. Assim, ahomegeneidade do tempo implica a conservacao da energia, a homogeneidade do espacotem como consequencia a conservacao do momento linear e a invariancia rotacional originaa conservacao do momento angular, quaisquer que sejam os sitemas em estudo. A relacaoentre um princıpio de simetria e os observaveis que se conservam faz-se, no caso das trans-formacoes de simetria constituirem grupos contınuos, atraves de objectos matematicosdesignados por geradores da algebra do respectivo grupo.

1.5 Quebra explıcita e espontanea de simetria

Quando a interaccao dum sistema fısico com o resto do universo nao e desprezavel epode descrever-se por intermedio de um campo de forcas exteriores, um sistema podenao apresentar todas as simetrias que possuiria se estivesse isolado, isto e, sujeito apenasas interaccoes dos seus constituintes. Diz-se entao que ha quebra explıcita de simetriamotivada pelo efeito das accoes externas.

Por outro lado, existem teorias cujas equacoes fundamentais possuem certas sime-trias, mas em que estas nao sao partilhadas pelas solucoes das equacoes. Isto e, emque uma solucao particular e um elemento dum conjunto de solucoes que correspondema equilıbrios alternativos, que nao sao em si mesmo simetricos, mas que estao simet-ricamente relacionados uns com os outros. Diz-se, nestes casos, que ha uma quebraespontanea de simetria.

Rigorosamente, a simetria nao foi quebrada, encontra-se escondida . As simetriasescondidas ocorrem frequentemente nas manifestacoes experimentais dos campos ele-mentares, e sao mais difıceis de detectar do que aquelas que sao quebradas explicita-mente pela accao de forcas exteriores. Um exemplo que elucida bem esta diferenca e odo chamado ”demonio de Coleman”, um ser imaginario que, vivendo no interior dumferromagnete, nao se apercebe da existencia da simetria rotacional pelo facto dos spins seencontrarem todos alinhados numa determinada direccao. No entanto a simetria existe,manifestando-se no facto de todas as diferentes direccoes de alinhamento global dos spinsserem igualmente provaveis.

1.6 A Relatividade e a Estrutura do Espaco-Tempo

No que se segue, consideramos apenas a estrutura do espaco tempo das teorias nao rela-tivistas, classicas ou quanticas, e da Teoria Restrita da Relatividade. Nao nos referiremospor isso a estrutura do espaco-tempo da Teoria Geral da Relatividade.

1.6. A RELATIVIDADE E A ESTRUTURA DO ESPACO-TEMPO 9

O Princıpio Restrito da Relativiade estabelece que todos os sistemas de referenciagalileanos sao igualmente apropriados para formular as leis da natureza. De acordo comeste postulado, que se encontra empiricamente muito bem fundamentado, nao e possıvelsingularizar, por meio de experiencias de qualquer tipo, um sistema de referencia galileanorelativamente a qualquer outro sistema de referencia do mesmo tipo. Em particular, naoe possıvel ecolher um deles para definir o repouso e o movimento absolutos. Repouso emovimento sao assim conceitos relativos.

Um sistema de referencia galileano , ou um sistema inercial, como tambem saoconhecidos, e um sistema de coordenadas relativamente ao qual se verifica a lei deinercia, ou seja, relativamente ao qual um corpo sobre o qual nao actuam forcas continuanum estado de repouso ou em movimento uniforme numa linha recta. um corpo sobreo qual nao actuam forcas sistema de coordenadas relativamente ao qual um corpo sobreo qual nao actuam forcas nao esta acelerado: ou esta em repouso ou num estado demovimento retilıneo e uniforme.

A primeira vista, esta definicao e de fraca utilidade, ja que pressupoe que se podedeterminar se sobre um corpo de prova actuam ou nao actuam forcas. Esta questao naose poe paras as forcas de curto alcance, como e o caso das interaccoes fortes e fracas, etambem para as forcas electromagneticas porque, embora possuam alcance infinito, a suaaccao pode ser eliminada usando corpos de prova nao carregados e nao polarizados, oucriando escudos para o campo electromagnetico. Contudo, a accao dos campos gravıticosnao pode evitada, porque os corpos de prova sao acelerados independentemente da suamassa. No entanto a accao das forcas gravıticas pode ser minimizada considerando corpossuficientemente afastados de todos os outros. E que acontece, por exemplo, com o Sistemade Referencia Celeste Internacional ( ICRS – International Celestial Reference System),que foi definido em 1997 pela Uniao Astronomica Internacional (IAU – InternationalAstronomical Union) para refenciar os corpos celestes, cuja origem e o baricentro dosistem solar e as orientacoes dos eixos sao determinadas por estrelas fixas (de facto, porfontes de radiacao extra-galacticas).

A relatividade do repouso e do movimento foi enunciada por Galileu, a propositodo movimento de sistemas mecanicos. Opiniao contraria tinha Newton que defendeu aexistencia de um espaco e de um tempo absolutos. No entanto, nao ha nada na dinamiade Newton que obrigue a supor a existencia de um espaco absoluto, antes pelo contrario.De facto, como as forcas produzem aceleracao e nao velocidade, os sitemas de referenciarelativamente aos quais a sua lei de movimento e valida sao galileanos e nao e possıveldistinguir dinamicamente, entre os referenciais de inercia, aquele que estara em repousoabsoluto. O mesmo ja nao se passa com o tempo, pois este flui igualmente em todos ossistemas galileanos, tendo o conceito de simultaniedade de dois acontecimentos um valorabsoluto.

De acordo com o Princıpio da Relatividade de Galileu, os fenomenos mecanicos devemseguir o mesmo curso de desenvolvimento em todos os sistemas de inercia. Einstein esten-deu o princıpio da relatividade tambem a electrodinamica: ¿ ... tal como na Mecanica,

10 CAPITULO 1. INTRODUCAO AOS PRINCIPIOS DE SIMETRIA

tambem na Electrodinamica os fenomenos nao apresentam nenhuma particularidade quepossa fazer-se corresponder a ideia de repouso absoluto. Pelo contrario, em todos ossistemas de coordenadas em que sao validas as equacoes da Mecanica, tambem sao igual-mente validas as leis opticas e electrodinamicasÀ.

Assim, de acordo com o Princıpio Restrito da Relatividade de Einstein, observadoresinstalados em sistemas de inecia diferentes devem estabelecer as mesmas leis da naturezacomo resultado das suas experiencias.

As leis da natureza traduzem-se matematicamente por equacoes que relacionam entresi as estruturas matematicas que se usam para representar os observaveis e os estadosdos sistemas. A equivalencia dos varios sistemas de inercia traduz-se na invariancia dasleis e na covariancia das equacoes. Isto e, as estruturas matematicas que representamos observaveis podem apresentar aspectos diferentes em sistemas de inercia diferentes,mas esses aspectos variam da mesma forma quando se passa dum sistema de inerciapara outro, de tal modo que as relacoes entre as estruturas matematicas permaneceminalteradas, ou seja, as leis nao variam.

A teoria mecanica de Newton satisfaz o Princıpio da Relatividade em sistemas dereferencia espaco-temporais com as seguintes caracterısticas estruturantes:

a) Os acontecimentos ocorrem em pontos do espaco afim E3×T , em que E3 e o espacoafim euclideano das coordenadas cartesianas x, y e z, que podem ser medidas por reguas,e t e a coordenada de um espaco afim euclideano a uma dimensao, T , que pode sermedida por relogios sincronizados. O vector de posicao do ponto de E3 de coordenadasx, y e z designa-se por r ≡ (x , y , z ).

b) O hiper-espaco t = te que contem o acontecimento e = (re , te) separa o futurocausal do acontecimento e do seu passado causal. O futuro causal do acontecimento ee o conjunto dos acontecimentos que podem ser influenciados por e, ou seja, o domıniode E3 × T constituıdo pelos pontos x = (r, t) em que t > te. O passado causal doacontecimento e e o conjunto dos acontecimentos que podem influenciar e, ou seja, odomınio de E3 × T constituıdo pelos pontos x = (r, t) em que t < te.

c) As linhas rectas do genero temporal, isto e, as que nao estao contidas em hiper-planos t = const, representam movimentos livres.

d) Se um mesmo acontecimento ocorre no ponto x = (r, t) do sistema de inercia S eno ponto x′ = (r′, t ′) do sistema de inerica S ′, tem-se sempre

t′ = t (1.6.1)

er′ = r− vt , (1.6.2)

em que v e a velocidade do ponto O′ , origem das coordenadas espaciais de S ′, relativa-mente a origem O das coordenadas espaciais de S.

1.6. A RELATIVIDADE E A ESTRUTURA DO ESPACO-TEMPO 11

As equacoes (1.6.1) e (1.6.2)definem as transformacoes de Galileu. A equacao demovimento de Newton e covariante relativamente a transformacoes de Galileu.

Mas, como se sabe, nem todas as leis fısicas sao invariantes de Galileu. Por exemplo,as que governam os fenomenos electromagneticos nao o sao, o que se manifesta, porexemplo, no facto de nao se verificar a lei de adicao vectorial das velocidades que se deduzdas transformacoes de Galileu, quando aplicada a situacoes em que uma das parcelas ea velocidade da luz. Na verdade, verifica-se experimentalmente que a velocidade da luzno vacuo e independente da velocidade da fonte luninosa, facto que Einstein ergueu acategoria de postulado. Perante a incompatibilidade entre a teoria mecanica de Newtone a teoria electromagnetica de Maxwell no que respeita ao princıpio da relatividade,Einstein optou pela invariancia da teoria de Maxwell, deixando cair a empiricamente malfundada suposicao de que o conceito de simultaneidade, implıcita nas transformacoes deGalileu, tem um valor absoluto.

A estrutura matematica do espaco-tempo da teoria restrita da relatividade e umconsequencia directa da combinacao do postulado da invariancia da velocidade da luzcom a lei de inercia.

Segundo o Postulado da Invariancia da Velocidade da Luz, no vazio a luzpropaga-se em linha recta, a mesma velocidade em todas as direccoes, em todos os refer-enciais de inercia. Isto significa que se dois acontecimentos aparecem ligados por um raioluminoso para um observador dum referencial de inercia , propagando-se no vacuo, elesaparecem tambem ligados por um raio luminoso para observadores de quaisquer outrosreferenciais de inercia.

A fim de tirar as consequencias deste postulado, e conveniente comecarmos por fixara notacao que vamos usar. Assim, designamos por

x ≡ (x0, x1, x2, x3) ≡ (ct, x, y, z) ≡ (x0,x)

as coordenadas de um acontecimento pontual P num referencial de inercia S, e por

x′ ≡ (x′0, x′1, x′2, x′3) ≡ (ct′, x′, y′, z′) ≡ (x′0,x′)

as coordenadas do mesmo acontecimento pontual P no referencial inercial S ′. Nestasexpressoes, c designa a velocidade da luz no vacuo em qualquer referencial inercial (ela

e invariante), x = ~OP e o vector de posicao espacial do acontecimento P no sistema deeixos cartesianos do referencial inercial S (O e a origem desse sistema de eixos cartesianos

do referencial S), e x′ = ~O′P e o vector de posicao espacial do acontecimento P nosistema de eixos cartesianos do referencial inercial S ′ (O′ e a origem desse sistema deeixos cartesianos do referencial S ′).

Com estas notacoes, dois acontecimentos P e Q podem aparecer ligados no referencialinercial S por um raio luminoso propagando-se no vazio, se e so se, a distancia espacialentre os acontecimentos P e Q for igual a c vezes o modulo da sua distancia temporal,

12 CAPITULO 1. INTRODUCAO AOS PRINCIPIOS DE SIMETRIA

isto e, se e so se √(x− y)2 = c | t− t′ |,

ou ainda se e so se

(x0 − y0)2 = (x− y)2 (1.6.3)

Mas devido a invariancia da velocidade da propagacao da luz, se a anterior igualdade severifica no referencial inercial S, deve verificar-se a mesma igualdade em qualquer outroreferencial inercial S ′:

(x′0 − y′0)2 = (x′ − y′)2. (1.6.4)

Isto e, quando a eq.(1.6.3) se verifica, tambem tem de se verificar a eq.(1.6.4); e vice-versa. Esta propriedade, que resulta apenas da invariancia da velocidade da luz, restringeas possıveis relacoes entre as coordenadas espaco-temporais de dois acontecimentos ob-servados a partir de referenciais de inercia diferentes. Ela pode escrever-se na forma

(x0 − y0)2 − (x− y)2 = 0 ⇐⇒ (x′0 − y′0)2 − (x′ − y′)2 = 0. (1.6.5)

Introduzindo a matriz

G = [gµν ] =def≡

1 0 0 00 −1 0 00 0 −1 00 0 0 −1

(1.6.6)

a restricao (1.6.5) ainda se pode dar a forma

∑µ,ν

(xµ − yµ)gµ,ν(xν − yν) = 0 ⇐⇒ ∑

µ,ν

(x′µ − y′µ)gµ,ν(x′ν − y′ν) = 0 (1.6.7)

Exploremos agora as consequencias da lei de inercia para a estrutura do espaco-tempodas teorias relativistas. A Lei de Inercia diz que as partıculas livres de qualquer accaoexterior nao possuem aceleracao em referenciais de inercia. Isto e, se sao livres, ouestao paradas ou movem-se com velocidade rectilınea e uniforme. Resulta desta lei que,designado (x0, x1, x2, x3) as coordenadas espaco-temporais de uma partıcula livre numreferencial de inercia S, se deve ter

d2xk

d(x0)2= 0; k = 1, 2, 3. (1.6.8)

Mas a ausencia de aceleracao das partıculas livres verifica-se em qualquer sistema deinercia. Logo, designado por x′0, x′1, x′2, x′3) as coordenadas da mesma partıcula livrenoutro referencial inercial S ′, tambem se deve ter

d2x′k

d(x′0)2= 0; k = 1, 2, 3, (1.6.9)

1.6. A RELATIVIDADE E A ESTRUTURA DO ESPACO-TEMPO 13

Ou seja, quando a eq.(1.6.8) se verifica num qualquer referencial de inercia S, tambema eq.(1.6.9) se tem de verificar noutro qualquer referencial de inercia S ′; e vice-versa.Esta propriedade resulta apenas da lei de inercia e restringe tambem as possıveis relacoesentre as coordenadas espaco-temporais de dois acontecimentos observados a partir dereferenciais de inercia diferentes. Ele pode escrever-se na forma

d2xk

(dx0)2= 0; k = 1, 2, 3 ⇐⇒ d2x′k

d(x′0)2= 0; k = 1, 2, 3. (1.6.10)

Ve-se assim que o postulado da invariancia da velocidade da luz, por um lado, e a leide inercia, pelo outro, impoem restricoes as relacoes gerais

x = (x0, x1, x2, x3); =⇒ x‘′ = (x′0, x′1, x′2, x′3), (1.6.11)

entre as coordenadas dum mesmo acontecimento que e observado a partir de dois referen-ciais inerciais diferentes. As transformacoes que satisfazem essas resticoes, concretamentea eq.(1.6.7) e a eq.(1.6.10), sao aquelas que aplicam a forma diferencial

µ,ν=0,1,2,3

gµνdxµdxν ≡ (dx0)2 − (dx)2

num multiplo constante dela propria:

[∑

µ,ν=0,1,2,3

gµνdxµdxν ≡ (dx0)2 − (dx)2] = K [∑

σ,ρ=0,1,2,3

gσρdx′σdx′ρ ≡ (dx′0)2 − (dx′)2].

(1.6.12)De facto, esta condicao garante simultaneamente que quando nao ha aceleracao numreferencial, tabem nao a ha noutro, e que a luz se propaga com a mesma velocidade c emtodos os referenciais.

As transformacoes que satisfazem a condicao (1.6.12) com K = 1, ou seja, que satis-fazem a condicao

[∑

µ,ν=0,1,2,3

gµνdxµdxν ≡ (dx0)2 − (dx)2] = [∑

σ,ρ=0,1,2,3

gσρdx′σdx′ρ ≡ (dx′0)2 − (dx′)2].

(1.6.13)chamam-se transformacoes de Poincare. Como veremos mais tarde, o seu conjunto formaum grupo de transformacoes das coordenadas, o chamado Grupo de Poincare ou Grupode Lorentz nao homogeneo.

O postulado da invariancia da velocidade da luz atribui uma estrutura conformal (istoe, um campo de cones nulos) ao espaco-tempo da relatividade restrita; a lei de inerciada-lhe uma estrutura projectiva (uma famılia de linhas rectas). Em conjunto, estas duasestruturas primitivas definem a estrutura do espaco afim (o espaco das coordenadas) deMinkowski.

As transformacoes que satisfazem a condicao (1.6.12) com K 6= 1 formam o grupode Poincare aumentado por dilatacoes (ou contracoes). Embora haja aplicacoes em que

14 CAPITULO 1. INTRODUCAO AOS PRINCIPIOS DE SIMETRIA

se julga ser conveniente considerar dilatacoes na estrutura conformal (em espacos a duasdimensoes de certas teorias de padrao), elas nao possuem relevancia na estrutura doespaco-tempo a quatro dimensoes das teorias relativistas classicas e das teorias quanticasdos campos. Por esta razao apenas consideraremos transformacoes de coordenadas paraas quais ∑

µ,ν=0,1,2,3

gµνdx′µdx′ν =∑

µ,ν=0,1,2,3

gµνdxµdxν (1.6.14)

ou, equivalentemente,

gρσ =∑

µ,ν=0,1,2,3

gµν∂x′µ

∂xρ

∂x′ν

∂xσ; ρ, σ = 0, 1, 2, 3, (1.6.15)

Note-se esta ultima expressao nao representa uma equacao, mas sim um sistema de 16equacoes, tantas quantos os possıveis pares de valores de gρσ, embora algumas delas serepitam no sentido de conterem informacao ja contemplada noutras equacoes do sistema.

O princıpio restrito de relatividade postula a invariancia das leis fısicas e a covarianciadas equacoes que as representam, relativamente a transformacoes de Poincare.

Capıtulo 2

Grupos de Lie

2.1 Introducao

Os grupos constituem uma ferramenta matematica indispensavel para se explorarem asconsequencias fısicas da existencia de alguns dos mais importantes pricıpios de simetria,em particular os que sao formulados traves de automorfismos das estruturas matematicasque modelam o espaco-tempo. Exemplos importantes sao as translacoes espaciais e tem-porais, as rotacoes espaciais, e as transformacoes de Galileu, de Lorentz e de Poincare.

Os conceitos principais dos Grupos de Lie forma introduzidos em matematica por S.Lie(1842-1899) na decada de 70 do Sec. XIX. Os Grupos de Lie surgiram relacionadoscom o problema da solvabilidade das equacoes diferenciais por quadraturas, e com ainvestigacao de grupos de transformacoes contınuas. Foi o sucesso da aplicacao da teoriade grupos a resolucao de equacoes algebricas de ordens mais elevadas, que se manifestouna criacao da teoria de Galois, que levou a tentar-se uma aproximacao semelhante para asequacoes diferenciais. E, embora a posicao dos grupos na teoria das equacoes diferenciaisseja diferente da que tem na teoria das equacoes algebricas, essa tentativa levou a criacaodos grupos de Lie e tambem ao aprofundamento da teoria dos grupos algebricos.

Uma primeira investigacao sistematica da estrutura global dos grupos de Lie foi feitapor E. Cartan e H. Weyl. Uma primeira revisao moderna da teoria dos Grupos deLie deve-se a L. S. Pontryagin (Topological groups, Princeton University Press, 1958,traducao do russo).

Representando os grupos de Lie por operadores lineares do espaco de Hilbert dosestados quanticos e possıvel tirar conclusoes gerais sobre o comportamento dos sistemas,que dependem do princıpio de simetria a que o grupo diz respeito e nao dos detalhesda constituicao e da dinamica de cada sistema fısico em particular. Este metodo tem-serevelado tambem de grande importancia quando os princıpios de simetria sao enunciadosem termos de automorfismos nos espacos de variaveis quanticas sem analogia em fısica

15

16 CAPITULO 2. GRUPOS DE LIE

classica, tais como as rotacoes dos espacos do isospin, do sabor e da cor.

Fundamentalmente, um grupo de Lie e um conjunto provido de duas estruturas com-patıveis, a saber: a de grupo topologico e de variedade diferenciavel. Convem por issocomecar por definir estes dois conceitos.

2.2 Grupos algebricos

Um grupo e um sistema algebrico constituıdo por um conjunto e por uma operacaobinaria que verifica os axiomas de grupo. A operacao binaria chama-se ou multiplicacaoou adicao. No primeiro caso o grupo diz-se multiplicativo e no segundo diz-se aditivo. Poreconomia de espaco, apresentaremos a definicao e os axiomas dos grupos multiplicativose aditivos simultaneamente, comecando pelos grupos multiplicativos e escrevendo entreparenteses rectos o que se refere aos grupos aditivos.

Um grupo e um sistema algebrico G ≡< G, o >, constituıdo por um conjunto naovazio G e por uma operacao binaria o chamada multiplicacao [adicao ] e designada por .[e designada por +] , que verifica os seguintes axiomas:

I. A operacao e associativa, isto e

(f.g).h = f.(g.h), [ (f + g) + h = f + (g + h) ], ∀f, g, h ∈ G. (2.2.1)

II. A operacao admite quocientes da divisao a esquerda e a direita [ diferencas dasubtracao a esquerda e a direita], isto e:

∀g, h ∈ G, =⇒ ∃x ∈ G : h.x = g, [h + x = g ] , (2.2.2)

e

∀g, h,∈ G, =⇒ ∃y ∈ G : y.h = g, [ y + h = g ] . (2.2.3)

Os quocientes da divisao a esquerda e a direita [ as diferencas da subtracao a es-querda e a direita] tambem se designam simplesmente por quocientes esquerdos e direitos[diferencas esquerdas e direitas].

Note-se que uma operacao binaria num conjunto G e uma aplicacao de G2 sobre G,e que portanto o produto [ a soma] de dois elementos quaisquer do grupo existe sempree e um elemento do grupo, ou seja:

g.h ∈ G, [ g + h ∈ G ] , ∀g, h ∈ G. (2.2.4)

Ha autores que frizam este ponto dizendo que a operacao fundamental do grupo efechada sobre o conjunto de suporte do grupo.

2.2. GRUPOS ALGEBRICOS 17

Do axioma II obtem-se as seguintes propriedades:

1. No grupo existe um elemento neutro e, isto e:

∃e ∈ G =⇒ e.g = g.e = g, [ e + g = g + e = g], ∀g ∈ G.

Ao elemento neutro chama-se o elemento identidade ou o elemento zero do grupo, con-soante este e multiplicativo ou aditivo, respectivamente.

2. Cada elemento g ∈ G possui um recıproco g−1 ∈ G [(−g) ∈ G], isto e

∀g ∈ G, ∃g−1 =⇒ g−1.g = g.g−1 = e[∃(−g) ∈ G =⇒ (−g) + g = g + (−g) = e].

Ao recıproco chama-se inverso ou simetrico, consoante os grupos sao multiplicativos ouaditivos, respectivamente.

Por esta razao, em vez do axioma II acima expresso podem usar-se os dois seguintes,que lhe sao equivalentes:

IIb. A operacao define um elemento neutro e ∈ G que e.g = g.e = g, [e+g = g+e = g],∀g ∈ G.

IIIb. A operacao define recıprocos para todos os elemtos g ∈ G, isto e, para cadaelemento g ∈ G existe sempre um elemento g−1 ∈ G [existe sempre um elemento (−g) ∈G], tal que g−1.g = g.g−1 = e [tal que (−g) + g = g + (−g) = e ].

Pode mostrar-se, recorrendo ao absurdo, que:

a) O elemento identidade de um grupo e unico, isto e, so existe em G um elemento etal que e.g = g.e = g; [so existe um elemento e tal que e + g = g + e = g; ]

b) O recıproco de qualquer elemnto de um grupo e unico, isto e, para um dado g ∈ Gso existe um g−1 ∈ g [ so existe um (−g) ∈ G ], tal que g−1.g = g.g−1 = e; [tal que(−g) + g = g + (−g) = e; ]

c) Em qualquer grupo, o quociente esquerdo e unico [ a diferenca esquerda e unica], omesmo se passando para o quociente direito [para a diferenca direita]. Isto e, dados doiselemntos g e h de G, so existe um elemento x de G e um elemento y de G tais que

h.x = g [h + x = g]

ey.h = g [x + h = g]

Um grupo cuja operacao basica e comutativa diz-se comutativo ou abeliano. Assim,num grupo multiplicativo [aditivo] abeliano G verifica-se a igualdade

f.g = g.f, [ f + g = g + f ], ∀f, g ∈ G.

18 CAPITULO 2. GRUPOS DE LIE

Nota 1: O semi-grupo e uma estrutura algebrica ainda mais simples que a de grupo,pois apenas possui o axioma da associatividade, nao sendo necessario admitir a existenciade quocientes esquerdos e direitos (ou diferencas esquerdas e direitas). Assim, num semi-grupo nao ha elemento neutro nem inverso [simetrico]. O papel dos semi-grupos emFısica nao e tao importante quanto o desempenhado pelos grupos.

Nota 2: Quando se juntam novos axiomas estruturantes a uma estrutura ja existente,diz-se que a segunda estrurada e menos geral que a primeira. Inversamente, quando seretiram axiomas a uma estrutura, obtem-se uma estrutura mais geral. Assim, o semi-grupo e uma generalizacao do conceito de grupo.

2.3 Grupos topologicos

Um grupo topologico e um grupo algebrico provido duma topologia relativamente asquais as operacoes do grupo sao contınuas. Ou seja, um grupo topologico e uma estruturamatematica G ≡ {G,×, τ} constituıda por um conjunto G, uma operacao binaria × euma topologia τ , que possui a seguintes propriedades:

a) E um grupo relativamente a operacao binaria ×;

b) E um espaco topologico, com a topologia τ ;

c) As operacoes do grupo sao contınuas relativamente a topologia τ .

Os conceitos usados em a) e b) ja foram expostos anteriormente. Quanto a con-tinuidade das operacoes do grupo, vamos considera-la separadamente para o produto epara a inversao.

Ha continuidade do produto relativamente a cada um dos factores se, designado por g1

e g2 dois elementos quaisquer do grupo topologico e por g1g2 o seu produto, consideradauma vizinhanca qualquer U12 de g1g2, e sempre possıvel encontrar uma vizinhanca U1 deg1 e uma vizinhanca U2 de g2 tal que U1U2 ⊂ U12.

Pelo seu lado, a inversao e contınua se, sendo g um elemento qualquer do grupo e g−1

o seu inverso, considerada uma vizinhanca qualquer V de g−1 e sempre possıvel encontraruma vizinhanca U de g tal que U−1 ⊂ V .

Estas duas condicoes podem escrever-se numa so:

∀g1, g2 ∈ G, para cada vizinhanca U ′12 de g1g

−12 existem sempre vizinhancas U1 de g1

e U2 de g2 tais que U1U−12 ⊂ U ′

12.

A um dado grupo algebrico podem ser associadas diferentes topologias, obtendo-seassim grupos topologicos diferentes. Por outro lado, grupos topologicos diferentes podem

2.4. VARIEDADES DIFERENCIAVEIS 19

possuir espacos topologicos homeomorfos entre si.

Dois grupos topologicos dizem-se isomorfos se os seus grupos algebricos sao isomorfose os seus espacos topologicos sao homeomorfos.

Finalmente, uma aplicacao f : G −→ X, em que X designa um espaco topologico,diz-se contınua no ponto g ∈ G se, para cada vizinhanca V ⊂ X da imagem f(g) de g epossıvel encontrar uma vizinhanca U de g tal que

f(U) ⊂ V.

No caso do espaco de chegada ser o eixo real R, a funcao f(g) diz-se contınua em g0

se para cada numero positivo δ existe uma vizinhanca U ⊂ G de g0 tal que

|f(g)− f(g0)| < δ,∀g ∈ U.

2.4 Variedades Diferenciaveis

As variedades e os mapeamentos de variedades sao os elementos basicos da geometriadiferencial. As variedades sao objectos geometricos que tem localmente a estrutura deum espaco de Banach, ou seja, de um espaco vectorial normado e completo. Na maioriadas aplicacoes fısicas, este espaco tem dimensao finita e e simplesmente o espaco realeuclideano Rn. Mas ha situacoes - que surgem na geometria diferencial das teorias decampo de padrao - em que e necessario considerar variedades com dimensao infinita e epor essa razao que alargamos o domınio das estruturas que as moldam aos espacos deBanach, os quais, evidentemente, incluem os espacos euclideanos como casos particulares.

Para se usar o conceito de variedade e necessario passar do ponto de vista local (asvariedades assemelham-se localmente a espacos normados completos) para o ponto devista global (a cobertura de toda a variedade). Nos casos em que estamos interessados,os dos grupos de Lie, esta transicao faz-se introduzindo novos elementos estruturantesque lhes atribuem caracterısticas primeiro de variedade topologica e, depois, de variedadetopologica diferenciavel.

Vamos comecar por definir o conceito de variedade topologica.

Seja M um espaco topologico e F um espaco de Banach. Chama-se mapa local decoordenadas ou simplesmente mapa ao par (V, φ) constituıdo por um conjunto abertoV ⊂ M e um homeomorfismo

φ : V −→ φ(V ) ⊂ F,

em que φ(V ) e um conjunto aberto de F .

20 CAPITULO 2. GRUPOS DE LIE

Diz-se que M e uma variedade topologica , ou simplesmente uma variedade moldadano espaco de Banach F , se M admite uma famılia A de mapas,

A = {(Vi, φi)}i∈I ,

tal que {Vi}i∈I cobre M .

A uma famılia A de mapas chama-se um atlas da variedade.

Por definicao, a dimensao da variedade M, que se designa por dim M , e a dimensaodo espaco vectorial de Banach que a molda. Se F coincide com Rn, M e uma variedadereal de dimensao n.

So se torna possıvel usar variedades em analise matematica quando as transformacoesde coordenadas locais de um mapa para outro forem diferenciaveis relativamente as re-spectivas coordenadas. De facto, a existencia de um espaco topologico subjacente aqualquer variedade permite definir de maneira inequıvoca o conceito de funcao contınuasobre uma variedade, mas nao o de funcao diferenciavel.

Para se esclarecer este ponto, consideremos uma funcao f : M → R cuja derivabili-dade pretendenmos estabelecer no ponto v ∈ M . Seja V1 uma vizinhanca de v e (V1, φ1)um mapa de V1. Pode, tentativamente, dizer-se que a funcao f(v) e derivavel no pontov se a aplicacao f.φ−1

1 : F → R o for. Mas esta definicao nao faz sentido, como se veconsiderando o seguinte exemplo. Seja V2 outra vizinhanca de v e (V2, φ2) um mapa localde V2. Aquele criterio de diferenciabilidade nao e aceitavel porque a funcao f.φ−1

2 nao enecesssariamente diferenciavel, mesmo que f.φ−1

1 o seja. Na verdade, de

f.φ−12 = f.φ−1

1 .(φ1.φ−12 )

resulta que a funcao f.φ−12 so e diferenciavel em v se a funcao φ1.φ

−12 : F → F o for.

O que nao e necessariamente verdade, como se ve considerando φ2 = h−1.φ1, em queh : F → F e um homeomorfismo nao derivavel.

Neste exemplo ve-se qual e o novo elemento estruturante que e necessario acrescentarpara que o conceito de derivada fique bem definida numa variedade. Na verdade, se(Vi, φi) e (Vj, φj) forem dois mapas dum atlas A tais que Vij ≡ Vi ∩ Vj 6= ®, entao

φij = φi.φ−1j : φj(Vij) −→ φi(Vij),

e um homeomorfismo entre os dois abertos φi(Vij) e φj(Vij) de F . As aplicacoes φij saochamadas funcoes de transicao do atlas A. Assim, para que as funcoes f : M → Rsejam derivaveis em todos os ponto v ∈ M duma variedade e necessario que as funcoesde transicao dos seus atlas o sejam.

Se as funcoes de transicao de um atlas A sao p vezes diferenciaveis, o atlas diz-se da classe Cp. Dois atlas diferenciaveis cuja uniao e um atlas diferenciavel dizem-secompatıveis.

2.5. DEFINICAO DE GRUPO DE LIE 21

Seja A um atlas diferenciavel de classe Cp em M . O atlas diferenciavel maximal (oatlas e uma cobertura!) de classe Cp contendo A e chamado a estrutura diferenciavel emM de classe Cp determinada por A. Uma estrutura diferenciavel de classe C∞ tambemse chama estrutura suave. Uma variedade juntamente com uma estrutura diferenciavel euma variedade diferenciavel ou variedade diferencial.

Muitas vezes consideram-se variedades com outras restricoes toplogicas, tais comocompacidade. Por exemplo, o facto de que os espacos vectoriais topologicos de Hausdorff,localmente compactos, terem dimensao finita, implica que as variedades topologicas deHausdorff localmente compactas tem tambem dimensao finita. Por outro lado, e semprepossıvel prover uma variedade compacta com um atlas finito, isto e, possuindo um numerofinito de mapas.

2.5 Definicao de grupo de Lie

O Grupos de Lie foram originalmente definidos como grupos de transformacoes locais emespacos a n dimensoes Rn ou Cn, transformacoes essas que dependendiam analıticamentedum numero finito de parametros, sendo requerido que os parametros dos produtos dastransformacoes fossem exprimıveis em termos dos parametros dos factores por meio defuncoes analıticas. Esta ideia prevalece ainda hoje na definicao de Grupo de Lie, embora adimensao dos espacos possa ser infinita e a condicao de analiticidade possa ser substituıdapela de diferenciabiliodade.

Assim:

Um grupo de Lie e um grupo topologico cujo espaco topologico e uma variedade difer-enciavel com uma estrutura da classe C∞ de tal modo que as operacoes de multiplicacao

(x, y) −→ xy (G × G −→ G)

e de inversao

x −→ x−1 (G −→ G)

sao funcoes C∞.

Para garantir que se verificam estas duas ultimas condicoes basta garantir que aaplicacao

χ : (g, h) → gh−1

do produto directo G×G em G seja indefinidamente diferenciavel.

Por definicao, a dimensao do grupo de Lie e a da variedade que o molda.

Os grupos de Lie com que nos deparamos em muitos casos sao automorfismos (istoe, bijeccoes contınuas e lineares) de espacos afins euclideanos (ou pseudoeuclideanos).

22 CAPITULO 2. GRUPOS DE LIE

Possuem por isso dimensao finita e, nesses casos, pode dizer-se mais simplesmente queum grupo de Lie e um conjunto provido com as estruturas compatıveis de grupo e devariedade real analıtica. O espaco topologico destes grupos tem a estrutura de umavariedade analıtica, de tal modo que as operacoes de multiplicacao e de inversao saofuncoes analıticas. Repare-se que as funcoes analıticas sao, evidentemente de classe C∞,mas o inverso pode nao ser verdadeiro. Ainda nestes casos particulares, ha quem prefiradizer que um grupo de Lie de dimensao n e um grupo topologico G cujo espaco topologicoe uma variedade analıtica de dimensao n, onde as operacoes do grupo sao funcoes C∞.

2.6 Parametrizacao local dum grupo de Lie

Os grupos de Lie mais usados em Fısica sao moldadas pelo espaco vectorial real euclideanoRn. Sao portanto variedades de dimensao finita, reais e analıticas, com uma estrutura daclasse C∞. Neste caso, os elementos g dum grupo G de Lie de dimensao n, pertencentesa um aberto V (g ∈ V ⊂ G), podem ser univocamente parametrizados num mapa (V ; φ)pelas coordenadas cartesianas (x1(g), x2(g), ..., xn(g) do ponto φ(g) ∈ U ⊂ Rn, em queU e o domınio de Rn homeomorfo com V :

φ : V ⊂ G ←→ U ⊂ Rn.

Isto e, os elementos do grupo de Lie mapeados por (V, φ) podem ser designados por

g = g(x1, x2, ..., xn) ou, equivalentemente, (x1(g), x2(g), ..., xn(g)) (2.6.1)

em que(x1(g), x2(g), ..., xn(g)) = φ(g) (2.6.2)

Seja g um elemento de G e V e V ′ duas das suas vizinhancas. Consideremos ummapa em cada uma dessas vizinhancas, (V, φ) e (V ′, φ′), respectivamente. De acordo coma notacao atras estabelecida, designemos respectivamente por (x1(g), x2(g), ..., xn(g)) epor (x′1(g), x′2(g), ..., x′n(g)) , o mesmo elemento g nos dois mapas considerados. Como asfuncoes de transicao

Φ = φ′.φ−1 : φ(V ∩ V ′) −→ φ′(V ∩ V ′)

sao derivaveis indefinidamente, as coordenadas de φ′(g) sao funcoes derivaveis em todasas ordens das coordenadas de φ(g):

x′1(g) = x′1(x1(g), x2(g), ..., xn(g))x′2(g) = x′2(x1(g), x2(g), ..., xn(g))...x′n(g) = x′n(x1(g), x2(g), ..., xn(g))

em que as derivadas∂px′µ(g)

∂xpν

2.6. PARAMETRIZACAO LOCAL DUM GRUPO DE LIE 23

existem para todos os os valores de p = 1, 2, 3, ...,∞ e para todos os valores de µ, ν =1, 2, ..., n.

E evidente que havera um numero infinito de maneiras de parametrizar os elemen-tos de um grupo de Lie nas vizinhanca de um elemento qualquer, correspondendo ainfinidade de homeomorfismos que e possivel estabelecer com abertos em Rn. No casoda parametrizacao dos elementos na vizinhanca do elemento neutro, e conveniente escol-her homeomorfismos que facam corresponder o elemento neutro do grupo a origem dascoordenadas em U ⊂ Rn:

φ(e) = (x1(e), x2(e), ..., xn(e)) = (0, 0, ..., 0). (2.6.3)

ou, equivalentemente,e = g(0, 0, ..., 0) (2.6.4)

Para alem de serem contınuas, as operacoes do grupo sao funcoes C∞. Isto e, escolhidoum mapa (V, φ) na vizinhanca V de um elemento qualquer g do grupo, se f , gf e g−1

pertencerem tambem a vizinhanca V , existem todas as derivadas

∂pxµ(gf)

∂xqν(f)∂xp−q

σ (g), (2.6.5)

e∂pxµ(g−1)

∂xpν(g)

,

em que p = 1, 2, ...,∞ , q = 1, 2, ..., p e µ, ν, σ = 1, 2, ..., n.

Capıtulo 3

O Grupo SU(n)

3.1 Definicao

O Grupo SU(n) e constituıdo pelo conjunto das matrizes n × n complexas, unitarias eunimodulares; e pela operacao definida pela regra de multiplicacao de matrizes. Isto e,

∀U ∈ SU(N) =⇒{

U † = U−1

detU = 1

em que U desiga matrizes n× n complexas:

U = Uij =

u11 u12 · · · u1n

u21 u22 · · · u2n...

......

...un1 un2 · · · unn

,

E facil verificar que matrizes complexas unitarias e unimodulares constituem de factoum grupo, em que a operacao basica e a regra de multiplicacao de matrizes. Na verdade:a) a regra de multiplicacao de matrizes quadradas e associativa; b) existe um e um soelemento neutro, a matriz diagonal

Idef≡ {δij};

e cada matriz possui uma e uma so matriz inversa, pois sao finitas e possuiem determi-nante nao-nulo.

Cada elemento UεSU(n) e definido por 2n2 numeros reais, dois por cada um dos n2

elementos de matrizukl = xkl + iykl ; k, l = 1, 2, · · ·n,

25

26 CAPITULO 3. O GRUPO SU(N)

em que xkl e ykl sao variaveis reais. Mas nem todas esta variaveis sao linearmente inde-pendentes. Na verdade, ha n2 equacoes de constrangimento introduzidas pela condicaode unitaridade,

n∑

k=1

u∗kiukj = δij,

e uma introduzida pela condicao de unimodularidade. O conjunto das matrizes do grupoSU(n) possui assim n2 − 1 graus de liberdade, isto e, pode ser caracterizados por n2 − 1parametros reis independentes.

3.2 Parametrizacao local do grupo SU(n)

O principal metodo de investigacao na teoria dos grupos de Lie e o metodo infinitesimalcriado por Lie. Este metodo torna possıvel reduzir o estudo duma estrutura matematicatao complexa como e um grupo de Lie ao estudo duma estrutura puramente algebrica,a Algebra de Lie. Localmente, um grupo de Lie fica inteiramente determinado pela suaAlgebra de Lie.

No que vai seguir-se utilizaremos algumas propriedades das matrizes complexas naosingulares, cuja demonstracao se pode encontrar, por exemplo, em F.R. Gantemacher:The theory of matrices, Chelsea Publishing Company, N.Y..

Como as matrizes UεSU(n) sao nao singulares, a equacao

eA = U (3.2.1)

admite solucoes a que se chama logaritmo de U :

A = lnU.

Por outro lado, da condicao de unitaridade

U †U = UU † = I

obtem-seeAeA† = eA†eA = I

donde se conclui que o logaritmo duma matriz unitaria e uma matriz anti-hermıtica:

A† = −A.

Por outro lado, da eq.(3.2.1) conclui-se que

eξk = λk,

3.2. PARAMETRIZACAO LOCAL DO GRUPO SU(N) 27

em que ξk designa os valores proprios de A e λk os de U . Assim, recorrendo outra vez a(3.2.1), obtem-se sicessivamente

detU =n∏

k=1

λk =n∏

k=1

eξk = e∑n

k=1ξk = eTrA.

Mas como detU = 1, conclui-se que

TrA = 0.

Isto e, alem de serem anti-hermıticas, as matrizes A possuem traco nulo.

Ora o conjunto das matrizes complexas n × n anti-hermıticas e de traco nulo con-stituem um espaco vectorial real relativamente as regras usuais de adicao de matrizes,

A + B = C : ci,j = aij + bij ; i, j = 1, 2, · · · , n,

e de multiplocacao de reais por matrizes,

cA = B : bij = c aij ; i, j = 1, 2, · · · , n.

Na verdade:

a) a adicao de matrizes e associativa;

b) o conjunto possui um elemento neutro da adicao, constituıdo pela matriz em quetodos os elementos sao iguais a zero;

c) Toda a matriz possui uma matriz simetica, aquela em que os elementos correspon-dentes sao os seus simeticos;

d) O produto de qualquer elemento do conjunto por um numero real e ainda umelemento do conjunto, isto e, continua a ser uma matris complexa, n× n, anti-hermıticae de traco nulo;

e) As regras de adicao de matrizes e de multiplicacao de matrizes por numeros saomutuamente distributivas.

O espaco vectorial assim definido possui n2 − 1 dimensoes. Na verdade, porque saon × n, complexas, anti-hermıticas e de traco nulo, as matrizes A sao caracterizadas por2n2−n2−1 = n2−1 variaveis reais linearmente independentes. Por esta razao, e possıvelencontrar n2− 1 vectores linearmente independentes, mas nao mais do que esse numero.

Seja{A1, A2, · · · , Aµ, · · · , An2−1}

uma base no espaco vectorial atras definido. Entao, qualquer matriz do espaco pode serescrita na forma duma combinacao linear dos vectores da base, com coeficientes reais:

A = A(x1, x2, · · · , xµ, · · · , xn2−1) =n2−1∑

µ=1

xµAµ; x1, x2, · · · , xn2−1 εR. (3.2.2)

28 CAPITULO 3. O GRUPO SU(N)

Repare-se agora que a eq.( 3.2.1) tem, para uma dada matriz U , mais que umasolucao A. Mas dada uma matriz A so lhe corresponde uma matriz U . Os elementosdo Grupo SU(n) podem ser assim parametrizados escolhendo-se primeiro uma base noespaco vectorial das matrizes n × n complexas, anti-hermıticas e de traco nulo; e es-crevendo depois

U(x1, x2, ..., xn2−1) = eA(x1,x2,...,xn2−1) = e∑n2−1

ν=1xνAν , (3.2.3)

Repare-se ainda que em vez de (3.2.1) poderiamos ter escrito, equivalentemente,

U = e−iH (3.2.4)

em que H e agora uma matriz n× n complexa, hermıtica e de traco nulo:

H† = H e TrH = 0. (3.2.5)

A eq.(3.2.4) pode ser tambem encarada como a decomposicao polar da matriz U ,atraves dos seguintes teoremas:

Teorema 1: Uma matriz unitaria U pode sempre decompor-se polarmente na forma

U = Ie−iH

em que I e a matriz identidade atras definida e H e uma matiz hermıtica.

Teorema 2: Na decomposicao polar atras considerada, se a matriz alem de serunitaria for unimodular tem-se

trH = 0.

Com as matrizes H pode igualmente construir-se um espaco vectorial a n2 − 1 di-mensoes, o que permite, escolhida uma base

{H1, H2, · · · , Hn2−1}

nesse espaco, escrever sucessivamente

H =n2−1∑

ν=1

xνHν

e

U(x1, x2, ..., xn2−1) = e−i∑n2−1

ν=1xνHν . (3.2.6)

Partindo de uma qualquer destas parametrizacoes (quer em termos de matrizes hermıticasquer de matrizes anti-hermıticas), pode verificar-se que o grupo SU(n) e um grupo deLie moldado por uma variedade analıtica. Na verdade, consideremos, para concretizar,

3.3. GERADORES INFINITESIMAIS DO GRUPO SU(N) 29

o caso duma parametrizacao em termos de matrizes anti-hermıtias. Introduzindo umanova base

{A′1, A

′2, · · · , A′

µ, · · · , A′n2−1}

obterıamos uma nova parametrizacao. Na verdade, de

A = A(x′1, x′2, ..., x

′n2−1) =

n2−1∑

ν=1

x′νA′ν

obtem-se

U = U(x′1, x′2, ..., x

′n2−1) = e

∑n2−1

ν=1x′νA′ν .

Escrevendo agora na igualdade

A =n2−1∑

µ=1

xµAµ =n2−1∑

µ=1

x′µA′µ

os vectores duma das bases como combinacoes lineares dos vectores da outra base, pode-mos concluir que as coordenadas de U numa base sao funcoes analıticas das coordenadasda mesma matriz U na outra base.

3.3 Geradores Infinitesimais do Grupo SU(n)

Desenvolvendo o segundo membro da eq.(3.2.3) em potencias das suas coordenadas,obtem-se:

U(x1, x2, · · · , xn2−1) = I +n2−1∑

ν

xνAν +1

2!(n2−1∑

ν=1

xνAν)2 + · · ·

Derivando esta equacao em ordem a ρ obtem-se

∂U(x)

∂xρ

= Aρ +1

2!

n2−1∑

ν=1

xν(AρAν + AνAρ) + · · ·

Repare-se que a derivada direccional segundo o eixo ρ depende nao so de Aρ, mas tambemde todos os outros vectores de base. No entanto, se a derivada for calculada na origemdas coordenadas, tem-se simplesmente

∂U(x)

∂xρ

∣∣∣∣∣x=0

= Aρ. (3.3.1)

Por esta razao a Aρ chama-se gerador infinitesimal do grupo na vizinhanca da origem nadireccao de ρ.

Repare-se que em termos das matrizes hermıticas Hν se tem

U(x1, x2, ..., xn) = e−i∑n

ν=1xνHν , ∀U ∈ SU(n),

30 CAPITULO 3. O GRUPO SU(N)

−iHν =∂U(x1, x2, ..., xn)

∂xν

eAν = −i Hν ; ν = 1, 2, ..., n.

No caso do grupo SU(2), a base dos geradores infinitesimais atras considerada contemtres matrizes de base, que podem ser escolhidas de qualquer maneira desde que sejamhermıticas, possuam traco nulo e sejam linearmente independentes. As matrizes de Paulisatifazem essas condicoes.

No caso do grupo SU(3), a base contem oito matrizes, que podem ser igualmentequaisquer, desde que sejam todas hermınicas, possuam traco nulo e sejam linearmenteindependentes. As matrizes de Gell-Mann sao oito dessas matrizes.

3.4 Constantes de Estrutura do Grupo SU(n)

A parametrizacao (3.2.3) liga cada elemento de SU(n) a matriz identidade I atraves dumcaminho contınuo no espaco Rn, que liga x a orivem x = 0. Consideremos agora doispontos x(1) e x(2) em Rn e as correspondentes matizes U1 = U(x(1)) e U2 = U(x(2)) emSU(n). O produto destas matrizes e uma matriz terceira matriz U3 = U2U1 que seraparemetrizada por um conjunto de coordenadas que designamos por x(3):

U(x(2))U(x(1)) = U(x(3)).

Mas como U3 fica determinado por U1 e U2, tambem as suas coordenadas ficam determi-nadas pelas dos coordenadas dos factores:

x(3)µ = fµ(x(2), x(1)). (3.4.1)

Se um dos factores e a matriz identidade, isto e, se

U(0)U(x) = U(x)U(0) = U(x),

deve verificar-sexµ = fµ(0, x) = fµ(x, 0). (3.4.2)

Fazendo nesta equacao x = 0, obtem-se

0 = fµ(0, 0). (3.4.3)

Desenvolvendo agora a funcao fµ(x, x′) do segundo membro da eq.(3.4.1) em serie depotencias, obtem-se

fµ(x, x′) = Cµ +n2−1∑

ν=1

Cµν(xν + x′ν) +n2−1∑

ν,ρ=1

C ′µνρ(xνxρ + x′νx

′ρ) +

n2−1∑

ν,ρ=1

Cµνρxνx′ρ +O(x3).

(3.4.4)

3.4. CONSTANTES DE ESTRUTURA DO GRUPO SU(N) 31

Fazendo nesta ultima equacao x = x′ = 0 , conclui-se que a condicao (3.4.3)so severifica se

Cµ = 0.

Por outro lado, so e possıvel satizfazer a totalidade das condicoes (3.4.2) se

Cµν = δµν

eC ′

µνρ = 0.

Assim, o desenvolvimento (3.4.4) ate a segunda ordem fica reduzido a

fµ(x, x′) = xµ + x′µ +n2−1∑

ν,ρ=1

Cµνρxνx′ρ +O(x3).

Entrando com este resultado em

e∑

xµAmue∑

x′muAmu = efµ(x,x′)Aµ ,

e desenvolvendo as exponenciais explicitamente ate a segunda ordem nas coordenadas,ve-se que os termos de primeira ordem e os termos de segunda ordem em xµxν e emx′µx

′ν sao iguais em ambos os membros. Para que estes sejam iguais ordem a ordem ate

a segunda e necessario que os coeficientes dos termos em xµx′ν sejam tambem iguais em

ambos os membros, o que so acontece se

AµAν =1

2AµAν +

1

2AνAµ +

∑ρ

CρµνAρ

ou seja, se1

2[Aµ, Aν ] =

∑ρ

CρµνAρ. (3.4.5)

que e uma condicao a que os geradores infinitesimais tem de obedecer e que apareceescrita em termos do comutador que desempenha o papel de operacao de multiplicacaonao associativa da Algebra de Lie. Este pormenor e muito importante porque, tocandoos ındices µ e ν um pelo outro na equacao anterior e trocando a ordem dos factores nocomutador pode escrever-se

1

2[Aµ, Aν ] = −∑

ρ

CρνµAρ

equacao esta que, comparada com a eq.(3.4.5) permite concluir que

Cρµν = −Cρνµ.

Entrando com este resultado na eq.(3.4.5) esta pode tomar a forma

[Aµ, Aν ] = CρµνAρ ; µ, ν = 2, · · · , n2 − 1, (3.4.6)

onde

Cρµν

def≡ Cρµν − Cρνµ (3.4.7)

sao as chamadas constantes de estrutura do grupo.

32 CAPITULO 3. O GRUPO SU(N)

3.5 Algebra de Lie do Grupo SU(n)

Relacoes do tipo (3.4.6), que mostram que a Agebra de Lie e um sistema fechado relati-vamente ao seu produtio nao-associativo, sao validas para qualquer Grupo de Lie e naoapenas para o Grupo SU(n).

Na verdade, por definicao uma algebra dum espaco vectorial e uma estrutura matematicaque, para alem das operacoes basicas da adicao de vectores e da multiplicacao de escalarespor vectores, possui um novo elemento estruturante que e uma operacao de multiplicacaode vectores, que se pode designar por

u¯ v,

que nao e associativa e satisfaz a identidade de Jacobi:

u¯ (v ¯w) + v ¯ (w ¯ u) + w ¯ (u¯ v) = 0.

A Algebra de Lie do grupo SU(n) e constituıda pelo espaco vectorial das matrizesn× n antihermıticas e pelo produto nao associativo dos comutadores das matrizes entresi

A¯Bdef≡ [A,B]

def≡ AB −BA,

o qual satisfaz automaticamente a identidade de Jacobi.

Pode igualmente definir-se a Algebra de Lie em termos das matrizes hermıticas detraco nulo.

Como veremos oportunamente, no caso do grupo SU(2) a base dos geradores infinites-imais atras considerada contem tres matrizes que podem ser escolhidas livremente, desdeque satisfacam as seguintes condicoes: serem hermıticas, de traco nulo e linearmenteindependentes umas das outras. As tres matrizes de Pauli satifazem essas condicoes econstituem a escolha usual.

Como veremos tambem mais a frente, no caso do grupo SU(3) a base contem oito ma-trizes, que podem igualmente ser escolhidas livremente, desde que satisfacam as seguintescondicoes: serem hermıticas, de traco nulo e linearmente independentes umas das out-ras.As oito matrizes de Gell-Mann satifazem essas condicoes e constituem a escolha usual.

Capıtulo 4

Representacoes dos Grupos de Lie

4.1 Definicao de reprsentacao de um grupo

Chama-se representacao dum grupo a um homomorfismo num grupo de transformacoes.

Devemos lembrar-nos que as transformacoes sao aplicacoes dum conjunto sobre simesmo e que um homomorfismo e uma aplicacao de um sistema algebrico sobre outrosistema algebrico do mesmo tipo, que preserva as relacoes e as operacoes basicas.

Seja entao G o grupo a representar, X um conjunto e T um conjunto de transformacoesinvertıveis de X. Entao G fica representado em T quando se define uma aplicacao

T : g ∈ G −→ T (g) ∈ T (4.1.1)

tal queT (gh−1) = T (g)T−1(h). (4.1.2)

Repare-se que a eq.(4.1.2) e equivalente a estas tres:

T (gh) = T (g)T (h),

T−1(g) = T (g−1)

eI = T (e)

Nesta ultima equacao, I e a transformacao identidade do conjunto X e e e o elementoneutro do grupo G. Assim, a imagem de G em T e um grupo que preserva as operacoesbasicas do grupo que representa.

Se o conjunto e um espaco vectorial L sobre um corpo K , as transformacoes darepresentacao sao operadores T em L. Se estes operadores sao lineares, a representacao

33

34 CAPITULO 4. REPRESENTACOES DOS GRUPOS DE LIE

diz-se linear. Dada a grande importancia das representacoes lineares, repetimos a suadefenicao explicitamente.

Diz-se que o grupo G se encontra representado por operadores lineares no espacovectorial L se a cada elemento g ∈ G se pode fazer corresponder um operador T (g)actuando no espaco vectorial L,

g −→ T (g) ; ∀g ε G, ∀u εL =⇒ T(g)u ε L, (4.1.3)

de tal forma que:

∀g ∈ G , ∀u,v ∈ L e ∀α, β ∈ C =⇒ T(g)[αu + βv] = αT(g)u + βTv; (4.1.4)

e∀g, h ∈ G =⇒ T (gh−1) = T (g)T−1(h). (4.1.5)

A condicao (4.1.4) traduz a linearidade da representacao. Por sua vez, a condicao (4.1.5)traduz a preservacao dos axiomas do grupo na sua representacao, por parte da aplicacao(4.1.3) que a estabelece.

Note-se que, tal como fizemos notar anteriormente para uma representacao geral,tambem nas representacoes por operadores lineares a condicao (4.1.5) contem implıcitasas seguintes igualdades que, no seu conjunto, sao equivalentes a ela:

∀g, h ∈ G =⇒ T (gh) = T (g)T (h);

∀g ∈ G =⇒ T (g−1) = T−1(g);

eT (e) = I (4.1.6)

em que I e o operador identidade da representacao, isto e

∀u ∈ L =⇒ Iu = u.

Muitas vezes as representacoes lineares designam-se apenas por representacoes, poissao essas as que interessam nas aplicacoes fısicas. Chama-se dimensao da representacaoa dimensao do espaco linear onde ela se realiza.

Se o grupo a representar e topologico, consideram-se representacoes contınuas de Gem espacos vectoriais topologicos. Se o Grupo e de Lie, interassam-nos as representacoesdiferenciaveis. No caso dos grupos de Lie terem dimensao finita, as representacoes difer-enciaveis sao analıticas. Estes conceitos serao clarificados a medida que prosseguirmos.

Em Fısica Quantica estamos particularmente interessados na representacao de gru-pos de tranformacoes de simetria no espaco de Hilbert H. O Teorema de Wigner per-mite afirmar que os representantes lineares no espaco de Hilbert das transformacoes desimetria sao necessariamente operadores unitarios ou operadores anti-unitarios. Se as

4.2. REPRESENTACOES EQUIVALENTES 35

transformacoes de simetria constituem um grupo de Lie, as suas representantes temnecessariamente de ser unitarias porque se podem levar, por variacao contınua dosparametros, a coincidir com aquela que representa o elemento neutro do grupo que,como vimos, e necessariamente representado pela transformacao identidade do espacovectorial (vide eq.(4.1.6)).

Se Φ e Ψ forem dois vectores do espaco de Hilbert H, as fases relativas podem serescolhidas de tal forma que, para uma dada representacao unitaria

T def≡ {T (g) : g ∈ G}

se tem sempre(T (g)Φ, T (g)Ψ) = (Φ, Ψ); ∀g ∈ G; ∀Φ, Ψ ∈ H

4.2 Representacoes equivalentes

Um dos problemas basicos da teoria das representacoes e o de enumerar todas as pos-siveis representacoes de um dado grupo. No estudo deste problema, ha dois conceitosque desempenham um papel fundamental: o da equivalencia e o da reducibilidade dasrepresentacoes. Comecemos pelo primeiro.

Conhecendo-se uma representacao T def≡ {T (g) : g ∈ G} do grupo G em L, podemosconstruir novas representacoes do mesmo grupo em espacos vectoriais L′, com o mesmonumero de dimensoes que o espaco L (em particular L′ pode coincidir com L). Osoperadores da nova representacao constroiem-se atraves da operacao

TA(g) = AT (g)A−1,∀g ∈ G, (4.2.1)

em que A e uma aplicacao linear nao singular que leva vectores de L para L′:

A : L −→ L′. (4.2.2)

Pode verificar-se facilmente que o conjunto dos operadores TA(g) assim obtidos constituide facto uma representacao de G em L′.

Com efeito,

TA(gh) = AT (gh)A−1 = AT (g)T (h)A−1 = AT (g)A−1AT (h)A−1 = TA(g)TA(h).

Quaisquer duas representacoes T e T ′ dum mesmo grupo G cujos elementos se podempor em correspondencia uns com os outros por uma igualdade da forma (4.2.1) dizem-se equivalentes entre si. Na verdade, a eq.(4.2.1) estabelece uma correspondencia deequivalencia entre T ≡ {T (g) : g ∈ G} e TA(g) : g ∈ G} porque se verificam as condicoes

36 CAPITULO 4. REPRESENTACOES DOS GRUPOS DE LIE

que tais correspondencias devem satisfazer, nomeadamente, e reflexiva (T e equivalente asi mesma atraves do operador identidade I do espaco vectorial onde se encontra definida);e simetrica ( se T ′ e equivalente a T atraves do operador A, tambem T e equivalente a T ′

atraves do operador A−1); e e transitiva (se T e equivalente a T ′ atraves do operador Ae T ′ e equivalente a T ′′ atraves do operador B, tambem T e equivalente a T ′′ atraves dooperador BA). Por esta razao, o conjunto de todas as representacoes de um grupo podeser partido em classes de representacoes mutuamente equivalentes, bastando consideraruma representacao de cada classe.

O conceito de representacao redutıvel permite ir ainda mais alem na tarefa de estudartodas as representacoes dum grupo, sem ter de as construir todas.

4.3 Representacoes redutıveis

Diz-se que uma representacao T de G em L e redutıvel se existe pelo menos um sub-espaconao trivial L(1) ⊂ L, que e deixado invariante por todos os operadores da representacao.

Um espaco L(1) ∈ L diz-se invariante relativamente a todos os operadores T (g) darepresentacao T dum grupo G no espaco vectorial L se

∀u(1) ∈ L(1) e ∀g ∈ G =⇒ T(g)u(1) ∈ L(1).

Se nao existe em L nenhum sub-espaco nao trivial invariante, a representacao diz-seirredutıvel. Recordemos que os sub-espacos triviais de um espaco vectorial qualquer Lsao o sub-espaco vazio ® e o proprio espaco L.

Suponhamos T e uma representacao dum grupo G num espaco vectorial L e que existeum sub-espaco irredutıvel L(1) ∈ L, que tem dimensao finita n1. Entao cada operadorT (g) da representacao induz em L(1) o operador T (1)(g), atraves da definicao

T (1)(g)u(1) def≡ T(g)u(1) , ∀u(1) ∈ L(1).

E evidente que o conjunto dos operadores induzidos forma uma representacao T (1) deG em L(1). Diz-se que T (1) e induzida por T no sub-espaco invariante L(1). Se T forunitaria, tambem T (1) e unitaria.

Agora, deve notar-se que se T for uma representacao unitaria redutıvel de G em L,e L(1) for um sub-espaco invariante relativamente aos operadores T (g) da representacao,entao o sub-espaco

L(2)def≡ L(1)

que e o complemento ortogonal de L(1) em L, tambem e invariante relativamente aosoperadores T (g).

4.3. REPRESENTACOES REDUTIVEIS 37

Recordemos que o complemento ortogonal L(1)⊥ de L(1) em L e o conjunto dos vectores

de L que nao pertencem a L(1) e sao ortogonais a todos os seus vectores.

A invariancia do sub-espaco L(2) traduz-se por

∀u(2) ∈ L(2) e ∀g ∈ G =⇒ T(g)u(2) ∈ L(2),

porque se T (g)u(2) = u(1) ∈ L(1) entao T−1(g)u(1) = u(2) ∈ L(2) e L(1) nao seria invariante.

Dados um sub-espaco L(1) dum espaco euclideano L e o seu complemento ortogonalL(2) ≡ L(1)

⊥ , os vectores u ∈ L podem decompor-se univocamente numa soma

u = u(1) + u(2)

em que u(1) pertence a L(1) e u(2) pertence ao seu complemento ortogonal.

Por outro lado, em espacos euclideanos numeraveis, escolhida uma base ortonormada

B = (e1, e2, ..., ei, ...),

os operadores lineares T podem ser representados por matrizes T cujos elementos Tij sao

as componentes dos vectores Tej segundo os vectores de base ei:

Tij

def≡ (ei, Tej),

onde (u,v) representa o produto escalar dos vecores u e v.

Entao as matrizes representativas dos operadores T (g) podem ser escritas na forma

T (g) =

(T (1)(g) 0

0 T (2)(g)

),

onde as matrizes T (1)(g) e T (2)(g) representam os operadores T (1)(g) e T (2)(g) das rep-resentacoes T (1) e T (2) induzidas pela representacao T nos subespacos invariantes L(1) eL(2), respectivamente.

Isto e, cada operador T (g) da representacao T pode decompor-se na soma directa dosperadores induzidos num sub-espaco invariante e no seu completemnto ortogonal:

T (g) = T (1)(g)⊕ T (2)(g).

Tem-se, evidentemente:

[T (1)(g)⊕ T (2)(g)](u(1) + u(2)) ≡ T(1)(g)u(1) + T(2)(g)u(2).

A seguir inpecciona-se se os sub-espacos L(1) e L(2) contem eles proprios ub-espacosinvariantes. Se contem, pode prosseguir-se com a definicao de operadores induzidos nesses

38 CAPITULO 4. REPRESENTACOES DOS GRUPOS DE LIE

sub-espacos invariantes e nos respectivos complementos ortogonais. Se este processopode ser levado a cabo ate que nao sobre nenhum sub-espaco irredutıvel, a representacaoT diz-se completamente redutıvel. Suponhamos que existem N sub-espacos invariantesirredutıveis. Entao cada operador T (g) da represntacao decompoe-se na soma directados N operadores T (i)(g) que induz nos respectivos espacos invariantes L(i:

T (g) = T (1)(g)⊕ T (2)(g)⊕ ...⊕ T (N)(g)

e o espaco L decompoe-se tambem na soma directa dos sub-espacos invariantes:

L = L(1) ⊕ L(2) ⊕ ...⊕ L(N).

Os grupos finitos sao sempre completamente redutıveis. Os grupos topologicos nemsempre sao completamente redutıveis. Se os grupos sao topologicos, aqueles que sao com-pactos, como e o caso do grupos das rotacoes no espaco, verificam os seguintes teoremasdos grupos finitos:

Teorema 1: Em qualquer classe de representacoes equivalentes existe sempre umaque e unitaria.

Teorema 2: Qualquer representacao unitaria e completamente redutıvel.

Teorema 3: Qualquer representacao irredutıvel tem dimensao finita.

Quando os grupos sao apenas localmente compactos, como e o caso do grupo deLorentz, existem no espaco de Hilbert representacoes irredutıveis em numero suficiente,entendendo-se por isso o seguinte: para cada elemento g′ ∈ G existe uma representacaoirredutıvel T ′ tal que T ′(g′) 6= I em que I e o operador identidade.

A razao para se verificar o Teorema 1 para grupos topologicos compactos reside nofacto de, para esse tipo de grupos, ser possıvel definir uma funcional da media a partirda qual se podem redefinir os produtos escalares e assim construir uma representacaounitaria que seja equivalente a uma que o nao seja. Nos grupos que apenas sao localmentecompactos nao e possıvel definir uma funcional da media.

4.4 Representacoes Diferenciais de Grupos de Lie

Ate agora referimo-nos a aspectos gerais da teoria de representacoes lineares de grupostopologicos. A partir de agora vamos particularizar para o caso dos grupos de Lie, dedimensao finita. Mas, antes de prosseguir, e conveniente distinguir bem os conceitos dedimensao do grupo de Lie, que e a dimensao da variedade que o molda, e a dimensaoda representacao, que e a dimensao do espaco vectorial onde os elementos do grupo saorepresentados por tranformacoes lineares. Alem disso, para preservar as caracterısticas

4.4. REPRESENTACOES DIFERENCIAIS DE GRUPOS DE LIE 39

da estrutura do grupo estas transformacoes estas devem ser tambem contınuas e difer-enciaveis. Sao precisamente estes dois conceitos que comecaremos por definir.

Consideremos uma representacao linear T do grupo de Lie G de dimensao n no espacovectorial L de dimensao N .

Como ja vimos na seccao anterior, cada elento g ∈ V ⊂ G de uma vizinhanca V podeser parametrizado por n parametros reais:

g = g(x1, x2, ..., xn) (4.4.1)

em queg(0, 0, ..., 0) = e. (4.4.2)

Se o grupo de Lie for simplesmente conexo, qualquer dois dos seu pontos podem serligados por caminhos homotopicos, a que correspondem tambem caminhos em Rn. Emparticular qualquer ponto da vizinhanca V 3 e pode ser ligado a origem por um caminhohomotopico, a que corresponde em Rn um caminho com origem no ponto e fim no pontoO origem do sistema cartesiano de coordenadas.

A continuidade de uma representacao T de um grupo topologico G, nao necessariamentede Lie, pode estabelecer-se se o espaco linear for, pelo menos, normado ( a norma poderesultar dum produto esclar, como e o caso dos espacos de Hilbert). Assim, diz-se diz-seque a representacao e contınua em g ∈ G se e so se

‖{T (h)− T (g)}u‖h→g → 0, ∀u ∈ L .

Nesta expressao ‖u‖ designa a norma do vector u ∈ L. Tambem se diz que a repre-sentacao e contınua no ponto g do grupo se

T (h) → T (g) quando h → g,

sendo o primeiro limite tomado no sentido da eq.(4.4) (o segundo limite e tomado nosentido da topologia do espaco topologico subjacente ao grupo em questao).

Escolhendo uma baseB = (e1, e2, ..., eN),

nao necessariamente ortonogonal, no espaco L, cada operador T (g) da representacaopode ser representado por uma matriz N ×N cujos elementos Tji(g) sao as componentes

dos vectores T (g)ei segundo os vectores de base ej:

T (g)ei =N∑

j=1

Tji(g)ej.

Sendo a representacao contınua no sentido atras definido, os elementos de matriz dosoperadores duma representacao contınua dum grupo de Lie,

Tji(g) = Tji(x1, x2, ..., xn)

40 CAPITULO 4. REPRESENTACOES DOS GRUPOS DE LIE

sao funcoes contınuas dos parametros x1, x2, ..., xn do grupo. A representacao diz-sediferenciavel se aqueles elementos de matriz forem tambem funcoes diferenciaveis, isto e,se existirem as derivadas de qualquer ordem

∂pTij(x)

∂xpµ

; µ = 1, 2, ..., n ; p = 1, 2, ...,∞ .

Para representacoes diferenciaveis, define-se a derivada parcial do operador T (g) emordem ao parametro µ, ou seja

∂T (g)/∂xµ

atraves da identidade

∂T (g)

∂xµ

eidef≡

N∑

j=1

∂Tji(g)

∂xµ(g)ej; i = 1, 2, ..., N .

4.5 Geradores Infinitesimais e Algebra da Representacao

Chamam-se geradores infinitesimas da representacao as derivadas direccionais dos op-eradores da representacao segundo cada um dos eixos de paramentrizacao, calculadasno elemento neutro. Ou seja, designado os geradores infinitesimais por Iµ, tem-se, pordefinicao:

def≡ ∂T (g)

∂xµ(g)

∣∣∣∣∣g=e

; µ = 1, 2, ..., n (4.5.1)

Equivalentemente, tem-se

Iµ =∂T (x1, x2, ..., xn)

∂xµ

]

x1=x2=...=xn=0

. (4.5.2)

Vamos demonstrar agora alguns teoremos sobre os geradores infinitesimais dos gruposde Lie.

Teorema 1: Os geradores infinitesimais definem completamente a representacao nasvizinhancas do elementro neutro parametrizadas pelo mesmo mapa.

Na verdade, seja

v(g;u)def≡ T(g)u (4.5.3)

o vector que se obtem aplicando qualquer operador T (g) da representacao T a um qual-quer vector u de L. Para g = e tem-se, atendendo a (4.1.6),

v(e;u) = u. (4.5.4)

4.5. GERADORES INFINITESIMAIS E ALGEBRA DA REPRESENTACAO 41

A representacao fica definida quando se conhecem todos os operadores T (g) que aconstituem ou, equivalentemente, quando se conhecem todos os vectores v(g;u), paratodos os g ∈ G e todos os u ∈ L. Vamos mostrar que, escolhido um mapa (V, φ)numa vizinhanca V 3 e do elemento neutro e do grupo, os vectores v(g ∈ V;u ∈ L)ficam unıvocamente determinados quando se conhecem os geradores infinitesimais darepresentacao, naquele mapa.

Substituibdo g por g−1 na eq.(4.5.3), a obtem-se

v(g−1;u) = T(g−1)u.

Aplicando o operador T (fg) a ambos os membros desta equacao, em que f e um outroelemento qualquer do grupo, obtem-se, sucessivamente:

T (fg)v(g−1;u) = T(fg)T(g−1)u = T(fgg−1)u = v(f;u),

ou seja:

v(f;u) = T(fg)v(g−1;u), ∀f, g ∈ G e ∀u ∈ L. (4.5.5)

Derivando agora ambos os membros da eq(4.5.5) em ordem a cada uma das coor-denadas cartesianas do ponto φ(f) ∈ Rn, que designamos por xµ(f) e permutando asdesignacoes g e f , obtem-se:

{∂v(g;u)

∂xµ(g)=

n∑

ν=1

∂T (gf)

∂xν(gf)

∂xν(gf)

∂xµ(g)v(f−1;u) ; µ = 1, 2, ..., n (4.5.6)

O sistema de equacoes (4.5.6) e valido para todos os f, g ∈ V ⊂ G. Em particular,quando f = g−1 ele assume a seguinte forma:

{∂v(g;u)

∂xµ(g)=

n∑

ν=1

Sνµ(g)Iνv(g;u) ; µ = 1, 2, ..., n (4.5.7)

em que a matiz Sνµ(g), definida para cada elemento g do grupo na vizinhanca do elementoneutro por

Sνµ(g) =∂xν(gf)

∂xµ(g)

∣∣∣∣∣f=g−1

; µ, ν = 1, 2, ..., n (4.5.8)

so depende do grupo e da sua parametrizacao nas vizinhancas do elemento neutro, e

Iν =∂T (gf)

∂xν(gf)

∣∣∣∣∣gf=e

; ν = 1, 2, ..., n (4.5.9)

sao os geradores infinitesimais ja definidos na eq.(4.5.1). Repare-se que a derivada parcialque entra na definicao de Sνµ em (4.5.8) e apenas uma das que foram consideradas em(2.6.5).

42 CAPITULO 4. REPRESENTACOES DOS GRUPOS DE LIE

Vamos mostrar agora que o sistema de equacoes diferenciais (4.5.7), juntamente coma condicao inicial

v(e;u) = u, (4.5.10)

permite determinar todos os vectores v(g;u), para todos os vectores u ∈ L e para todosos g ∈ V ⊂ G. Na verdade, comecemos por considerar a coleccao dos elementos g ∈ Vtais que

g = g(x1, 0, 0, ..., 0)

Para os elementos desta coleccao, o sistema de equacoes (4.5.7) reduz-se a seguinteequacao:

∂v(x1, 0, 0, ..., 0;u)

∂x1(x1, 0, ..., 0)=

n∑

ν=1

Sν1(x1, 0, ..., 0)Iνv(x1, 0, ..., 0;u) (4.5.11)

Esta equacao, juntamente com a condicao inicial

v(0, 0, ..., 0;u) = u, (4.5.12)

determina completamente o vector

v(x1, 0, ..., 0;u),

qualquer que seja o vector u ∈ L, para todos os valores de x1 para os quais g(x1, 0, ..., 0) ∈V ⊂ G. Repare-se que a Eq.(4.5.11) nao e de facto uma, mas sim N equacoes diferenciaisindependentes, uma para cada componente do vector v(x1, 0, ..., 0;u) segundo os vectoresde uma base ortonormada de L. Mas, por sua vez, a Equacao vectorial (??) tambemdetermina N condicoes iniciais, uma para cada componente de v(x1, 0, ..., 0;u) segundocada um dos vectores de base. O vector v(x1, 0, ..., 0;u) fica assim completamente deter-minado.

Podemos continuar o procedimento, resolvendo a equacao diferencial

∂v(x1, x2, 0, ..., 0;u)

∂x2(x1, x20, ..., 0)=

n∑

ν=1

Sν2(x1, x2, 0, ..., 0)Iνv(x1, x2, 0, ..., 0;u)

com a condicao inicial

v(x1, x2, 0, ..., 0;u)|x2=0 = v(x1, 0, 0, ..., 0).

E assim sucessivamente, ate termos obtido

v(x1, x2, ..., xn;u), ∀u ∈ L ,

conforme se pretendia.

Repare-se que nesta demosntracao usaram-se dois tipos distintos de informacao. Noprimeiro tipo incluem-se os valores de Sνµ(g), definida em (4.5.8), referentes a todos osvalores dos ındices da parametrizacao, de 1 a n e a todos os valores dos parametros que

4.5. GERADORES INFINITESIMAIS E ALGEBRA DA REPRESENTACAO 43

cobrem a vizinhanca do elemento neutro. Este tipo de informacao depende apenas daconcretizacao da operacao basica do grupo, em funcao da parametrizacao escolhida.

No segundo tipo de informacao incluem-se os geradores infinitesimais da representacao,

I1, I2, ..., In

que, para alem de dependerem da estrutura do grupo e da parametrizacao, contem todaa informacao sobre a representacao na vizinhanca da identidade I.

Teorema 2: Os geradores infinitesimais satisfazem entre si as relacoes de comutacao:

Iν Iσ − Iσ Iν =n∑

µ=1

Cµνσ Iµ para todos os ν, σ = 1, 2, ..., n, (4.5.13)

em que as constantes Cµνσ nao dependem da representacao.

Para demonstrar este teorema basta notar que a condicao necessaria e suficiente paraque o sistema de equacoes diferenciais (4.5.7) seja soluvel e que existam e sejam iguaisas derivadas parciais de segunda ordem relativas a cada par de variaveis, tomadas numae na outra ordem. Reescrevendo a eq.(4.5.7) nas seguintes formas

∂v(g;u)

∂xν(g)=

n∑

µ=1

Sµν(g)Iµv(g;u)

e∂v(g;u)

∂xσ(g)=

n∑

µ=1

Sµσ(g)Iµv(g;u);

derivando a primeira equacao em ordem a xσ e a segunda em ordem a xν , obtem-se,respectivamente:

∂2v(g;u)

∂xσ(g)∂xν(g)=

n∑

µ=1

{∂Sµν(g)

∂xσ(g)Iµv(g;u) + Sµν(g)Iµ

∂v(g;u)

∂xσ(g)

}

e∂2v(g;u)

∂xnu(g)∂xσ(g)=

n∑

µ=1

{∂Sµσ(g)

∂xnu(g)Iµv(g;u) + Sµσ(g)Iµ

∂v(g;u)

∂xnu(g)}.

Entrando na primeira destas duas ultimas equacoes com as duas anteriores, obtem-se:

∂2v(g;u)

∂xσ(g)∂xν(g)=

n∑

µ=1

∂Sµν(g)

∂xσ(g)Iµv(g;u) +

n∑

µ,µ′=1

Sµν(g)IµSµ′σ(g)Iµ′v(g;u)

e∂2v(g;u)

∂xnu(g)∂xσ(g)=

n∑

µ=1

∂Sµσ(g)

∂xnu(g)Iµv(g;u) +

n∑

µ,µ′=1

Sµσ(g)IµSµ′ν(g)Iµ′v(g;u).

44 CAPITULO 4. REPRESENTACOES DOS GRUPOS DE LIE

Igualando as duas expressoes, obtem-se:

n∑

µ,µ′=1

Sµν(g)Sµ′σ(g)(IµIµ′ − Iµ′ Iµ

)v(g;u) =

n∑

µ=1

(∂Sµσ(g)

∂xν(g)− ∂Sµν(g)

∂xσ(g)

)Iµv(g;u).

Quando g = e tem-seSµν(e) = δµν

ev(e;u) = u,

pelo que a igualdade acima obtida permite escrever

[Iν Iσ − Iσ Iν

]u =

n∑

µ=1

[∂Sµσ(g)

∂xν(g)− ∂Sµν(g)

∂xσ(g)

]

g=e

Iµu.

Como esta igualdade se verifica qualquer que seja o vector u ∈ L, os operadores doprimeiro e do segundo membros devem ser iguais entre si, o que da a Eq.(refeq:RCGI),com

Cµνσ

def≡[∂Sµσ(g)

∂xν(g)− ∂Sµν(g)

∂xσ(g)

]

g=e

(4.5.14)

As constantes Cµνσ chamam-se as constantes de estrutura do grupo. Elas dependemda forma como os parametros do produto dependem dos factores, nas vizinhancas doelemento neutro, mas nao da representacao.