Estatistica Basica.docx

download Estatistica Basica.docx

of 66

Transcript of Estatistica Basica.docx

  • 7/30/2019 Estatistica Basica.docx

    1/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 1

    ESTATSTICABSICA(Prof Mnica Barradas)

  • 7/30/2019 Estatistica Basica.docx

    2/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 2

    NDICE

    1. Introduo Geral Compreenso Estatstica........................................................................3

    2. Distribuio de Freqncia.................................................................................................10

    3. Medidas de Centralidade ou de Tendncia Central............................................................14

    4. Medidas de Assimetria e Curtose.......................................................................................23

    5. Principais Tipos de Representao Grfica........................................................................25

    6. Medidas de Disperso ou de Variabilidade........................................................................28

    7. Correlao e Regresso.......................................................................................................32

    8. Introduo Amostragem...................................................................................................47

    9. Probabilidade......................................................................................................................53

    10. Variveis Aleatrias Discretas ........................................................................................56

    11. Distribuies de Variveis Aleatrias Discretas..............................................................60

    12. Distribuies de Variveis Aleatrias Contnuas............................................................62

  • 7/30/2019 Estatistica Basica.docx

    3/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 3

    CAPTULO 1INTRODUO A ESTATISTICA

    1. Objeto da Estatstica

    Estatstica uma cincia exata que visa fornecer subsdios ao analista para coletar,organizar, resumir, analisar e apresentar dados. Trata de parmetros extrados da populao,tais como mdia ou desvio padro.

    A estatstica fornece-nos as tcnicas para extrair informao de dados, os quais so muitasvezes incompletos, na medida em que nos do informao til sobre o problema em estudo,sendo assim, objetivo da Estatstica extrair informao dos dados para obter uma melhorcompreenso das situaes que representam.

    Quando se aborda uma problemtica envolvendo mtodos estatsticos, estes devem ser

    utilizados mesmo antes de se recolher amostra, isto , deve-se planejar a experincia quenos vai permitir recolher os dados, de modo que, posteriormente, se possa extrair o mximode informao relevante para o problema em estudo, ou seja, para a populao de onde osdados provm.

    Quando de posse dos dados, procura-se agrupa-los e reduzi-los, sob forma de amostra,deixando de lado a aleatoriedade presente.

    Seguidamente o objetivo do estudo estatstico pode ser o de estimar uma quantidade outestar uma hiptese, utilizando-se tcnicas estatsticas convenientes, as quais realam toda a

    potencialidade da Estatstica, na medida em que vo permitir tirar concluses acerca de uma

    populao, baseando-se numa pequena amostra, dando-nos ainda uma medida do errocometido.

    2. Ferramentas Estatsticas

    2.1 - O que Estatstica?

    Segundo JURAN:1. a cincia da tomada de deciso perante incertezas;2. Coleta, anlise e interpretao de dados;3. um kit de ferramentas que ajuda a resolver problemas;

    4. Base para a maior parte das decises tomadas quanto ao controle da qualidade, assimcomo em quase todas as outras reas da atividade humana moderna.

    Vista dessa forma, a Estatstica no deve ser confundida como uma disciplina isolada, e sim,compreendida como uma ferramenta ou um conjunto de ferramentas, disponvel para asoluo de problemas em diversas reas do conhecimento.

    Segundo FEIGENBAUM: Preciso significativamente aumentada em produo de itens eprodutos tem sido acompanhada pela necessidade de mtodos aperfeioados para medio,especificao e registro dela. A estatstica, denominada cincia das medies, representauma das tcnicas mais valiosas utilizadas nas quatro tarefas, e isso tem ficado cada vez maisevidente.

  • 7/30/2019 Estatistica Basica.docx

    4/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 4

    2.2 Onde se aplica a Estatstica na Engenharia?

    As aplicaes concentram-se fundamentalmente em dois campos de ao: o ControleEstatstico do Processo e o Controle Estatstico da Qualidade.

    Definies segundo JURAN:1. Processo: qualquer combinao especfica de mquinas, ferramentas, mtodos, materiaise/ou pessoas empregadas para atingir qualidades especficas num produto ou servio. Estasqualidades so chamadas de caractersticas de qualidade, que podem ser uma dimenso,

    propriedade do material, aparncia, etc.2. Controle: um ciclo defeedback(realimentao) atravs da qual medimos o desempenhoreal, comparando-o com o padro, e agimos sobre a diferena.3. Controle Estatstico do Processo (CEP): aplicao de tcnicas estatsticas para medir eanalisar a variao nos processos.4. Controle Estatstico da Qualidade (CEQ): aplicao de tcnicas estatsticas para medir e

    aprimorar a qualidade dos processos. CEQ inclui CEP, ferramentas de diagnstico, planos deamostragem e outras tcnicas estatsticas.Segundo FEIGENBAUM, provavelmente, mais importante do que os prprios mtodosestatsticos tm sido o impacto causado sobre o pensamento industrial pela filosofia querepresentam. O ponto de vista estatstico resume-se essencialmente nisto: a variabilidadena qualidade do produto deve ser constantemente estudada:

    Esse ponto de vista, que enfatiza o estudo da variao, exerce efeito significativo sobrecertas atividades no controle da qualidade. Ainda segundo FEIGENBAUM, cincoferramentas estatsticas tornaram-se amplamente utilizadas nas tarefas de controle daqualidade:

    1. Distribuio de freqncias;2. Grficos de controle;3. Aceitao por amostragem;

    4. Mtodos especiais;5. Confiabilidade.

    Na abordagem do papel dos mtodos estatsticos no gerenciamento de processos deproduo, KUME tambm faz referncia variabilidade. Diz que, (...) independentementedos tipos de produtos ou de mtodos de produo usados, as causas de produtos defeituososso universais. Variao, esta a causa., Variaes nos materiais, na condio dosequipamentos, no mtodo de trabalho e na inspeo so as causas dos defeitos. Aindasegundo KUME, (...) os mtodos estatsticos so ferramentas eficazes para a melhoria do

    processo produtivo e reduo de seus defeitos.

    O primeiro passo na busca da verdadeira causa de um defeito a cuidadosa observao dofenmeno do defeito. Aps tal observao cuidadosa, a verdadeira causa torna-se evidente.

  • 7/30/2019 Estatistica Basica.docx

    5/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 5

    As ferramentas estatsticas, diz KUME, conferem objetividade e exatido observao. Asmximas da forma estatstica de pensar so:

    1. Dar maior importncia aos fatos do que os conceitos abstratos;

    2. No expressar fatos em termos de intuio ou idias. Usar evidncias obtidas a partir deresultados especficos da observao;3. Os resultados da observao, sujeitos como so a erros e variaes, so partes de um todoobscuro. A principal meta da observao descobrir esse todo obscuro;4. Aceitar o padro regular que aparece em grande parte dos resultados observados comouma informao confivel.5. O conhecimento dominado ato o presente momento no nada mais que umembasamento para hipteses futuras. Uma vez que isso tenha sido compreendido, a forma de

    pensar mencionada pode ser aproveitada para aprofundar a compreenso do processoprodutivo e dos meios para melhor-lo.

    2.3 Definies Bsicas da Estatstica

    1) FENMENO ESTATSTICO: qualquer evento que se pretenda analisar, cujo estudoseja possvel da aplicao do mtodo estatstico. So divididos em trs grupos:Fenmenos de massa ou coletivo: so aqueles que no podem ser definidos por uma simplesobservao. A estatstica dedica-se ao estudo desses fenmenos.

    Fenmenos individuais: so aqueles que iro compor os fenmenos de massa.Fenmenos de multido: quando as caractersticas observadas para a massa no severificam para o particular.

    2) DADO ESTATSTICO: um dado numrico e considerado a matria-prima sobre aqual iremos aplicar os mtodos estatsticos.3) POPULAO: o conjunto total de elementos portadores de, pelo menos, umacaracterstica comum.4) AMOSTRA: uma parcela representativa da populao que examinada com o

    propsito de tirarmos concluses sobre a essa populao.5) PARMETROS: So valores singulares que existem na populao e que servem paracaracteriz-la.Para definirmos um parmetro devemos examinar toda a populao.6) ESTIMATIVA: um valor aproximado do parmetro e calculado com o uso daamostra.

    7) ATRIBUTO: quando os dados estatsticos apresentam um carter qualitativo, olevantamento e os estudos necessrios ao tratamento desses dados so designadosgenericamente de estatstica de atributo.8) VARIVEL: , convencionalmente, o conjunto de resultados possveis de um fenmeno.

    Var ivel Qualitati va: Quando seus valores so expressos por atributosVar ivel Quantitati va: Quando os dados so de carter nitidamente quantitativo, e oconjunto dos resultados possui uma estrutura numrica, trata-se, portanto da estatstica devarivel e se dividem em:Var ivel Discreta ou Descontnua: Seus valores so expressos geralmente atravs denmeros inteiros no negativos. Resulta normalmente de contagens. Ex: N de alunos

    presentes s aulas de introduo estatstica econmica no 1 semestre de 1997: mar = 18,abr = 30 , mai = 35 , jun = 36.

  • 7/30/2019 Estatistica Basica.docx

    6/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 6

    Var ivel Contnua: Resulta normalmente de uma mensurao, e a escala numrica de seuspossveis valores corresponde ao conjunto R dos nmeros Reais, ou seja, podem assumir,teoricamente, qualquer valor entre dois limites. Ex.: Quando voc vai medir a temperatura deseu corpo com um termmetro de mercrio o que ocorre o seguinte: O filete de mercrio,ao dilatar-se, passar por todas as temperaturas intermedirias at chegar na temperatura

    atual do seu corpo.

    2.4 Planejamento para Coleta e Anlise de Dados

    As ferramentas devem ser utilizadas de maneira eficiente para alcanar o sucesso. Para tanto,o processo deve incluir:1. planejamento cuidadoso da coleta de dados;2. anlise de dados para tirar concluses estatsticas e3. transio para a resposta ao problema tcnico original.

    Segundo JURAN, alguns passos-chave so:

    1. Coletar informaes anteriores suficientes para traduzir o problema de engenharia emproblema especfico que possa ser avaliado por mtodos estatsticos;2. Planejar a coleta de dados:a. Determinar o tipo de dados necessrios quantitativos (mais custo, mais til) equalitativos;

    b. Determinar se quaisquer dados prvios esto disponveis e so aplicveis ao presenteproblema;c. Se o problema exigir uma avaliao de vrias decises alternativas, obter informaessobre as conseqncias econmicas de uma deciso errada.d. Se o problema exigir a estimao de um parmetro, definir a preciso necessria para aestimativa;

    e. Determinar se o erro de medio grande o suficiente para influenciar o tamanhocalculado da amostra ou o mtodo da anlise de dados;f. Definir as suposies necessrias para calcular o tamanho da amostra exigido;g. Calcular o tamanho da amostra necessrio considerando a preciso desejada do resultado,erro amostral, variabilidade dos dados, erros de medio e outros fatores;h. Definir quaisquer requisitos para preservar a ordem das medies quando o tempo for um

    parmetro chave;i.Determinar quaisquer requisitos para coletar dados em grupos definidos diferentescondies a serem avaliadas;

    j. Definir o mtodo de anlise de dados e quaisquer hipteses necessrias;k.Definir os requisitos para quaisquer programas de computador que venham a sernecessrios.3. Coletar dados:a. Usar mtodos para assegurar que a amostra selecionada de forma aleatria;

    b. Registrar os dados e tambm as condies presentes no momento de cada observao;c. Examinar os dados amostrais para assegurar que o processo mostra estabilidade suficiente

    para se fazer previses vlidas para o futuro.4. Analisar os dados:a. Selecionar os dados;

    b. Avaliar as hipteses previamente estabelecidas. Se necessrio, tomar atitudes corretivas(novas observaes);

    c. Aplicar tcnicas estatsticas para avaliar o problema original;d. Determinar se dados e anlises adicionais so necessrios;

  • 7/30/2019 Estatistica Basica.docx

    7/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 7

    e. Realizar anlises de sensibilidade variando estimativas amostrais importantes e outrosfatores na anlise e observando o efeito sobre as concluses finais.5. Rever as concluses da anlise de dados para determinar se o problema tcnico originalfoi avaliado ou se foi modificado para se enquadrar nos mtodos estatsticos.6. Apresentar os resultados:

    a. Estabelecer as concluses de forma significativa, enfatizando os resultados nos termos doproblema original, e no na forma dos ndices estatsticos usados na anlise;b. Apresentar graficamente os resultados quando apropriado. Usar mtodos estatsticossimples no corpo do relatrio e colocar as anlises complexas em um apndice.7. Determinar se as concluses do problema especfico so aplicveis a outrosproblemas ou se os dados e clculos poderiam ser teis para outros problemas.

    3. ESTATSTICA DESCRITIVAViu-se anteriormente um roteiro para coleta e anlise de dados. As sries de dados,

    basicamente, so provenientes de duas fontes: os dados histricos e os dados de

    experimentos planejados.

    Os dados histricos so sries de dados existentes e, em geral, analisar estatisticamenteesses dados mais econmico (tempo e despesas) se comparado com dados obtidos a partirde experimentos planejados. Mesmo com uma anlise estatstica complexa, em geral, poucosucesso se obtm com tais dados. No controle de um processo, algumas razes para esseinsucesso ocorrer so:

    impossvel distinguir a origem de um determinado efeito.

    processo.

    operao do processo.odem no ter sido mantidas

    constantes, e serem as reais causadoras dos efeitos observados no processo.Por essas razes, recomenda-se a anlise de sries de dados histricos apenas para aindicao de variveis importantes a serem observadas em um experimento planejado.

    Os dados de experimentos planejados so coletados com o objetivo estudar e analisar umproblema. So dados reunidos em diversas sries de variveis com aparente importncia emum processo, enquanto se mantm constantes (com valores registrados) todas as outras

    variveis que possivelmente poderiam alterar o resultado. Aqui tratar-se- de mtodosprticos de organizao de dados. Segundo SPIEGEL4: A parte da estatstica que procurasomente descrever e analisar um certo grupo, sem tirar quaisquer concluses ou infernciassobre um grupo maior, chamada estatstica descritiva ou dedutiva.Freqentemente dois ou mais mtodos de organizao so utilizados para descrever comclareza dados coletados. Alguns desses mtodos so: grficos dos dados na ordemcronolgica, distribuio e histogramas de freqncia, caractersticas amostrais, medidas detendncia central e medidas de disperso.

  • 7/30/2019 Estatistica Basica.docx

    8/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 8

    4. SRIES ESTATSTICAS

    TABELA: Resume um conjunto de dados dispostos segundo linhas e colunas de maneirasistemtica.

    De acordo com a Resoluo 886 do IBGE, nas casas ou clulas da tabela devemos colocar:

    um trao horizontal ( - ) quando o valor zero; trs pontos ( ... ) quando no temos os dados; zero ( 0 ) quando o valor muito pequeno para ser expresso pela unidade utilizada; um ponto de interrogao ( ? ) quando temos dvida quanto exatido de

    determinado valor.

    Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto. "Salientamos quenestes documentos as tabelas no sero abertas devido a limitaes do editor html".

    qualquer tabela que apresenta a distribuio de um conjunto de dados estatsticos emfuno da poca, do local ou da espcie.

    Sries Homgradas: so aquelas em que a varivel descrita apresenta variao discreta oudescontnua. Podem ser do tipo temporal , geogrfica ou especfica.

    a) Srie Temporal: Identifica-se pelo carter varivel do fator cronolgico. O local e aespcie (fenmeno) so elementos fixos. Esta srie tambm chamada de histrica ouevolutiva.

    ABC VECULOS LTDA.

    Vendas no 1 bimestre de 2002

    PERODO UNIDADES VENDIDAS *

    JAN/2002 2 0FEV/2002 1 0TOTAL 3 0

    * Em mil unidades

    .

  • 7/30/2019 Estatistica Basica.docx

    9/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 9

    b) Srie Geogrfica: Apresenta como elemento varivel o fator geogrfico. A poca e o fato(espcie) so elementos fixos. Tambm chamada de espacial, territorial ou de localizao.

    ABC VECULOS LTDA.

    Vendas no 1 bimestre de 2002

    FILIAIS UNIDADES VENDIDAS *

    So Paulo 1 3Rio de Janeiro 1 7TOTAL 3 0

    * Em mil unidades

    c) Srie Especfica: O carter varivel apenas o fato ou espcie. Tambm chamada desrie categrica.

    ABC VECULOS LTDA.

    Vendas no 1 bimestre de 2002

    MARCA UNIDADES VENDIDAS *

    FIAT 1 8GM 1 2

    TOTAL 3 0

    * Em mil unidades

    Sries Conjugadas: Tambm chamadas de tabelas de dupla entrada. So apropriadas apresentao de duas ou mais sries de maneira conjugada, havendo duas ordens declassificao: uma horizontal e outra vertical. O exemplo abaixo de uma srie geogrfica-temporal.

    ABC VECULOS LTDA.

    Vendas no 1 bimestre de 2002

    FILIAIS Janeiro/2002 Fevereiro/2002So Paulo 1 0 3Rio de Janeiro 1 2 5TOTAL 2 2 8

    * Em mil unidades

    Obs: as sries hetergradas sero estudas no captulo 2 ( distribuio de frequncias ).

  • 7/30/2019 Estatistica Basica.docx

    10/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 10

    CAPTULO 2DISTRIBUIO DE FREQUNCIAS

    uma ferramenta estatstica apropriada para a apresentao de grandes massas de dadosnuma forma que torna mais clara a tendncia central e a disperso dos valores ao longo da

    escala de medio, bem como a freqncia relativa de ocorrncia dos diferentes valores.

    Quando da anlise de dados, comum procurar conferir certa ordem aos nmeros tornando-os visualmente mais amigveis. O procedimento mais comum o de diviso por classes oucategorias, verificando-se o nmero de indivduos pertencentes a cada classe.

    um tipo de tabela que condensa uma coleo de dados conforme as frequncias (repetiesde seus valores).

    Tabela pr imitiva ou dados bru tos: uma tabela ou relao de elementos que no foramnumericamente organizados. difcil formarmos uma idia exata do comportamento do

    grupo como um todo, a partir de dados no ordenados.

    Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51

    ROL:Tem-se um rol aps a ordenao dos dados (crescente ou decrescente).

    Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60

    Distribuio de frequncia sem i ntervalos de classe: a simples condensao dos dadosconforme as repeties de seus valores. Para um tabela de tamanho razovel esta distribuiode frequncia inconveniente, j que exige muito espao. Veja exemplo abaixo:

    Tabela 1

    Dados Frequncia

    41 3

    42 2

    43 1

    44 1

    45 146 2

    50 2

    51 1

    52 1

    54 1

    57 1

    58 2

    60 2

    Total 20

  • 7/30/2019 Estatistica Basica.docx

    11/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 11

    Distribuio de fr equncia com intervalos de classe:Quando o tamanho da amostra elevado mais racional efetuar o agrupamento dos valores em vrios intervalos de classe.

    Tabela 2

    Classes Frequncias41 |------- 45 7

    45 |------- 49 3

    49 |------- 53 4

    53 |------- 57 1

    57 |------- 61 5

    Total 20

    2.1 Elementos de uma Distribuio de Freqncia com classes

    CLASSE: so os intervalos da varivel simbolizada por ie o nmero total de classessimbolizada pork. Ex: na tabela anteriork=5 e49 |------- 53 a 3 classe, onde i=3.Para aconstruo de uma tabela a partir de um dado bruto calcularemos o katravs da Regra deSturges" k=1+3,3logn(para n25).LIMITES DE CLASSE: so os extremos de cada classe. O menor nmero o limiteinferior de classe (li) e o maior nmero, limite superior de classe (Ls). Ex: em 49 |--- 53Li3= 49 e Ls3= 53. O smbolo |--- representa um intervalo fechado esquerda e aberto

    direita. O dado 53 no pertence classe 3 e sim a classe 4 representada por 53 |--- 57.

    AMPLITUDE DO INTERVALO DE CLASSE: obtida atravs da diferena entre olimite superior e inferior da classe simbolizada pora = Ls - li. Ex: na tabela anteriora= 53 -49 = 4. Obs: Na distribuio de frequncia c/ classe o c ser igual em todas as classes.Paraa construo de uma tabela a partir de um dado bruto temos: a=Ls-Li/K

    AMPLITUDE TOTAL DA DISTRIBUIO: a diferena entre o valor mximo e ovalor mnimo da amostra. Onde At = Xmax - Xmin. Em nosso exemplo At= 60 - 41 = 19.

    PONTO MDIO DE CLASSE: o ponto que divide o intervalo de classe em duas partesiguais.Ex: em 49 |------- 53 o ponto mdio x3 = (53+49)/2 = 51, ou seja, x3=(Li+Ls)/2.

  • 7/30/2019 Estatistica Basica.docx

    12/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 12

    Os dados brutos a seguir apresentam um conjunto de tempos para determinada operao.

    5,1 5,3 5,3 5,6 5,8 5,9 6 6,1 6,2 6,26,3 6,3 6,3 6,4 6,4 6,4 6,5 6,5 6,6 6,7

    6,7 6,8 6,8 6,9 6,9 7 7,1 7,1 7,2 7,27,3 7,4 7,5 7,5 7,6 7,6 7,6 7,7 7,7 7,87,8 7,9 7,9 8 8 8,1 8,2 8,3 8,3 8,48,5 8,5 8,6 8,7 8,8 8,8 8,9 9 9,1 9,29,4 9,4 9,5 9,5 9,6 9,8 9,9 10 10,2 10,2

    10,4 10,6 10,8 10,9 11,2 11,5 11,8 12,3 12,7 14,9

    2.2 Regras para a elaborao de uma distribuio de freqncias com classes

    1 Organize os dados brutos em um ROL.

    2 Calcule a amplitude total At.

    No nosso exemplo: At=14,95,1 = 9,8

    3 Calculeo nmero de classes (K), que ser calculado usando K = . Obrigatoriamentedeve estar compreendido entre 5 a 20. Neste caso, K igual a 8,94, aproximadamente, 8. Nonosso exemplo: n= 80 dados, ento , k=n= 8,9 .4 Conhecido o nmero de classes define-se a amplitude de cada classe:

    No exemplo, a ser igual a:

    5 Temos ento o menor n da amostra, o n de classes e a amplitude do intervalo. Podemosmontar a tabela, com o cuidado para no aparecer classes com frequncia = 0 (zero).

    6 Com o conhecimento da amplitude de cada classe, define-se os limites para cada classe(inferior e superior), onde limite Inferior ser 5,1 e o limite superior ser 15 + 1,23.

    Intervalo deClasse

    FreqnciaAbsoluta (fi)

    FreqnciaAcumulada (Fi)

    FreqnciaRelativa (fr)

    FreqnciaAcumulada (Fr)

    05,10 |---| 06,33 13 13 16,25 16,2506,34 |---| 07,57 21 34 26,25 42,5007,58 |---| 08,81 22 56 27,50 70,0008,82 |---| 10,05 15 71 18,75 88,7510,06 |---| 11,29 4 75 5,00 93,7511,30 |---| 12,53 3 78 3,75 97,5012,54 |---| 13,77 1 79 1,25 98,7513,78 |---| 15,01 1 80 1,25 100

    Total 80 - 100 -

  • 7/30/2019 Estatistica Basica.docx

    13/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 13

    Obs: Agrupar os dados em classes uma importante ferramenta para resumir grandes massasde dados brutos, no entanto acarreta perda de alguns detalhes.

    Frequncias simpl es ou absolutas(fi): so os valores que realmente representam o nmero

    de dados de cada classe. A soma das frequncias simples igual ao nmero total dos dadosda distribuio.

    Frequncias relati vas(fr): so os valores das razes entre as frequncias absolutas de cadaclasse e a frequncia total da distribuio. A soma das frequncias relativas igual a 1 (100%).

    Frequncia simples acumulada de uma classe(Fi): o total das frequncias de todos osvalores inferiores ao limite superior do intervalo de uma determida classe.

    Frequncia relativa acumulada de um classe(Fr): a frequncia acumulada da classe,

    dividida pela frequncia total da distribuio.

  • 7/30/2019 Estatistica Basica.docx

    14/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 14

    CAPTULO 3MEDIDAS DE CENTRALIDADE

    H vrias medidas de tendncia central, entretanto nesta apostila, ser abordado o estudo deapenas aquelas que so mais significativas. As mais importante medidas de tendncia centralso: a mdia aritmtica, mdia aritmtica para dados agrupados, mdia aritmtica ponderada,mediana, moda.

    3. Medidas de Centralidade

    3.1 Mdia Aritmtica=

    Sendo a mdia uma medida to sensvel aos dados, preciso ter cuidado com a suautilizao, pois pode dar uma imagem distorcida dos dados.

    A mdia possui uma particularidade bastante interessante, que consiste no seguinte:se calcularmos os desvios de todas as observaes relativamente mdia e somarmos essesdesvios o resultado obtido igual a zero.

    A mdia tem uma outra caracterstica, que torna a sua utilizao vantajosa em certasaplicaes: Quando o que se pretende representar a quantidade total expressa pelos dados,utiliza-se a mdia.

    Na realidade, ao multiplicar a mdia pelo nmero total de elementos, obtemos a quantidadepretendida.

    igual ao quociente entre a soma dos valores do conjunto e o nmero total dos valores.

    ...onde xi so os valores da varivel e n o nmero de valores.

    .Dados no-agrupados:

    Quando desejamos conhecer a mdia dos dados no-agrupados em tabelas de frequncias,determinamos a mdia aritmtica simples.

    Exemplo: Os dados a seguir apresentam leituras de concentrao de um processo qumicofeitas a cada duas horas 10, 14, 13, 15, 16, 18 e 12, temos, uma concentrao mdia de:

    .= (10+14+13+15+16+18+12) / 7 = 14

    Desvio em relao mdia: a diferena entre cada elemento de um conjunto de valores e

    a mdia aritmtica, ou seja:..di = Xi -

  • 7/30/2019 Estatistica Basica.docx

    15/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 15

    No exemplo anterior temos sete desvios:.d1 = 10 - 14 = - 4 ,.d2 = 14 - 14 = 0 , d3 = 13 - 14 =- 1 ,.d4 = 15 - 14 = 1 ,.d5 = 16 - 14 = 2 ,..d6 = 18 - 14 = 4 e.d7 = 12 - 14 = - 2.

    Propriedades da mdia

    1 propriedade: A soma algbrica dos desvios em relao mdia nula.

    No exemplo anterior : d1+d2+d3+d4+d5+d6+d7 = 0

    2 propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores deuma varivel, a mdia do conjunto fica aumentada (ou diminuda) dessa constante.

    Se no exemplo original somarmos a constante 2 a cada um dos valores da varivel temos:

    Y = 12+16+15+17+18+20+14 / 7 = 16 ou

    Y = .+ 2 = 14 +2 = 16

    3 propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma varivelpor uma constante (c), a mdia do conjunto fica multiplicada (ou dividida) por essaconstante.

    Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da variveltemos:

    Y = 30+42+39+45+48+54+36 / 7 = 42 ou

    Y = x 3 = 14 x 3 = 42

    .

    Dados agrupados:

    Sem intervalos de classe

    Consideremos a distribuio relativa de um canal de comunicao que est sendomonitorado pelo registro do n de erros em um conjunto de caracteres (string) 1.000 bits.Dados para 34 desses conjuntos so vistos a seguir.

    N de erros frequncia = fi

    0 2

    1 6

    2 10

    3 12

    4 4

    total 34

  • 7/30/2019 Estatistica Basica.docx

    16/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 16

    Como as frequncias so nmeros indicadores da intensidade de cada valor da varivel, elasfuncionam como fatores de ponderao, o que nos leva a calcular a mdia aritmticaponderada, dada pela frmula:

    ..xi. ..fi. ..xi.fi .0 2 0

    1 6 6

    2 10 20

    3 12 36

    4 4 16

    total 34 78

    onde 78 / 34 = 2,3 erros

    Com intervalos de classe

    Neste caso, convencionamos que todos os valores includos em um determinado intervalo declasse coincidem com o seu ponto mdio, e determinamos a mdia aritmtica ponderada pormeio da frmula:

    ..onde Xi o ponto mdio da classe.

    Exemplo: Calcular o nmero de molas fora de conformidade, em cada batelada de produo,com um tamanho igual a 40 conforme a tabela abaixo.

    N de molas frequncia = fi ponto mdio = xi ..xi.fi.50 |---- 54 4 52 208

    54 |---- 58 9 56 504

    58 |---- 62 11 60 660

    62 |---- 66 8 64 512

    66 |---- 70 5 68 34070 |---- 74 3 72 216

    Total 40 2.440

    Aplicando a frmula acima temos: 2.440 / 40.= 61. logo... = 61 molas

  • 7/30/2019 Estatistica Basica.docx

    17/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 17

    MODA

    o valor que ocorre com maior frequncia em uma srie de valores.

    Mo o smbolo da moda.

    Desse modo, a fora modal de remoo para um conector a fora mais comum, isto , afora de remoo medida em um teste de laboratrio para um conector.

    .

    A Moda quando os dados no esto agrupados

    A moda facilmente reconhecida: basta, de acordo com definio, procurar o valor

    que mais se repete.

    Exemplo: Na srie { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda igual a 10.

    H sries nas quais no exista valor modal, isto , nas quais nenhum valor apareamais vezes que outros.

    Exemplo: { 3 , 5 , 8 , 10 , 12 } no apresenta moda. A srie amodal.

    .Em outros casos, pode haver dois ou mais valores de concentrao. Dizemos, ento,que a srie tem dois ou mais valores modais.

    Exemplo: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A srie bimodal.

    .A Moda quando os dados esto agrupados

    a) Sem intervalos de classe

    Uma vez agrupados os dados, possvel determinar imediatamente a moda: basta fixar ovalor da varivel de maior frequncia.

    Exemplo: Qual a temperatura mais comum medida no ms abaixo:

    Temperaturas Frequncia

    0 C 3

    1 C 9

    2 C 12

    3 C 6

    Resp: 2 C a temperatura modal, pois a de maior frequncia.

  • 7/30/2019 Estatistica Basica.docx

    18/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 18

    .

    b) Com intervalos de classe

    A classe que apresenta a maior frequncia denominada classe modal. Pela definio,

    podemos afirmar que a moda, neste caso, o valor dominante que est compreendido entreos limites da classe modal. O mtodo mais simples para o clculo da moda consiste emtomar o ponto mdio da classe modal. Damos a esse valor a denominao de moda bruta.

    Mo = ( Li+ Ls) / 2

    onde Li = limite inferior da classe modal e Ls= limite superior da classe modal.

    Exemplo: Calcule a resistncia modal dos 33 resistores conforme a tabela abaixo.

    Resistencia (em ohms) Frequncia54 |---- 58 9

    58 |---- 62 11

    62 |---- 66 8

    66 |---- 70 5

    Resp: a classe modal 58|--- 62, pois a de maior frequncia. Li=58 e Ls=62

    Mo = (58+62) / 2 = 60 cm (este valor estimado, pois no conhecemos o valor real da

    moda).

    Mtodo mais elaborado pela frmula de CZUBER:

    Mo = Li + ((fmo - fant) / ( 2fmo(fant + fpost))) x c

    Li= limite inferior da classe modal

    fmo= frequncia da classe modal

    fant =frequncia da classe anterior da classe modal

    fpost =frequncia da classe posterior da classe modal

    c = amplitude da classe modal

    Obs: A moda utilizada quando desejamos obter uma medida rpida e aproximada deposio ou quando a medida de posio deva ser o valor mais tpico da distribuio. J amdia aritmtica a medida de posio que possui a maior estabilidade.

  • 7/30/2019 Estatistica Basica.docx

    19/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 19

    MEDIANA

    A mediana de um conjunto de valores, dispostos segundo uma ordem (crescente ou

    decrescente), o valor situado de tal forma no conjunto que o separa em dois subconjuntosde mesmo nmero de elementos.

    Smbolo da mediana: Md

    .A mediana em dados no-agrupados

    Dada uma srie de valores como, por exemplo: { 5, 2, 6, 13, 9, 15, 10 }

    De acordo com a definio de mediana, o primeiro passo a ser dado o da ordenao(crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 }

    O valor que divide a srie acima em duas partes iguais igual a 9, logo a Md = 9.

    Mtodo prtico para o clculo da Mediana

    Se a srie dada tiver nmero mpar de termos:

    O valor mediano ser o termo de ordem dado pela frmula :

    O elemento mediano ser:..EMd = n + 1 / 2

    Exemplo: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 2, 5 }

    1 - ordenar a srie { 0, 0, 1, 1, 2, 2, 3, 4, 5 }

    n = 9 logo (n + 1)/2 dado por (9+1) / 2 = 5, ou seja, o 5 elemento da srie ordenada ser amediana.

    A mediana ser o 5 elemento, ou seja, Md = 2

    Se a srie dada tiver nmero par de termos:

    O elemento mediano ser:..EMd = n / 2

    Exemplo: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 }

    1 - ordenar a srie { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }

    n = 10 logo a frmula ficar: :..EMd = 10 / 2 = 5

    Ser na realidade (5 termo + 6 termo) / 2

  • 7/30/2019 Estatistica Basica.docx

    20/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 20

    A mediana ser = (2+3) / 2, ou seja, Md = 2,5 . A mediana no exemplo ser a mdiaaritmtica do 5 e 6 termos da srie.

    Notas:

    Quando o nmero de elementos da srie estatstica for mpar, haver coincidncia damediana com um dos elementos da srie. Quando o nmero de elementos da srie estatstica for par, nunca haver

    coincidncia da mediana com um dos elementos da srie. A mediana ser sempre amdia aritmtica dos 2 elementos centrais da srie.

    Em um srie a mediana, a mdia e a moda no tm, necessariamente, o mesmo valor. A mediana, depende da posio e no dos valores dos elementos na srie ordenada.

    Essa uma da diferenas marcantes entre mediana e mdia (que se deixainfluenciar, e muito, pelos valores extremos). Vejamos:

    Em { 5, 7, 10, 13, 15 } a mdia = 10 e a mediana = 10

    Em { 5, 7, 10, 13, 65 } a mdia = 20 e a mediana = 10

    Isto , a mdia do segundo conjunto de valores maior do que a do primeiro, por influnciados valores extremos, ao passo que a mediana permanece a mesma.

    .

    A mediana em dados agrupados

    a) Sem intervalos de classe

    Neste caso, o bastante identificar a frequncia acumulada imediatamente superior metadeda soma das frequncias. A mediana ser aquele valor da varivel que corresponde a talfrequncia acumulada.

    Exemplo conforme tabela abaixo:

    Varivel xi Frequncia fi Frequncia acumulada

    0 2 2

    1 6 82 9 17

    3 13 30

    4 5 35

    Total 35 -

    Quando o somatrio das frequncias formpar o valor mediano ser o termo de ordem dadopela frmula :.

  • 7/30/2019 Estatistica Basica.docx

    21/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 21

    Como o somatrio das frequncias = 35 a frmula ficar: ( 35+1 ) / 2 = 18 termo = 3..

    Quando o somatrio das frequncias forpar o valor mediano ser o termo de ordem dadopela frmula :.

    Exemplo - Calcule Mediana da tabela abaixo:

    Varivel xi Frequncia fi Frequncia acumulada

    12 1 1

    14 2 3

    15 1 4

    16 2 6

    17 1 7

    20 1 8

    Total 8 -

    Aplicando a frmula acima teremos: [(8/2)+ (8/2+1)]/2 = (4 termo + 5 termo) / 2 = (15 +16) / 2 = 15,5

    b) Com intervalos de classe

    Devemos seguir os seguintes passos: 1) Determinamos as frequncias acumuladas ; 2)

    Calculamos ; 3) Marcamos a classe correspondente frequncia acumulada

    imediatamente superior . Tal classe ser a classe mediana; 4) Calculamos aMediana pela seguinte frmula:..Li + [(EMd- Fant) x c] / fMd

    Li = o limite inferior da classe mediana.

    Fant = a frequncia acumulada da classe anterior classe mediana.

    fMd= a frequncia simples da classe mediana.

    c = a amplitude do intervalo da classe mediana.

  • 7/30/2019 Estatistica Basica.docx

    22/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 22

    Exemplo:

    classes frequncia = fi Frequncia acumulada

    50 |---- 54 4 4

    54 |---- 58 9 13

    58 |---- 62 11 24

    62 |---- 66 8 32

    66 |---- 70 5 37

    70 |---- 74 3 40

    Total 40 -

    = 40 / 2 =.20..logo.a classe mediana ser 58 |---- 62

    Li = 58....... Fant = 13........... fMd = 11........... c = 4

    Substituindo esses valores na frmula, obtemos: Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11= 60,54

    OBS: Esta mediana estimada, pois no temos os 40 valores da distribuio.

    Emprego da Mediana

    Quando desejamos obter o ponto que divide a distribuio em duas partes iguais. Quando h valores extremos que afetam de maneira acentuada a mdia aritmtica.

  • 7/30/2019 Estatistica Basica.docx

    23/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 23

    CAPTULO 4 - MEDIDAS DE ASSIMETRIA E CURTOSE

    Denominamos curtose o grau de achatamento de uma distribuio em relao a umadistribuio padro, denominada curva normal (curva correspondente a uma distribuioterica de probabilidade).

    Distribuies simtricas

    A distribuio das frequncias faz-se de forma aproximadamente simtrica, relativamente auma classe mdia. Quando a distribuio simtrica, a mdia e a mediana coincidem.

    Caso especial de uma distribuio simtrica

    Quando dizemos que os dados obedecem a uma distribuio normal, estamos tratando dedados que se distribuem em forma de sino.

    Distribuies Assimtricas

    A distribuio das freqncias apresenta valores menores num dos lados:

  • 7/30/2019 Estatistica Basica.docx

    24/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 24

    Distribuies com "caudas" longas

    Observamos que nas extremidades h uma grande concentrao de dados em relao aos

    concentrados na regio central da distribuio.

    A partir do exposto, deduzimos que se a distribuio dos dados:

    1.for aproximadamente simtrica, a mdia aproxima-se da mediana

    2.for enviesada para a direita (alguns valores grandes como "outliers"), a mdia tende a sermaior que a mediana

    3. for enviesada para a esquerda (alguns valores pequenos como "outliers"), a mdia tende aser inferior mediana.

    So representaes visuais dos dados estatsticos que devem corresponder, mas nuncasubstituir as tabelas estatsticas. Tm como caractersticas principais, o uso de escalas, aexistncia de um sistema de coordenadas, a simplicidade, clareza e veracidade de sua

    representao.

  • 7/30/2019 Estatistica Basica.docx

    25/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 25

    CAPTULO 5 - REPRESENTAO GRFICA

    Os grficos podem ser:

    1. Grficos de informao: grficos destinados principalmente ao pblico em geral,objetivando proporcionar uma visualizao rpida e clara. So grficos tipicamenteexpositivos, dispensando comentrios explicativos adicionais. As legendas podem seromitidas, desde que as informaes desejadas estejam presentes ou

    2. Grficos de anlise: grficos que prestam-se melhor ao trabalho estatstico, fornecendoelementos teis fase de anlise dos dados, sem deixar de ser tambm informativos. Osgrficos de anlise freqentemente vm acompanhados de uma tabela estatstica. Inclui-se,muitas vezes um texto explicativo, chamando a ateno do leitor para os pontos principaisrevelados pelo grfico.

    Mas o uso indevido de Grficos pode trazer uma idia falsa dos dados que esto sendoanalisados, chegando mesmo a confundir o leitor, tratando-se, na realidade, de um problemade construo de escalas..Os grficos pode ser classificados em: Diagramas, Estereogramas, Pictogramas eCartogramas..4.1 - DiagramasSo grficos geomtricos dispostos em duas dimenses. So os mais usados na

    representao de sries estatsticas. Eles podem ser :1 - Grficos em barras horizontais.

    2 - Grficos em barras verticais (colunas). Quando as legendas no so breves usa-se depreferncia o grfico em barras horizontais. Nesses grficos os retngulos tm a mesma basee as alturas so proporcionais aos respectivos dados. A ordem a ser observada acronolgica, se a srie for histrica, e a decrescente, se for geogrfica ou categrica.

    Fig 1. Grfico de barras de harmnicos da rede eltrica em uma determinada regio.

  • 7/30/2019 Estatistica Basica.docx

    26/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 26

    3 - Grficos em barras compostas.

    4 - Grficos em colunas superpostas. Eles diferem dos grficos em barras ou colunas

    convencionais apenas pelo fato de apresentar cada barra ou coluna segmentada em partescomponentes. Servem para representar comparativamente dois ou mais atributos.

    5 - Grficos em linhas ou lineares. So freqentemente usados para representao de sriescronolgicas com um grande nmero de perodos de tempo. As linhas so mais eficientes doque as colunas, quando existem intensas flutuaes nas sries ou quando h necessidade dese representarem vrias sries em um mesmo grfico. Quando representamos, em um mesmosistema de coordenadas, a variao de dois fenmenos, a parte interna da figura formada

    pelos grficos desse fenmeno denominada de rea de excesso.

    6 - Grficos em setores. Este grfico construdo com base em um crculo, e empregado

    sempre que desejamos ressaltar a participao do dado no total. O total representado pelocrculo, que fica dividido em tantos setores quantas so as partes. Os setores so tais quesuas reas so respectivamente proporcionais aos dados da srie. O grfico em setores sdeve ser empregado quando h, no mximo, sete dados.

    Obs: As sries temporais geralmente no so representadas por este tipo de grfico..

    4.2 - EstereogramasSo grficos geomtricos dispostos em trs dimenses, pois representam volume. So usadosnas representaes grficas das tabelas de dupla entrada. Em alguns casos este tipo degrfico fica difcil de ser interpretado dada a pequena preciso que oferecem.

    4.3 - PictogramasSo construdos a partir de figuras representativas da intensidade do fenmeno. Este tipo degrfico tem a vantagem de despertar a ateno do pblico leigo, pois sua forma atraente esugestiva. Os smbolos devem ser auto-explicativos. A desvantagem dos pictogramas queapenas mostram uma viso geral do fenmeno, e no de detalhes minuciosos. Veja oexemplo abaixo:

  • 7/30/2019 Estatistica Basica.docx

    27/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 27

    4.4 - CartogramasSo ilustraes relativas a cartas geogrficas (mapas). O objetivo desse grfico o de figuraros dados estatsticos diretamente relacionados com reas geogrficas ou polticas.

    Dados obtidos de uma amostra servem como base para uma deciso sobre a populao.

    Quanto maior for o tamanho da amostra, mais informao obtemos sobre a populao.Porm, um aumento do tamanho da amostra tambm implica um aumento da quantidade dedados e isso torna difcil compreender a populao, mesmo quando esto organizados emtabelas. Em tal caso, precisa-se de um mtodo que possibilite conhecer a populao numrpido exame.Um histograma atende s necessidades, por meio da organizao de muitos dados numhistograma, pode-se conhecer a populao de maneira objetiva.

    4.5 - Grficos dos Dados na Ordem CronolgicaRepresentao grfica do resultado Y versus a ordem cronolgica de execuo doexperimento (diagrama do resultado Y versus tempo t). Nesse tipo de grfico, alguns dos

    possveis fenmenos que podem ser observados so:

    freqentemente em funo de aquecimento, fadiga, e outros fatores relacionados com otempo.

    curva de aprendizagem ou caractersticas relativas ao material.

    4.6 - Histogramas de Freqncia ou Distribuio de Freqncias uma ferramenta estatstica apropriada para a apresentao de grandes massas de dadosnuma forma que torna mais clara a tendncia central e a disperso dos valores ao longo daescala de medio, bem como a freqncia relativa de ocorrncia dos diferentes valores.

  • 7/30/2019 Estatistica Basica.docx

    28/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 28

    CAPTULO 6 - MEDIDAS DE DISPERSO OU DEVARIABILIDADE

    No captulo 3 vimos algumas medidas de localizao do centro de uma distribuio dedados. Veremos agora como medir a variabilidade presente num conjunto de dados.

    Um aspecto importante no estudo descritivo de um conjunto de dados o da determinaoda variabilidade ou disperso desses dados, relativamente medida de localizao do centroda amostra.

    DESVIO PADRO ( S )

    a medida de disperso mais empregada, pois leva em considerao a totalidade dos valoresda varivel em estudo. um indicador de variabilidade bastante estvel. O desvio padro

    baseia-se nos desvios em torno da mdia aritmtica e a sua frmula bsica pode ser traduzidacomo: a raiz quadrada da mdia aritmtica dos quadrados dos desvios e representadapor S.

    Uma vez que a varincia envolve a soma de quadrados, a unidade em que se exprime no amesma que a dos dados. Assim, para obter uma medida da variabilidade ou disperso com asmesmas unidades que os dados, tomamos a raiz quadrada da varincia e obtemos o desvio

    padro.

    O desvio padro uma medida que s pode assumir valores no negativos e quanto maiorfor, maior ser a disperso dos dados.

    A frmula acima empregada quando tratamos de uma populao de dados no-agrupados.

  • 7/30/2019 Estatistica Basica.docx

    29/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 29

    Exemplo: Calcular o desvio padro da populao representada por - 4 , -3 , -2 , 3 , 5

    Xi- 4 - 0,2 - 3,8 14,44

    - 3 - 0,2 - 2,8 7,84

    - 2 - 0,2 - 1,8 3,24

    3 - 0,2 3,2 10,24

    5 - 0,2 5,2 27,04

    Total - - 62,8

    Sabemos que n = 5 e 62,8 / 5 = 12,56.

    A raiz quadrada de 12,56 o desvio padro = 3,54

    Quando os dados esto agrupados (temos a presena de frequncias) a frmula do desviopadro ficar:

    ou

    Exemplo: Calcule o desvio padro populacional da tabela abaixo:

    Xi f i Xi . f i . f i

    0 2 0 2,1 -2,1 4,41 8,82

    1 6 6 2,1 -1,1 1,21 7,26

    2 12 24 2,1 -0,1 0,01 0,12

    3 7 21 2,1 0,9 0,81 5,67

    4 3 12 2,1 1,9 3,61 10,83

    Total 30 63 - - - 32,70

    Sabemos que fi = 30 e 32,7 / 30 = 1,09.

    A raiz quadrada de 1,09 o desvio padro = 1,044

    Se considerarmos os dados como sendo de uma amostra o desvio padro seria a raiz

    quadrada de 32,7 / (30 -1) = 1,062

  • 7/30/2019 Estatistica Basica.docx

    30/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 30

    Obs: Nas tabelas de frequncias com intervalos de classe a frmula a ser utilizada amesma do exemplo anterior.

    VARINCIA ( S

    2

    )Define-se a varincia, como sendo a medida que se obtm somando os quadrados dosdesvios das observaes da amostra, relativamente sua mdia, e dividindo pelo nmero deobservaes da amostra menos um.

    A varincia uma medida que tem pouca utilidade como estatstica descritiva, porm extremamente importante na inferncia estatstica e em combinaes de amostras.

    MEDIDAS DE DISPERSO RELATIVA

    CVP: Coeficiente de Variao de Pearson

    Na estatstica descritiva o desvio padro por si s tem grandes limitaes. Assim, um desviopadro de 2 unidades pode ser considerado pequeno para uma srie de valores cujo valormdio 200; no entanto, se a mdia for igual a 20, o mesmo no pode ser dito.

    Alm disso, o fato de o desvio padro ser expresso na mesma unidade dos dados limita o seuemprego quando desejamos comparar duas ou mais sries de valores, relativamente suadisperso ou variabilidade, quando expressas em unidades diferentes.

    Para contornar essas dificuldades e limitaes, podemos caracterizar a disperso ouvariabilidade dos dados em termos relativos a seu valor mdio, medida essa denominada de

    CVP: Coeficiente de Variao de Pearson ( a razo entre o desvio padro e a mdiareferente aos dados de uma mesma srie).

    A frmula do CVP = (S / ) x 100 (o resultado neste caso expresso em percentual,entretanto pode ser expresso tambm atravs de um fator decimal, desprezando assim o valor100 da frmula).

    S2 =

  • 7/30/2019 Estatistica Basica.docx

    31/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 31

    Exemplo 1:

    Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de indivduos:

    Discriminao M D I A DESVIO PADRO

    ESTATURAS 175 cm 5,0 cm

    PESOS 68 kg 2,0 kg

    Qual das medidas (Estatura ou Peso) possui maior homogeneidade?

    Resposta: Teremos que calcular o CVP da Estatura e o CVP do Peso. O resultado menorser o de maior homogeneidade (menor disperso ou variabilidade).

    CVP estatura = ( 5 / 175 ) x 100 = 2,85 %

    CVP peso = ( 2 / 68 ) x 100 = 2,94 %.

    Logo, nesse grupo de indivduos, as estaturas apresentam menor grau de disperso que ospesos.

    Exemplo 2:

    O risco de uma ao de uma empresa pode ser devidamente avaliado atravs da variabilidade

    dos retornos esperados. Portanto, a comparao das distribuies probabilsticas dosretornos, relativas a cada ao individual, possibilita a quem toma decises perceber osdiferentes graus de risco. Analise, abaixo, os dados estatsticos relativos aos retornos de 5aes e diga qual a menos arriscada?

    Discriminao Ao A Ao B Ao C Ao D Ao E

    Valor esperado 15 % 12 % 5 % 10 % 4 %

    Desvio padro 6 % 6,6 % 2,5 % 3 % 2,6 %

    Coeficiente de variao 0,40 0,55 0,50 0,30 0,65

  • 7/30/2019 Estatistica Basica.docx

    32/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 32

    CAPTULO 7CORRELAO E REGRESSO

    7.1 DIAGRAMAS DE DISPERSO

    Na prtica, muitas vezes essencial estudar a relao entre duas variveis associadas como,por exemplo, o grau a dimenso de uma pea de mquina ir variar em funo da mudanada velocidade de um torno.

    Para estudar a relao entre duas variveis, tais como dito acima, pode-se usar o chamadodiagrama de disperso. Diagrama de Disperso uma forma de grfico onde simplesmenterepresenta-se graficamente cada par de variveis de uma srie de dados em um sistema deeixos.

    Tomando como exemplo os dados da Tabela abaixo, pode-se construir um diagrama dedisperso:

    7.1.1 COMO CONSTRUIR UM DI AGRAMA DE D ISPERSO

    Um diagrama de disperso construdo conforme as seguintes etapas:

    Etapa 1Coletar dados em pares (X,Y) entre os quais deseja-se estudar as relaes, e organize-os emuma tabela. desejvel que se tenha pelo menos 30 pares de dados.

    Etapa 2Encontrar os valores mximo e mnimo, tanto para Xcomo para Y. Defina as escalas dos

    eixos horizontal e vertical de forma que ambos os comprimentos sejam aproximadamenteiguais; assim, o diagrama ficar mais fcil de interpretar.

    Determinar, para cada eixo, entre 3 e 10 divises para as unidades da escala de graduao, eutilize nmeros inteiros para torna-lo mais fcil de ler. Quando duas variveis consistiremem um fator e uma caracterstica da qualidade, use o eixo horizontal Xpara o fator e o eixovertical Ypara a caracterstica da qualidade.

    Etapa 3Marcar os dados num papel milimetrado. Quando os mesmos valores de dados forem obtidosa partir de diferentes observaes, mostre estes pontos, desenhando crculos concntricos

    ou marcando o segundo ponto rente ao primeiro.

  • 7/30/2019 Estatistica Basica.docx

    33/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 33

    Etapa 4Inserir todos os itens necessrios. Certificar de que os seguintes itens sejam includos paraque qualquer pessoa, alm do autor do diagrama, possa entende-lo num rpido exame:

    a. Ttulo do diagrama;b. Perodo de tempo;c. Quantidade de pares de dados;d. Denominao e unidade de medida de cada eixo;

    Exemplo 1:Um fabricante de tanques plsticos, que os fabricava pelo processo de moldagem a sopro,encontrou problemas de tanques defeituosos com paredes finas. Suspeitou-se que a variaoda presso do ar, dia a dia, era a causa das paredes finas no-conformes. A Tabela a seguirmostra dados sobre a presso de sopro e a percentagem defeituosa.

    Tabela 1Dados da Presso de Sopro e Percentagem Defeituosade Tanques de Plstico

    Conforme visto na Tabela acima, existem 30 pares de dados.

    Etapa 2Neste exemplo, indicamos a presso de sopro por X(eixo horizontal) e a percentagemdefeituosa porY(eixo vertical).Assim:O valor mximo de x: xmx = 9,4 (kgf/cm)O valor mnimo de x: xmn = 8,2 (kgf/cm)O valor mximo de y: ymx = 0,928 (%)O valor mnimo de y: ymn = 0,864 (%)

    Marca-se divises para graduao:no eixo horizontalem intervalos de 0,5(kgf/cm) de 8,0 a 9,5(kgf/cm)

    no eixo verticalem intervalos de 0,01(%) de 0,85 a 0,93(%)

  • 7/30/2019 Estatistica Basica.docx

    34/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 34

    Etapa 3Marca-se os pontos no grfico.

    Etapa 4Anota-se o perodo de tempo a que se refere amostra coletada (1 de outubro a 9 denovembro), a quantidade de amostras (n = 30), o eixo horizontal (presso de sopro[kgf/cm]), o eixo vertical (percentagem defeituosa [%]), e o ttulo do diagrama (diagrama dedisperso da presso do sopro e a percentagem defeituosa).

    Figura 1Exemplo de Diagrama de Disperso

    7.1.2 Como Interpretar os Diagramas de Disperso

    Assim como possvel avaliar o formato de uma distribuio em um histograma, adistribuio global dos pares de dados pode ser interpretada a partir de um diagrama dedisperso. Ao proceder a leitura, a primeira coisa que se deve fazer examinar se h ou no

    pontos atpicos no diagrama. Geralmente, pode-se julgar que quaisquer pontos afastados dogrupo principal (Figura 2) resultaram de erros na medio ou registro de dados, ou foramcausados por alguma mudana nas condies de operao. necessrio excluir esses pontos

    para anlise da correlao. Contudo, ao invs de desprezar completamente estes pontos,deveria ser dada a devida ateno causa de tais irregularidades, pois muitas vezes,informaes inesperadas, porm muito teis, so obtidas descobrindo-se por que elesocorreram.

    Existem muitos tipos de padres de disperso, e alguns destes so dados da Figura 3. Nestafigura, tanto na .1 como na .2, Yaumenta com X; este o caso da correlao positiva. Eainda, como a .1 mostra esta tendncia de forma notvel, diz-se que ela apresenta fortecorrelao positiva. As Figuras .4 e .5 mostram o oposto da correlao positiva, pois medida que Xaumenta, Ydiminui; este o caso da chamada correlao negativa. A Figura4 indica uma forte correlao negativa. A Figura .3 mostra o caso em que Xe Yno tm

    nenhuma relao especfica; portanto, dizemos que no h correlao. Na Figura .6, medida que Xaumenta, Yvaria num padro curvo. Isto ser explicado posteriormente.

  • 7/30/2019 Estatistica Basica.docx

    35/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 35

    Figura 2Exemplo de Pontos Suspeitos

    .1 - Correlao Positiva

    .2 - Correlao Negativa.3 - Pode haver Correlao Positiva

    .4 - Pode haverCorrelao Negativa

    .5 - No H Correlao

    .6 - No H Correlao

  • 7/30/2019 Estatistica Basica.docx

    36/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 36

    Figura 3Exemplos de Correlao

    7.2 Clculo de Coeficientes de Correlao

    Para estudar a relao entre Xe Y importante traar primeiro um diagrama de disperso,entretanto, a fim de conhecer a fora da relao em termos quantitativos, til calcular ocoeficiente de correlao de acordo com a seguinte definio:

    onde:

  • 7/30/2019 Estatistica Basica.docx

    37/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 37

    onde n a quantidade de pares de dados

    O coeficiente de correlao, r, est no intervalo1 r rformaior que 1, houve claramente um erro de clculo e deve-se refaze-lo. No caso de fortecorrelao positiva, ele atinge um valor prximo de +1 e, de forma anloga, numa fortecorrelao negativa, ele fica prximo de1. Quando | r | est prximo de 1, ele indica umaforte correlao entre Xe Y. Quando se aproxima de 0 (zero), implica numa correlao fraca.Quando | r| = 1, os dados estaro sobre uma linha reta.

    Exemplo 2Calculemos o coeficiente de correlao para o Exemplo 1, dos tanques de plstico. A Tabela2 abaixo apresenta os clculos, a partir dela obtm-se os resultados desejados.

    O valor de r 0,59, existindo portanto uma correlao positiva entre a presso de sopro e apercentagem defeituosa de tanques de plstico.

  • 7/30/2019 Estatistica Basica.docx

    38/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 38

    Tabela 2Preparao para o clculo do coeficiente de correlao.

    7.3 AJUSTAMENTO DE CURVAS E O MTODO DOS MNIMOS QUADRADOS

    Num diagrama de disperso possvel, freqentemente, visualizar uma curva regular que seaproxima dos dados. Essa curva denominada de ajustamento.

    Figura 4Exemplo de Curvas em Diagramas de Disperso

  • 7/30/2019 Estatistica Basica.docx

    39/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 39

    O problema geral da determinao das equaes de curvas que se acomodem a certosconjuntos de dados denominado AJUSTAMENTO DE CURVAS.

    7.4 Equaes das Curvas de Ajustamento

    Para fins de referncia, relaciona-se abaixo alguns tipos de curvas de ajustamento e suasequaes. Todas as letras, exceto Xe Y, representam constantes. As letras Xe Yreferem-se,freqentemente, a variveis independentes e dependentes, respectivamente, embora esses

    papis possam ser permutados.

    onde o segundo membro das equaes so denominados polinmios do 1, 2, 3, 4 en-simo graus.

    As funes definidas pelas quatro primeiras equaes so, s vezes, denominadas FunesLinear, Quadrtica, Cbica e do 4 Grau, respectivamente.

    Como outras equaes possveis (entre muitas usadas na prtica), menciona-se as seguintes:

    Para decidir qual a curva a adotar, conveniente a obteno de diagramas de disperso dasvariveis transformadas. Por exemplo, se o diagrama de disperso de logYem funo de Xapresentar uma relao linear, a equao ter o aspecto da (7), enquanto, se o de logYemfuno de logXfor linear, a equao ter o formato de (8).

    Emprega-se, freqentemente, para tal finalidade, grficos no qual uma ou ambas as escalasso logartmicas (semilog ou log-log [dilog]).

  • 7/30/2019 Estatistica Basica.docx

    40/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 40

    7.5 O Mtodo dos Mnimos Quadrados

    Antes, necessrio instituir uma definio da melhor reta de ajustamento, da melhorparbola de ajustamento, etc.

    Figura 5 - A melhor curva de ajustamento

    Para conseguir uma definio possvel, considere-se a Figura 6.2 na qual os dados estorepresentados pelos pontos (X1,Y1), (X2,Y2), ..., (Xn,Yn). Para um valor dado de X, porexemploX1, haver uma diferena entrey1 e p valor correspondente determinado na curvaC.

    Como est representado na figura, essa diferena e1, que , muitas vezes, designada comodesvio, erro ou resduo e pode ser positivo, negativo ou nulo. De modo semelhante, obtm-seos desvios e2, e3, ..., en.

    Uma medida de qualidade do ajustamentoda Curva C aos dados apresentados (aderncia) proporcionada pela quantidade e2 + e3 + ... + en. Se ela pequena, o ajustamento bom,se grande, o ajustamento est ruim.

    Portanto, uma definio pode ser feita:

    De todas as curvas que se ajustam a um conjunto de pontos, a que tem a propriedade deapresentar o mnimo valor de e2 + e3 + ... + en denominada a melhor curva deajustamento.

    Diz-se que uma curva que apresenta essa propriedade ajusta os dados no sentido dosmnimos quadrados e denominada curva de mnimos quadrados.

  • 7/30/2019 Estatistica Basica.docx

    41/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 41

    7.6 REGRESSO

    Deseja-se, freqentemente, com base em dados amostrais estimar o valor de uma varivel Y,correspondente ao conhecido de uma varivel X. Isso pode ser alcanado mediante aavaliao do valor de Y, a partir de uma curva de mnimo quadrado que se ajuste aos dados

    amostrais. A curva resultante denominada de regresso de Ypara X, visto que Yavaliado a partir de X.Se se desejar estimar o valor de Xa partir de um atribudo a Y, usa-se uma curva deregresso de Xpara Y, o que importa em uma permutao das varveis no diagrama dedisperso, de modo que Xpassa a ser a varivel dependente e Ya independente.Em geral, a reta ou curva de regresso de Ypara Xno igual de Xpara Y.

    Exemplo 3No Exemplo 1, dos tanques plsticos com paredes finas defeituosas, constatou-se que haviauma correlao positiva entre a presso de sopro e a percentagem defeituosa. A fim de evitaresse problema, pergunta-se:

    - Quando a presso de sopro estiver em um certo valor, qual ser a espessura das paredesformadas?- Como a presso de sopro deve ser controlada para que as paredes do tanque no fiquemfinas?

    Para realizar essa anlise e poder responder s perguntas feitas, necessrio compreender,quantitativamente, a relao entre a presso de sopro e a espessura da parede.

    A Tabela 3 mostra os dados de uma experincia na qual a presso de sopro foi mudada e, emcada vez, a espessura das paredes foi medida. A Figura 6 um diagrama de disperso

    baseado nestes dados.

    Tabela 3Presso de Sopro x Espessura da Parede

    Figura 6Relao entre a Presso de Ar e a Espessura da Parede

  • 7/30/2019 Estatistica Basica.docx

    42/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 42

    Pode-se representar a presso do sopro porxe a espessura da parede pory, admitindo umarelao linear:

    onde: uma constante

    chamado de coeficiente de regresso

    Tal reta geralmente chamada de reta de regresso, onde y a varivel resposta (ouvarivel dependente), e x a varivel explicativa (ou varivel independente). A formaquantitativa de entender a relao entre xe y, pela busca de uma forma de regresso entre xey, chamada de Anlise de Regresso.

    Seja (Xi,Yi) (para 1 i n) um conjunto de npares de dados observados. Sejam os

    valores estimados e a e b, e seja ei o resduo entre , isto :

    Pelo mtodo dos mnimos quadrados, so obtidos como os valores que minimizam

    soma dos quadrados dos resduos. Esse mtodo aplicado atravs das seguintesetapas:

    os valores de a e b obtidos dessas etapas minimizam a soma dos quadrados dos resduos.

    Agora, usando os dados da Tabela 4, pode-se calcular a reta de regresso.

  • 7/30/2019 Estatistica Basica.docx

    43/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 43

    Tabela 4

    A cada aumento de 1(kgf/cm) da presso do ar, a espessura da parede diminui de 1,28(mm).

  • 7/30/2019 Estatistica Basica.docx

    44/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 44

    Figura 7 - mostra a reta de regresso calculada acima.

    7.8 Problemas que envolvem mais de duas variveis

    Podem ser tratadas de maneira anloga aos de duas. Por exemplo, pode haver uma relao

    entre trs variveis X, Ye Zque pode ser descrita pela expresso:

    que denominada equao linear das variveis X, Ye Z.

    Em um sistema tridimensional de coordenadas retangulares, essa equao representa umplano e os pontos amostrais reais (X1,Y1), (X2,Y2), ..., (Xn,Yn) podem dispersar-se emposies no muito distantes desse plano, que pode ser denominado de ajustamento.

    Mediante a extenso do mtodo dos mnimos quadrados, pode-se falar de um plano demnimos quadrados de ajustamento dos dados.

    Se o nmero de variveis exceder a trs, perde-se a intuio geomtrica porque, ento, serianecessrio considerar espaos de quatro ou mais dimenses.Os problemas que envolvem a avaliao de uma varivel a partir de duas ou mais outras sodenominados problemas de regresso mltipla.

  • 7/30/2019 Estatistica Basica.docx

    45/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 45

    Exerccios:

    1) A quantidade de libras de vapor usadas por ms por uma planta qumica esta relacionada

    temperatura (F) mdia ambiente para aquele ms. O consumo do ano passado e a temperaturaso mostrados na seguinte tabela:

    Meses Temperatura Consumo/1.000Janeiro 21 185,79Fevereiro 24 214,47Maro 32 288,03Abril 47 424,84Maio 50 454,58Junho 59 539,03Julho 68 621,55

    Agosto 74 675,06Setembro 62 562,03Outubro 50 452,93

    Novembro 41 369,95Dezembro 30 273,98

    a) Construa um diagrama de dispersob) Encontre a equao da retac) Calcule a correlaod) Qual ser a estimativa do consumo esperado de vapor quando a temperatura mdia for de

    55F?

    2) Um artigo publicado numa revista (maro de 1986) apresentou dados sobre a concentrao delicor verde de Na2S e da produo de uma mquina de papel.

    Nmero deobservaes

    Concentrao(g/l) de licor

    verde de Na2SProduo (t/dia)

    1 40 8252 42 8303 49 8904 46 895

    5 44 8906 48 9107 46 9158 43 9609 53 990

    10 52 101011 54 101212 57 103013 58 1050

    a) Encontre o valor ajustado y, correspondente a x = 910b) Encontre a correlao entre as variveis estudadas

  • 7/30/2019 Estatistica Basica.docx

    46/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 46

    3) A tabela a seguir representa o nmero de horas de estudo fora da sala de aula paradeterminada turma de alunos de Estatstica, ao longo de trs semanas e as notas obtidasnuma prova aplicada ao final do perodo:

    Estudante 1 2 3 4 5 6 7 8

    Horas de Estudo 20 16 34 23 27 32 18 22Grau obtido 64 61 84 70 88 92 72 77

    a. Trace o diagrama de disperso correspondente.b. Determine a equao de regresso dos mnimos quadrados para predizer o grau

    obtido na prova com base nas horas de estudo. Desenhe a reta do item anteriorsobre o diagrama.

    c. Estime o grau que seria obtido na prova por algum que estudasse 30 horas forada sala de aula.

    d. Calcule o coeficiente de correlao e interprete-o.e. Teste se o coeficiente de correlao populacional () pode ser considerado nulo

    ao nvel de 5% de significncia? Interprete o resultado obtido.

  • 7/30/2019 Estatistica Basica.docx

    47/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 47

    CAPTULO 8INTRODUO AMOSTRAGEM

    8- Definies

    8.1 Populao e amostra

    Qualquer estudo cientfico enfrenta o dilema de estudo da populao ou da amostra.Obviamente teria-se uma preciso muito superior se fosse analisado o grupo inteiro, a

    populao, do que uma pequena parcela representativa, denominada amostra. Observa-seque impraticvel na grande maioria dos casos, estudar-se a populao em virtude dedistncias, custo, tempo, logstica, entre outros motivos.

    A alternativa praticada nestes casos o trabalho com uma amostra confivel. Se a amostra confivel e proporciona inferir sobre a populao, chamamos de inferncia estatstica. Paraque a inferncia seja vlida, necessria uma boa amostragem, livre de erros, tais como faltade determinao correta da populao, falta de aleatoriedade e erro no dimensionamento daamostra.

    Quando no possvel estudar, exaustivamente, todos os elementos da populao, estudam-se s alguns elementos, a que damos o nome de Amostra.

    Quando a amostra no representa corretamente a populao diz-se enviesada e a suautilizao pode dar origem a interpretaes erradas.

    8.2 Recenseamento

    Recenseamento a contagem oficial e peridica dos indivduos de um Pas, ou parte de umPas. Ele abrange, no entanto, um leque mais vasto de situaes. Assim, pode definir-serecenseamento do seguinte modo:

    Estudo cientfico de um universo de pessoas, instituies ou objetos fsicos com o propsitode adquirir conhecimentos, observando todos os seus elementos, e fazer juzos quantitativosacerca de caractersticas importantes desse universo.

  • 7/30/2019 Estatistica Basica.docx

    48/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 48

    8.3 Amostragem

    Amostragem o processo que procura extrair da populao elementos que atravs declculos probabilsticos ou no, consigam prover dados inferenciais da populao-alvo.

    Tipos de Amostragem

    No ProbabilsticaAcidental ou convenincia

    Intencional

    Quotas ou proporcional

    Desproporcional

    Probabilstica

    Aleatria SimplesAleatria Estratificada

    Conglomerado

    8.3.1.No Probabi lstica

    A escolha de um mtodo no probabilstico, via de regra, sempre encontrar desvantagemfrente ao mtodo probabilstico. No entanto, em alguns casos, se faz necessrio a opo poreste mtodo. Fonseca (1996), alerta que no h formas de se generalizar os resultadosobtidos na amostra para o todo da populao quando se opta por este mtodo deamostragem.

    Acidental ou conveninciaIndicada para estudos exploratrios. Freqentemente utilizados em super mercados

    para testar produtos. Intencional

    O entrevistador dirige-se a um grupo em especfico para saber sua opinio. Porexemplo, quando de um estudo sobre automveis, o pesquisador procura apenasoficinas.

    Quotas ou proporcionalNa realidade trata-se de uma variao da amostragem intencional. Necessita-se ter

    um prvio conhecimento da populao e sua proporcionalidade. Por exemplo, deseja-se entrevistar apenas indivduos da classe A, que representa 12% da populao. Estaser a quota para o trabalho. Comumente tambm subestratifica-se uma quotaobedecendo a uma segunda proporcionalidade.

    DesproporcionalMuito utilizada quando a escolha da amostra for desproporcional populao.Atribuem-se pesos para os dados, e assim obtm-se resultados ponderadosrepresentativos para o estudo.

  • 7/30/2019 Estatistica Basica.docx

    49/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 49

    8.3.2 Probabilstica

    Para que se possa realizar inferncias sobre a populao, necessrio que se trabalhe comamostragem probabilstica. o mtodo que garante segurana quando investiga-se algumahiptese. Normalmente os indivduos investigados possuem a mesma probabilidade de ser

    selecionado na amostra.

    Aleatria Simples

    o mais utilizado processo de amostragem. Prtico e eficaz, confere preciso ao processo deamostragem. Normalmente utiliza-se uma tabela de nmeros aleatrios e nomeia-se osindivduos, sorteando-se um por um at completar a amostra calculada.

    Uma variao deste tipo de amostragem a sistemtica. Em um grande nmero deexemplos, o pesquisador depara-se com a populao ordenada. Neste sentido, tem-se osindivduos dispostos em seqncia o que dificulta a aplicao exata desta tcnica.Quando se trabalha com sorteio de quadras de casas, por exemplo, h uma regra crescente

    para os nmeros das casas. Em casos como este, divide-se a populao pela amostra eobtm-se um coeficiente (y). A primeira casa ser a de nmero x, a segunda ser a denmero x + y; a terceira ser a de nmero x + 3. y. Supondo que este coeficiente seja 6. O

    primeiro elemento ser 3. O segundo ser 3 + 6. O terceiro ser 3 + 2.6. O quarto ser 3 +3.6, e assim sucessivamente.

    Aleatria EstratificadaQuando se deseja guardar uma proporcionalidade na populao heterognea. Estratifica-secada subpopulao por intermdio de critrios como classe social, renda, idade, sexo, entreoutros.

    Conglomerado

    Em corriqueiras situaes, torna-se difcil coletar caractersticas da populao. Nestamodalidade de amostragem, sorteia-se um conjunto e procura-se estudar todo o conjunto. exemplo de amostragem por conglomerado, famlias, organizaes e quarteires.

  • 7/30/2019 Estatistica Basica.docx

    50/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 50

  • 7/30/2019 Estatistica Basica.docx

    51/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 51

    8.4 Tipos de dados

    VARIVEL: , convencionalmente, o conjunto de resultados possveis de um fenmeno.

    Varivel Qualitativa: Quando seus valores so expressos por atributos: sexo, cor da pele, etc.

    Varivel Quantitativa: Quando os dados so de carter nitidamente quantitativo, e o conjuntodos resultados possui uma estrutura numrica, trata-se, portanto da estatstica de varivel ese dividem em:

    Varivel Discreta ou Descontnua:Seus valores so expressos geralmente atravs denmeros inteiros no negativos. Resulta normalmente de contagens. Ex: N de alunos

    presentes s aulas de introduo estatstica econmica no 1 semestre de 1997: mar = 18,abr = 30, mai = 35, jun = 36.

    Varivel Contnua: Resulta normalmente de uma mensurao, e a escala numrica de seuspossveis valores corresponde ao conjunto R dos nmeros Reais, ou seja, podem assumir,teoricamente, qualquer valor entre dois limites. Ex.: Quando voc vai medir a temperatura deseu corpo com um termmetro de mercrio o que ocorre o seguinte: O filete de mercrio,ao dilatar-se, passar por todas as temperaturas intermedirias at chegar na temperaturaatual do seu corpo.

    De acordo com o que dissemos anteriormente, numa anlise estatstica distinguem-seessencialmente duas fases:

    Uma primeira fase em que se procura descrever e estudar a amostra: Estatstica Descritiva euma segunda fase em que se procura tirar concluses para a populao:

    1 Fase Estatstica Descritiva

    Procura-se descrever a amostra, pondo em evidncia as caractersticas principais e aspropriedades.

    2 Fase Estatstica Indutiva

    Conhecidas certas propriedades (obtidas a partir de uma anlise descritiva da amostra),expressas por meio de proposies, imaginam-se proposies mais gerais, que exprimam aexistncia de leis (na populao).

    No entanto, ao contrrio das proposies deduzidas, no podemos dizer que so falsas ouverdadeiras, j que foram verificadas sobre um conjunto restrito de indivduos e, portantono so falsas, mas no foram verificadas para todos os indivduos da Populao, pelo quetambm no podemos afirmar que so verdadeiras.

    Existe, assim, um certo grau de incerteza (percentagem de erro) que medido em termos deProbabilidade.

  • 7/30/2019 Estatistica Basica.docx

    52/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 52

    Considerando o que foi dito anteriormente sobre a Estatstica Indutiva, precisamos aqui danoo de Probabilidade, para medir o grau de incerteza que existe, quando tiramos umaconcluso para a populao, a partir da observao da amostra.

    8.5 Espao Amostral

    A estatstica trabalha com os resultados dos experimentos. Quando algum experimento realizado, algum resultado ocorre; denota-se um resultado tpico pelo smbolo e. Talresultado chamado evento simples.

    Se for feita uma lista de todos os possveis resultados de interesse do experimento, essa srie chamada de espao amostral.

    8.6 Dimensionamento da amostraPlano Amostral

    Quando deseja-se dimensionar o tamanho da amostra, o procedimento desenvolve-se em trsetapas distintas:

    Avaliar a varivel mais importante do grupo e a mais significativa; Analisar se ordinal, intervalar ou nominal; Verificar se a populao finita ou infinita;

    Varivel intervalar e populao infinita

    Varivel intervalar e populao finita

    Varivel nominal ou ordinal e populao infinita

    Varivel nominal ou ordinal e populao finita

    Obs: A proporo (p) ser a estimativa da verdadeira proporo de um dos nveis escolhidospara a varivel adotada. Por exemplo, 60% dos telefones da amostra Nokia, ento p ser0,60.A proporo (q) ser sempre 1 - p. Neste exemplo q, ser 0,4. O erro representado por d.Para casos em que no se tenha como identificar as propores confere-se 0,5 para p e q.

  • 7/30/2019 Estatistica Basica.docx

    53/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 53

    CAPTULO 9PROBABILIDADE

    9. Conceito de Probabilidade

    Chamamos de probabilidade de um evento A (sendo que A est contido no Espao amostral)o nmero real P(A), tal que: nmero de casos favorveis de A / nmero total de casos.

    9.1 Eventos Equiprovveis

    OBS: Quando todos os elementos do Espao amostral tem a mesma chance de acontecer, oespao amostral chamado de conjunto equiprovvel.

    Ex: No lanamento de uma moeda qual a probabilidade de obter cara em um evento A?

    = { ca, co } = 2 A = {ca} = 1 P(A) = 1/2 = 0,5 = 50%

    9.2 Probabilidade Condicional

    Se A e B so dois eventos, a probabilidade de B ocorrer, depois de A ter acontecido definida por: P (B/A), ou seja, chamada probabilidade condicional de B. Neste caso oseventos so dependentes e definidos pela frmula:

    P (A e B ) = P (A) x P(B/A)

    Ex: Duas cartas so retiradas de um baralho sem haver reposio. Qual a probabilidade deambas serem COPAS ?

    P (Copas1 e Copas2) = P(Copas1) x P(Copas2/Copas1) = 13/52 x 12/51 = 0,0588 = 5,88 %

    P(Copas1) = 13/52

    P(Copas2/Copas1) = 12/51

    Obs:No exemplo anterior se a 1 carta retirada voltasse ao baralho o experimento seria dotipo com reposio e seria um evento independente. O resultado seria:

    P(Copas1) x P(Copas2) = 13/52 x 13/52 = 0,625 = 6,25 %

    Espao amostral do baralho de 52 cartas:

    Carta pretas = 26

    Pus = 13 (s, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)

    Espadas = 13 (s, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)

  • 7/30/2019 Estatistica Basica.docx

    54/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 54

    Cartas vermelhas = 26

    Ouros = 13 (s, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)

    Copas = 13 (s, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)

    9.3 Eventos Independentes

    Quando a realizao ou no realizao de um dos eventos no afeta a probabilidade darealizao do outro e vice-versa.

    Ex: Quando lanamos dois dados, o resultado obtido em um deles independe do resultadoobtido no outro. Ento qual seria a probabilidade de obtermos, simultaneamente, o n 4 no

    primeiro dado e o n 3 no segundo dado?

    Assim, sendo P1 a probabilidade de realizao do primeiro evento e P2 a probabilidade de

    realizao do segundo evento, a probabilidade de que tais eventos se realizemsimultaneamente dada pela frmula:

    P(1 n 2) = P(1 e 2) = P(1) x P(2)

    P1 = P(4 dado1) = 1/6 P2 = P(3 dado2) = 1/6

    P total = P (4 dado1) x P (3 dado2) = 1/6 x 1/6 = 1/36

    9.3.1 Eventos Mutuamente Exclusivos - Eventos Dependentes

    Dois ou mais eventos so mutuamente exclusivos quando a realizao de um exclui arealizao do(s) outro(s). Assim, no lanamento de uma moeda, o evento "tirar cara" e oevento "tirar coroa" so mutuamente exclusivos, j que, ao se realizar um deles, o outro nose realiza.

    Se dois eventos so mutuamente exclusivos, a probabilidade de que um ou outro se realize igual soma das probabilidades de que cada um deles se realize:

    P(1 U 2) = P(1 ou 2) = P(1) + P(2)

    Ex: No lanamento de um dado qual a probabilidade de se tirar o n 3 ou o n 4 ?

    Os dois eventos so mutuamente exclusivos ento: P = 1/6 + 1/6 = 2/6 = 1/3

    Obs: Na probabilidade da unio de dois eventos A e B, quando h elementos comuns,devemos excluir as probabilidades dos elementos comuns a A e B (elementos de A n B )

  • 7/30/2019 Estatistica Basica.docx

    55/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 55

    9.4 Teorema de Bayes ou Teorema da Probabilidade Total

    Sabemos que:

    P(A) =EP(Bi) . P(A|Bi)

    P(A n Bi) = P(A) . P(Bi|A) logo P(Bi|A) = P(A n Bi) / P(A) ento substituindo teremos:

    P (Bi|A) = P (Bi) . P (A|Bi) /EP(Bi) . P(A|Bi) que a frmula de Bayes

    Ex: Certo professor 4/5 das vezes vai trabalhar usando um fusca e usando um carroimportado nas demais vezes. Quando ele usa o fusca, 75 % das vezes ele chega em casaantes das 23 horas e quando usa o carro importado s chega em casa antes das 23 horas em60% das vezes. Ontem o professor chegou em casa aps s 23 horas. Qual a probabilidadede que ele, no dia de ontem, tenha usado o fusca ?

    B1 = usar o fusca B2 = usar carro importado A = chegar em casa aps 23 horas

    P(B1) = 4/5 = 0,80 P(B2) = 1/5 = 0,20

    P( A | B1) = 1 - 0,75 = 0,25 P( A | B2) = 1 - 0,60 = 0,40

    P (B1 | A) = P (B1) . P( A | B1) / P (B1) . P( A | B1) + P (B2) . P( A | B2)

    P (B1 | A) = 0,80 x 0,25 /(0,80 x 0,25) + (0,20 x 0,40) =

    P (B1 | A) = 0,20 / (0,20 + 0,08) = 0,7143 ou 71,43 %

    Exerccio: Em um lote de 12 peas, 4 s defeituosas. Sendo retirada uma pea, calcule: a) aprobabilidade de essa pea ser defeituosa. b) a probabilidade de essa pea no ser defeituosa.

  • 7/30/2019 Estatistica Basica.docx

    56/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 56

    CAPTULO 10VARIVEL ALEATRIA DISCRETA

    10.1 Distribuio de Probabilidades

    Apresentaremos neste captulo trs modelos tericos de distribuio de probabilidade, aosquais um experimento aleatrio estudado possa ser adaptado, o que permitir a soluo degrande nmero de problemas prticos.

    10.1.1 Varivel Aleatria

    Suponhamos um espao amostral S e que a cada ponto amostral seja atribudo um nmero.Fica, ento, definida uma funo chamada varivel aleatria.

    Muitas vezes no estamos interessados propriamente no resultado de um experimentoaleatrio, mas em alguma caracterstica numrica a ele associada. Essa caracterstica serchamada varivel aleatria.

    Assim, se o espao amostral relativo ao "lanamento simultneo de duas moedas" S={(ca,ca), (ca,co), (co,ca), (co,co)} e se X representa o "nmero de caras" que aparecem, acada ponto amostral podemos associar um nmero para X, de acordo com a tabela abaixo (X a varivel aleatria associada ao nmero de caras observado):

    Ponto Amostral X

    (ca,ca) 2(ca,co) 1

    (co,ca) 1

    (co,co) 0

    Logo podemos escrever:

    Nmero de caras (X) Probabilidade (X)2 1/4

    1 2/4

    0 1/4

    Total 4/4 = 1

  • 7/30/2019 Estatistica Basica.docx

    57/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 57

    Exemplo prtico de uma distribuio de probabilidade:

    Consideremos a distribuio de frequncia relativa ao nmero de acidentes dirios em uma

    rodovia durante o ms de nov/2003:

    Nmero de Acidentes Frequncia

    0 22

    1 5

    2 2

    3 1

    Podemos ento escrever a tabela de distribuio de probabilidade:

    Nmero de Acidentes (X) Probabilidade (X)

    0 0,73

    1 0,17

    2 0,07

    3 0,03

    Total 1,00

    Construmos acima uma tabela onde aparecem os valores de uma varivel aleatria X e asprobabilidades de X ocorrer que a tabela de distribuio de probabilidades.

    Funes de probabilidades: f(X) = p(X= xi)

    Ao definir a distribuio de probabilidade, estabelecemos uma correspondncia unvocaentre os valores da varivel aleatria X e os valores da varivel P (probabilidade). Estacorrespondncia define uma funo onde os valores xi formam o domnio da funo e osvalores pi o seu conjunto imagem. Assim, ao lanarmos um dado, a varivel aleatria X,definida por "pontos de um dado", pode tomar os valores 1,2,3,4,5 e 6. Ento resulta aseguinte distribuio de probabilidade:

    X P (X)

    1 1/6

    2 1/6

    3 1/6

    4 1/6

    5 1/6

    6 1/6

    T o t a l 6/6 = 1

  • 7/30/2019 Estatistica Basica.docx

    58/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 58

    10.2 Valor Esperado (Esperana Matemtica)

    Valor esperado de uma varivel aleatria ou de funo de varivel aleatria corresponde mdia ponderada dos valores que esta varivel aleatria ou esta funo assume, usando-secomo pesos para ponderao, as probabilidades correspondentes a cada valor.

    Para o caso de uma varivel aleatria discreta x, podemos escrever:

    E (x) = ( xi . pi )

    Exemplo:

    Numa empresa, as previses de despesa para o prximo ano foram calculadas como; R$ 9,10, 11 , 12 e 13 bilhes. Supondo que as despesas do ano corrente sejam desconhecidas, asseguintes probabilidades foram atribudas respectivamente: 30%, 20%, 25%, 5% e 20%.

    Qual a distribuio de probabilidade para o prximo ano?

    DISTRIBUIO DE PROBABILIDADES

    ANO DESPESA* (X) P (X)

    1 9 0,30

    2 10 0,203 11 0,25

    4 12 0,05

    5 13 0,20

    total = 1,00

    * em R$ bilhes

    Qual o valor esperado das despesas para o prximo ano?

    VALOR ESPERADO DAS DESPESAS

    ANODESPESA* X P (X) X . P (X)1 9 0,30 2,70

    2 10 0,20 2,003 11 0,25 2,754 12 0,05 0,60

    5 13 0,20 2,60

    VALOR ESPERADO E(X) = 10,65

    * em R$ bilhes

  • 7/30/2019 Estatistica Basica.docx

    59/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 59

    Qual a varincia das despesas para o prximo ano?

    Var(X) = [ E(X) - E(X) ]

    VARINCIA DAS DESPESAS

    ANO DESPESA* ( x) P (x) x . P (x) x . P (x)

    1 9 0,30 2,70 24,302 10 0,20 2,00 20,003 11 0,25 2,75 30,254 12 0,05 0,60 7,205 13 0,20 2,60 33,80

    10,65 115,55

    * em R$ bilhes

    VARINCIA DAS DESPESASVar(x) = [E(X) E(X) ] = 113,42115,55 = 2,13

    Conseqentemente o Desvio Padro igual a: = Var(x)

    Caso as projees ao longo do ano tenham sido estimadas em R$ 12 bilhes, comente aposio financeira da empresa.

  • 7/30/2019 Estatistica Basica.docx

    60/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 60

    CAPTULO 11DISTRIBUIES DE VARIVELALEATRIA DISCRETA

    Segundo JURAN (1992, p.33), Uma distribuio de probabilidade uma frmulamatemtica que relaciona os valores da caracterstica com a sua probabilidade de ocorrnciana populao.

    Quando a caracterstica que est sendo medida puder assumir qualquer valor (sujeito exatido do processo de medio), sua distribuio de probabilidade chamada distribuiocontnua de probabilidade.

    A partir das conceituaes anteriores, apresenta-se a conceituao de distribuio deprobabilidade e suas classificaes: distribuio contnua de probabilidade e distribuio

    discreta de probabilidade.Exemplo: a distribuio de freqncias dos dados de resistncias eltricas medidas. As distribuies discretas de probabilidade mais comuns so:(1) a Distribuio de Poisson;(2) a Distribuio Binomial;

    11.1 Distribuio Binomial

    Vamos imaginar fenmenos cujos resultados s podem ser de dois tipos, um dos quais

    considerado como sucesso e o outro insucesso. Este fenmeno pode ser repetido tantas vezesquanto se queira (n vezes), nas mesmas condies. As provas repetidas devem serindependentes, isto , o resultado de uma no deve afetar os resultados das sucessivas. Nodecorrer do experimento, a probabilidade p do sucesso e a probabilidade de q (q = 1 - p) doinsucesso manter-se-o constantes. Nessas condies X uma varivel aleatria discreta quesegue uma distribuio binomial.

    P(x) =

    P(x) = a probabilidade de que o evento se realize x vezes em n provas.

    p = a probabilidade de que o evento se realize em uma s prova = sucesso.

    q = a probabilidade de que o evento no se realize no decurso dessa prova = insucesso.

    OBS: O nome binomial devido frmula, pois representa o termo geral dodesenvolvimento do binmio de Newton.

  • 7/30/2019 Estatistica Basica.docx

    61/66

    Universidade de PernambucoEscola Politcnica -Estatstica Bsica - Prof. Mnica Barradas 61

    11.1.1 Parmetros da Distribuio Binomial

    Mdia = n . p Desvio padro = a raiz quadrada do produto de n . p . q

    Varincia = n . p . q

    Exerccio: Seis parafusos so escolhidos ao acaso da produo de certa mquina, queapresenta 10% de peas defeituosas. Qual a probabilidade de serem defeituosos dois deles?

    11.2 Distribuio dePoisson

    Distribuio de probabilidades aplicada para acontecimentos raros, entretanto o seu maioruso prtico como aproximao para a distribui