Codificacion de fuente completa-e

download Codificacion de fuente completa-e

of 52

Transcript of Codificacion de fuente completa-e

  • 8/7/2019 Codificacion de fuente completa-e

    1/58

    1

    Teora deTeora de Informacin Informacin

  • 8/7/2019 Codificacion de fuente completa-e

    2/58

    2

    Respuestas que brinda la Respuestas que brinda laTeora de InformacinTeora de Informacin

    Cantidad de InformacionTcnicas de codificacinCantidad mxima de informacion

    que puede transmitir un canalotras*

  • 8/7/2019 Codificacion de fuente completa-e

    3/58

    3

    Cantidad de Informacion Cantidad de Informacion L a capacidad de un mensaje de

    despejar incertidumbre sobre la ocurrencia de un evento.

    Depende de la probabilidad de ocurrencia del evento.*

  • 8/7/2019 Codificacion de fuente completa-e

    4/58

    4

    Cantidad de Informacion Cantidad de Informacion I(A) u 0

    P (A) = 1 ==> I(A) = 0

    I(A) = f [ P (A)]

    P (A) > P (B) ==> I(A) < I(B)

    P (AB) = P (A) . P (B) ==> I(AB) = I(A) + I(B)

    I(A) = I(A) = -- log P(A)* log P(A)*

  • 8/7/2019 Codificacion de fuente completa-e

    5/58

    5

    Lafuncin log (1/

    P(E))

    Lafuncin log (1/

    P(E))

  • 8/7/2019 Codificacion de fuente completa-e

    6/58

    6

    Unid a des de C a ntid a d deUnid a des de C a ntid a d deInform a cinInform a cin

    I (A) = -log b P(A)b = 2 => bit o shannonb = e => natb = 10 => hartley

    1 hartley = 3.32 bit1 nat = 1.44 bit

  • 8/7/2019 Codificacion de fuente completa-e

    7/58

    7

    Fu ente Discreta sin Fu ente Discreta sin memoria ( F DSM)memoria ( F DSM)

    S

    { m i }M{ p i }M

    m i

    Discreta Discreta : Numero finito de smbolos

    Sin memoria Sin memoria : independencia estadstica*

  • 8/7/2019 Codificacion de fuente completa-e

    8/58

    8

    E ntropa de una FDSM E ntropa de una FDSM

    I(m i) = - log p i

    H ( S) : Entrop a

    H ( S) = I = - p i log p i*

    S

    { m i }M{ p i }M

    m i

    E ntropa :E ntropa : cantidad de informacioncantidad de informacionpromediopromedio

  • 8/7/2019 Codificacion de fuente completa-e

    9/58

    9

    La condicin de mxim a La condicin de mxim a entrop a se a lca nz a cu a ndo losentrop a se a lca nz a cu a ndo los

    eventos son equiprob a bles,eventos son equiprob a bles,

    p = *p = *

    C ondicin de mximaC ondicin de mximaentropaentropa

    Con M = 2 ; { pi}

    2 = {p , (1- p)

    }

    p 10

    1

    H( s)

  • 8/7/2019 Codificacion de fuente completa-e

    10/58

    10

    La Inform a cin promedio es mxim a silos eventos son equiprob a bles

    H( S)H( S) MAXMAX = log M= log M p a r a p i = 1 / M*

    C ondicin de mximaC ondicin de mxima E ntropa para una FDSM E ntropa para una FDSM

  • 8/7/2019 Codificacion de fuente completa-e

    11/58

    11

    Redundancia de una Redundancia de unaFDSM FDSM

    R (S) =R (S) = H( S)H( S) MAXMAX -- H( S)H( S) = log M= log M H( S)H( S)

    Medid a de l a inform a cin dej a d a debrind a r por l a fuente producto de l a noequiprob a bilid a d de los smbolos de l a fuente.*

  • 8/7/2019 Codificacion de fuente completa-e

    12/58

    12

    Trabajo IndependienteTrabajo IndependienteVea y justifique la solucin del Problema #1del Tema 2 en documento TI-1.Determine cual sera la estrategia de pesajeen la solucin del problema. Por qu?.

  • 8/7/2019 Codificacion de fuente completa-e

    13/58

    13

    Fuente Discreta con MemoriaFuente Discreta con MemoriaLas probabilidades de ocurrencia de los smbolosdependen de la ocurrencia de smbolosanteriores.(No hay independencia estadstica)Orden de la Fuente, r: Nmero de smbolos queintervienen en la influencia de la ocurrencia de unnuevo smbolo.Estado de la Fuente: Conjunto de smbolos que

    determinan la ocurrencia de los smbolossiguientes.Ejemplos de FDCM: Textos, Imgenes, etc.

  • 8/7/2019 Codificacion de fuente completa-e

    14/58

    14

    FD C M FD C M Orden r Estado: mimj.mr (r smbolos que definenel estado)

    S

    { m i }M{ p i / m1m2mr }M

    m i

    NE: Nmero mximo de est a dos de un a FDCM = M r

  • 8/7/2019 Codificacion de fuente completa-e

    15/58

    15

    Ej emplo Ej emplo

    10

    0.9

    0.1

    0.5

    0.5

    R t = 0.5978R ne = 0.3668R se = 0.251

    T = 0.9 0.10.5 0.5

    0 1

    0

    1

    C a er en el est a do

    Da do que

    estoy en H( S) =0.4022H( S) = 0.653P (0) = 0.833P (1) = 0.167

  • 8/7/2019 Codificacion de fuente completa-e

    16/58

    16

    Ej emplo de FD C M Ej emplo de FD C M

    A

    B

    C

    0.5

    0.50.5

    0.50.5

    0.5

    Orden 1

    P (A/A) = P (B/A)= 0.5, P (C/A)=0

    P (B/B) = P (C/B)= 0.5, P (A/B)=0

    P(C/C) =

    P(A/C)= 0.5,

    P(B/C)=0

    P rob a bilid a d de los Est a dos: P (Si)

    Entrop a de un a FDCM = H( S/Si) P (Si)

    Di a g. De Est a dos

    [T] =

    C a er en el est a doA B CDa do que

    estoy en A

    B

    C

    00 0

    M a triz deTr a nsicin

  • 8/7/2019 Codificacion de fuente completa-e

    17/58

    17

    Fuente ad j unta de una FD C M Fuente ad j unta de una FD C M Es la FDSM con igual probabilidad deocurrencia de smbolos que la FDSM.Equivale a removerle la memoria a laFDCM.Redundancia Secuencial= H(S Adj ) H(S).

    Medida de lo que disminuye la informacin producto de la dependencia secuencial.

  • 8/7/2019 Codificacion de fuente completa-e

    18/58

    18

    Pa r a Fuentes discretas con memoria (FD C M) ,

    existe redund a nci a por no equiprob a bilid a d yredund a nci a por dependenci a secuenci a l.

    Redundancia Redundancia

    R (S) tot a l = R (S)R (S) tot a l = R (S)no equipno equip + R (S)+ R (S)sec*sec*

  • 8/7/2019 Codificacion de fuente completa-e

    19/58

    19

    Modelo de Transmisin de Modelo de Transmisin de Datos Datos

    C

    ana

    l

    fuente

    Codif.de fuente

    cifrado Codif.de canal

    transmisor

    receptorDecodifde canal

    descifradoDecodif.de fuente

    destino

  • 8/7/2019 Codificacion de fuente completa-e

    20/58

    20

    Est a blecer un a correspondenci a entre los

    smbolos de una

    fuente y los smbolos dela lf a beto de un cdigo.

    Codificacin deCodificacin deFu enteFu ente

    P roceso enc a min a do a logr a r un a

    represent a cin ms eficiente de l a inform a cin( eliminar redundancia )*.

  • 8/7/2019 Codificacion de fuente completa-e

    21/58

    21

    C ondiciones del cdigoC ondiciones del cdigo

    singular separable (Unicamente decodificable)

    instantneo

  • 8/7/2019 Codificacion de fuente completa-e

    22/58

    22

    C onsideremos cuatro cdigosC onsideremos cuatro cdigos

    m1 --- 01 m1 --- 0 m1 --- 0 m1 --- 0

    m2 --- 01 m2 --- 01 m2 --- 01 m2 --- 10

    m3 --- 10 m3 --- 001 m3 --- 011 m3 --- 110

    ab c d

    N o singular singulares

    no separable separables

    instantneo*

  • 8/7/2019 Codificacion de fuente completa-e

    23/58

    23

    Cdigos No Singula

    resSingul a res

    No sep a r a bles

    Sep a r a blesNo

    inst a ntneos

    Instantneos* Instantneos*

    C ondiciones del cdigoC ondiciones del cdigo

  • 8/7/2019 Codificacion de fuente completa-e

    24/58

    24

    a .- No singul a r.b.- singul a r, no sep a r a ble.c.- singul a r , sep a r a ble, no inst a ntneo.d.- singul a r, sep a r a ble, inst a ntneo.*

    m1 --- 01 m1 --- 0 m1 --- 0m1 --- 0

    m2 --- 01 m2 --- 01 m2 --- 01m2 --- 10

    m3 --- 10 m3 --- 001 m3 --- 011 m3--- 110

    ab c d

  • 8/7/2019 Codificacion de fuente completa-e

    25/58

    25

    C ondicin de los prefi j osC ondicin de los prefi j osLa condicin necesaria y suficiente

    p a r a que un cdigo se a instantneo esque sus p a la br a s cumpl a n l a condicinde los prefijos:

    N o exista palabra que sea prefi j o de N o exista palabra que sea prefi j o deotra palabra de longitud mayor otra palabra de longitud mayor.*

  • 8/7/2019 Codificacion de fuente completa-e

    26/58

    26

    C digos eficientesC digos eficientes

    l i longitud de l a p a la br a codific a d a del mens a je m ir : # de smbolos del a lf a beto del cdigo

    L = 7 p i l i : L ongitud promedio de l a p a la br a *

    E strategia E strategia : Asign a r p a la br a s ms cort a s a

    smbolos ms proba

    bles

  • 8/7/2019 Codificacion de fuente completa-e

    27/58

    27

    E ficiencia de un cdigo E ficiencia de un cdigo

    log r : C a ntid a d mxim a de inform a cin deun smbolo de cdigo

    L log rL log r uu H(s)H(s)

    Eficienci a del cdigo :

    L ! ,L ! ,S)S) / (/ (L log r)L log r) *

  • 8/7/2019 Codificacion de fuente completa-e

    28/58

    28

    Mtodos de codificacin Mtodos de codificacin

    Cdigo de Sha

    nnonCdigo de Huffm a n

    otros.

  • 8/7/2019 Codificacion de fuente completa-e

    29/58

    29

    C digo de HuffmanC digo de HuffmanCdigo de mxim a eficienci a , noCdigo de mxim a eficienci a , no

    existe otro de m a yor eficienci a .existe otro de m a yor eficienci a .Emple a do p a r a codific a r FD SMEmple a do p a r a codific a r FD SM

    en la

    s que se conocen la

    s pi deen la

    s que se conocen la

    s pi deca d a mens a je.ca d a mens a je.

  • 8/7/2019 Codificacion de fuente completa-e

    30/58

    30

    N o hay dos mensa j es con igualessecuencias

    C umple la condicin de los prefi j os Smbolos mas probables son codificadoscon palabras de cdigos de menor longitud. l 1e l 2 e ....... e l M L os dos mensa j es menos probables soncodificados con palabras de igual longitud l M = l M - 1 *

    Principios del C digo de Principios del C digo de

    Huffman Huffman

  • 8/7/2019 Codificacion de fuente completa-e

    31/58

    31

    Procedimiento para el cdigo deProcedimiento para el cdigo de

    HuffmanHuffmanLos mensajes son ordenados en orden de probabilidadesdecrecientes.Se agrupan los r (para binarios r=2) mensajes menos

    probables y sus probabilidades se suman formando unafuente reducida de la original que contiene el nuevomensaje compuesto y no los originales.Se mantiene la organizacin de probabilidadesdecrecientes en la nueva fuente reducida construida.

    El procedimiento se repite hasta que la fuente reducidaquede con r mensajes.Se asignan dgitos del cdigo de atrs hacia delantecumpliendo la condicin de los prefijos.V ea ejemplo #2 en problem a s del Tem a 2. R esuelv a losproblem a s 3 y 4 propuestos.

  • 8/7/2019 Codificacion de fuente completa-e

    32/58

    32

    Inconvenientes del cdigo de Inconvenientes del cdigo de Huffman Huffman

    La s prob a bilid a des de l a fuente pueden no ser

    conocid a s a priori Solucin : Empleo de mens a jes p a trones ==>

    determin a r est a dstic a s.

    Na

    tura

    leza

    de la

    fuente puede significa

    rconjunto muy gr a nde de smbolos (lent a codific a cin y requiere gr a n memori a .)*

  • 8/7/2019 Codificacion de fuente completa-e

    33/58

    33

    Cdigo de H u ffman ModificadoCdigo de H u ffman ModificadoEjemplo: Codificacin de doc u mento facsmil para G3

    FAX 1728 pel

    B B B B B

    Codific a la s longitudes de recorrido :Ej: 100B, 40N, 788B, 80N, 600B, 60N, 60B,20N, 40B*

  • 8/7/2019 Codificacion de fuente completa-e

    34/58

    34

    Fuente con 1728 x 2 mens a jes = 1728 long. debl a nco y 1728 long. de negro = 3456 mens a jes

    L ongitud de recorrido : N = 64 m + n;n = 0, 1, ... , 63 palabras de terminacinm = 1, 2, ... , 27 palabras de establecimiento27 x 64 = 1728;

    Nmero tot a l de mens a jes : (27 + 64) 2 = 182Ej: Pa r a un a longitud de 146 = 2 x 64 + 18;

    n = 18. m = 2*

    Huffman Modificado Huffman Modificado

  • 8/7/2019 Codificacion de fuente completa-e

    35/58

    35

    L ong Bl a nco Negro

    0 00110101 000011011111 000111 010

    63 00110100 000001100111

    Palabras de terminacin Palabras de terminacin

    L ong. Bl a nco Negro

    1 (64) 11011 00000011112 (128) 10010 000011001000

    6327 (1728) 010011011 0000001100101EO L 00000000001

    Palabras de establecimiento Palabras de establecimiento

  • 8/7/2019 Codificacion de fuente completa-e

    36/58

    36

    Ejemplo de H u ffman ModificadoEjemplo de H u ffman Modificado

    23 bl a nco 51 negro 930 bl a nco146 negro 578 bl a nco

    23 bl a nco 51 negro ( 14 x 64) + 34 bl a nco

    (2x64) + 18 negro ( 9 x 64) + 2 bla

    ncon=23 B; n = 51 N; (m = 14B) + (n = 34B); (m = 2N) + (n = 18N); (m=9B) + (n=2B)

    0000100 000001010011 011010011 00010011000011001000 0000001000 0110100000 0111

    000000000001*

  • 8/7/2019 Codificacion de fuente completa-e

    37/58

    37

    Ej emplo: Ej emplo:Vamos a codificar 23(b) 51(n) 930(b) 146(n) 578(b)

    1. 23b LSB 00001002. 5 1n LSB 0000010100113. 9 30b 14 6 4 + 34 = 011010011 00010011

    896 M SB 34 LSB

    4. 146 n 2 6 4 + 1 8 = 000011001000 0000001000128 M SB 18 LSB

    5.578

    b9

    6

    4 + 2= 01101000

    0111576 M SB 2 LSB

  • 8/7/2019 Codificacion de fuente completa-e

    38/58

    38

    C odificacin adaptativaC odificacin adaptativa

    Para casos en que el comportamientoestadstico de la fuente vare o seadesconocido, puede a j ustarse la

    codificacin de forma dinmicateniendo en cuenta el comportamientode la fuente.

  • 8/7/2019 Codificacion de fuente completa-e

    39/58

    39

    Mensaje probabilidad pal. codigo

    m1 0.4 1m

    20.24 01

    .........................................m7

    Cdigos corrientes Cdigos corrientes

    Conociendo comport a miento est a dsticode l a fuente (ex a ct a o por p a trones) :

    Entr a d a s

    Sa lid a

  • 8/7/2019 Codificacion de fuente completa-e

    40/58

    40

    Cdigos adaptativos Cdigos adaptativos Con cdigos a d a pt a tivos l a ta bl a es v a ri a bley se a d a pt a a la s c a r a cterstic a s de l a fuentey no es neces a rio conocer l a s prob a bilid a des

    Mens a je conta dor prob. estim a d a p a l. Cdigo

    m1 400 0.4 1

    .................................................................Se p a rte de un a codific a cin a cord a d a por TX y R X

    ( puede ser cu a lquier a )C a d a cierto nmero de mens a jes se estim a n l a s

    prob a bilid a des y a just a codific a cin

    Igu a l procedimiento en el R X.*

  • 8/7/2019 Codificacion de fuente completa-e

    41/58

    41

    Mtodos de compresin Mtodos de compresin

  • 8/7/2019 Codificacion de fuente completa-e

    42/58

    42

    Aplic a ble a fuentes de c a r a cteres.

    Existen mltiples va

    ria

    ntes.Con frecuenci a es el primer p a so de un a lgoritmo de

    compresin ms complejo.

    Se sustituye p a rte del texto origin a l por textocomprimido precedido por c a rcter indic a tivo decompresin.*

    Compresin orientada aCompresin orientada acaracteres caracteres

  • 8/7/2019 Codificacion de fuente completa-e

    43/58

    43

    Ej emplo :

    Texto origin a l : M C M X C V I I I I I I I C L D M

    Texto comprimido : M C M X C V C I E F C L D M

    E = I ; F = 7

    Compresin orientada aCompresin orientada acaracteres caracteres

  • 8/7/2019 Codificacion de fuente completa-e

    44/58

    44

    MNP5 MNP5

    Protocolo de comunicacin entre MOD E Ms con dos etapas de compresin .

    E tapa 1 ) Compresin orient a d a a ca rcter(cu a ndo un C h . Se repite 3 veces o ms sesustituye por 3 veces el c a rcter seguido del

    exceso de 3) E tapa 2 ) Compresin a d a pt a tiv a con t a bl a dinmic a de 256 fil a s. *

  • 8/7/2019 Codificacion de fuente completa-e

    45/58

    45

    A c a d a fila le corresponde un a p a la br a de cdigo

    fij a .Se p a rte de un orden a miento comn de los

    ca r a cteres en TX y R X y por lo t a nto de un a codific a cin comn.

    Tr a s un nmero de mens a jes determin a do losca r a cteres son reorden a dos en l a ta bl a a corde a sufrecuenci a de ocurrenci a , c a mbi a ndo l a codific a cin

    de los mismos a corde a la posicin que ocup a n en l a ta b a l tr a s el reorden a miento.

    MN P 5 produce rel a ciones de compresin entre 1.5 y 2,

    supera

    da

    s h oy por numerosos mtodos de compresin.*

    Procedimiento de etapa 2 Procedimiento de etapa 2

  • 8/7/2019 Codificacion de fuente completa-e

    46/58

    46

    A lgoritmos de adaptacin de A lgoritmos de adaptacin decadenas cadenas ( string( string- -matchingmatching

    algorithms)algorithms)P ermiten a provec h a r rel a ciones de ordensuperior entre p a la br a s y fr a ses en untexto.Aprecien que en los vistos a nteriormentese sustitu a n sol a mente c a r a cteresindividu a les que se repet a n, a h or a setr a ta de sustituir c a den a s de c a r a cteresque se repit a n.

  • 8/7/2019 Codificacion de fuente completa-e

    47/58

    47

    Mtodos de diccionarios Mtodos de diccionariosLos mensajes (palabras) son uniones desmbolos. Los mtodos de diccionario no se

    basan ni en los smbolos ni en la probabilidad del mensaje. Se basan solo en palabras.

    Vamos a tratar de construir un diccionario a partir de los mensajes de la fuente.

  • 8/7/2019 Codificacion de fuente completa-e

    48/58

    48

    I

    dea de compresin I

    dea de compresinDurante la transmisin van llegando conjuntos desmbolos que son una sucesin de palabras. Si las

    almacenamos en un diccionario, tenemos laesperanza de tener la repeticin de determinadosconjuntos de smbolos (por ejemplo la cadenaero) y aparecen con una determinada frecuencia,

    le podemos asignar un nmero y transmitir elnmero (por ejemplo campero, pero, espero, etc)

    pero puede dejar de utilizarse.

  • 8/7/2019 Codificacion de fuente completa-e

    49/58

    49

    Partimos de un diccionario inicial con 2 56 cdigo de 8 bitsEl algoritmo de codificacin consiste enalmacenar cadenas de caracteres que nocoinciden con ninguna de las presentes en el

    diccionario original y agregar esta nuevacadena al diccinario enviando el primer carcter.

  • 8/7/2019 Codificacion de fuente completa-e

    50/58

    5 0

    Ej emplo Ej emplo :Cadena: itty bitty bit binDiccionario inicial:

    El primer carcter que llega al codificador es la ique est en el diccionario por lo que se espera elprximo carcter t. Se agrega la cadena it y setransmite la i---105

  • 8/7/2019 Codificacion de fuente completa-e

    51/58

    5 1

  • 8/7/2019 Codificacion de fuente completa-e

    52/58

    5 2

    J . Ziv

    A.L

    empel1977

    Algoritmo b a sa do en

    buffers de vent a n a sdesliz a ntes, LZ77

    Algoritmo b a sa do en

    buffers de vent a n a sdesliz a ntes, LZ77

    A lgoritmos de adaptacin de A lgoritmos de adaptacin decadenas cadenas ( string( string- -matchingmatching

    algorithms)algorithms)

    En un texto (im a gen, etc. )frecuentemente se repiten c a den a s de C h .

    La secuenci a repetid a se sustituye por un

    cdigo corto

  • 8/7/2019 Codificacion de fuente completa-e

    53/58

    5 3

    A lgoritmo A lgoritmo LZ77 LZ77

    The brown fox jumped over the brown foxy jumping frog53 octetos, 424 bits

    C a d a octeto ==> p a trn de 9 bits = 1 seguido de A SCII 8 bits.

    Se busc a n c a den a s repetid a s y son sustituid a s por

    puntero a la secuenci a a nterior

    longitud de c a den a repetid a

    . Dos opciones identific a d a s por dos bits de c a becer a :

    - 8 bits de puntero , 4 bits de longitud, con c a becer a 00

    - 12 bit de puntero, 6 bits de longitud, con c a becer a 01*

  • 8/7/2019 Codificacion de fuente completa-e

    54/58

    5 4

    0b26 d13 d 0b27 d5d*

    The brown fox jumped over the brown foxy jumping frog

    53 octetos, 424 bits

    2613 5

    27

    A lgoritmo A lgoritmo LZ77 LZ77

  • 8/7/2019 Codificacion de fuente completa-e

    55/58

    55

    Preguntas

    Por la semejanza en los principios de LZ 77 con elcompresor Winzip responda:Cmo es posible que al aplicar compresin a unarchivo me de cmo resultado un archivo demayor tamao?En qu consiste que hayan ms de un tipo omodo de compresin, uno lento y otro rpido? En

    qu se diferenciarn?Por qu el lento puede alcanzar mayores nivelesde compresin que el rpido?

  • 8/7/2019 Codificacion de fuente completa-e

    56/58

    56

    C odificacin de FuenteC odificacin de Fuente

    C onclusionesC onclusionesPrimer proceso de la comunicacin.Permite comunicacin ms eficiente.

    Objetivo: Extraccin de redundancia.Mtodos: Cdigo de Huffm a n Huffm a n modific a do.

    Compresin de c a r a cteres MN P 5 y otros Ad a pt a cin de c a den a s. etc*

  • 8/7/2019 Codificacion de fuente completa-e

    57/58

    57

    Trabajo independiente

    Localice 3 algoritmos o estndares de compresin,indicando su aplicacin y las razones de

    compresin que alcanzan reportadas en laliteratura.Hay algoritmos de compresin sin prdida deinformacin y con prdida de informacin. Qu

    significado tendr esta clasificacin y refieraaplicaciones de ambos?

  • 8/7/2019 Codificacion de fuente completa-e

    58/58

    58

    Pero. Pero.El canal tiene, ruido, distorsin einterferencia.Los errores qu??Cmo protegemos la informacin contralos errores??

    C odificacin de canal** C odificacin de canal**