DATLAS OLOMBIA MÉTODOS DE CÁLCULO/C · 2018-09-24 · DATLAS – COLOMBIA - MÉTODOS DE...

12
DATLAS COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS 1 Métodos de cálculo de los indicadores de complejidad En este documento se describen en detalle los métodos para calcular las medidas de complejidad económica. DATLAS contiene dos conjuntos de medidas de complejidad: las basadas en las exportaciones de bienes o productos (HS Rev. 3, a cuatro dígitos según datos de la DIAN), y las basadas en el empleo formal de todos los sectores de actividad económica, sean bienes o servicios (CIIU-AC, Rev. 3, a cuatro dígitos, según datos de la PILA). En la explicación que sigue se describen los métodos basados en las exportaciones por producto de ciudades y departamentos colombianos, pero se precisa cuando el procedimiento difiere para los datos de empleo por sectores. En las ecuaciones presentadas el subíndice c indica ciudades o departamentos, y el subíndice p indica productos (o sectores). Para simplificar la notación no se utiliza subíndice por año, pero todos los cálculos aplican para cada uno de los años con información (2008- 2014). Cálculo de ventajas comparativas reveladas Se parte de las exportaciones por producto, año y localidad (ciudades o departamentos, procesados por separado), organizados en forma matricial: A partir de esta matriz de datos de exportaciones se pueden generar agregados a nivel de localidad, de producto, o de total de las exportaciones colombianas por año: A partir de estas medidas se calcula la Ventaja Comparativa Revelada (RCA, por sus siglas in inglés) para cada localidad en cada producto:

Transcript of DATLAS OLOMBIA MÉTODOS DE CÁLCULO/C · 2018-09-24 · DATLAS – COLOMBIA - MÉTODOS DE...

Page 1: DATLAS OLOMBIA MÉTODOS DE CÁLCULO/C · 2018-09-24 · DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS 2 Una precisión relevante es que el cálculo del RCA con los

DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS

1

Métodos de cálculo de los indicadores de complejidad

En este documento se describen en detalle los métodos para calcular las medidas de complejidad económica. DATLAS contiene dos conjuntos de medidas de complejidad: las basadas en las exportaciones de bienes o productos (HS Rev. 3, a cuatro dígitos según datos de la DIAN), y las basadas en el empleo formal de todos los sectores de actividad económica, sean bienes o servicios (CIIU-AC, Rev. 3, a cuatro dígitos, según datos de la PILA). En la explicación que sigue se describen los métodos basados en las exportaciones por producto de ciudades y departamentos colombianos, pero se precisa cuando el procedimiento difiere para los datos de empleo por sectores. En las ecuaciones presentadas el subíndice c indica ciudades o departamentos, y el subíndice p indica productos (o sectores). Para simplificar la notación no se utiliza subíndice por año, pero todos los cálculos aplican para cada uno de los años con información (2008-2014). Cálculo de ventajas comparativas reveladas Se parte de las exportaciones por producto, año y localidad (ciudades o departamentos, procesados por separado), organizados en forma matricial:

A partir de esta matriz de datos de exportaciones se pueden generar agregados a nivel de localidad, de producto, o de total de las exportaciones colombianas por año:

A partir de estas medidas se calcula la Ventaja Comparativa Revelada (RCA, por sus siglas in inglés) para cada localidad en cada producto:

Page 2: DATLAS OLOMBIA MÉTODOS DE CÁLCULO/C · 2018-09-24 · DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS 2 Una precisión relevante es que el cálculo del RCA con los

DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS

2

Una precisión relevante es que el cálculo del RCA con los datos de exportaciones utiliza al resto del mundo como referencia (Xp en este caso es el total de las exportaciones mundiales del producto p, y X es el total de las exportaciones mundiales de todos los productos). En cambio, los cálculos con los datos de empleo utilizan al total del país como referencia (Xp en este caso es el total del empleo formal del sector p, y X es el total del empleo formal de todos los sectores). Cálculos de diversidad y ubicuidad La matriz de los RCA se transforma en una matriz binaria dependiendo de si los valores son mayores o menores a uno:

Esta matriz indica qué productos (o sectores) son relativamente grandes en cada departamento o ciudad. Con esta matriz se construyen los indicadores básicos de diversidad a nivel de la localidad y de ubicuidad a nivel de producto. Es decir, la diversidad es el conteo de cuántos productos de exportación son relativamente grandes en cada localidad, y la ubiquidad es el conteo de los lugares que exportan en cantidades relativamente grandes cada producto. Respectivamente, la diversidad de los lugares y la ubicuidad de los productos son:

Cálculo de la complejidad de los productos y los lugares Una medida de la complejidad de un lugar es la diversidad de sus productos (o sectores) ponderada por la ubicuidad de los productos (o sectores) en los que tiene ventaja comparativa revelada mayor que uno. Análogamente, la complejidad del producto puede medirse como la ubicuidad del producto ponderada por la diversidad de las localidades que exportan dichos productos con ventaja comparativa revelada mayor que uno. Este método puede extenderse para ponderar nuevamente en una etapa siguiente la ubicuidad por la diversidad y viceversa, y así sucesivamente. Por consiguiente, usando el método de reflejos se llega a las medidas siguientes:

Page 3: DATLAS OLOMBIA MÉTODOS DE CÁLCULO/C · 2018-09-24 · DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS 2 Una precisión relevante es que el cálculo del RCA con los

DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS

3

Donde:

Utilizando notación de vectores, esto puede expresarse de la siguiente manera:

Cuando n Æ ∞ tenemos la siguiente expresión:

Donde es un eigenvector de .

El segundo mayor eigenvector de se toma como el Índice de Complejidad

Económica del lugar (ICE) y el segundo mayor eigenvector de se toma como Índice de Complejidad Económica del Producto (ICP) cuando se usan los datos de expostaciones, o como el Índice de Complejidad Sectorial (ICS) cuando se usan los datos de empleo sectorial. El ICE de un lugar es matemáticamente idéntico al promedio de los ICP de los productos (o de los ICS de los sectores) en los que un lugar tiene RCA>1. Cuando se usan los datos de exportaciones, se utilizan los valores para 2013 de los PCI que han sido calculados en el Atlas Internacional de Complejidad Económica con base en el comercio mundial (http://atlas.cid.harvard.edu). Nótese que los cálculos de los indicadores de complejidad de las exportaciones por lugar (ICE según exportaciones) se hacen sólo para los departamentos y ciudades con exportaciones superiores a US$50 por habitante. Cuando se utiliza la información de empleo, los cálculos de complejidad por sector utilizan la información por sector/localidad incluyendo solo los sectores con al menos 50 empleos formales en un mes

Page 4: DATLAS OLOMBIA MÉTODOS DE CÁLCULO/C · 2018-09-24 · DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS 2 Una precisión relevante es que el cálculo del RCA con los

DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS

4

promedio, y sólo las localidades con al menos 10 sectores con 50 o más empleados formales. La complejidad con base en los sectores productivos (ICE según los sectores) solo se presenta para departamentos y ciudades. Por debajo de estos umbrales la composición de las exportaciones o el empleo es inestable y/o carece de representatividad. Cálculos de proximidad y distancia tecnológica entre productos (o sectores) En el módulo de exportaciones, la proximidad tecnológica entre dos productos también se toma de los cálculos de comercio internacional según el Atlas Internacional de Complejidad Económica. La proximidad tecnológica es calculada como la probabilidad condicional de que cuando un país exporta un producto con ventaja comparativa revelada mayor que uno, exporte también otro producto con RCA  mayor  que  uno  (a  este  tipo  de  probabilidad  condicional  se  la  denomina  “co-ubicación”). Para garantizar la simetría de la matriz resultante, se usa como denominador la ubicuidad del producto más ubicuo entre cada par de productos:

Para el módulo de empleo, la proximidad tecnológica entre dos sectores no se calcula mediante las probabilidades de co-ubicación, sino mediante las probabilidades de que dos sectores compartan un cierto porcentaje de sus trabajadores a través de flujos laborales entre ambos sectores. Partiendo de la métrica de proximidad tecnológica, la densidad se estima como la suma de las proximidades de los productos en los que una localidad tiene ventaja comparativa como proporción de la suma de las proximidades entre todos los productos:

Y la distancia de una localidad a un producto se calcula como uno menos la densidad:

Cálculos de la complejidad potencial por lugar y el valor estratégico por producto El Índice de Complejidad Potencial (COI) de un lugar es la suma de las densidades para los productos en los que no se tiene ventaja comparativa revelada (es decir, que tienen RCA<1), multiplicado por el PCI de dichos productos:

Page 5: DATLAS OLOMBIA MÉTODOS DE CÁLCULO/C · 2018-09-24 · DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS 2 Una precisión relevante es que el cálculo del RCA con los

DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS

5

Por ende, lugares que están más cerca de producir un mayor número de productos más complejos tienen mayor complejidad potencial. Finalmente, el valor estratégico de un producto para un lugar (COG) es la ganancia en la complejidad de la localidad que se lograría si consigue exportar ese producto con ventaja comparativa revelada mayor que uno. Esa medida tiene en cuenta tanto la ganancia directa como la indirecta por el hecho de acercarse a otros productos que el lugar aún no exporta con VCR>1:

Nuevamente, cuando se trata de exportaciones se utilizan los PCI tomados del Atlas de Complejidad Económica Internacional, mientras que cuando se trata de la complejidad de todos los sectores productivos con base en el empleo formal, se utiliza sólo la información para Colombia. Los mapas de similitud de los productos y de los sectores Los mapas de similitud tecnológica de los productos y de los sectores son visualizaciones de las proximidades entre los productos o sectores calculados como se ha explicado anteriormente. Dado que la mayoría, pero no todos, los productos tienen al menos algún grado de proximidad con muchos otros productos, el mapa de productos no podría representar todos los 1.240 productos de la clasificación a cuatro dígitos HS2 o todas las conexiones entre ellos. Por lo tanto, se necesitan algunos criterios simples de diseño para construir el mapa. En primer lugar, el mapa del producto es una red conectada, lo que implica que no incluye islas aisladas de productos. En segundo lugar, la visualización de la red tiene que ser relativamente parsimoniosa, debido a que un exceso de enlaces crearía una complejidad visual innecesaria que impediría apreciar las conexiones más relevantes. Para poner en práctica estos criterios, se usa un algoritmo que ordena los valores de la matriz de proximidad en orden descendente y tiene en cuenta el número mínimo de enlaces y la cantidad máxima de posibles proximidades. Como resultado, la visualización del mapa de productos incluye 865 nodos (productos) con un promedio de 4,6 bordes (enlaces) por nodo. Los 375 productos que no quedan incluidos en el mapa del producto representan sólo el 1,1% del comercio mundial o el 0,96% de las exportaciones colombianas en 2014. Del mismo modo, el mapa de los sectores incluye 390 de los 444 códigos de

Page 6: DATLAS OLOMBIA MÉTODOS DE CÁLCULO/C · 2018-09-24 · DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS 2 Una precisión relevante es que el cálculo del RCA con los

DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS

6

sectores a cuatro dígitos de la CIIU. Los 54 sectores que no quedan incluidos representan menos del 0,25% del empleo formal en 2014. Limitaciones Dado que los cálculos por el lado de los productos y por el lado de los sectores se llevan a cabo de forma independiente (los primeros con datos internacionales, éstos con datos colombianos), no existe una correspondencia entre ambos. Esto significa que los datos de empleo no se muestran por producto, ni tampoco para las actividades exportadoras por separado. Esto también significa que los rankings de complejidad de los productos y de los sectores pueden diferir sustancialmente en algunos casos (flores cortadas, por ejemplo). Del mismo modo, los productos con mayor potencial no se corresponden necesariamente con los sectores con mayor potencial (por un departamento o ciudad, no el país en su conjunto ya que no hay manera de determinar el potencial de los sectores a nivel nacional). No existen criterios para determinar si son mejores las medidas de complejidad por el lado del producto o por el lado de los sectores, simplemente porque captan diferentes aspectos de las capacidades productivas. Nuestros métodos de cálculo no proporcionan una medida del grado de confianza que se puede asignar a las medidas de complejidad o a la identificación de los productos o los sectores con potencial. En general, la presencia y el potencial de los productos o sectores más complejos son más difíciles de predecir ya dichos productos o sectores ocurren con menos frecuencia. Sin embargo, algunos productos o sectores pueden quedar clasificados como de baja complejidad en contradicción con el nivel aparente de capacidades técnicas requeridas en su producción (por ejemplo, la extracción de petróleo), lo cual se debe a que son productos o sectores que ocurren en muchos lugares que tienen pocas capacidades para producir otras cosas. Ciertos productos y sectores que ocurren de manera muy poco frecuente y muy impredecible se excluyen de los espacios de producto y de la industria como se explicó anteriormente. Sin embargo, las medidas de la complejidad de dichos productos se incluyen en las tablas correspondientes y en los gráficos de dispersión de productos potenciales por lugar (no así en el caso de los sectores raros, para los cuales no se pueden calcular las medidas de complejidad). Más información Para una discusión más amplia de las bases conceptuales de las medidas de complejidad económica y para encontrar bibliografía técnica relevante, le invitamos a visitar el Atlas de Complejidad Económica (http://atlas.cid.harvard.edu) y a descargar el libro (http://atlas.cid.harvard.edu/book/).

Page 7: DATLAS OLOMBIA MÉTODOS DE CÁLCULO/C · 2018-09-24 · DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS 2 Una precisión relevante es que el cálculo del RCA con los

DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS

7

Calculation Methods for Economic Complexity Variables In this document we describe the methods for calculating the economic complexity variables presented in DATLAS. The tool contains two groups of metrics: those based on exports of goods (HS Rev. 3, at 4 digits, using customs data from DIAN), and those based on formal employment data of all industries producing either goods or services (ISIC-AC, Rev. 3, at 4 digits, using social security data from PILA). In the explanation that follows we describe the methods for the case of the export data. However, precisions are made whenever the procedures for employment data differ from those for export data. In the equations below, the sub-index c indicates cities or departments, and the sub-index p indicates products (or industries). While we do not use a sub-index for years in order to simplify notation, all calculations are applied for each year separately (2008-2013). Calculation of Revealed Comparative Advantages We start with data for exports by product, year and locality (either cities or departments, treated separately), organized in matrix form:

From this matrix, we build locality, product and total aggregates of Colombian exports per year:

Building on these metrics we calculate the Revealed Comparative Advantage (RCA) for each locality/product combination:

Page 8: DATLAS OLOMBIA MÉTODOS DE CÁLCULO/C · 2018-09-24 · DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS 2 Una precisión relevante es que el cálculo del RCA con los

DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS

8

The RCA calculation with export data is made using the rest of the world as benchmark (accordingly, Xp is the worldwide value of exports of product p, and X is the total value of international trade in a given year). However, calculations on employment data by industry use the Colombian totals as benchmark (Xp in this case is the total formal employment in Colombia in industry p, and X is the total formal employment in all industries). Diversity and Ubiquity Calculations The RCA matrix is transformed in a binary matrix depending on whether a particular value is larger than 1 or not:

This matrix indicates the products (or industries) that are relatively large in each department or city. From this matrix we compute the Diversity indicator at the locality level, and the Ubiquity indicator at the product (or industry) level –that is, the count of the number of products with relatively large exports for each locality, and the count of the places that export a given product with a relatively high intensity:

Economic Complexity Metrics by product and localities One metric of the complexity of a location is its diversity weighed by the relative ubiquity of the products (or industries) in which it displays relative comparative advantage levels larger than one. Similarly, the complexity of a product or industry can be measured by its ubiquity weighed by the diversity of the localities that are competitive in such product or industry. Extending this exercise ad infinitum, correcting diversity with ubiquity and vice-versa with consecutive iterations, is called the method of reflections. It can be expressed as follows:

Page 9: DATLAS OLOMBIA MÉTODOS DE CÁLCULO/C · 2018-09-24 · DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS 2 Una precisión relevante es que el cálculo del RCA con los

DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS

9

Where:

Using vector notation, the calculation method can be written in a compact manner as:

When n Æ ∞, we obtain the following expression:

Where is an eigenvector of .

We take the second largest eigenvector of to be the Economic Complexity

Index (ECI), and the second largest eigenvector of to be the Product Complexity Index when using export data (PCI), or the Industry Complexity Index (ICI) when using employment data by industry. The ECI of a locality is mathematically equivalent to the average of the PCIs of those products (or the ICI of those industries) in which a location has an RCA larger than 1. When working with export data, we use the PCI values by product for 2013 already available at the International Atlas of Economic Complexity, which were calculated

Page 10: DATLAS OLOMBIA MÉTODOS DE CÁLCULO/C · 2018-09-24 · DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS 2 Una precisión relevante es que el cálculo del RCA con los

DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS

10

using the method described above on international trade data at the country level (http://atlas.cid.harvard.edu). However, export complexity calculations by locality (ECI of exports) are made only for departments and cities that export more than $50 per capita. When using employment data, ICI values are calculated on employment levels per industry/locality combination, including only industries with at least 50 formal employees in an average month, and only localities with at least 10 industries with 50 or more formal employees. Industry complexity calculations by locality (ECI of industries) are presented only for departments and cities. Below these thresholds the composition of exports or employment is unstable and/or lacks representativeness. Technological proximity between products (or industries) and distance from a location to a product or industry In the exports module, technological proximities between products are also calculated on international trade data at the country level, and are taken from the International Atlas of Economic Complexity (http://atlas.cid.harvard.edu). The technological proximity between two products is calculated as the conditional probability that a country exports a product with an RCA larger than 1, given that it does so with the other product –we  call  this  kind  of  conditional  probability  “co-location”  proximity.  To  guarantee  symmetry in the resulting proximity matrix, we use the ubiquity of the most ubiquitous product in each pair as the denominator of the conditional probability:

For the employment module, the technological proximity between pairs of industries is not calculated with co-location conditional probabilities, but with the probability that two industries have similar human capital requirements, which is measured through the relative intensity of labor flows between the two industries. Building on the proximity metric between pairs of products, we estimate the density of a location around a product as the sum of the proximities between the products that a locality exports with RCA >1 and each given product:

The distance from a locality to a product is measured as the unit minus the density value.

Page 11: DATLAS OLOMBIA MÉTODOS DE CÁLCULO/C · 2018-09-24 · DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS 2 Una precisión relevante es que el cálculo del RCA con los

DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS

11

Calculations of the Complexity Outlook Index and the Complexity Outlook Gain The Complexity Outlook Index (COI) of a locality is the sum of the densities for the products in which a location has RCA lower than 1, multiplied by their PCIs.

Hence,  places  “closer”  to  producing  a  larger  number  of  more  complex  products  show higher COI values. Finally, the Complexity Outlook Gain (COG) of a product in a location is the COI gain that a locality would observe by adding a given product to its export mix. This metric takes into account both the immediate gain of adding the product and the indirect  gain  of  becoming  “closer”  to  other  products  with  RCA  lower  than  1.  

The product and industry spaces The product and industry spaces are visualizations of the proximities between products or industries calculated as explained above. Since most, but not all, products have at least some degree of proximity with many other products, the product space cannot represent all the 1,240 products in the HS2 four-digit classification or all the connections between them. Therefore, some simple design criteria are needed to construct the space. First, the product space has to be a connected network, which implies avoiding islands of isolated products. Second, the network visualization has to be relatively sparse, because too many links create unnecessary visual complexity obscuring the most relevant connections. To implement these criteria, an algorithm is used, which sorts the values of the proximity matrix in descending order and takes into account the minimum number of links and the maximum possible sum of proximities. As a result, the visualization of the product space includes 865 nodes (products) with an average of 4.6 edges (links) by node. The 375 products that are not included in the product space account for only 1.1% of world trade or 0.96% of Colombian exports in 2014. Similarly, the industry space includes 390 of the 444 ISIC four-digit industry codes, with the

Page 12: DATLAS OLOMBIA MÉTODOS DE CÁLCULO/C · 2018-09-24 · DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS 2 Una precisión relevante es que el cálculo del RCA con los

DATLAS – COLOMBIA - MÉTODOS DE CÁLCULO/CALCULATION METHODS

12

remaining 54 industries representing less than 0.25% of formal employment in 2014. Caveats Since the product and industry calculations are done independently (the former with international data, the latter with Colombian data), there is no correspondence between both. This means that employment data are not shown by product or separately for exporting activities. This also means that product and industry complexity rankings may differ substantially in some cases (cut flowers, for instance). Similarly, the products with the most potential do not necessarily correspond with the industries with the most potential (for a department or city, not the country as a whole since there is no way to determine industry potential at the national level). No criteria exist to determine whether the product or the industry measures are better, simply because they capture different aspects of productive capabilities. Our methods of calculation do not provide a measure of the degree of confidence that can be attached to the complexity rankings or the potential rankings of products or industries. In general, the presence and potential of more complex products or industries is harder to predict because they occur less frequently. However, some products or industries may be ranked as low complexity when they may not be complex in view of the technical capabilities required in their production (such as petroleum), because they happen to occur in many countries with few other productive capabilities. Products and industries that occur too rarely and unpredictably are excluded from the product and industry spaces as explained above. However, the complexity measures for those products are included in the corresponding tables and in the scatters of potential products by place (not so for the rare industries, for which complexity measures cannot be computed). For more information For a more detailed discussion on the conceptual basis of the Economic Complexity Metrics, and to find further relevant technical literature, we invite you to visit the Atlas of Economic Complexity (http://atlas.cid.harvard.edu) and to download the book (http://atlas.cid.harvard.edu/book).