Vol. 3 Núm. 007 Suplemento CICA Multidisciplinario

Enero - Junio 2019

PROPUESTA DE TÉCNICAS DE MINERÍA DE DATOS PARA LA SELECCIÓN DE ATRIBUTOS EN LA PREDICCIÓN DEL FRACASO EMPRESARIAL

PROPOSAL OF DATA MINING TECHNIQUES FOR THE SELECTION OF ATTRIBUTES IN THE PREDICTION OF BUSINESS FAILURE

PROPOSTA DE TÉCNICAS DE DATA MINING PARA SELEÇÃO DE ATRIBUTOS NA PREVISÃO DE FALÊNCIA EMPRESARIAL

AUTORES

Hugo Arnaldo Martínez Noriega¹ Autor de correspondencia: hamn2000@gmail.com

Universidad 0 Martha Abreu de Las Villas, Villa Clara, Cuba

Bolívar Ernesto Medrano Broche² email: bol.medrano@hotmail.com

XOA.S.A, Guayaquil, Ecuador

Recibido: 21/03/2019 Aceptado: 29/05/2019 Publicado: 30/06/2019

RESUMEN

El análisis de la información financiera mediante el empleo de razones tiene una limitada capacidad para cuantificar de forma eficiente el éxito o fracaso financiero de una empresa, debido a la gran cantidad de indicadores que se pueden utilizar. Surge la necesidad de encontrar indicadores que permitan poner de manifiesto, lo antes posible, procesos de insolvencia o fracaso empresarial y así poder evaluar los posibles escenarios para la posterior toma de decisiones. En la predicción del fracaso empresarial resulta útil contar con técnicas que permitan seleccionar los atributos, en este caso indicadores financieros con alto poder predictivo. Las técnicas de minería de datos resultan una propuesta acertada en la selección de estos atributos con alta capacidad predictiva en procesos de fracaso empresarial. En este trabajo se presentan las principales limitantes del análisis financiero basado en razones financieras. Se fundamenta la propuesta de técnicas de minería de datos que pueden ser empleadas en el análisis financiero para la predicción del fracaso empresarial. Además se discuten las principales ventajas de las técnicas de minería de datos en el proceso de toma de decisiones respecto a la evaluación del fracaso empresarial.

PALABRAS CLAVES: minería de datos, algoritmo de selección de atributos, fracaso empresarial, razones financieras

ABSTRACT

The analysis of financial information through the use of reasons has a limited capacity to quantify efficiently the financial success or failure of a company, due to the large number of indicators that can be used. The need arises to find indicators that make it possible to reveal, as soon as possible, insolvency or business failure processes and thus be able to evaluate possible scenarios for subsequent decision-making. In the prediction of business failure it is useful to have techniques that allow the selection of attributes, in this case financial indicators with high predictive power. The techniques of data mining are an appropriate proposal in the selection of these attributes with high predictive capacity in business failure processes. In this paper, the main limitations of financial analysis based on financial ratios are presented. The proposal of data miningtechniques that can be used in financial analysis for the prediction of business failure is based. In addition, the main advantages of data mining techniques in the decision- making process regarding the evaluation of business failure are discussed.

KEYWORDS: data mining, attribute selection algorithm, business failure, financial ratio

RESUMO

A análise da informação financeira através da utilização de rácios tem uma capacidade limitada para quantificar de forma eficiente o sucesso ou insucesso financeiro de uma empresa, devido ao grande número de indicadores que podem ser utilizados. Surge a necessidade de encontrar indicadores que permitam revelar, o mais rapidamente possível, processos de insolvência ou insolvência empresarial e assim poder avaliar os cenários possíveis para a posterior tomada de decisão. Na previsão de insucesso empresarial, é útil contar com técnicas que permitam selecionar atributos, neste caso indicadores financeiros com alto poder preditivo. Técnicas de mineração de dados são uma proposta de sucesso na seleção desses atributos com alta capacidade preditiva em processos de falha de negócios. Neste trabalho, são apresentadas as principais limitações da análise financeira com base em índices financeiros. Baseia-se a proposta de técnicas de mineração de dados que podem ser utilizadas em análises financeiras para a previsão de falência de negócios. Além disso, são discutidas as principais vantagens das técnicas de mineração de dados no processo de tomada de decisão quanto à avaliação do insucesso empresarial.

PALAVRAS-CHAVE: mineração de dados, algoritmo de seleção de atributos, fracasso empresarial, razões financeiras

INTRODUCCIÓN

La toma de decisiones basada en la información es una actividad fundamental en las empresas actuales, es la base para su supervivencia y buen funcionamiento. La información contable reflejada en los estados financieros de las empresas supone una amplia fuente de información para la toma de decisiones, pero no son suficientes en sí mismas para la interpretación económica y financiera de la empresa. Se necesita entonces de técnicas para el análisis de estados financieros que posibiliten evaluar el funcionamiento pasado, presente y proyectado de la empresa, entre las más difundidas está el cálculo de razones financieras (Weston y Brigham, 1994). El estudio de las razones permite conocer la evolución de los valores a través del tiempo que empiezan a dar una señal de alarma de algún tipo de situación potencialmente peligrosa para empresas de características similares. Las razones financieras a pesar de ser un instrumento de uso frecuente, cuyo buen diseño y conocimiento permiten resolver algunos aspectos concretos para la toma de decisiones financieras, tiene una limitada capacidad para cuantificar de forma eficiente el éxito o fracaso empresarial de una empresa (Ibarra, 2009). La predicción del fracaso empresarial ha sido un tema recurrente en la literatura financiera y la utilización de técnicas de minería de datos resulta una propuesta acertada en la selección de estos atributos (razones financieras) con alta capacidad predictiva en procesos de fracaso empresarial (Cueto, Diéguez y Oliver, 2015).El empleo de nuevos paradigmas de tratamiento de la información ha permitido una mejor gestión del conocimiento lo que se traduce en decisiones adecuadas oportunas y eficaces. En la actualidad las técnicas de minería de datos tienen muchas aplicaciones en el campo empresarial, tales como: análisis de clientes, aprobación de préstamos, determinación de montos de crédito; detección de fraudes empresariales entre otras (Sosa, 2007) En la presente investigación se realiza un estudio de las limitaciones del análisis financiero tradicional y se exponen las ventajas de los métodos procedentes de los algoritmos de la minería de datos en la predicción del fracaso empresarial por su alta capacidad a nivel teórico y empírico en la obtención de mejores resultados en las validaciones.

Limitaciones del análisis financiero tradicional basado en razones financieras

El número de razones que se analicen debe ser reducido pues un número excesivo de estas, requeriría mucho tiempo para obtener una apreciación de conjunto al no poder relacionarlas entre sí. Otros autores exponen la necesidad de encontrar una variable común en qué basar las decisiones financieras para todo tipo de empresas.

Un problema en el análisis financiero es la una gran cantidad de información que se utiliza de los estados financieros. Por ejemplo un estado de resultado típico, puede estar estructurado con 20 conceptos, el balance y el estado de flujo de efectivo por lo menos con 50 rubros cada uno. Por tanto, los datos que se puede obtener con estos conceptos a través de las distintas técnicas como: el análisis vertical, horizontal y las razones financieras, pueden crecer exponencialmente. Esto deriva en una dificultad en el manejo de una cantidad de datos para llevar acabo el análisis, además de que la información puede ser similar y redundante.

Se torna complejo decidir cuáles deben ser las razones a emplear, ya que no existe una respuesta única sino que la elección tiene mucho que ver con el tipo de empresa

su dimensión y el aspecto de esta que se desea investigar. El hecho de que una razón concreta tome un valor ciertamente alejado de una situación empresarial desahogada no implica el deterioro de la misma. Solamente cuando un número elevado de estas razones apunten hacia una situación de insolvencia. Resulta interesante establecer qué razones financieras explican mejor la insolvencia inmediata de la empresa, a fin de que sean éstos los considerados en un proceso de la determinación posible del fracaso empresarial.

En el estudio de Vázquez y otros. (2011) se exponen los inconvenientes de emplear una gran cantidad de razones financieras que son manejadas en la literatura contable y financiera, y que muchas veces son complejos estudios y especulaciones teóricas. Los investigadores o analistas, se refieren a una misma razón con diferentes nombres, o bien, con un mismo nombre para un conjunto de razones. Esto denota la magnitud de la información que se requiere analizar y que en varios casos se encuentra interrelacionada. Por otra parte se analiza información duplicada que en ocasiones es irrelevante. Al ampliar el detalle es posible perder la visión integral del conjunto estudiado. Otras investigaciones plantean los resultados derivados de la investigación empírica (las determinadas mediante la aplicación de técnicas estadísticas) y a priori (propuestas en la literatura contable), corroboran que no existe un grado de convergencia entre la cantidad de factores y la diversidad de razones útiles para el análisis de la información financiera; por lo que se hace necesario aplicar técnicas que permitan unificar o simplificar su estructura similar. En Ibarra, (2001) y Vázquez y otros. (2011), los autores corroboran las desventajas e inconvenientes al emplear una gran cantidad de razones financieras en el análisis.

Técnicas de análisis de datos en estudios de fracaso empresarial

La selección de atributos relevantes es una tarea usual en la minería de datos. En la predicción del fracaso empresarial resulta útil contar con técnicas que permitan seleccionar las razones financieras que tengan alto poder predictivo. La combinación de técnicas de minería de datos ha permitido crear modelos híbridos en los estudios de fracaso empresarial. Desde los estudios pioneros de Altman, (1968) con su propuesta de modelos predictivos mediante el Análisis Discriminante, Blum (1974); Altman y Eisenheis (1978), la Regresión Logística Ohlson, (1980); Lo, (1986); Premachandra y otros. (2009), las Redes Neuronales Atiya, (2001); Du Jardin, (2009), Máquina de Soporte Vectorial (SVM) Kim y Sohn (2010). Recientemente la Regresión por Mínimos Cuadrados Parciales (PLS), ha sido empleada de manera combinada con SVM y con el Análisis Discriminante Lineal (LDA), para la predicción del fracaso empresarial Yang y otros. (2011); (Serrano y Gutiérrez, 2013). La combinación de estas técnicas de construcción de atributos y de reducción de información basada en la selección de atributos, tiene a su favor que no rompen con la semántica de los datos, lo que facilita la interpretación de los resultados. Tiene la desventaja de no tratar la multicolinealidad lo que puede limitar el uso de algunos clasiﬁcadores. Otra de las técnicas utilizadas para la reducción de la dimensión de la matriz de datos basada en la construcción de atributos es la Regresión por Mínimos Cuadrados Parciales (PLS) que usualmente se denomina componentes o variables latentes de (Jong, 1993).

La técnica PLS ha sido empleada de manera combinada con SVM y con el LDA, para la predicción del fracaso empresarial Yang y otros. (2011); Serrano y Gutiérrez, (2013). Los resultados de investigación citados han supuesto avances en el área del análisis financiero al contar con nuevos modelos de predicción de quiebra que se pueden emplear o tomar como referencia para detectar problemas financieros en la clasificación de empresas en estado de quiebra.

Al realizar el análisis financiero para determinar el estado de quiebra o no de una empresa, el conjunto de datos que se toman como entrada es una matriz donde las observaciones son empresas de un mismo sector y las columnas son razones financieras. La forma de definir las razones financieras hace que compartan información entre sí, por ejemplo dos razones con esta característica son: capital de trabajo/total de activos, beneficio neto/total de activo. Esta cuestión provoca que los análisis, a menudo, se realicen con información duplicada e irrelevante. Lo que pone de manifiesto la necesidad de contar con la capacidad de seleccionar aquellas razones que resulten más importantes para predecir el fracaso. La combinación de técnicas de minería de datos y técnicas estadísticas permiten dar soluciones eficaces a este problema de selección de atributos.

Ventajas al utilizar técnicas de análisis de datos en estudios de quiebra empresarial

Las razones ﬁnancieras son expresiones matemáticas de la relación entre dos actividades contables y pueden ser tomadas como una señal de alarma de algún tipo de situación potencialmente peligrosa para las empresas. En un estudio de predicción del fracaso empresarial de un grupo de empresas, el volumen de datos suele ser considerable, puede estar dado por una matriz de varias decenas de columnas atributos (razones ﬁnancieras) y tantas ﬁlas como empresas se tomen en cuenta. Esta es la razón por la cual la predicción del fracaso empresarial ha sido abordada mediante enfoques estadísticos y de minería de datos. La reducción de la dimensión de esta matriz de datos se clasifican en dos tipos, las de construcción de atributos y las de selección de atributos Van der Maaten y Van den Herik, (2009).

Una de las técnicas de construcción de atributos más populares es el PCA, Guyon y Elisseeff, (2003). Esta técnica tiene el inconveniente de que rompe con la representación original de las variables, lo cual hace difícil la interpretación de los resultados. Una ventaja del PCA es que los atributos que construyen tienen la característica de ser ortogonales entre sí. Este rasgo hace que el PCA sea muy empleado en condiciones donde exista multicolinealidad. Por otro lado la técnica PLS es una técnica de reducción de la dimensión de la matriz de datos basada en la construcción de nuevos atributos (componentes) Jong, (1993). Esta técnica combina las características de la Regresión Lineal y el PCA que puede ser utilizada en condiciones donde el número de observaciones es mucho menor que el número de atributos. Otra técnica para la reducción de la dimensión de la matriz de datos, es la descomposición matricial CUR Mahoney y Drineas, (2009). Al igual que la descomposición en valores singulares (SVD) Golub y Loan, (1996) permite obtener aproximaciones matriciales de menor rango para una matriz de datos.

Una de las propuestas a seguir para dar solución al problema de selección de atributos es la utilización de algoritmos que basan su mecanismo en la búsqueda local, como el algoritmo ColumnSelect para la generación de soluciones (subconjuntos de atributos X_m×k). Para evaluar cada solución se propone emplear la precisión de la clasificación que se realiza con el subconjunto de atributos X_m×k, o con un subconjunto T_m×q de componentes ortogonales calculadas mediante la regresión PLS o el PCA a partir de los atributos X_m×k. Para clasificar se emplea el método k-vecinos más cercanos (KNN), o el análisis discriminante lineal. Para verificar la clasificación se emplea la validación cruzada.

DISCUSIÓN

La combinación de estas técnicas estadísticas y de minería de datos supone grandes ventajas pues conformará un algoritmo híbrido para la generación de los subconjuntos de atributos a evaluar en cada iteración. De esta manera se llegará a una matriz aleatoria, donde los atributos en este caso (razones financieras) que se obtendrán son los de mayor factor de importancia para el estudio de selección.

El análisis de la información financiera mediante razones, permite conocer la evolución de los valores a través del tiempo que empiezan a dar una señal de alarma.

CONCLUSIONES

Las limitaciones del análisis financiero basado en razones financieras, se debe a la gran cantidad de razones que se presentan actualmente en la literatura contable y financiera lo cual dificulta detectar por sí solos los procesos de deterioro empresarial.
Las combinaciones de técnicas de minería de datos que se presentan en los estudios, permiten predecir el fracaso empresarial o el estado de insolvencia a través de la información contable; específicamente las razones financieras.
La utilización de algoritmos híbridos para la selección de atributos, permiten discriminar con mayor capacidad el estado de quiebra o no, de una empresa.

BIBLIOGRAFÍA

Altman, E. I. (1968). Financial ratios, discriminant analysis and the prediction of corporate bankruptcy. The journal of finance, 23(4), 589-609

Altman, E. y Eisenheis, R.A. (1978). Financial applications of discriminant analysis aclariﬁcation. Journal of ﬁnancial and quantitative analysis.

Atiya, A. F. (2001). Bankruptcy prediction for credit risk using neural networks: A survey and new results. IEEE Transactions on Neural Networks, 12(4).

Blum, M. (1974). Failing company discriminant analysis. Journal of Accounting Research, 12(1):1– 25.

Cueto, M. J. V., Diéguez, A. I. I., & Oliver, A. B. (2015). Utilización de técnicas paramétricas y no paramétricas para la elaboración de un modelo de predicción de quiebra en las microempresas. Perspectiva Socioeconómica, 1(2), 28-49.

Du Jardin, P. (2009). Bankruptcy prediction models: How to choose the most relevant variables? Mpra paper, University Library of Munich, Germany.

Ibarra, A. (2001). Análisis de las diﬁcultades ﬁnancieras en las empresas en una economía emergente: Las bases de datos y las variables independientes en el sector hotelero de la bolsa Mexicana de valores. Tesis Doctoral, Universidad Autónoma de Barcelona.

Ibarra, A. (2009). Desarrollo del Análisis Factorial Multivariable Aplicado al Análisis Financiero Actual. Colombia.

Jong, S. (1993). Simpls: an alternative approach to partial least squares regression. Chemometrics and intelligent laboratory systems, 18(3):251–263

Kim, H. S. y Sohn, S. Y. (2010). Support vector machines for default prediction of smes based on technology credit. European Journal of Operational Research, 201(3):838–846.

Lo, A. W. (1986). Logit versus discriminant analysis: A speciﬁcation test and application to corporate bankruptcies. Journal of Econometrics, 31(2):151 – 178

Ohlson, J. A. (1980). Finanacial ratios and the probabilistic prediction of bankruptcy. Journal of Accounting Research, pág. 109–131.

Premachandra, I., Bhabra, G. S., y Sueyoshi, T. (2009). Dea as a tool for bankruptcy assessment: A comparative study with logistic regression technique. European Journal of Operational Research, 193(2):412 – 424.

Serrano, C. y Gutiérrez, B. (2013). Partial least square discriminant analysis for bankruptcy prediction. Decision Support Systems, 54(3):1245–1255.

Sosa Sierra, María Del Carmen; (2007). Inteligencia artificial en la gestión financiera empresarial. Pensamiento & Gestión, diciembre, 153-186.

Vázquez Carrazana, Guerra Fonseca y Ahmed Tellez: "Aplicación de métodos multivariados: una respuesta a las limitaciones de los ratios financieros", en Contribuciones a la Economía, enero 2011, en http://www.eumed.net/ce/2011a/.

Weston, J. y Brigham, E. (1994). Fundamentos de administración

ﬁnanciera. McGraw-Hill.

Yang, Z., You, W., y Ji, G. (2011). Using partial least squares and support vector machines for bankruptcy prediction. Expert Systems with Applications, 38(7):8336

– 8342

1 Docente Universidad 0 Martha Abreu de Las Villas, Villa Clara, Cuba

2 Gerente de empresas XOA S.A. Ecuador