Editor: Mario Pérez-Montoro (Universitat de Barcelona, España)

Contribuciones incorporadas al Glosarium BITriJ.M. Díaz Nafría (jul.2009), Mario Pérez-Montoro (nov.2009), Mehrad Golkhosravi (nov.2009)

(In. data, Fr. donnée, Al. Daten -pl.- Angabe) Intuitivamente, podemos identificar los datos como acaecimientos físicos (pequeñas parcelas (o trozos) de la realidad) susceptibles de transportar asociada cierta información. Poseen una naturaleza material y pueden ser considerados como el soporte físico de la información. Son hechos físicos que no contienen un significado inherente, no incluyen necesariamente interpretaciones u opiniones, y no llevan asociado ningún rasgo indicativo que pueda desvelar su importancia o su relevancia. En este sentido, cada uno de los enunciados impresos que aparecen en este libro puede ser considerado como datos. El nombre del cliente, el importe de la compra o el número de transacción bancaria que aparece en una factura podrían ser considerados como ejemplos típicos de datos dentro del contexto de las empresas.

Con el ánimo de sistematizar, podemos recoger esta propuesta a partir de la siguiente definición: Dato = soporte físico de la información.
1. Dato en el contexto organizacional

Es importante señalar algunas características de los datos de la mano de esta caracterización. En primer lugar, que al ser acaecimientos físicos, los datos son sencillos de capturar, estructurar, cuantificar o transferir. En segundo, que un dato, dependiendo de cómo sea la clave de codificación en la que se ve envuelto (como veremos a continuación), puede ser convencional o natural (no convencional). El número de cuenta que aparece en el dorso de una tarjeta de crédito bancaria es un ejemplo de dato de tipo convencional. Las nubes de aspecto plúmbeo que aparecen el cielo justo antes de la tormenta son un ejemplo de dato natural o no convencional. En tercer lugar, un mismo dato puede informar o no a un agente dependiendo, como también veremos a continuación, del stock previo de conocimiento del agente. En quinto, que en el seno de una organización los datos acostumbran a ser de tipo convencional y suelen aparecer como conjuntos de caracteres alfanuméricos materializados sobre un documento (físico o electrónico). Y, por último, que en el mismo contexto, en el de las organizaciones, la acumulación indiscriminada de datos no siempre lleva necesariamente a una mejora en la toma de decisiones.

Podemos justificar esta manera de definir el concepto de dato revisando cómo se entiende este mismo concepto en otros contextos. Así, por ejemplo, nuestra caracterización recoge sin tensión el sentido que se le da al concepto de dato en las disciplinas de la informática y de las telecomunicaciones: conjunto de caracteres asociados a un concepto. El conjunto de caracteres “35.879.987” respecto al concepto número del documento nacional de identidad (DNI), podría ser un ejemplo.

En la misma línea, nuestra propuesta encaja perfectamente también con el uso que se hace de la palabra “dato” cuando se definen ciertas aplicaciones informáticas. Un sistema de gestión de bases de datos (SGBDD), sin ir más lejos, suele definirse como un recurso informático que permite la gestión de registros a partir de los datos o conjuntos de caracteres (cifras, palabras, número, etc.) que aparecen en esos registros. En cierto sentido, se puede defender la idea de que la gestión de registros que esas herramientas habilitan es una gestión de tipo sintáctico (a partir de los conjuntos de caracteres que aparecen en los registros) y no de tipo semántico (a partir del contenido informativo asociados a esos conjuntos de caracteres). Frente a una ecuación de búsqueda, un SGBDD recupera aquellos registros donde aparezcan los datos que conforman esa ecuación. En los mismos términos, un sistema de Data Mining o de Text Mining permite, entre otras cosas, detectar correlaciones o patrones entre datos (o conjuntos de caracteres) que aparecen en los registros que conforman el sistema para que, posteriormente, de una manera intelectual, alguien puede decidir si ese patrón se corresponde o no con alguna genuina correlación semántica.

2. El Modelo de Floridi

Según la definición diafórica de Floridi (procedente del griego διαφορά, diferencia, discrepancia) “un dato es un hecho supuesto en relación a alguna diferencia o a la falta de uniformidad dentro de algún contexto”.

Según el autor esta definición puede ser aplicada en tres niveles: 1) Diáfora de re: como falta de uniformidad en el mundo exterior, es decir, como datos puros, previos a su interpretación epistemológica (semejante a los dedomena euclideos). 2) Diáfora de signo: entre dos estados físicos. 3) Diafora de dicto: entre dos símbolos.

En virtud de la posición adoptada respecto a la neutralidad ontológica y a la naturaleza de la información ambiental (1) puede ser idéntico a (2), o bien hacer posible las señales en (2), a la vez que dichas señales serían condición necesaria para la codificación de símbolos en (3).

Esta definición presenta la ventaja de independizar los datos respecto a su soporte y supone cuatro tipos de independencia o neutralidad: taxonómica (respecto a la clasificación de los relata); tipológica (respecto al tipo lógico de los relata); ontológica (respecto a la naturaleza del soporte de la desigualdad); genética (respecto a la semántica del informando).

A su vez, estos cuatro tipos de neutralidad tienen consecuencias importantes respecto a la naturaleza de la información y los datos. Así:
Según la neutralidad taxonómica, no hay nada que pueda caracterizar a los datos por sí mismos. En consecuencia, éstos son entidades puramente relacionales.
Según la neutralidad tipológica, la información puede constar de diferentes tipos de datos como relata: →primarios, secundarios, metadatos, operacionales o derivativos.
Según la neutralidad ontológica y en combinación con la exclusión –por parte de la Definición General de Información– de información sin datos, supone que tampoco puede haberla sin representación de los datos. Lo cual, a su vez, puede implicar varios niveles de neutralidad ontológica: 1) No puede haber información sin implementación física (sea cual sea su naturaleza). 2) Cualquier elemento del mundo físico deriva su función, su significado, su existencia de un sistema de respuestas a preguntas binarias (es decir, aquello a lo que llamamos realidad procede de una análisis teórico-interrogativo). 3) La información no es sino un “intercambio con el mundo exterior en virtud de nuestra adaptación a él, a la vez que éste se resiente de nuestra propia adaptación” (Wiener, 1954). 4) La información no es sino una diferencia que crea otra diferencia. De modo que el significado se convierte en potencial a tenor de su capacidad autogenerativa.
Según la neutralidad genética, la semántica puede ser independiente del informando y, por lo tanto, el significado no tiene porque estar en la mente. Lo cual no es lo mismo que la tesis realista según la cual el significado sería incluso independiente del productor o informante. Bajo esta última tesis se hablará de información ambiental.

Se puede además hablar de datos:

primarios: los que son relativos a lo que explícitamente está en cuestión (p.ej., la respuesta dada por un sistema de información a una pregunta de un usuario).

secundarios: equivalentes a la ausencia de determinados datos primarios (p.ej., el silencio administrativo ante una demanda determinada).

operacionales: los relativos a las operaciones y rendimiento general del sistema de información (p. ej., una indicación de que el sistema no está funcionando adecuadamente, o que está ocupado).

derivativos: los que se pueden usar como fuentes indirectas en pesquisas ajenas a aquellas sobre las que versan directa y primariamente los datos (p. ej., “el hecho de que haya mencionado dos veces el sol, es signo de que está de buen humor”).

Meta~: indicaciones acerca de la naturaleza y de las características de otros datos, normalmente primarios (p. ej., “lo que dice fulanito es mentira”, “este texto está almacenado en una código ASCI extendido”, “en los datos recibidos no se ha detectado ningún error”…).

Referencias

  • Boisot, Max H. (1998). Knowledge Assets. Oxford: Oxford University Press.
  • Davenport, T.; Prusak, L. (1998). Working Knowledge. Boston: Harvard Business School Press.
  • Floridi, L. (2005). “Semantic Conceptions of Information” en Stanford Encyclopedia of Philisophy, Edición electrónica [online]  <http://plato.stanford.edu/entries/information-semantic/> [Consultado: sept/2008]
  • Nonaka, Ikujiro y Takeuchi, Hirotaka (1995). The Knowledge Creating Company. Oxford: Oxford University Press.
  • Pérez-Montoro Gutiérrez, Mario (2008). Gestión del Conocimiento en las Organizaciones. Gijón: Trea. ISBN 978-84-9704-376-2.
  • Pérez-Montoro Gutiérrez, Mario (2007). The Phenomenon of Information. Lanham (Maryland): Scarecrow Press.
  • Pérez-Montoro Gutiérrez, Mario (2003). “El documento como dato, conocimiento e información”. [En línea]. Tradumática, núm. 2, 2003. <http://www.fti.uab.es/tradumática/revista&gt; [Consulta: 30 dic. 2003].
  • von Krogh, Georg, Ichijo, Kazui y Nonaka, Ikujiro (2000). Enabling Knowledge Creation. Oxford: Oxford University Press.

Glossarium BITri

  • Si se desea realizar alguna entrada para ser incorporada a la futura edición del artículo o hacer comentarios sobre la página del glosario acceder aquí.

Anuncios