Què és la Ciència de Dades, o Data Science, i com va començar

La Ciència de Dades és una disciplina transversal, que inclou els àmbits de la informàtica, l’estadística i les matemàtiques.

El terme ciència de dades (Data Science) va ser utilitzat per primera vegada l’any 1974 pel científic informàtic danès Peter Naur al seu llibre Concise Survey of Computer Methods. En aquesta primera definició, Naur entén la ciència de dades com un qüestió inherent a la gestió i manipulació de les dades tal com es presenten, donant poca importància, però, a la quantitat d’informació que hi podrien amagar.

Va ser reconeguda com una disciplina per dret propi (per tant, ja no és una branda de la informàtica i l’estadística) només l’any 2001. William Cleveland va definir els seus camps d’especialització, enumerant sis àrees diferents: investigació multidisciplinària, models, processament de dades, pedagogia, avaluació d’eines i teoria.

Amb l’arribada del Big Data i la idea de “valor de la dada” (Data Value) típica d’aquest paradigma, el mateix concepte de Data Science ha evolucionat. La ciència de dades s’ha d’entendre, doncs, com una disciplina transversal, que inclou tant els àmbits de la informàtica, l’estadística i les matemàtiques, com en el sentit original, com un conjunt de competències més directives, vinculades a la necessitat més recent de saber llegir, interpretar i capitalitzar les dades amb finalitats comercials.

Què és Data Science?

Data Science és un camp interdisciplinari que utilitza mètodes, processos, algorismes i sistemes científics per extreure valor de les dades. Els científics de dades combinen habilitats en diverses disciplines, incloses les estadístiques, la tecnologia de la informació i l’administració d’empreses, per analitzar les dades recollides del web, telèfons intel·ligents, clients, sensors i altres fonts.

La ciència de dades mostra tendències i genera informació que les empreses poden utilitzar per prendre millors decisions i crear productes i serveis més innovadors. Les dades són la base de la innovació, però el seu valor prové de la informació que els científics de dades poden obtenir i activar.

Quins són els seus principals camps d’ús?

  • Detecció de frau i risc
  • Atenció sanitària
  • Cerca a Internet
  • Publicitat dirigida
  • Recomanacions de llocs web
  • Reconeixement d’imatges avançat
  • Reconeixement de veu
  • Planificació de rutes aèries
  • Jocs
  • Realitat augmentada