3 roles clave en el universo Big Data

¿A qué se dedican los científicos, ingenieros y arquitectos de datos?

3 roles clave en el universo Big Data: Científicos, ingenieros y arquitectos de datos (Data Scientists, Data Engineers y Data Architects en inglés) son tres profesiones o roles que a menudo se confunden. Las tareas que llevan a cabo son bastante diferentes aunque, sobre todo en el caso de los ingenieros de datos y los científicos de datos, es bastante habitual solaparlas. Digamos que en general las dos figuras más claras suelen ser la del científico de datos y la del arquitecto de datos.

 

Data Scientist –

Al científico de datos se le suele relacionar con los modelos estadísticos, los modelos de aprendizaje automático y la inteligencia artificial. Es esa especie de unicornio empresarial que sabe un poco de todo (o idealmente debería). Tiene un conocimiento amplio de matemáticas y es bueno programando en distintos lenguajes. Sin olvidar la componente de negocio que todo científico de datos debe tener para poder traducir el lenguaje de negocios en modelos estadísticos útiles.

(si)

Data Architect –

Por otro lado, se encuentra la figura del arquitecto de datos. A estos profesionales se les suele relacionar con la parte de infraestructura y administración de sistemas. Montan y mantienen la infraestructura (clúster Big Data, servidores) para que los científicos de datos trabajen sobre ella. Han tomado especial relevancia en el contexto del Big Data, donde para tener una infraestructura on-premise es necesario tener un equipo de infraestructura potente. De otro modo, los resultados de los modelos estadísticos de los científicos de datos pasarán a ser verdaderos unicornios, es decir, inexistentes. Ellos son los que se encargan de que los cimientos del proyecto de datos estén estables.

(si)

 

Data Engineer –

Aquí suelen empezar las confusiones. El ingeniero de datos podríamos definirlo como la pieza clave entre el arquitecto de datos y el científico de datos. Desde mi punto de vista, es la pieza más importante en cualquier proyecto de datos. Son los encargados de diseñar los pipelines. Aquel que dado un proyecto con unas necesidades especificas escoge las tecnologías adecuadas, las «tuberías» para llevar el dato de A a B.

 

Un rol más y no menos importante: Analista de Datos

Luego existe un rol que se suele confundir con el de ingeniero de datos que es el del modelizador/analista de datos. Este rol debe tener conocimientos de ETL, APIs y modelización de bases de datos. Definen la codificación de datos, esquemas, compresiones y el versionado. También llevan a cabo la monitorización de las ETLs, validaciones, etc. Este puesto se suele confundir bastante con el ingeniero de datos, teniendo este último mucho más componente de diseño e ingeniería.

 


¿Qué pensás de estos roles? ¿trabajás en alguno de ellos?

¿Queres ver quiénes ocupan estos roles en el equipo Tekne? Si te quedan dudas, podes contactarte con nosotros.

 


3 Roles clave en el universo big data
Fuente: https://machinelearningparatodos.com/roles-data-science-big-data/

Si te gustó la nota, compartila!

Somos @TekneDataLabs