En este artículo vamos a ver las formas más comunes de llamar a
servicios de procesamiento externos.
Muchas veces se confunde a Data Factory con una herramienta ETL,
cuando en realidad es un servicio de integración de datos y orquestación de
procesos. La actividad estrella en Data Factory es el "Copy Activity"
que permite tomar datos de una fuente de datos origen, y los deposita en algún
almacenamiento destino, y ¡es muy buena haciéndolo! Soporta multitud de orígenes
y destinos, permite conectar con datos on premise (incluso ODBC), consultar
APIs, etc. Todo el resto de las actividades de Data Factory están hechas
alrededor de Copy Activity y dan soporte a esta, ya sea consultando marcas de
agua, haciendo validaciones o consultando metadata, entre otras. Lo que no hace
Data Factory por sí solo (dejando afuera el nuevo Data Flow que prácticamente
es otra herramienta), es realizar tareas típicas de ETL tales como filtrar
filas, crear columnas derivadas de otras, controlar la limpieza de los datos,
existencia de datos, agregaciones, etc, y para llevar a cabo estas tareas
podemos utilizar servicios de procesamiento fuera de lo que es Data Factory. A continuación,
vamos a ver algunos de los más comunes, y sus ventajas: