¿Qué es el programa Virtualbox?
Aprender sobre VirtualBox te ayudará notablemente a comprender lo que significa una emulación en toda la extensión de la palabra y donde este programa es de los que mayormente tienen que ayudar a los usuarios en muchas facetas.
VirtualBox en tal sentido es un software o aplicación que tiene como finalidad la ejecución de máquinas virtuales, mismas que posteriormente se convierten en sistemas operativos para que se puedan usar a todas las aplicaciones que de estas se devienen como por ejemplo el uso de Windows o de Apple por citar a dos.
Pero no solamente a esos dos que son comercialmente hablando los más populares sino a los denominados del bloque de software libre tales como por ejemplo LINUX/GNU. Eso habla muy bien de la capacidad que tiene este programa de llegar a muchos usuarios con su ejecución de emulaciones.
La plataforma trabaja de forma tan simple como instalar este programa o tenerlo de forma portable y usarlo sobre el sistema operativo con el que estás ya trabajando dejando una muy buena base para la confiabilidad.
Uno de los mejores usos que se le da a VirtualBox es el de probar a una cantidad innumerable de aplicaciones en otros sistemas operativos y ya eso es todo un ahorro y dolores de cabeza que posteriormente serán eliminados.
¿Cómo funciona Virtualbox?
El funcionamiento de VirtualBox es todo un proceso obra de mucho ingenio y hacer las cosas de forma mucho más certera y fácil.
Para empezar, VirtualBox se encarga de crear una máquina virtual, eso quiere decir que ya trabaja como si fuese un emulador en toda la extensión de la palabra. Luego, también viene el trabajo pleno para con cualquier sistema operativo, lo que quiere decir que tienes una muy buena gama de donde escoger.
Más adentro tenemos que VirtualBox permite usar aplicaciones de todo tipo pero basadas en la emulación tal y como si estuviese trabajando en algún sistema operativo diferente. Con eso entonces el funcionamiento ya dista mucho de tener que instalar nuevas particiones y demás en un disco duro.
La sencillez forma el común denominador de VirtualBox, sobre todo tomando en cuenta que su uso está destinado a las pruebas puntuales, eso indica que ante todo este programa busca que salgas de dudas con referencial al trabajo de ciertos programas trasladados a un sistema operativo en particular.
En resumen, todo lo que estés creando con este programa se ejecuta mediante la creación y hasta reutilización de todos los discos duros para la creación de estas máquinas virtuales, así como también el monitoreo constante.
¿Qué es adoopH?
Hadoop es framework de código abierto con el que se pueden almacenar y procesar cualquier tipo de datos masivos. Tiene la capacidad de operar tareas de forma casi ilimitada con un gran poder de procesamiento y obtener respuestas rápidas a cualquier tipo de consulta sobre los datos almacenados. Esto se consigue gracias a la ejecución distribuida de código de múltiples nodos (es decir, máquinas), donde cada nodo se encarga de procesar una parte del trabajo a realizar.
Es esta capacidad de almacenamiento y procesamiento de todo tipo de datos (tanto estructurados como no estructurados), que hacen de Hadoop una importante estructura de trabajo para el Big Data.
Además, Hadoop permite almacenar datos y ejecutar aplicaciones de hardware comercial.
Como decíamos, Hadoop es clave para el Big Data, puesto que cada vez se generan más cantidades de datos que las empresas y organismos públicos no solo necesitan almacenar, sino también procesar y analizar. Además, los datos provienen cada vez más de diversas y muy variadas fuentes, como redes sociales, plataformas de vídeo en streaming, e-commerce o el IoT (el Internet de las cosas), lo que hace necesario contar con framework capaz de almacenar y procesar esos grandes volúmenes de datos de manera ágil. Las tecnologías de Hadoop permiten hacerlo.
Sqoop
es una herramienta de línea de comandos desarrollada para transferir grandes volúmenes de datos de bases de datos relacionarles a Hadoop, de ahí su nombre que viene de la fusión de SQL y Hadoop. Concretamente transforma datos relacionarles en Hive o HBase en una dirección y en la otra de HDFS a datos relacionares como MySQL, Oracle, Postgress o a un data warehouse.
El proceso de transferencia consiste leer fila por fila cada tabla de la base de datos e importarlas a HDFS, la salida de estos es un conjunto de ficheros que puede estar en formato CSV, Avro, binario o de secuencia.
Recientemente se ha creado Sqoop2 para mejorar la usabilidad de Sqoop, proporcionando una aplicación web y mayor integración con Oozie.
Características
Proporciona una API Java para realizar el procesamiento en la ingesta. Permitiendo programar aplicaciones que realicen algunas tipo de transformación sobre los datos.
Proporciona comandos para listar tablas y esquemas.
Soporta cargas incrementarles de datos.
Proporciona multitud de conectores como FTP, JDBC, Kafka, Kite, SFTP
Write a comment ...